Original Title: Edge AI Implementation of Hybrid Deep Learning for Network Traffic Prediction
Source: www.researchgate.net
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការអនុវត្ត Edge AI នៃការរៀនស៊ីជម្រៅបែបកូនកាត់សម្រាប់ការទស្សន៍ទាយចរាចរណ៍បណ្តាញ

ចំណងជើងដើម៖ Edge AI Implementation of Hybrid Deep Learning for Network Traffic Prediction

អ្នកនិពន្ធ៖ Martin Samola

ឆ្នាំបោះពុម្ព៖ 2022

វិស័យសិក្សា៖ Telecommunications and Artificial Intelligence

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ បណ្តាញទំនាក់ទំនងទំនើបដូចជា 5G និង IoT កំពុងជួបប្រទះនឹងកំណើនចរាចរណ៍ទិន្នន័យយ៉ាងខ្លាំង ដែលទាមទារឱ្យមានម៉ូដែលទស្សន៍ទាយចរាចរណ៍បណ្តាញប្រកបដោយប្រសិទ្ធភាព និងតាមពេលវេលាជាក់ស្តែង (Real-time) ដើម្បីជៀសវាងការកកស្ទះ និងបង្កើនប្រសិទ្ធភាពបណ្តាញ។

វិធីសាស្ត្រ (The Methodology)៖ ឯកសារនេះស្នើឡើងនូវការប្រើប្រាស់បច្ចេកវិទ្យា Edge AI រួមបញ្ចូលគ្នាជាមួយម៉ូដែលរៀនស៊ីជម្រៅបែបកូនកាត់ (Hybrid Deep Learning) ដើម្បីទស្សន៍ទាយ និងវិភាគទិន្នន័យចរាចរណ៍នៅក្បែរប្រភពដើម។

ការប្រើប្រាស់ម៉ូដែលកូនកាត់ (CNN-LSTM Hybrid Models) ដើម្បីចាប់យកលក្ខណៈពិសេសនៃលំហ (Spatial) និងពេលវេលា (Temporal) នៃទិន្នន័យ
ការដាក់ពង្រាយម៉ូដែលលើឧបករណ៍ចុងកាត់ (Edge Device Deployment) ដូចជា IoT Sensors និង Edge Gateways ដើម្បីកាត់បន្ថយភាពយឺតយ៉ាវ
ការធ្វើឱ្យប្រសើរម៉ូដែលតាមរយៈបច្ចេកទេសបង្រួមទំហំ (Quantization and Pruning) សម្រាប់ឧបករណ៍ដែលមានធនធានមានកម្រិត

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ប្រព័ន្ធកូនកាត់ Edge AI នេះផ្តល់នូវការកែលម្អយ៉ាងសំខាន់លើភាពត្រឹមត្រូវនៃការទស្សន៍ទាយ និងកាត់បន្ថយពេលវេលាឆ្លើយតបបានយ៉ាងលឿនបើប្រៀបធៀបទៅនឹងវិធីសាស្ត្រផ្អែកលើក្លោដ (Cloud-based approaches) ជាប្រពៃណី។
ការដំណើរការទិន្នន័យនៅនឹងកន្លែង (Local inference) ជួយកាត់បន្ថយការប្រើប្រាស់កម្រិតបញ្ជូន (Bandwidth) ព្រមទាំងលើកកម្ពស់សុវត្ថិភាព និងឯកជនភាពនៃទិន្នន័យអ្នកប្រើប្រាស់ដោយមិនចាំបាច់បញ្ជូនទិន្នន័យឆៅទៅកាន់ម៉ាស៊ីនមេកណ្តាល។
ការអនុវត្តជាក់ស្តែងនៅក្នុងទីក្រុងឆ្លាតវៃ (Smart Cities) និងបណ្តាញ 5G បង្ហាញពីសមត្ថភាពរបស់ប្រព័ន្ធក្នុងការបែងចែកធនធានដោយស្វ័យប្រវត្តិ កាត់បន្ថយការកកស្ទះ និងគាំទ្រដល់ការថែទាំប្រព័ន្ធទុកជាមុន (Predictive Maintenance) ប្រកបដោយប្រសិទ្ធភាពខ្ពស់។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Traditional & Cloud-Based Models (ARIMA, SVM, Random Forest) ម៉ូដែលប្រពៃណី និងផ្អែកលើ Cloud (ARIMA, SVM, RF)	ងាយស្រួលយល់ និងបកស្រាយ (ARIMA) ហើយមានប្រសិទ្ធភាពសម្រាប់សំណុំទិន្នន័យតូចៗ និងមាននិន្នាការច្បាស់លាស់។	ជួបការលំបាកក្នុងការចាប់យកទំនាក់ទំនងទិន្នន័យស្មុគស្មាញ (Non-linear) ហើយមានភាពយឺតយ៉ាវខ្ពស់ (High Latency) ដោយសារត្រូវបញ្ជូនទិន្នន័យទៅ Cloud។	មានប្រសិទ្ធភាពទាបក្នុងការទស្សន៍ទាយទិន្នន័យដែលមានបម្រែបម្រួលលឿន និងទាមទារការពន្យារពេល (Latency) ច្រើនក្នុងការឆ្លើយតប។
Edge-Based Hybrid Deep Learning (CNN-LSTM / CNN-GRU) ម៉ូដែលរៀនស៊ីជម្រៅកូនកាត់ដាក់លើឧបករណ៍ចុងកាត់ (Edge AI)	អាចចាប់យកទាំងលក្ខណៈទំហំ (Spatial) និងពេលវេលា (Temporal) នៃទិន្នន័យ ព្រមទាំងផ្តល់ការឆ្លើយតបភ្លាមៗ (Real-time) ដោយមិនពឹងផ្អែកលើ Cloud ទាំងស្រុង។	ទាមទារបច្ចេកទេសបង្រួមម៉ូដែល (Quantization/Pruning) ព្រោះឧបករណ៍ Edge មានកម្រិតសមត្ថភាពគណនា និងអង្គចងចាំ។	បង្កើនភាពត្រឹមត្រូវនៃការទស្សន៍ទាយ កាត់បន្ថយពេលវេលាឆ្លើយតប និងសន្សំសំចៃកម្រិតបញ្ជូន (Bandwidth) ក្នុងបណ្តាញខ្នាតធំ (5G/IoT)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តប្រព័ន្ធនេះទាមទារឱ្យមានការវិនិយោគលើផ្នែករឹងនៅចុងកាត់បណ្តាញ និងការប្រើប្រាស់បច្ចេកទេសធ្វើឱ្យប្រសើរម៉ូដែល (Optimization) ដើម្បីដំណើរការលើធនធានមានកម្រិត។

Hardware: ឧបករណ៍ចុងកាត់ (Edge Devices) ដូចជា IoT Sensors, Gateways, ឬ Edge Servers ដែលអាចមាន GPU តូចៗសម្រាប់ពន្លឿនការគណនា (ឧទាហរណ៍ Edge TPUs)។
Software & Techniques: ទាមទារវិធីសាស្ត្រសន្សំសំចៃធនធានដូចជា Quantization (បំប្លែង 32-bit ទៅ 8-bit), Pruning, Knowledge Distillation និងប្រព័ន្ធ Federated Learning សម្រាប់សុវត្ថិភាពទិន្នន័យ។
Dataset: ទិន្នន័យចរាចរណ៍បណ្តាញពិតប្រាកដដែលប្រមូលបានតាមពេលវេលាជាក់ស្តែង (Real-Time) ដែលទាមទារការសម្អាតទិន្នន័យ (Noise reduction, Handling missing data) នៅនឹងកន្លែង។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ឯកសារនេះបានធ្វើការវាយតម្លៃដោយប្រើប្រាស់ទិន្នន័យចរាចរណ៍បណ្តាញក្នុងពិភពពិត តាមរយៈករណីសិក្សាលើបណ្តាញ 5G ទីក្រុងឆ្លាតវៃ (Smart City) និងបណ្តាញសហគ្រាស ប៉ុន្តែមិនបានបញ្ជាក់ទីតាំងភូមិសាស្ត្រជាក់លាក់ទេ។ សម្រាប់ប្រទេសកម្ពុជា លំនាំនៃការប្រើប្រាស់បណ្តាញអាចមានភាពខុសគ្នាខ្លាំងរវាងទីក្រុង (ដូចជាភ្នំពេញ) និងតំបន់ជនបទ ដែលទាមទារឱ្យមានការបង្ហាត់ម៉ូដែលឡើងវិញជាមួយទិន្នន័យក្នុងស្រុក។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកវិទ្យា Edge AI និង Hybrid Deep Learning នេះមានសក្តានុពលខ្ពស់សម្រាប់កម្ពុជា ស្របពេលដែលការប្រើប្រាស់អ៊ីនធឺណិត និងគម្រោងទីក្រុងឆ្លាតវៃកំពុងកើនឡើង។

Phnom Penh & Sihanoukville Smart City Projects: អាចប្រើប្រាស់លើឧបករណ៍ IoT នៅតាមដងផ្លូវ ដើម្បីទស្សន៍ទាយការកកស្ទះទិន្នន័យកាមេរ៉ាសុវត្ថិភាព និងគ្រប់គ្រងចរាចរណ៍ដោយស្វ័យប្រវត្តិ។
Telecom Providers (Smart, Cellcard, Metfone): ក្រុមហ៊ុនទូរគមនាគមន៍អាចដាក់ប្រព័ន្ធនេះនៅតាមបង្គោលអង់តែន (Base Stations) ដើម្បីគ្រប់គ្រងការប្រើប្រាស់កម្រិតបញ្ជូន (Bandwidth) នៅពេលមានពិធីបុណ្យជាតិធំៗ ជៀសវាងការគាំងប្រព័ន្ធ។
Banking & Enterprise Networks (e.g., ACLEDA, ABA): ធនាគារអាចអនុវត្ត Edge AI ដើម្បីវិភាគចរាចរណ៍បណ្តាញសម្រាប់ស្វែងរកភាពមិនប្រក្រតី ឬការវាយប្រហារ (Cybersecurity) នៅតាមសាខានីមួយៗ ដោយរក្សាឯកជនភាពទិន្នន័យខ្ពស់បំផុត។

ការបំពាក់ Edge AI នឹងជួយស្ថាប័ននានានៅកម្ពុជាក្នុងការកាត់បន្ថយចំណាយលើ Cloud Server បង្កើនសុវត្ថិភាពទិន្នន័យកម្រិតខ្ពស់ និងឆ្លើយតបទៅនឹងបញ្ហាបណ្តាញបានទាន់ពេលវេលា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះនៃ Hybrid Deep Learning: និស្សិតគួរសិក្សាពីរបៀបផ្សំ CNN និង LSTM/GRU សម្រាប់ទិន្នន័យ Time-Series ដោយប្រើប្រាស់បណ្ណាល័យ (Libraries) ដូចជា TensorFlow ឬ PyTorch តាមរយៈវគ្គសិក្សានៅលើ Coursera ឬ Fast.ai។
អនុវត្តការបង្រួមទំហំម៉ូដែល (Model Optimization): រៀនបំប្លែងម៉ូដែលធំៗទៅជាម៉ូដែលស្រាលសម្រាប់ឧបករណ៍ Edge តាមរយៈបច្ចេកទេស Quantization ដោយប្រើប្រាស់ឧបករណ៍ដូចជា TensorFlow Lite ឬ ONNX Runtime។
សាកល្បងដាក់ពង្រាយលើឧបករណ៍ Edge (Edge Deployment): ធ្វើការសាកល្បងជាក់ស្តែងដោយដាក់ពង្រាយម៉ូដែលដែលបានបង្រួមទៅលើឧបករណ៍ខ្នាតតូច ដូចជា Raspberry Pi 4 ឬ NVIDIA Jetson Nano ដើម្បីវាស់ស្ទង់ Latency និង CPU Usage។
សិក្សាពីការរៀនបែបវិមជ្ឈការ (Federated Learning): ស្វែងយល់ពីរបៀបបង្ហាត់ម៉ូដែលដោយមិនបាច់ប្រមូលទិន្នន័យឆៅមកកន្លែងតែមួយ ដោយប្រើប្រាស់ Framework ដូចជា TensorFlow Federated (TFF) ឬ Flower ជំនាញនេះមានតម្រូវការខ្ពស់ផ្នែក Privacy។
អនុវត្តគម្រោងខ្នាតតូចក្នុងបរិវេណសាកលវិទ្យាល័យ: ប្រមូលទិន្នន័យចរាចរណ៍អ៊ីនធឺណិត (Network Traffic) ពី Wi-Fi Router របស់សាកលវិទ្យាល័យ (ដោយប្រើប្រាស់ Wireshark) ដើម្បីសាងសង់ម៉ូដែលទស្សន៍ទាយការកកស្ទះទិន្នន័យនៅម៉ោងសម្រាក។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Edge AI	ការដាក់ឱ្យដំណើរការម៉ូដែលបញ្ញាសិប្បនិម្មិត (AI) នៅលើឧបករណ៍ដែលនៅក្បែរប្រភពទិន្នន័យបំផុត (ដូចជារ៉ោតទ័រ កាមេរ៉ា ឬសេនស័រ) ជាជាងការពឹងផ្អែកលើម៉ាស៊ីនមេកណ្តាល (Cloud Server) ដើម្បីកាត់បន្ថយភាពយឺតយ៉ាវនិងសន្សំសំចៃអ៊ីនធឺណិត។	ដូចជាមានចុងភៅប្រចាំការនៅក្នុងផ្ទះបាយផ្ទាល់ខ្លួនរបស់អ្នក ជាជាងត្រូវកម្ម៉ង់ម្ហូបពីភោជនីយដ្ឋានឆ្ងាយៗរាល់ពេលឃ្លាន។
Hybrid Deep Learning	ការរួមបញ្ចូលគ្នានូវប្រភេទបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតពីរ ឬច្រើនប្រភេទ (ដូចជាការរួមបញ្ចូល CNN និង LSTM) ដើម្បីទាញយកអត្ថប្រយោជន៍នៃចំណុចខ្លាំងរបស់ពួកវារៀងៗខ្លួន ក្នុងការវិភាគទិន្នន័យដ៏ស្មុគស្មាញ។	ដូចជាការសហការគ្នារវាងអ្នកជំនាញគូររូប (មើលឃើញរូបរាង) និងអ្នកជំនាញប្រវត្តិសាស្ត្រ (ដឹងពីព្រឹត្តិការណ៍តាមពេលវេលា) ដើម្បីដោះស្រាយរឿងក្តីមួយ។
Convolutional Neural Networks (CNN)	ប្រភេទនៃម៉ូដែលរៀនស៊ីជម្រៅដែលពូកែក្នុងការស្វែងរកលំនាំ ឬលក្ខណៈពិសេសនៅក្នុងលំហ (Spatial Features) ដូចជាការស្វែងរកទំនាក់ទំនងនៃចរាចរណ៍ទិន្នន័យរវាងឧបករណ៍ផ្សេងៗនៅក្នុងតំបន់បណ្តាញតែមួយ។	ដូចជាភ្នែកទិព្វដែលអាចមើលឃើញប្លង់រួមនៃទីក្រុងទាំងមូល ហើយដឹងភ្លាមថាតំបន់ផ្លូវណាមានឡានកកស្ទះទាក់ទងគ្នា។
Long Short-Term Memory (LSTM)	ជាប្រភេទបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតម៉្យាង (RNN) ដែលមានសមត្ថភាពចងចាំទិន្នន័យក្នុងរយៈពេលវែង និងអាចទស្សន៍ទាយព្រឹត្តិការណ៍បន្ទាប់ដោយផ្អែកលើលំដាប់លំដោយនៃពេលវេលា (Temporal Features) នៃចរាចរណ៍ទិន្នន័យពីអតីតកាល។	ដូចជាមនុស្សចាស់ដែលមានបទពិសោធន៍យូរឆ្នាំ ដែលដឹងថារាល់ពេលមានមេឃខ្មៅងងឹតនិងខ្យល់ខ្លាំង (អតីតកាល) វានឹងមានភ្លៀងធ្លាក់នៅបន្តិចទៀតនេះ (អនាគត)។
Federated Learning	បច្ចេកទេសបង្ហាត់ម៉ូដែល AI បែបវិមជ្ឈការ ដែលឧបករណ៍ Edge នីមួយៗរៀនពីទិន្នន័យរបស់ខ្លួន ហើយបញ្ជូនតែចំណេះដឹង (Model Updates) ទៅកាន់ម៉ាស៊ីនមេកណ្តាល ដោយមិនចាំបាច់បញ្ជូនទិន្នន័យផ្ទាល់ខ្លួនទៅឡើយ។	ដូចជាសិស្សរៀនធ្វើលំហាត់នៅផ្ទះរៀងៗខ្លួន រួចយកតែចម្លើយសរុបមកប្រាប់គ្រូ ដោយមិនចាំបាច់អោយគ្រូមើលសៀវភៅព្រាង ឬដឹងពីអាថ៌កំបាំងផ្ទាល់ខ្លួនរបស់ពួកគេឡើយ។
Quantization	បច្ចេកទេសកាត់បន្ថយទំហំ និងភាពស្មុគស្មាញនៃម៉ូដែល AI តាមរយៈការបន្ថយភាពជាក់លាក់នៃតួលេខទម្ងន់ម៉ូដែល (ឧ. ពី 32-bit ទៅ 8-bit) ដើម្បីឱ្យវាអាចដំណើរការបានលឿននិងប្រើប្រាស់អង្គចងចាំតិចលើឧបករណ៍តូចៗ។	ដូចជាការបង្រួមទំហំរូបភាពពីកម្រិតច្បាស់ខ្លាំង (4K) មកត្រឹមធម្មតា (HD) ដើម្បីងាយស្រួលផ្ញើតាមទូរស័ព្ទលឿន តែនៅតែអាចមើលដឹងថារូបអ្វី។
Concept Drift	បាតុភូតដែលលំនាំនៃទិន្នន័យជាក់ស្តែងផ្លាស់ប្តូរខុសពីធម្មតាតាមពេលវេលា ដែលធ្វើឱ្យម៉ូដែល AI ដែលធ្លាប់តែទស្សន៍ទាយត្រូវ លែងមានភាពត្រឹមត្រូវ ហើយទាមទារការបង្ហាត់ឡើងវិញ។	ដូចជាច្បាប់ចរាចរណ៍ត្រូវបានរដ្ឋាភិបាលផ្លាស់ប្តូរថ្មី ដូច្នេះអ្នកបើកបរចាស់ៗត្រូវតែរៀនច្បាប់នោះឡើងវិញ ដើម្បីកុំឱ្យបើកបរខុសច្បាប់។
Latency	ពេលវេលាដែលត្រូវប្រើប្រាស់ដើម្បីបញ្ជូនទិន្នន័យពីប្រភពមួយទៅកាន់ប្រព័ន្ធដំណើរការកណ្តាល រួចទទួលបានការឆ្លើយតបមកវិញ ដែលនៅក្នុងប្រព័ន្ធបណ្តាញទំនើប គេត្រូវតែធ្វើឲ្យពេលវេលានេះខ្លីបំផុត (Low Latency)។	ដូចជាពេលវេលារង់ចាំតាំងពីពេលដែលអ្នកចុចបញ្ជូនសារទៅកាន់មិត្តភក្តិ រហូតដល់ពេលដែលអ្នកទទួលបានសារតបវិញភ្លាមៗ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖