Original Title: Edge AI Implementation of Hybrid Deep Learning for Network Traffic Prediction
Source: www.researchgate.net
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការអនុវត្ត Edge AI នៃការរៀនស៊ីជម្រៅបែបកូនកាត់សម្រាប់ការទស្សន៍ទាយចរាចរណ៍បណ្តាញ

ចំណងជើងដើម៖ Edge AI Implementation of Hybrid Deep Learning for Network Traffic Prediction

អ្នកនិពន្ធ៖ Martin Samola

ឆ្នាំបោះពុម្ព៖ 2022

វិស័យសិក្សា៖ Telecommunications and Artificial Intelligence

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ បណ្តាញទំនាក់ទំនងទំនើបដូចជា 5G និង IoT កំពុងជួបប្រទះនឹងកំណើនចរាចរណ៍ទិន្នន័យយ៉ាងខ្លាំង ដែលទាមទារឱ្យមានម៉ូដែលទស្សន៍ទាយចរាចរណ៍បណ្តាញប្រកបដោយប្រសិទ្ធភាព និងតាមពេលវេលាជាក់ស្តែង (Real-time) ដើម្បីជៀសវាងការកកស្ទះ និងបង្កើនប្រសិទ្ធភាពបណ្តាញ។

វិធីសាស្ត្រ (The Methodology)៖ ឯកសារនេះស្នើឡើងនូវការប្រើប្រាស់បច្ចេកវិទ្យា Edge AI រួមបញ្ចូលគ្នាជាមួយម៉ូដែលរៀនស៊ីជម្រៅបែបកូនកាត់ (Hybrid Deep Learning) ដើម្បីទស្សន៍ទាយ និងវិភាគទិន្នន័យចរាចរណ៍នៅក្បែរប្រភពដើម។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Traditional & Cloud-Based Models (ARIMA, SVM, Random Forest)
ម៉ូដែលប្រពៃណី និងផ្អែកលើ Cloud (ARIMA, SVM, RF)
ងាយស្រួលយល់ និងបកស្រាយ (ARIMA) ហើយមានប្រសិទ្ធភាពសម្រាប់សំណុំទិន្នន័យតូចៗ និងមាននិន្នាការច្បាស់លាស់។ ជួបការលំបាកក្នុងការចាប់យកទំនាក់ទំនងទិន្នន័យស្មុគស្មាញ (Non-linear) ហើយមានភាពយឺតយ៉ាវខ្ពស់ (High Latency) ដោយសារត្រូវបញ្ជូនទិន្នន័យទៅ Cloud។ មានប្រសិទ្ធភាពទាបក្នុងការទស្សន៍ទាយទិន្នន័យដែលមានបម្រែបម្រួលលឿន និងទាមទារការពន្យារពេល (Latency) ច្រើនក្នុងការឆ្លើយតប។
Edge-Based Hybrid Deep Learning (CNN-LSTM / CNN-GRU)
ម៉ូដែលរៀនស៊ីជម្រៅកូនកាត់ដាក់លើឧបករណ៍ចុងកាត់ (Edge AI)
អាចចាប់យកទាំងលក្ខណៈទំហំ (Spatial) និងពេលវេលា (Temporal) នៃទិន្នន័យ ព្រមទាំងផ្តល់ការឆ្លើយតបភ្លាមៗ (Real-time) ដោយមិនពឹងផ្អែកលើ Cloud ទាំងស្រុង។ ទាមទារបច្ចេកទេសបង្រួមម៉ូដែល (Quantization/Pruning) ព្រោះឧបករណ៍ Edge មានកម្រិតសមត្ថភាពគណនា និងអង្គចងចាំ។ បង្កើនភាពត្រឹមត្រូវនៃការទស្សន៍ទាយ កាត់បន្ថយពេលវេលាឆ្លើយតប និងសន្សំសំចៃកម្រិតបញ្ជូន (Bandwidth) ក្នុងបណ្តាញខ្នាតធំ (5G/IoT)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តប្រព័ន្ធនេះទាមទារឱ្យមានការវិនិយោគលើផ្នែករឹងនៅចុងកាត់បណ្តាញ និងការប្រើប្រាស់បច្ចេកទេសធ្វើឱ្យប្រសើរម៉ូដែល (Optimization) ដើម្បីដំណើរការលើធនធានមានកម្រិត។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ឯកសារនេះបានធ្វើការវាយតម្លៃដោយប្រើប្រាស់ទិន្នន័យចរាចរណ៍បណ្តាញក្នុងពិភពពិត តាមរយៈករណីសិក្សាលើបណ្តាញ 5G ទីក្រុងឆ្លាតវៃ (Smart City) និងបណ្តាញសហគ្រាស ប៉ុន្តែមិនបានបញ្ជាក់ទីតាំងភូមិសាស្ត្រជាក់លាក់ទេ។ សម្រាប់ប្រទេសកម្ពុជា លំនាំនៃការប្រើប្រាស់បណ្តាញអាចមានភាពខុសគ្នាខ្លាំងរវាងទីក្រុង (ដូចជាភ្នំពេញ) និងតំបន់ជនបទ ដែលទាមទារឱ្យមានការបង្ហាត់ម៉ូដែលឡើងវិញជាមួយទិន្នន័យក្នុងស្រុក។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកវិទ្យា Edge AI និង Hybrid Deep Learning នេះមានសក្តានុពលខ្ពស់សម្រាប់កម្ពុជា ស្របពេលដែលការប្រើប្រាស់អ៊ីនធឺណិត និងគម្រោងទីក្រុងឆ្លាតវៃកំពុងកើនឡើង។

ការបំពាក់ Edge AI នឹងជួយស្ថាប័ននានានៅកម្ពុជាក្នុងការកាត់បន្ថយចំណាយលើ Cloud Server បង្កើនសុវត្ថិភាពទិន្នន័យកម្រិតខ្ពស់ និងឆ្លើយតបទៅនឹងបញ្ហាបណ្តាញបានទាន់ពេលវេលា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃ Hybrid Deep Learning: និស្សិតគួរសិក្សាពីរបៀបផ្សំ CNN និង LSTM/GRU សម្រាប់ទិន្នន័យ Time-Series ដោយប្រើប្រាស់បណ្ណាល័យ (Libraries) ដូចជា TensorFlow ឬ PyTorch តាមរយៈវគ្គសិក្សានៅលើ Coursera ឬ Fast.ai។
  2. អនុវត្តការបង្រួមទំហំម៉ូដែល (Model Optimization): រៀនបំប្លែងម៉ូដែលធំៗទៅជាម៉ូដែលស្រាលសម្រាប់ឧបករណ៍ Edge តាមរយៈបច្ចេកទេស Quantization ដោយប្រើប្រាស់ឧបករណ៍ដូចជា TensorFlow Lite ឬ ONNX Runtime។
  3. សាកល្បងដាក់ពង្រាយលើឧបករណ៍ Edge (Edge Deployment): ធ្វើការសាកល្បងជាក់ស្តែងដោយដាក់ពង្រាយម៉ូដែលដែលបានបង្រួមទៅលើឧបករណ៍ខ្នាតតូច ដូចជា Raspberry Pi 4 ឬ NVIDIA Jetson Nano ដើម្បីវាស់ស្ទង់ Latency និង CPU Usage។
  4. សិក្សាពីការរៀនបែបវិមជ្ឈការ (Federated Learning): ស្វែងយល់ពីរបៀបបង្ហាត់ម៉ូដែលដោយមិនបាច់ប្រមូលទិន្នន័យឆៅមកកន្លែងតែមួយ ដោយប្រើប្រាស់ Framework ដូចជា TensorFlow Federated (TFF) ឬ Flower ជំនាញនេះមានតម្រូវការខ្ពស់ផ្នែក Privacy។
  5. អនុវត្តគម្រោងខ្នាតតូចក្នុងបរិវេណសាកលវិទ្យាល័យ: ប្រមូលទិន្នន័យចរាចរណ៍អ៊ីនធឺណិត (Network Traffic) ពី Wi-Fi Router របស់សាកលវិទ្យាល័យ (ដោយប្រើប្រាស់ Wireshark) ដើម្បីសាងសង់ម៉ូដែលទស្សន៍ទាយការកកស្ទះទិន្នន័យនៅម៉ោងសម្រាក។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Edge AI ការដាក់ឱ្យដំណើរការម៉ូដែលបញ្ញាសិប្បនិម្មិត (AI) នៅលើឧបករណ៍ដែលនៅក្បែរប្រភពទិន្នន័យបំផុត (ដូចជារ៉ោតទ័រ កាមេរ៉ា ឬសេនស័រ) ជាជាងការពឹងផ្អែកលើម៉ាស៊ីនមេកណ្តាល (Cloud Server) ដើម្បីកាត់បន្ថយភាពយឺតយ៉ាវនិងសន្សំសំចៃអ៊ីនធឺណិត។ ដូចជាមានចុងភៅប្រចាំការនៅក្នុងផ្ទះបាយផ្ទាល់ខ្លួនរបស់អ្នក ជាជាងត្រូវកម្ម៉ង់ម្ហូបពីភោជនីយដ្ឋានឆ្ងាយៗរាល់ពេលឃ្លាន។
Hybrid Deep Learning ការរួមបញ្ចូលគ្នានូវប្រភេទបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតពីរ ឬច្រើនប្រភេទ (ដូចជាការរួមបញ្ចូល CNN និង LSTM) ដើម្បីទាញយកអត្ថប្រយោជន៍នៃចំណុចខ្លាំងរបស់ពួកវារៀងៗខ្លួន ក្នុងការវិភាគទិន្នន័យដ៏ស្មុគស្មាញ។ ដូចជាការសហការគ្នារវាងអ្នកជំនាញគូររូប (មើលឃើញរូបរាង) និងអ្នកជំនាញប្រវត្តិសាស្ត្រ (ដឹងពីព្រឹត្តិការណ៍តាមពេលវេលា) ដើម្បីដោះស្រាយរឿងក្តីមួយ។
Convolutional Neural Networks (CNN) ប្រភេទនៃម៉ូដែលរៀនស៊ីជម្រៅដែលពូកែក្នុងការស្វែងរកលំនាំ ឬលក្ខណៈពិសេសនៅក្នុងលំហ (Spatial Features) ដូចជាការស្វែងរកទំនាក់ទំនងនៃចរាចរណ៍ទិន្នន័យរវាងឧបករណ៍ផ្សេងៗនៅក្នុងតំបន់បណ្តាញតែមួយ។ ដូចជាភ្នែកទិព្វដែលអាចមើលឃើញប្លង់រួមនៃទីក្រុងទាំងមូល ហើយដឹងភ្លាមថាតំបន់ផ្លូវណាមានឡានកកស្ទះទាក់ទងគ្នា។
Long Short-Term Memory (LSTM) ជាប្រភេទបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតម៉្យាង (RNN) ដែលមានសមត្ថភាពចងចាំទិន្នន័យក្នុងរយៈពេលវែង និងអាចទស្សន៍ទាយព្រឹត្តិការណ៍បន្ទាប់ដោយផ្អែកលើលំដាប់លំដោយនៃពេលវេលា (Temporal Features) នៃចរាចរណ៍ទិន្នន័យពីអតីតកាល។ ដូចជាមនុស្សចាស់ដែលមានបទពិសោធន៍យូរឆ្នាំ ដែលដឹងថារាល់ពេលមានមេឃខ្មៅងងឹតនិងខ្យល់ខ្លាំង (អតីតកាល) វានឹងមានភ្លៀងធ្លាក់នៅបន្តិចទៀតនេះ (អនាគត)។
Federated Learning បច្ចេកទេសបង្ហាត់ម៉ូដែល AI បែបវិមជ្ឈការ ដែលឧបករណ៍ Edge នីមួយៗរៀនពីទិន្នន័យរបស់ខ្លួន ហើយបញ្ជូនតែចំណេះដឹង (Model Updates) ទៅកាន់ម៉ាស៊ីនមេកណ្តាល ដោយមិនចាំបាច់បញ្ជូនទិន្នន័យផ្ទាល់ខ្លួនទៅឡើយ។ ដូចជាសិស្សរៀនធ្វើលំហាត់នៅផ្ទះរៀងៗខ្លួន រួចយកតែចម្លើយសរុបមកប្រាប់គ្រូ ដោយមិនចាំបាច់អោយគ្រូមើលសៀវភៅព្រាង ឬដឹងពីអាថ៌កំបាំងផ្ទាល់ខ្លួនរបស់ពួកគេឡើយ។
Quantization បច្ចេកទេសកាត់បន្ថយទំហំ និងភាពស្មុគស្មាញនៃម៉ូដែល AI តាមរយៈការបន្ថយភាពជាក់លាក់នៃតួលេខទម្ងន់ម៉ូដែល (ឧ. ពី 32-bit ទៅ 8-bit) ដើម្បីឱ្យវាអាចដំណើរការបានលឿននិងប្រើប្រាស់អង្គចងចាំតិចលើឧបករណ៍តូចៗ។ ដូចជាការបង្រួមទំហំរូបភាពពីកម្រិតច្បាស់ខ្លាំង (4K) មកត្រឹមធម្មតា (HD) ដើម្បីងាយស្រួលផ្ញើតាមទូរស័ព្ទលឿន តែនៅតែអាចមើលដឹងថារូបអ្វី។
Concept Drift បាតុភូតដែលលំនាំនៃទិន្នន័យជាក់ស្តែងផ្លាស់ប្តូរខុសពីធម្មតាតាមពេលវេលា ដែលធ្វើឱ្យម៉ូដែល AI ដែលធ្លាប់តែទស្សន៍ទាយត្រូវ លែងមានភាពត្រឹមត្រូវ ហើយទាមទារការបង្ហាត់ឡើងវិញ។ ដូចជាច្បាប់ចរាចរណ៍ត្រូវបានរដ្ឋាភិបាលផ្លាស់ប្តូរថ្មី ដូច្នេះអ្នកបើកបរចាស់ៗត្រូវតែរៀនច្បាប់នោះឡើងវិញ ដើម្បីកុំឱ្យបើកបរខុសច្បាប់។
Latency ពេលវេលាដែលត្រូវប្រើប្រាស់ដើម្បីបញ្ជូនទិន្នន័យពីប្រភពមួយទៅកាន់ប្រព័ន្ធដំណើរការកណ្តាល រួចទទួលបានការឆ្លើយតបមកវិញ ដែលនៅក្នុងប្រព័ន្ធបណ្តាញទំនើប គេត្រូវតែធ្វើឲ្យពេលវេលានេះខ្លីបំផុត (Low Latency)។ ដូចជាពេលវេលារង់ចាំតាំងពីពេលដែលអ្នកចុចបញ្ជូនសារទៅកាន់មិត្តភក្តិ រហូតដល់ពេលដែលអ្នកទទួលបានសារតបវិញភ្លាមៗ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖