Original Title: Edge AI: Challenges and Opportunities in Real-Time Processing
Source: www.researchgate.net
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

បញ្ញាសិប្បនិម្មិតនៅគែមបណ្តាញ (Edge AI)៖ បញ្ហាប្រឈម និងឱកាសក្នុងដំណើរការទិន្នន័យជាក់ស្តែង

ចំណងជើងដើម៖ Edge AI: Challenges and Opportunities in Real-Time Processing

អ្នកនិពន្ធ៖ Andrei McCall (Ladoke Akintola University of Technology)

ឆ្នាំបោះពុម្ព៖ 2025

វិស័យសិក្សា៖ Computer Science

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហាប្រឈមក្នុងការដាក់ពង្រាយបញ្ញាសិប្បនិម្មិត (AI) លើឧបករណ៍ដែលមានធនធានមានកំណត់ (Edge devices) ដើម្បីកាត់បន្ថយការពន្យារពេល ធានាឯកជនភាពទិន្នន័យ និងកាត់បន្ថយការពឹងផ្អែកលើប្រព័ន្ធក្លោដ (Cloud) សម្រាប់ដំណើរការជាក់ស្តែង។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះធ្វើការពិនិត្យឡើងវិញយ៉ាងទូលំទូលាយអំពីស្ថាបត្យកម្ម Edge AI និងវិភាគលើបច្ចេកវិទ្យាគាំទ្រ ព្រមទាំងករណីសិក្សាជាក់ស្តែងក្នុងឧស្សាហកម្មនានា។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Cloud-based AI
បញ្ញាសិប្បនិម្មិតលើប្រព័ន្ធក្លោដ (Cloud-based AI)
មានសមត្ថភាពគណនាខ្ពស់ និងអាចដំណើរការម៉ូដែល AI ដែលមានទំហំធំ និងស្មុគស្មាញបានយ៉ាងល្អ។ ទាមទារការភ្ជាប់អ៊ីនធឺណិតជានិច្ច មានការពន្យារពេលខ្ពស់ (Latency) ស៊ីកម្រិតបញ្ជូនទិន្នន័យច្រើន និងប្រឈមនឹងបញ្ហាឯកជនភាព។ មិនស័ក្តិសមសម្រាប់កម្មវិធីដែលត្រូវការការឆ្លើយតបលឿនបំផុត (Ultra-low-latency) និងឯកជនភាពខ្ពស់នោះទេ។
Edge AI with Hardware Accelerators
Edge AI ជាមួយឧបករណ៍បង្កើនល្បឿនផ្នែករឹង
អាចដំណើរការទិន្នន័យជាក់ស្តែងបានលឿនបំផុត (Sub-30ms) រក្សាឯកជនភាពទិន្នន័យនៅនឹងកន្លែង និងកាត់បន្ថយការពឹងផ្អែកលើអ៊ីនធឺណិត។ ទាមទារឧបករណ៍ផ្នែករឹងដែលមានតម្លៃរាងខ្ពស់បន្តិច (ដូចជា Jetson Nano ឬ Google Coral) និងស៊ីថាមពលច្រើនជាង Microcontrollers។ សម្រេចបានល្បឿនវិភាគក្រោម 30 មីលីវិនាទី ជាមួយនឹងភាពត្រឹមត្រូវ 97% (សម្រាប់ការសម្គាល់ផ្ទៃមុខ)។
TinyML on Microcontrollers
TinyML លើឧបករណ៍បញ្ជាខ្នាតតូច (Microcontrollers)
ស៊ីថាមពលតិចតួចបំផុត (ក្រោម 1 mW) ស័ក្តិសមសម្រាប់ឧបករណ៍ដើរដោយថ្ម និងមានតម្លៃថោកសម្រាប់ការដាក់ពង្រាយទ្រង់ទ្រាយធំ។ មានដែនកំណត់ខ្លាំងលើទំហំអង្គចងចាំ (RAM) និងកម្លាំងម៉ាស៊ីន ដែលតម្រូវឱ្យមានការបង្រួមម៉ូដែល (Quantization) យ៉ាងតឹងរ៉ឹង។ ប្រើប្រាស់ថាមពលតិចជាង 1 mW សម្រាប់ការតាមដាន និងរកឃើញភាពមិនប្រក្រតីនៃរំញ័រម៉ាស៊ីន (Predictive Maintenance)។

ការចំណាយលើធនធាន (Resource Cost)៖ ដំណើរការប្រព័ន្ធ Edge AI ទាមទារការវិនិយោគលើឧបករណ៍ផ្នែករឹង (Hardware) ជាក់លាក់ និងចំណេះដឹងលើការបង្រួមម៉ូដែល ទោះបីជាវាជួយកាត់បន្ថយថ្លៃចំណាយប្រចាំខែលើការប្រើប្រាស់ Cloud ក៏ដោយ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ឯកសារនេះផ្តល់ជាទិដ្ឋភាពទូទៅនៃបច្ចេកវិទ្យា Edge AI ដោយលើកយកករណីសិក្សាទូទាំងពិភពលោក តែមិនបានបញ្ជាក់ពីសំណុំទិន្នន័យ (Dataset) ជាក់លាក់នោះទេ។ សម្រាប់ប្រទេសកម្ពុជា ការធានាថាម៉ូដែល AI ត្រូវបានបង្ហាត់លើទិន្នន័យក្នុងស្រុក (ឧទាហរណ៍៖ សម្បុរមុខខ្មែរ ភាសាខ្មែរ ឬលក្ខខណ្ឌអាកាសធាតុស្រុកយើង) គឺមានសារៈសំខាន់ណាស់ ដើម្បីចៀសវាងភាពលម្អៀង និងធានាភាពត្រឹមត្រូវក្នុងបរិបទជាក់ស្តែង។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកវិទ្យា Edge AI គឺមានសក្តានុពលខ្លាំង និងស័ក្តិសមបំផុតសម្រាប់ការដោះស្រាយបញ្ហាហេដ្ឋារចនាសម្ព័ន្ធបណ្តាញខ្សោយ និងជំរុញឧស្សាហកម្មនៅប្រទេសកម្ពុជា។

សរុបមក Edge AI ផ្តល់នូវដំណោះស្រាយឆ្លាតវៃដែលកាត់បន្ថយការចំណាយលើអ៊ីនធឺណិត រក្សាឯកជនភាព និងឆ្លើយតបលឿន ដែលជាកាតាលីករដ៏សំខាន់សម្រាប់ជំរុញសេដ្ឋកិច្ចឌីជីថលកម្ពុជា ជាពិសេសក្នុងតំបន់ដាច់ស្រយាល។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាស្វែងយល់ពីមូលដ្ឋានគ្រឹះនៃ Edge AI និង TinyML: និស្សិតគប្បីចាប់ផ្តើមរៀនពីរបៀបដំណើរការម៉ូដែល Machine Learning នៅលើឧបករណ៍តូចៗ ដោយធ្វើការអនុវត្តផ្ទាល់ជាមួយនឹងឧបករណ៍ (frameworks) ដូចជា TensorFlow Lite និង PyTorch Mobile
  2. សាកល្បងអនុវត្តជាមួយឧបករណ៍ផ្នែករឹងខ្នាតតូច: ធ្វើការបញ្ជាទិញឧបករណ៍ដែលមានតម្លៃសមរម្យដូចជា ESP32, Raspberry Pi, ឬ Arduino Nano 33 BLE Sense ដើម្បីសាកល្បងដំណើរការកម្មវិធីងាយៗ ដូចជាការសម្គាល់សម្លេង ឬការចាប់សញ្ញាចលនា (Gesture Recognition) ដោយប្រើប្រាស់ TensorFlow Lite Micro
  3. សិក្សាឱ្យស៊ីជម្រៅលើបច្ចេកទេសបង្រួមម៉ូដែល (Model Compression): រៀនពីបច្ចេកទេសកាត់បន្ថយទំហំម៉ូដែល AI ដូចជាការធ្វើ Quantization (បំប្លែងពី FP32 ទៅ INT8) និង Pruning ដើម្បីបង្កើនល្បឿនដំណើរការ និងសន្សំសំចៃថ្ម ដោយប្រើឧបករណ៍ដូចជា Apache TVMONNX Runtime
  4. អភិវឌ្ឍគម្រោងស្រាវជ្រាវផ្ទាល់ខ្លួនសម្រាប់បរិបទកម្ពុជា: ប្រើប្រាស់កាមេរ៉ាភ្ជាប់ជាមួយ Google Coral Edge TPUNVIDIA Jetson Nano ដើម្បីបង្កើតគម្រោងជាក់ស្តែង ឧទាហរណ៍៖ ប្រព័ន្ធអានស្លាកលេខរថយន្តកម្ពុជាដោយស្វ័យប្រវត្តិ ឬប្រព័ន្ធតាមដានសុខភាពដំណាំស្រូវ ដែលដំណើរការដោយមិនពឹងផ្អែកលើអ៊ីនធឺណិត។
  5. ស្វែងយល់ពីការរៀនបែបសហការ និងសុវត្ថិភាព (Federated Learning): បន្តការស្រាវជ្រាវលើបច្ចេកវិទ្យា Federated Learning (FL) ដើម្បីយល់ពីរបៀបដែលឧបករណ៍ Edge ជាច្រើនអាចសហការគ្នាបង្រៀនម៉ូដែល AI តែមួយដោយមិនចាំបាច់បញ្ជូនទិន្នន័យឯកជនទៅកាន់ម៉ាស៊ីនមេ (Cloud) ដែលជួយពង្រឹងសុវត្ថិភាពទិន្នន័យ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Edge AI បច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិតដែលដំណើរការការវិភាគ និងកាត់សេចក្តីទិន្នន័យដោយផ្ទាល់នៅលើឧបករណ៍ចុងកាត់ (ដូចជាកាមេរ៉ាសុវត្ថិភាព ទូរស័ព្ទដៃ ឬសេនស័រ) ដោយមិនចាំបាច់បញ្ជូនទិន្នន័យទាំងអស់ទៅកាន់ម៉ាស៊ីនមេ (Cloud) នោះទេ ដែលជួយកាត់បន្ថយការពន្យារពេល និងការពារឯកជនភាព។ ដូចជាការមានខួរក្បាលគិតផ្ទាល់នៅនឹងភ្នែកឬត្រចៀករបស់អ្នក ជាជាងត្រូវបញ្ជូនរាល់ព័ត៌មានទៅប្រាប់អ្នកផ្សេងឱ្យជួយគិតជំនួស។
Model Compression បច្ចេកទេសកាត់បន្ថយទំហំ និងភាពស្មុគស្មាញនៃម៉ូដែល AI តាមរយៈវិធីសាស្រ្តដូចជា Quantization ឬ Pruning ដើម្បីធ្វើឱ្យវាតូចល្មមអាចដំណើរការបាននៅលើឧបករណ៍ដែលមានអង្គចងចាំ (RAM) និងថាមពលមានកម្រិតខ្លាំង។ ដូចជាការបង្រួមឯកសារវីដេអូធំៗឱ្យតូច ដើម្បីអាចផ្ញើតាមទូរស័ព្ទបានលឿន ដោយមិនសូវបាត់បង់គុណភាព។
Federated Learning វិធីសាស្ត្របង្រៀនម៉ូដែល AI ដែលអនុញ្ញាតឱ្យឧបករណ៍ជាច្រើន (ឧទាហរណ៍ ទូរស័ព្ទរាប់ពាន់គ្រឿង) ធ្វើការរៀនសូត្រពីទិន្នន័យរៀងៗខ្លួន ហើយបញ្ជូនតែចំណេះដឹងដែលរៀនបានថ្មីៗ (Model updates) ទៅកាន់ម៉ាស៊ីនមេ ដោយរក្សាទុកទិន្នន័យដើមនៅលើឧបករណ៍ផ្ទាល់ខ្លួនដដែល។ ដូចជាសិស្សរៀនធ្វើលំហាត់នៅផ្ទះរៀងៗខ្លួន រួចយកតែចម្លើយសរុបមកប្រាប់គ្រូ ដោយមិនចាំបាច់យកសៀវភៅព្រាងមកបង្ហាញគ្រូទាំងអស់នោះទេ។
TinyML សាខាមួយនៃបច្ចេកវិទ្យា Machine Learning ដែលផ្តោតលើការបង្ហាត់ និងដំណើរការម៉ូដែល AI នៅលើឧបករណ៍ Microcontrollers ខ្នាតតូចបំផុត ដែលស៊ីភ្លើងតិចជាង 1 មីលីវ៉ាត់ (1 mW) និងមានអង្គចងចាំត្រឹមតែទំហំគីឡូបៃ (KB)។ ដូចជាការបំពាក់កម្មវិធីឆ្លាតវៃទៅក្នុងនាឡិកាដៃខ្នាតតូចដែលអាចចាប់សញ្ញាជីពចរអ្នកបាន ដោយប្រើថ្មពិលតូចមួយអស់រាប់ខែ។
Neuromorphic Computing ប្រព័ន្ធកុំព្យូទ័រដែលត្រូវបានរចនាឡើងដោយយកគំរូតាមរចនាសម្ព័ន្ធ និងដំណើរការនៃកោសិកាខួរក្បាលមនុស្សពិតៗ (Spiking Neural Networks) ដើម្បីសន្សំសំចៃថាមពលកម្រិតខ្ពស់ និងដំណើរការទិន្នន័យប្រភេទព្រឹត្តិការណ៍ (Event-driven) បានលឿនក្នុងពេលជាក់ស្តែង។ ដូចជាការសាងសង់ម៉ាស៊ីនដោយចម្លងតាមរបៀបដែលកោសិកាខួរក្បាលមនុស្សធ្វើការផ្ទាល់ ដើម្បីឱ្យវាគិតបានលឿននិងមិនសូវស៊ីភ្លើង។
Quantization ដំណើរការបំប្លែងទិន្នន័យតួលេខនៃម៉ូដែល AI ពីទម្រង់ដែលមានភាពសុក្រឹតខ្ពស់ (ឧទាហរណ៍ ទសភាគ 32-bit) ទៅជាទម្រង់ទាប (ឧទាហរណ៍ ចំនួនគត់ 8-bit) ដើម្បីជួយឱ្យការគណនាលឿនជាងមុន និងស៊ីអង្គចងចាំតិច ដោយរក្សាភាពត្រឹមត្រូវប្រហាក់ប្រហែលដើម។ ដូចជាការបង្គត់តួលេខ 10.456 ទៅជា 10 ដើម្បីងាយស្រួលគិតលេខរហ័សក្នុងខួរក្បាល។
Hardware-Aware Neural Architecture Search (NAS) ប្រព័ន្ធស្វែងរក និងបង្កើតរចនាសម្ព័ន្ធម៉ូដែល AI ដោយស្វ័យប្រវត្តិ ដែលគិតគូរជាមុនអំពីល្បឿន ថាមពល និងសមត្ថភាពរបស់ឧបករណ៍ផ្នែករឹង (Hardware) ជាក់លាក់ណាមួយ ដែលម៉ូដែលនោះនឹងត្រូវយកទៅដាក់ឱ្យដំណើរការ។ ដូចជាអ្នកម៉ៅការសាងសង់ផ្ទះដែលរចនាប្លង់ផ្ទះដោយគិតគូរជាស្រេចពីទំហំដី កម្លាំងកម្មករ និងថវិកាដែលគាត់មានក្នុងដៃជាក់ស្តែង។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖