Original Title: Edge AI: Challenges and Opportunities in Real-Time Processing
Source: www.researchgate.net
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

បញ្ញាសិប្បនិម្មិតនៅគែមបណ្តាញ (Edge AI)៖ បញ្ហាប្រឈម និងឱកាសក្នុងដំណើរការទិន្នន័យជាក់ស្តែង

ចំណងជើងដើម៖ Edge AI: Challenges and Opportunities in Real-Time Processing

អ្នកនិពន្ធ៖ Andrei McCall (Ladoke Akintola University of Technology)

ឆ្នាំបោះពុម្ព៖ 2025

វិស័យសិក្សា៖ Computer Science

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហាប្រឈមក្នុងការដាក់ពង្រាយបញ្ញាសិប្បនិម្មិត (AI) លើឧបករណ៍ដែលមានធនធានមានកំណត់ (Edge devices) ដើម្បីកាត់បន្ថយការពន្យារពេល ធានាឯកជនភាពទិន្នន័យ និងកាត់បន្ថយការពឹងផ្អែកលើប្រព័ន្ធក្លោដ (Cloud) សម្រាប់ដំណើរការជាក់ស្តែង។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះធ្វើការពិនិត្យឡើងវិញយ៉ាងទូលំទូលាយអំពីស្ថាបត្យកម្ម Edge AI និងវិភាគលើបច្ចេកវិទ្យាគាំទ្រ ព្រមទាំងករណីសិក្សាជាក់ស្តែងក្នុងឧស្សាហកម្មនានា។

ការវាយតម្លៃលើបច្ចេកវិទ្យាគាំទ្រ ដូចជាការបង្រួមម៉ូដែល (Model Compression) និងឧបករណ៍បង្កើនល្បឿនផ្នែករឹង (Hardware Accelerators)
ការវិភាគលើនិន្នាការថ្មីៗ ដូចជា TinyML, ការរៀនបែបសហការ (Federated Learning) និងកុំព្យូទ័រ Neuromorphic (Neuromorphic Computing)
ការពិនិត្យលើករណីសិក្សា (Case Studies) ក្នុងវិស័យយានយន្តស្វ័យប្រវត្តិ សុខាភិបាលកសិកម្មឆ្លាតវៃ និង IoT ឧស្សាហកម្ម

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ការប្រើប្រាស់ឧបករណ៍បង្កើនល្បឿន និងការបង្រួមម៉ូដែលជួយឱ្យសម្រេចបានល្បឿនវិភាគក្រោម 30 មីលីវិនាទី (sub-30 ms) សម្រាប់ការសម្គាល់ផ្ទៃមុខជាក់ស្តែង ដោយរក្សាបានភាពត្រឹមត្រូវ 97%។
បច្ចេកវិទ្យា TinyML អនុញ្ញាតឱ្យដំណើរការម៉ូដែល AI លើឧបករណ៍ចាប់សញ្ញាដែលមានកម្រិតថាមពលទាបខ្លាំង (ក្រោម 1 mW) សម្រាប់ការថែទាំបែបព្យាករណ៍ (Predictive Maintenance)។
ការស្រាវជ្រាវនាពេលអនាគតត្រូវផ្តោតសំខាន់លើស្ថាបត្យកម្មដែលដឹងពីផ្នែករឹង (Hardware-aware NAS), ការបន្សាំម៉ូដែលជាបន្តបន្ទាប់ដោយមិនពឹងផ្អែកលើក្លោដ (Continual learning) និងនិរន្តរភាពថាមពល (Green Edge AI)។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Cloud-based AI បញ្ញាសិប្បនិម្មិតលើប្រព័ន្ធក្លោដ (Cloud-based AI)	មានសមត្ថភាពគណនាខ្ពស់ និងអាចដំណើរការម៉ូដែល AI ដែលមានទំហំធំ និងស្មុគស្មាញបានយ៉ាងល្អ។	ទាមទារការភ្ជាប់អ៊ីនធឺណិតជានិច្ច មានការពន្យារពេលខ្ពស់ (Latency) ស៊ីកម្រិតបញ្ជូនទិន្នន័យច្រើន និងប្រឈមនឹងបញ្ហាឯកជនភាព។	មិនស័ក្តិសមសម្រាប់កម្មវិធីដែលត្រូវការការឆ្លើយតបលឿនបំផុត (Ultra-low-latency) និងឯកជនភាពខ្ពស់នោះទេ។
Edge AI with Hardware Accelerators Edge AI ជាមួយឧបករណ៍បង្កើនល្បឿនផ្នែករឹង	អាចដំណើរការទិន្នន័យជាក់ស្តែងបានលឿនបំផុត (Sub-30ms) រក្សាឯកជនភាពទិន្នន័យនៅនឹងកន្លែង និងកាត់បន្ថយការពឹងផ្អែកលើអ៊ីនធឺណិត។	ទាមទារឧបករណ៍ផ្នែករឹងដែលមានតម្លៃរាងខ្ពស់បន្តិច (ដូចជា Jetson Nano ឬ Google Coral) និងស៊ីថាមពលច្រើនជាង Microcontrollers។	សម្រេចបានល្បឿនវិភាគក្រោម 30 មីលីវិនាទី ជាមួយនឹងភាពត្រឹមត្រូវ 97% (សម្រាប់ការសម្គាល់ផ្ទៃមុខ)។
TinyML on Microcontrollers TinyML លើឧបករណ៍បញ្ជាខ្នាតតូច (Microcontrollers)	ស៊ីថាមពលតិចតួចបំផុត (ក្រោម 1 mW) ស័ក្តិសមសម្រាប់ឧបករណ៍ដើរដោយថ្ម និងមានតម្លៃថោកសម្រាប់ការដាក់ពង្រាយទ្រង់ទ្រាយធំ។	មានដែនកំណត់ខ្លាំងលើទំហំអង្គចងចាំ (RAM) និងកម្លាំងម៉ាស៊ីន ដែលតម្រូវឱ្យមានការបង្រួមម៉ូដែល (Quantization) យ៉ាងតឹងរ៉ឹង។	ប្រើប្រាស់ថាមពលតិចជាង 1 mW សម្រាប់ការតាមដាន និងរកឃើញភាពមិនប្រក្រតីនៃរំញ័រម៉ាស៊ីន (Predictive Maintenance)។

ការចំណាយលើធនធាន (Resource Cost)៖ ដំណើរការប្រព័ន្ធ Edge AI ទាមទារការវិនិយោគលើឧបករណ៍ផ្នែករឹង (Hardware) ជាក់លាក់ និងចំណេះដឹងលើការបង្រួមម៉ូដែល ទោះបីជាវាជួយកាត់បន្ថយថ្លៃចំណាយប្រចាំខែលើការប្រើប្រាស់ Cloud ក៏ដោយ។

Hardware: ឧបករណ៍បង្កើនល្បឿន AI ដូចជា Google Coral Edge TPU, NVIDIA Jetson Nano, FPGAs ឬ Microcontrollers ដែលស៊ីភ្លើងតិច (ESP32, STM32, RISC-V)។
Software: ក្របខ័ណ្ឌ (Frameworks) ដែលបានកាត់បន្ថយទំហំសម្រាប់ការប្រើប្រាស់លើឧបករណ៍តូចៗ ដូចជា TensorFlow Lite, PyTorch Mobile, OpenVINO, និង ONNX Runtime។
Expertise: ទាមទារអ្នកជំនាញដែលមានចំណេះដឹងក្នុងការបង្រួមម៉ូដែល (Model Compression ដូចជា Quantization និង Pruning) និងការបង្កើនប្រសិទ្ធភាពកូដកម្រិតទាប (Hardware-software co-optimization)។
Networking: បណ្តាញតភ្ជាប់សម្រាប់ Edge-Cloud ដូចជា 5G សម្រាប់ការបញ្ជូនទិន្នន័យលឿន ឬ LoRa networks សម្រាប់ប្រព័ន្ធ IoT ដែលប្រើប្រាស់ថាមពលទាបនៅក្នុងរោងចក្រ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ឯកសារនេះផ្តល់ជាទិដ្ឋភាពទូទៅនៃបច្ចេកវិទ្យា Edge AI ដោយលើកយកករណីសិក្សាទូទាំងពិភពលោក តែមិនបានបញ្ជាក់ពីសំណុំទិន្នន័យ (Dataset) ជាក់លាក់នោះទេ។ សម្រាប់ប្រទេសកម្ពុជា ការធានាថាម៉ូដែល AI ត្រូវបានបង្ហាត់លើទិន្នន័យក្នុងស្រុក (ឧទាហរណ៍៖ សម្បុរមុខខ្មែរ ភាសាខ្មែរ ឬលក្ខខណ្ឌអាកាសធាតុស្រុកយើង) គឺមានសារៈសំខាន់ណាស់ ដើម្បីចៀសវាងភាពលម្អៀង និងធានាភាពត្រឹមត្រូវក្នុងបរិបទជាក់ស្តែង។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកវិទ្យា Edge AI គឺមានសក្តានុពលខ្លាំង និងស័ក្តិសមបំផុតសម្រាប់ការដោះស្រាយបញ្ហាហេដ្ឋារចនាសម្ព័ន្ធបណ្តាញខ្សោយ និងជំរុញឧស្សាហកម្មនៅប្រទេសកម្ពុជា។

វិស័យកសិកម្មឆ្លាតវៃ (តំបន់ខេត្តបាត់ដំបង និងកំពង់ធំ): ការប្រើប្រាស់ Drone បំពាក់ដោយបច្ចេកវិទ្យា Edge AI ដើម្បីពិនិត្យមើលសុខភាពដំណាំ និងរកមើលសត្វល្អិតបំផ្លាញក្នុងពេលជាក់ស្តែង ដោយមិនចាំបាច់ពឹងផ្អែកលើសេវាអ៊ីនធឺណិតដែលខ្សោយនៅតំបន់ជនបទ។
ការគ្រប់គ្រងចរាចរណ៍ (រាជធានីភ្នំពេញ): ការដាក់ពង្រាយកាមេរ៉ាសុវត្ថិភាព Edge AI នៅតាមស្តុបចរាចរណ៍ ដើម្បីរាប់ចំនួនយានយន្ត និងកែសម្រួលភ្លើងស្តុបដោយស្វ័យប្រវត្តិ ដែលជួយកាត់បន្ថយការកកស្ទះ និងសន្សំសំចៃទំហំបញ្ជូនទិន្នន័យទៅ Cloud ដល់ទៅ ៧៥%។
ឧស្សាហកម្មកាត់ដេរ (Garment and Manufacturing Industry): ការប្រើប្រាស់បច្ចេកវិទ្យា TinyML បំពាក់លើម៉ាស៊ីនដេរ ឬម៉ាស៊ីនខ្នាតធំ ដើម្បីត្រួតពិនិត្យរំញ័រ និងរាយការណ៍ពីការខូចខាតមុនពេលវាចល័ត (Predictive Maintenance) ដែលជួយសន្សំសំចៃពេលវេលានិងថវិកាក្នុងចង្វាក់ផលិតកម្ម។

សរុបមក Edge AI ផ្តល់នូវដំណោះស្រាយឆ្លាតវៃដែលកាត់បន្ថយការចំណាយលើអ៊ីនធឺណិត រក្សាឯកជនភាព និងឆ្លើយតបលឿន ដែលជាកាតាលីករដ៏សំខាន់សម្រាប់ជំរុញសេដ្ឋកិច្ចឌីជីថលកម្ពុជា ជាពិសេសក្នុងតំបន់ដាច់ស្រយាល។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាស្វែងយល់ពីមូលដ្ឋានគ្រឹះនៃ Edge AI និង TinyML: និស្សិតគប្បីចាប់ផ្តើមរៀនពីរបៀបដំណើរការម៉ូដែល Machine Learning នៅលើឧបករណ៍តូចៗ ដោយធ្វើការអនុវត្តផ្ទាល់ជាមួយនឹងឧបករណ៍ (frameworks) ដូចជា TensorFlow Lite និង PyTorch Mobile។
សាកល្បងអនុវត្តជាមួយឧបករណ៍ផ្នែករឹងខ្នាតតូច: ធ្វើការបញ្ជាទិញឧបករណ៍ដែលមានតម្លៃសមរម្យដូចជា ESP32, Raspberry Pi, ឬ Arduino Nano 33 BLE Sense ដើម្បីសាកល្បងដំណើរការកម្មវិធីងាយៗ ដូចជាការសម្គាល់សម្លេង ឬការចាប់សញ្ញាចលនា (Gesture Recognition) ដោយប្រើប្រាស់ TensorFlow Lite Micro។
សិក្សាឱ្យស៊ីជម្រៅលើបច្ចេកទេសបង្រួមម៉ូដែល (Model Compression): រៀនពីបច្ចេកទេសកាត់បន្ថយទំហំម៉ូដែល AI ដូចជាការធ្វើ Quantization (បំប្លែងពី FP32 ទៅ INT8) និង Pruning ដើម្បីបង្កើនល្បឿនដំណើរការ និងសន្សំសំចៃថ្ម ដោយប្រើឧបករណ៍ដូចជា Apache TVM ឬ ONNX Runtime។
អភិវឌ្ឍគម្រោងស្រាវជ្រាវផ្ទាល់ខ្លួនសម្រាប់បរិបទកម្ពុជា: ប្រើប្រាស់កាមេរ៉ាភ្ជាប់ជាមួយ Google Coral Edge TPU ឬ NVIDIA Jetson Nano ដើម្បីបង្កើតគម្រោងជាក់ស្តែង ឧទាហរណ៍៖ ប្រព័ន្ធអានស្លាកលេខរថយន្តកម្ពុជាដោយស្វ័យប្រវត្តិ ឬប្រព័ន្ធតាមដានសុខភាពដំណាំស្រូវ ដែលដំណើរការដោយមិនពឹងផ្អែកលើអ៊ីនធឺណិត។
ស្វែងយល់ពីការរៀនបែបសហការ និងសុវត្ថិភាព (Federated Learning): បន្តការស្រាវជ្រាវលើបច្ចេកវិទ្យា Federated Learning (FL) ដើម្បីយល់ពីរបៀបដែលឧបករណ៍ Edge ជាច្រើនអាចសហការគ្នាបង្រៀនម៉ូដែល AI តែមួយដោយមិនចាំបាច់បញ្ជូនទិន្នន័យឯកជនទៅកាន់ម៉ាស៊ីនមេ (Cloud) ដែលជួយពង្រឹងសុវត្ថិភាពទិន្នន័យ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Edge AI	បច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិតដែលដំណើរការការវិភាគ និងកាត់សេចក្តីទិន្នន័យដោយផ្ទាល់នៅលើឧបករណ៍ចុងកាត់ (ដូចជាកាមេរ៉ាសុវត្ថិភាព ទូរស័ព្ទដៃ ឬសេនស័រ) ដោយមិនចាំបាច់បញ្ជូនទិន្នន័យទាំងអស់ទៅកាន់ម៉ាស៊ីនមេ (Cloud) នោះទេ ដែលជួយកាត់បន្ថយការពន្យារពេល និងការពារឯកជនភាព។	ដូចជាការមានខួរក្បាលគិតផ្ទាល់នៅនឹងភ្នែកឬត្រចៀករបស់អ្នក ជាជាងត្រូវបញ្ជូនរាល់ព័ត៌មានទៅប្រាប់អ្នកផ្សេងឱ្យជួយគិតជំនួស។
Model Compression	បច្ចេកទេសកាត់បន្ថយទំហំ និងភាពស្មុគស្មាញនៃម៉ូដែល AI តាមរយៈវិធីសាស្រ្តដូចជា Quantization ឬ Pruning ដើម្បីធ្វើឱ្យវាតូចល្មមអាចដំណើរការបាននៅលើឧបករណ៍ដែលមានអង្គចងចាំ (RAM) និងថាមពលមានកម្រិតខ្លាំង។	ដូចជាការបង្រួមឯកសារវីដេអូធំៗឱ្យតូច ដើម្បីអាចផ្ញើតាមទូរស័ព្ទបានលឿន ដោយមិនសូវបាត់បង់គុណភាព។
Federated Learning	វិធីសាស្ត្របង្រៀនម៉ូដែល AI ដែលអនុញ្ញាតឱ្យឧបករណ៍ជាច្រើន (ឧទាហរណ៍ ទូរស័ព្ទរាប់ពាន់គ្រឿង) ធ្វើការរៀនសូត្រពីទិន្នន័យរៀងៗខ្លួន ហើយបញ្ជូនតែចំណេះដឹងដែលរៀនបានថ្មីៗ (Model updates) ទៅកាន់ម៉ាស៊ីនមេ ដោយរក្សាទុកទិន្នន័យដើមនៅលើឧបករណ៍ផ្ទាល់ខ្លួនដដែល។	ដូចជាសិស្សរៀនធ្វើលំហាត់នៅផ្ទះរៀងៗខ្លួន រួចយកតែចម្លើយសរុបមកប្រាប់គ្រូ ដោយមិនចាំបាច់យកសៀវភៅព្រាងមកបង្ហាញគ្រូទាំងអស់នោះទេ។
TinyML	សាខាមួយនៃបច្ចេកវិទ្យា Machine Learning ដែលផ្តោតលើការបង្ហាត់ និងដំណើរការម៉ូដែល AI នៅលើឧបករណ៍ Microcontrollers ខ្នាតតូចបំផុត ដែលស៊ីភ្លើងតិចជាង 1 មីលីវ៉ាត់ (1 mW) និងមានអង្គចងចាំត្រឹមតែទំហំគីឡូបៃ (KB)។	ដូចជាការបំពាក់កម្មវិធីឆ្លាតវៃទៅក្នុងនាឡិកាដៃខ្នាតតូចដែលអាចចាប់សញ្ញាជីពចរអ្នកបាន ដោយប្រើថ្មពិលតូចមួយអស់រាប់ខែ។
Neuromorphic Computing	ប្រព័ន្ធកុំព្យូទ័រដែលត្រូវបានរចនាឡើងដោយយកគំរូតាមរចនាសម្ព័ន្ធ និងដំណើរការនៃកោសិកាខួរក្បាលមនុស្សពិតៗ (Spiking Neural Networks) ដើម្បីសន្សំសំចៃថាមពលកម្រិតខ្ពស់ និងដំណើរការទិន្នន័យប្រភេទព្រឹត្តិការណ៍ (Event-driven) បានលឿនក្នុងពេលជាក់ស្តែង។	ដូចជាការសាងសង់ម៉ាស៊ីនដោយចម្លងតាមរបៀបដែលកោសិកាខួរក្បាលមនុស្សធ្វើការផ្ទាល់ ដើម្បីឱ្យវាគិតបានលឿននិងមិនសូវស៊ីភ្លើង។
Quantization	ដំណើរការបំប្លែងទិន្នន័យតួលេខនៃម៉ូដែល AI ពីទម្រង់ដែលមានភាពសុក្រឹតខ្ពស់ (ឧទាហរណ៍ ទសភាគ 32-bit) ទៅជាទម្រង់ទាប (ឧទាហរណ៍ ចំនួនគត់ 8-bit) ដើម្បីជួយឱ្យការគណនាលឿនជាងមុន និងស៊ីអង្គចងចាំតិច ដោយរក្សាភាពត្រឹមត្រូវប្រហាក់ប្រហែលដើម។	ដូចជាការបង្គត់តួលេខ 10.456 ទៅជា 10 ដើម្បីងាយស្រួលគិតលេខរហ័សក្នុងខួរក្បាល។
Hardware-Aware Neural Architecture Search (NAS)	ប្រព័ន្ធស្វែងរក និងបង្កើតរចនាសម្ព័ន្ធម៉ូដែល AI ដោយស្វ័យប្រវត្តិ ដែលគិតគូរជាមុនអំពីល្បឿន ថាមពល និងសមត្ថភាពរបស់ឧបករណ៍ផ្នែករឹង (Hardware) ជាក់លាក់ណាមួយ ដែលម៉ូដែលនោះនឹងត្រូវយកទៅដាក់ឱ្យដំណើរការ។	ដូចជាអ្នកម៉ៅការសាងសង់ផ្ទះដែលរចនាប្លង់ផ្ទះដោយគិតគូរជាស្រេចពីទំហំដី កម្លាំងកម្មករ និងថវិកាដែលគាត់មានក្នុងដៃជាក់ស្តែង។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖