Original Title: Key Considerations for Real-Time Object Recognition on Edge Computing Devices
Source: doi.org/10.3390/app15137533
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការពិចារណាសំខាន់ៗសម្រាប់ការសម្គាល់វត្ថុក្នុងពេលវេលាជាក់ស្តែងនៅលើឧបករណ៍ Edge Computing

ចំណងជើងដើម៖ Key Considerations for Real-Time Object Recognition on Edge Computing Devices

អ្នកនិពន្ធ៖ Nico Surantha (Tokyo City University, Japan), Nana Sutisna (Institut Teknologi Bandung, Indonesia)

ឆ្នាំបោះពុម្ព៖ 2025 (Appl. Sci.)

វិស័យសិក្សា៖ Computer Science / Artificial Intelligence

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការកើនឡើងនៃឧបករណ៍ IoT ទាមទារឱ្យមានដំណើរការទិន្នន័យ និងការសម្គាល់វត្ថុក្នុងពេលវេលាជាក់ស្តែងនៅជាយបណ្ដាញ (Network Edge) ប៉ុន្តែវិធីសាស្ត្រផ្អែកលើក្លោដ (Cloud-based) បែបប្រពៃណីតែងជួបប្រទះបញ្ហាប្រឈមទាក់ទងនឹងភាពយឺតយ៉ាវ កម្រិតបញ្ជូនទិន្នន័យ និងការរក្សាឯកជនភាព។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះធ្វើការត្រួតពិនិត្យយ៉ាងទូលំទូលាយអំពីការរួមបញ្ចូលបញ្ញាសិប្បនិម្មិត (Edge AI) និងវាយតម្លៃលើករណីសិក្សាជាក់ស្តែងស្តីពីការត្រួតពិនិត្យខ្សែបញ្ជូនថាមពល ដោយប្រើប្រាស់ឧបករណ៍ Edge និងម៉ូដែល Deep Learning ធុនស្រាលផ្សេងៗ។

ការសិក្សាស្រាវជ្រាវអំពីឧបករណ៍ Edge ក្របខ័ណ្ឌការងារ ម៉ូដែលធុនស្រាល និងការធ្វើឱ្យប្រសើរផ្នែករឹង (Hardware Optimizations)
ការវាយតម្លៃករណីសិក្សាដោយប្រើម៉ូដែល YOLOv7 និង Tiny YOLOv7 (Case study using YOLO models)
ការសាកល្បងផ្ទាល់លើឧបករណ៍ Raspberry Pi 4B, Jetson Nano និង Jetson Orin Nano (Hardware implementation)
ការណែនាំរង្វាស់វាយតម្លៃថ្មីហៅថា ពិន្ទុនៃការដាក់ពង្រាយ Edge-AI (EADS - Edge-AI Deployment Score)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ការអនុវត្តម៉ូដែលធុនស្រាល និងបច្ចេកទេសបង្រួមម៉ូដែល (Model Compression) ដូចជា Tiny YOLOv7 កម្រិត INT8 ជួយកាត់បន្ថយពេលវេលាដំណើរការយ៉ាងច្រើននៅលើឧបករណ៍កុំព្យូទ័រជាយបណ្ដាញ។
ឧបករណ៍ Jetson Orin Nano ទទួលបានដំណើរការល្អបំផុតជាមួយនឹងពេលវេលាប្រតិបត្តិការត្រឹមតែ 0.008 វិនាទី ដោយប្រើម៉ូដែល Tiny YOLOv7 (INT8) ជាមួយក្របខ័ណ្ឌ TensorRT។
រង្វាស់វាយតម្លៃ Edge-AI Deployment Score (EADS) ដែលបានបង្កើតថ្មី អាចថ្លឹងថ្លែងយ៉ាងមានប្រសិទ្ធភាពរវាងភាពត្រឹមត្រូវ ពេលវេលាដំណើរការ ការប្រើប្រាស់ RAM និងការប្រើប្រាស់ថាមពល ដើម្បីជ្រើសរើសប្រព័ន្ធ Edge AI ដ៏ប្រសើរបំផុត។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
YOLOv7 (FP32) on Raspberry Pi 4B ម៉ូដែល YOLOv7 (FP32) ដំណើរការលើ Raspberry Pi 4B	ចំណាយលើផ្នែករឹងតិច ងាយស្រួលក្នុងការស្វែងរកឧបករណ៍ និងការរៀបចំដំបូង។	ដំណើរការយឺតខ្លាំង (មិនអាចប្រើសម្រាប់ពេលវេលាជាក់ស្តែងបានទេ) និងប្រើប្រាស់ថាមពលច្រើនធៀបនឹងទិន្នផលដែលទទួលបាន។	ទទួលបានពិន្ទុ EADS ទាបបំផុត (០.០០០) ជាមួយនឹងពេលវេលាអង្កេត (Inference Time) ១៦.៤០ វិនាទី។
YOLOv7-Tiny (FP16) on Jetson Nano using TensorRT ម៉ូដែល YOLOv7-Tiny (FP16) ដំណើរការលើ Jetson Nano ជាមួយបច្ចេកវិទ្យា TensorRT	មានតុល្យភាពល្អរវាងតម្លៃឧបករណ៍ និងល្បឿនដំណើរការ ព្រមទាំងរក្សាបានភាពត្រឹមត្រូវខ្ពស់។	ទាមទារចំណេះដឹងក្នុងការធ្វើឱ្យប្រសើរម៉ូដែល (Optimization) តាមរយៈក្របខ័ណ្ឌ TensorRT របស់ NVIDIA។	ពេលវេលាអង្កេតត្រឹមតែ ០.០៦ វិនាទី ជាមួយនឹងភាពត្រឹមត្រូវ (mAP) ០.៩៤៩ និងពិន្ទុ EADS ០.១៣០។
YOLOv7-Tiny (INT8) on Jetson Orin Nano using TensorRT ម៉ូដែល YOLOv7-Tiny (INT8) ដំណើរការលើ Jetson Orin Nano ជាមួយបច្ចេកវិទ្យា TensorRT	មានដំណើរការលឿនបំផុត ស័ក្តិសមបំផុតសម្រាប់ការសម្គាល់វត្ថុក្នុងពេលវេលាជាក់ស្តែង (Real-time) ប្រកបដោយប្រសិទ្ធភាពខ្ពស់។	ឧបករណ៍នេះមានតម្លៃថ្លៃជាងគេ និងទាមទារជំនាញកម្រិតខ្ពស់ក្នុងការសរសេរកូដ និងកំណត់រចនាសម្ព័ន្ធហាតវែរ។	ទទួលបានពិន្ទុ EADS ខ្ពស់បំផុត (១.០០០) ជាមួយនឹងពេលវេលាអង្កេតត្រឹមតែ ០.០០៨ វិនាទី និងភាពត្រឹមត្រូវ ០.៩៣៦ mAP។

ការចំណាយលើធនធាន (Resource Cost)៖ ការដាក់ពង្រាយប្រព័ន្ធ Edge AI ទាមទារការវិនិយោគលើផ្នែករឹងពិសេស ក៏ដូចជាជំនាញបច្ចេកទេសក្នុងការបង្រួមម៉ូដែល ដើម្បីទទួលបានតុល្យភាពរវាងការចំណាយ និងប្រសិទ្ធភាពដំណើរការ។

Hardware: ឧបករណ៍កុំព្យូទ័រជាយបណ្ដាញ (Edge Devices) ដូចជា NVIDIA Jetson Nano/Orin Nano ឬ Raspberry Pi 4B និងកាមេរ៉ា ឬដ្រូន (UAV) សម្រាប់ការចាប់យករូបភាព។
Software: ក្របខ័ណ្ឌ Deep Learning ដូចជា PyTorch, TensorRT (សម្រាប់ NVIDIA GPU), ឬ OpenVINO រួមទាំងប្រព័ន្ធប្រតិបត្តិការគាំទ្រ Edge Computing។
Expertise: ជំនាញខាងបញ្ញាសិប្បនិម្មិត (AI) ការបង្រួមម៉ូដែល (Model Quantization) និងការធ្វើឱ្យប្រសើរផ្នែករឹង-ផ្នែកទន់ (Hardware-Software Co-design)។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះផ្តោតលើការរកឃើញបញ្ហាខ្សែបញ្ជូនថាមពលអគ្គិសនី ដោយប្រើប្រាស់សំណុំទិន្នន័យជាក់លាក់។ សម្រាប់ប្រទេសកម្ពុជា លក្ខខណ្ឌបរិស្ថាន (ដូចជាដើមឈើក្រាស់ៗ ឬអាកាសធាតុត្រូពិច) និងប្រភេទនៃហេដ្ឋារចនាសម្ព័ន្ធខ្សែភ្លើងអាចមានភាពខុសគ្នា ដែលទាមទារឱ្យមានការប្រមូលទិន្នន័យក្នុងស្រុក និងការបង្ហាត់ម៉ូដែលឡើងវិញ (Retraining) ដើម្បីធានាបាននូវភាពត្រឹមត្រូវខ្ពស់ពេលយកមកអនុវត្ត។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនៃការប្រើប្រាស់ Edge AI នេះមានសក្តានុពលខ្ពស់ណាស់ក្នុងការជួយអភិវឌ្ឍហេដ្ឋារចនាសម្ព័ន្ធ និងប្រព័ន្ធស្វ័យប្រវត្តិកម្មនៅកម្ពុជាដោយមិនពឹងផ្អែកលើអ៊ីនធឺណិតខ្លាំង។

ការត្រួតពិនិត្យខ្សែភ្លើងអគ្គិសនីកម្ពុជា (EDC): អាចប្រើប្រាស់ដ្រូនបំពាក់ Edge AI ដើម្បីត្រួតពិនិត្យខ្សែភ្លើងតង់ស្យុងខ្ពស់នៅតាមបណ្តាខេត្ត ជួយកាត់បន្ថយគ្រោះថ្នាក់ដល់បុគ្គលិក និងសន្សំសំចៃពេលវេលាស្វែងរកកន្លែងខូចខាត។
កសិកម្មឆ្លាតវៃនៅខេត្តបាត់ដំបង (Smart Agriculture): អាចប្រើប្រាស់កាមេរ៉ា Edge AI ឬដ្រូន ដើម្បីតាមដានសុខភាពដំណាំ ឬរកមើលសត្វល្អិតចង្រៃក្នុងពេលវេលាជាក់ស្តែង ដោយមិនពឹងផ្អែកលើប្រព័ន្ធ Cloud ឬអ៊ីនធឺណិតល្បឿនលឿនដែលមានកម្រិតនៅតំបន់ជនបទ។
ការគ្រប់គ្រងចរាចរណ៍នៅរាជធានីភ្នំពេញ (Smart Traffic Management): អាចបំពាក់កាមេរ៉ាឆ្លាតវៃនៅតាមស្តុបចរាចរណ៍ ដើម្បីសម្គាល់យានយន្ត និងគ្រប់គ្រងលំហូរចរាចរណ៍ដោយស្វ័យប្រវត្តិ កាត់បន្ថយការកកស្ទះ។

ការដាក់ពង្រាយបច្ចេកវិទ្យា Edge AI អាចជួយកម្ពុជាលោតផ្លោះទៅកាន់ការប្រើប្រាស់ដំណោះស្រាយឌីជីថលឆ្លាតវៃ ដោយកាត់បន្ថយការពឹងផ្អែកលើប្រព័ន្ធ Cloud ដែលមានតម្លៃថ្លៃ និងពង្រឹងសុវត្ថិភាពទិន្នន័យក្នុងស្រុក។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះនៃ Computer Vision និង Deep Learning: ចាប់ផ្តើមស្វែងយល់អំពីការសម្គាល់វត្ថុ (Object Detection) ដោយប្រើប្រាស់ស្ថាបត្យកម្មសំណាញ់សរសៃប្រសាទ (CNNs) និងម៉ូដែល YOLOv7 ឬ YOLOv8 តាមរយៈវគ្គសិក្សាអនឡាញ។
ស្វែងយល់អំពីបច្ចេកទេសបង្រួមម៉ូដែល (Model Compression): អនុវត្តការបង្រួមទំហំម៉ូដែល (Quantization) ពីកម្រិត FP32 ទៅ FP16 ឬ INT8 ដោយប្រើប្រាស់ឧបករណ៍ដូចជា TensorFlow Lite ឬ TensorRT ដើម្បីបន្ថយការប្រើប្រាស់អង្គចងចាំ និងបង្កើនល្បឿន។
ការអនុវត្តផ្ទាល់លើឧបករណ៍ Edge Hardware: ទិញឧបករណ៍ដែលមានតម្លៃសមរម្យដូចជា Raspberry Pi 4 ឬ NVIDIA Jetson Nano ហើយសាកល្បងដាក់ពង្រាយម៉ូដែល YOLOv7-Tiny ដើម្បីចាប់យករូបភាពតាមកាមេរ៉ាផ្ទាល់។
ប្រមូលទិន្នន័យ និងបង្ហាត់ម៉ូដែលសម្រាប់បញ្ហាក្នុងស្រុក: បង្កើតសំណុំទិន្នន័យផ្ទាល់ខ្លួន (ឧទាហរណ៍៖ រូបភាពផ្លាកសញ្ញាចរាចរណ៍នៅកម្ពុជា ឬរូបភាពជំងឺលើស្លឹកស្រូវ) រួចធ្វើការបង្ហាត់ម៉ូដែលឡើងវិញ (Fine-tuning) ជាមួយ PyTorch ដើម្បីដោះស្រាយបញ្ហាជាក់ស្តែងនៅក្នុងសហគមន៍។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Edge Computing	បច្ចេកវិទ្យាដំណើរការទិន្នន័យដោយផ្ទាល់នៅលើឧបករណ៍ចុងក្រោយ (ដូចជាកាមេរ៉ា ឬស្មាតហ្វូន) ក្បែរប្រភពដែលបង្កើតទិន្នន័យនោះតែម្តង ដោយមិនចាំបាច់បញ្ជូនទិន្នន័យទាំងអស់ទៅកាន់ម៉ាស៊ីនមេ (Cloud) នោះទេ។ វាជួយកាត់បន្ថយភាពយឺតយ៉ាវ និងរក្សាឯកជនភាពទិន្នន័យបានល្អ។	ដូចជាការគិតលេខដោយខ្លួនឯងផ្ទាល់ដៃ ជាជាងទូរស័ព្ទទៅសួរគ្រូនៅផ្ទះដើម្បីសុំចម្លើយ។
Model Quantization	បច្ចេកទេសបង្រួមទំហំម៉ូដែលបញ្ញាសិប្បនិម្មិត (AI) ដោយបន្ថយកម្រិតភាពលម្អិតនៃតួលេខ (ឧទាហរណ៍៖ បំប្លែងពីទម្រង់ទសភាគ 32-bit ទៅជាចំនួនគត់ 8-bit) ដើម្បីឱ្យម៉ូដែលស៊ីទំហំផ្ទុកតិច និងអាចគណនាបានលឿននៅលើឧបករណ៍តូចៗដែលមានធនធានមានកម្រិត។	ដូចជាការបង្រួមទំហំរូបភាព (Resize) ពីកម្រិត 4K មកត្រឹម HD ដើម្បីងាយស្រួលផ្ញើតាមតេឡេក្រាមបានលឿន តែរូបនោះនៅតែអាចមើលដឹងច្បាស់ថារូបអ្វី។
Inference Time	រយៈពេលដែលម៉ូដែលបញ្ញាសិប្បនិម្មិតចំណាយពេលដើម្បីវិភាគទិន្នន័យថ្មី (ឧទាហរណ៍៖ រូបភាពមួយសន្លឹក) រួចបញ្ចេញលទ្ធផល ឬការទស្សន៍ទាយត្រឡប់មកវិញ។ សម្រាប់កម្មវិធី Real-time ពេលវេលានេះត្រូវតែខ្លីបំផុត។	ដូចជាពេលវេលាដែលខួរក្បាលរបស់អ្នកចំណាយពេលគិត និងឆ្លើយតប បន្ទាប់ពីមានគេសួរទាយប្រាជ្ញា។
Hardware Accelerator	បន្ទះឈីប ឬគ្រឿងម៉ាស៊ីនពិសេស (ដូចជា GPU, TPU, ឬ FPGA) ដែលត្រូវបានរចនាឡើងជាលក្ខណៈពិសេសដើម្បីគណនាប្រតិបត្តិការគណិតវិទ្យាស្មុគស្មាញនៃប្រព័ន្ធ AI ក្នុងល្បឿនលឿនខ្លាំង ដែលស៊ីភីយូ (CPU) ធម្មតាមិនអាចធ្វើបានប្រកបដោយប្រសិទ្ធភាព។	ដូចជាការប្រើម៉ាស៊ីនគិតលេខដើម្បីបូកលេខរាប់ពាន់ខ្ទង់ ជំនួសឱ្យការបូកដោយប្រើក្រដាសនិងប៊ិចធម្មតា។
Network Pruning	ការកាត់បន្ថយភាពស្មុគស្មាញរបស់សំណាញ់សរសៃប្រសាទសិប្បនិម្មិត (Neural Network) ដោយលុបចោលនូវប៉ារ៉ាម៉ែត្រ ឬការតភ្ជាប់ណាដែលមិនសូវសំខាន់ ឬមិនចូលរួមចំណែកធំដុំក្នុងការទស្សន៍ទាយ ដើម្បីឱ្យម៉ូដែលដំណើរការកាន់តែលឿននិងស៊ីធនធានតិច។	ដូចជាការកាត់មែកឈើដែលស្ងួត ឬមិនចេញផ្លែចោល ដើម្បីឱ្យដើមឈើលូតលាស់បានល្អ និងមិនកកស្ទះទីធ្លា។
Knowledge Distillation	វិធីសាស្ត្រផ្ទេរចំណេះដឹងពីម៉ូដែល AI ខ្នាតធំដែលមានភាពស្មុគស្មាញនិងឆ្លាតវៃខ្លាំង (ហៅថាគ្រូ) ទៅកាន់ម៉ូដែល AI ខ្នាតតូច (ហៅថាសិស្ស) ដើម្បីឱ្យម៉ូដែលតូចនោះអាចរក្សាបាននូវភាពត្រឹមត្រូវប្រហាក់ប្រហែលគ្នា តែងាយស្រួលយកទៅដាក់លើឧបករណ៍ Edge។	ដូចជាសាស្ត្រាចារ្យម្នាក់បង្រួញសៀវភៅក្រាស់១ពាន់ទំព័រ មកសរសេរជាសេចក្តីសង្ខេប១០ទំព័រ ឱ្យសិស្សអានហើយយល់បានដូចគ្នាដោយចំណាយពេលតិចបំផុត។
Cross-layer Optimization	ការធ្វើឱ្យប្រសើរឡើងនូវប្រព័ន្ធ AI ទាំងមូលដោយការកែសម្រួលផ្នែកជាច្រើនក្នុងពេលតែមួយ និងធ្វើការសហការគ្នា (តាំងពីកម្រិតកម្មវិធី កម្រិតម៉ូដែល រហូតដល់កម្រិតហាតវែរ) ដើម្បីសម្រេចបាននូវល្បឿនលឿន និងស៊ីភ្លើងតិចបំផុត។	ដូចជាការផ្លាស់ប្តូរទាំងម៉ាស៊ីនរថយន្ត កង់រថយន្ត និងរបៀបបើកបររបស់អ្នកបើកបរក្នុងពេលតែមួយ ដើម្បីឱ្យរថយន្តប្រណាំងរត់បានលឿនបំផុត។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖