Original Title: Key Considerations for Real-Time Object Recognition on Edge Computing Devices
Source: doi.org/10.3390/app15137533
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការពិចារណាសំខាន់ៗសម្រាប់ការសម្គាល់វត្ថុក្នុងពេលវេលាជាក់ស្តែងនៅលើឧបករណ៍ Edge Computing

ចំណងជើងដើម៖ Key Considerations for Real-Time Object Recognition on Edge Computing Devices

អ្នកនិពន្ធ៖ Nico Surantha (Tokyo City University, Japan), Nana Sutisna (Institut Teknologi Bandung, Indonesia)

ឆ្នាំបោះពុម្ព៖ 2025 (Appl. Sci.)

វិស័យសិក្សា៖ Computer Science / Artificial Intelligence

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការកើនឡើងនៃឧបករណ៍ IoT ទាមទារឱ្យមានដំណើរការទិន្នន័យ និងការសម្គាល់វត្ថុក្នុងពេលវេលាជាក់ស្តែងនៅជាយបណ្ដាញ (Network Edge) ប៉ុន្តែវិធីសាស្ត្រផ្អែកលើក្លោដ (Cloud-based) បែបប្រពៃណីតែងជួបប្រទះបញ្ហាប្រឈមទាក់ទងនឹងភាពយឺតយ៉ាវ កម្រិតបញ្ជូនទិន្នន័យ និងការរក្សាឯកជនភាព។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះធ្វើការត្រួតពិនិត្យយ៉ាងទូលំទូលាយអំពីការរួមបញ្ចូលបញ្ញាសិប្បនិម្មិត (Edge AI) និងវាយតម្លៃលើករណីសិក្សាជាក់ស្តែងស្តីពីការត្រួតពិនិត្យខ្សែបញ្ជូនថាមពល ដោយប្រើប្រាស់ឧបករណ៍ Edge និងម៉ូដែល Deep Learning ធុនស្រាលផ្សេងៗ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
YOLOv7 (FP32) on Raspberry Pi 4B
ម៉ូដែល YOLOv7 (FP32) ដំណើរការលើ Raspberry Pi 4B
ចំណាយលើផ្នែករឹងតិច ងាយស្រួលក្នុងការស្វែងរកឧបករណ៍ និងការរៀបចំដំបូង។ ដំណើរការយឺតខ្លាំង (មិនអាចប្រើសម្រាប់ពេលវេលាជាក់ស្តែងបានទេ) និងប្រើប្រាស់ថាមពលច្រើនធៀបនឹងទិន្នផលដែលទទួលបាន។ ទទួលបានពិន្ទុ EADS ទាបបំផុត (០.០០០) ជាមួយនឹងពេលវេលាអង្កេត (Inference Time) ១៦.៤០ វិនាទី។
YOLOv7-Tiny (FP16) on Jetson Nano using TensorRT
ម៉ូដែល YOLOv7-Tiny (FP16) ដំណើរការលើ Jetson Nano ជាមួយបច្ចេកវិទ្យា TensorRT
មានតុល្យភាពល្អរវាងតម្លៃឧបករណ៍ និងល្បឿនដំណើរការ ព្រមទាំងរក្សាបានភាពត្រឹមត្រូវខ្ពស់។ ទាមទារចំណេះដឹងក្នុងការធ្វើឱ្យប្រសើរម៉ូដែល (Optimization) តាមរយៈក្របខ័ណ្ឌ TensorRT របស់ NVIDIA។ ពេលវេលាអង្កេតត្រឹមតែ ០.០៦ វិនាទី ជាមួយនឹងភាពត្រឹមត្រូវ (mAP) ០.៩៤៩ និងពិន្ទុ EADS ០.១៣០។
YOLOv7-Tiny (INT8) on Jetson Orin Nano using TensorRT
ម៉ូដែល YOLOv7-Tiny (INT8) ដំណើរការលើ Jetson Orin Nano ជាមួយបច្ចេកវិទ្យា TensorRT
មានដំណើរការលឿនបំផុត ស័ក្តិសមបំផុតសម្រាប់ការសម្គាល់វត្ថុក្នុងពេលវេលាជាក់ស្តែង (Real-time) ប្រកបដោយប្រសិទ្ធភាពខ្ពស់។ ឧបករណ៍នេះមានតម្លៃថ្លៃជាងគេ និងទាមទារជំនាញកម្រិតខ្ពស់ក្នុងការសរសេរកូដ និងកំណត់រចនាសម្ព័ន្ធហាតវែរ។ ទទួលបានពិន្ទុ EADS ខ្ពស់បំផុត (១.០០០) ជាមួយនឹងពេលវេលាអង្កេតត្រឹមតែ ០.០០៨ វិនាទី និងភាពត្រឹមត្រូវ ០.៩៣៦ mAP។

ការចំណាយលើធនធាន (Resource Cost)៖ ការដាក់ពង្រាយប្រព័ន្ធ Edge AI ទាមទារការវិនិយោគលើផ្នែករឹងពិសេស ក៏ដូចជាជំនាញបច្ចេកទេសក្នុងការបង្រួមម៉ូដែល ដើម្បីទទួលបានតុល្យភាពរវាងការចំណាយ និងប្រសិទ្ធភាពដំណើរការ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះផ្តោតលើការរកឃើញបញ្ហាខ្សែបញ្ជូនថាមពលអគ្គិសនី ដោយប្រើប្រាស់សំណុំទិន្នន័យជាក់លាក់។ សម្រាប់ប្រទេសកម្ពុជា លក្ខខណ្ឌបរិស្ថាន (ដូចជាដើមឈើក្រាស់ៗ ឬអាកាសធាតុត្រូពិច) និងប្រភេទនៃហេដ្ឋារចនាសម្ព័ន្ធខ្សែភ្លើងអាចមានភាពខុសគ្នា ដែលទាមទារឱ្យមានការប្រមូលទិន្នន័យក្នុងស្រុក និងការបង្ហាត់ម៉ូដែលឡើងវិញ (Retraining) ដើម្បីធានាបាននូវភាពត្រឹមត្រូវខ្ពស់ពេលយកមកអនុវត្ត។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនៃការប្រើប្រាស់ Edge AI នេះមានសក្តានុពលខ្ពស់ណាស់ក្នុងការជួយអភិវឌ្ឍហេដ្ឋារចនាសម្ព័ន្ធ និងប្រព័ន្ធស្វ័យប្រវត្តិកម្មនៅកម្ពុជាដោយមិនពឹងផ្អែកលើអ៊ីនធឺណិតខ្លាំង។

ការដាក់ពង្រាយបច្ចេកវិទ្យា Edge AI អាចជួយកម្ពុជាលោតផ្លោះទៅកាន់ការប្រើប្រាស់ដំណោះស្រាយឌីជីថលឆ្លាតវៃ ដោយកាត់បន្ថយការពឹងផ្អែកលើប្រព័ន្ធ Cloud ដែលមានតម្លៃថ្លៃ និងពង្រឹងសុវត្ថិភាពទិន្នន័យក្នុងស្រុក។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃ Computer Vision និង Deep Learning: ចាប់ផ្តើមស្វែងយល់អំពីការសម្គាល់វត្ថុ (Object Detection) ដោយប្រើប្រាស់ស្ថាបត្យកម្មសំណាញ់សរសៃប្រសាទ (CNNs) និងម៉ូដែល YOLOv7YOLOv8 តាមរយៈវគ្គសិក្សាអនឡាញ។
  2. ស្វែងយល់អំពីបច្ចេកទេសបង្រួមម៉ូដែល (Model Compression): អនុវត្តការបង្រួមទំហំម៉ូដែល (Quantization) ពីកម្រិត FP32 ទៅ FP16 ឬ INT8 ដោយប្រើប្រាស់ឧបករណ៍ដូចជា TensorFlow LiteTensorRT ដើម្បីបន្ថយការប្រើប្រាស់អង្គចងចាំ និងបង្កើនល្បឿន។
  3. ការអនុវត្តផ្ទាល់លើឧបករណ៍ Edge Hardware: ទិញឧបករណ៍ដែលមានតម្លៃសមរម្យដូចជា Raspberry Pi 4NVIDIA Jetson Nano ហើយសាកល្បងដាក់ពង្រាយម៉ូដែល YOLOv7-Tiny ដើម្បីចាប់យករូបភាពតាមកាមេរ៉ាផ្ទាល់។
  4. ប្រមូលទិន្នន័យ និងបង្ហាត់ម៉ូដែលសម្រាប់បញ្ហាក្នុងស្រុក: បង្កើតសំណុំទិន្នន័យផ្ទាល់ខ្លួន (ឧទាហរណ៍៖ រូបភាពផ្លាកសញ្ញាចរាចរណ៍នៅកម្ពុជា ឬរូបភាពជំងឺលើស្លឹកស្រូវ) រួចធ្វើការបង្ហាត់ម៉ូដែលឡើងវិញ (Fine-tuning) ជាមួយ PyTorch ដើម្បីដោះស្រាយបញ្ហាជាក់ស្តែងនៅក្នុងសហគមន៍។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Edge Computing បច្ចេកវិទ្យាដំណើរការទិន្នន័យដោយផ្ទាល់នៅលើឧបករណ៍ចុងក្រោយ (ដូចជាកាមេរ៉ា ឬស្មាតហ្វូន) ក្បែរប្រភពដែលបង្កើតទិន្នន័យនោះតែម្តង ដោយមិនចាំបាច់បញ្ជូនទិន្នន័យទាំងអស់ទៅកាន់ម៉ាស៊ីនមេ (Cloud) នោះទេ។ វាជួយកាត់បន្ថយភាពយឺតយ៉ាវ និងរក្សាឯកជនភាពទិន្នន័យបានល្អ។ ដូចជាការគិតលេខដោយខ្លួនឯងផ្ទាល់ដៃ ជាជាងទូរស័ព្ទទៅសួរគ្រូនៅផ្ទះដើម្បីសុំចម្លើយ។
Model Quantization បច្ចេកទេសបង្រួមទំហំម៉ូដែលបញ្ញាសិប្បនិម្មិត (AI) ដោយបន្ថយកម្រិតភាពលម្អិតនៃតួលេខ (ឧទាហរណ៍៖ បំប្លែងពីទម្រង់ទសភាគ 32-bit ទៅជាចំនួនគត់ 8-bit) ដើម្បីឱ្យម៉ូដែលស៊ីទំហំផ្ទុកតិច និងអាចគណនាបានលឿននៅលើឧបករណ៍តូចៗដែលមានធនធានមានកម្រិត។ ដូចជាការបង្រួមទំហំរូបភាព (Resize) ពីកម្រិត 4K មកត្រឹម HD ដើម្បីងាយស្រួលផ្ញើតាមតេឡេក្រាមបានលឿន តែរូបនោះនៅតែអាចមើលដឹងច្បាស់ថារូបអ្វី។
Inference Time រយៈពេលដែលម៉ូដែលបញ្ញាសិប្បនិម្មិតចំណាយពេលដើម្បីវិភាគទិន្នន័យថ្មី (ឧទាហរណ៍៖ រូបភាពមួយសន្លឹក) រួចបញ្ចេញលទ្ធផល ឬការទស្សន៍ទាយត្រឡប់មកវិញ។ សម្រាប់កម្មវិធី Real-time ពេលវេលានេះត្រូវតែខ្លីបំផុត។ ដូចជាពេលវេលាដែលខួរក្បាលរបស់អ្នកចំណាយពេលគិត និងឆ្លើយតប បន្ទាប់ពីមានគេសួរទាយប្រាជ្ញា។
Hardware Accelerator បន្ទះឈីប ឬគ្រឿងម៉ាស៊ីនពិសេស (ដូចជា GPU, TPU, ឬ FPGA) ដែលត្រូវបានរចនាឡើងជាលក្ខណៈពិសេសដើម្បីគណនាប្រតិបត្តិការគណិតវិទ្យាស្មុគស្មាញនៃប្រព័ន្ធ AI ក្នុងល្បឿនលឿនខ្លាំង ដែលស៊ីភីយូ (CPU) ធម្មតាមិនអាចធ្វើបានប្រកបដោយប្រសិទ្ធភាព។ ដូចជាការប្រើម៉ាស៊ីនគិតលេខដើម្បីបូកលេខរាប់ពាន់ខ្ទង់ ជំនួសឱ្យការបូកដោយប្រើក្រដាសនិងប៊ិចធម្មតា។
Network Pruning ការកាត់បន្ថយភាពស្មុគស្មាញរបស់សំណាញ់សរសៃប្រសាទសិប្បនិម្មិត (Neural Network) ដោយលុបចោលនូវប៉ារ៉ាម៉ែត្រ ឬការតភ្ជាប់ណាដែលមិនសូវសំខាន់ ឬមិនចូលរួមចំណែកធំដុំក្នុងការទស្សន៍ទាយ ដើម្បីឱ្យម៉ូដែលដំណើរការកាន់តែលឿននិងស៊ីធនធានតិច។ ដូចជាការកាត់មែកឈើដែលស្ងួត ឬមិនចេញផ្លែចោល ដើម្បីឱ្យដើមឈើលូតលាស់បានល្អ និងមិនកកស្ទះទីធ្លា។
Knowledge Distillation វិធីសាស្ត្រផ្ទេរចំណេះដឹងពីម៉ូដែល AI ខ្នាតធំដែលមានភាពស្មុគស្មាញនិងឆ្លាតវៃខ្លាំង (ហៅថាគ្រូ) ទៅកាន់ម៉ូដែល AI ខ្នាតតូច (ហៅថាសិស្ស) ដើម្បីឱ្យម៉ូដែលតូចនោះអាចរក្សាបាននូវភាពត្រឹមត្រូវប្រហាក់ប្រហែលគ្នា តែងាយស្រួលយកទៅដាក់លើឧបករណ៍ Edge។ ដូចជាសាស្ត្រាចារ្យម្នាក់បង្រួញសៀវភៅក្រាស់១ពាន់ទំព័រ មកសរសេរជាសេចក្តីសង្ខេប១០ទំព័រ ឱ្យសិស្សអានហើយយល់បានដូចគ្នាដោយចំណាយពេលតិចបំផុត។
Cross-layer Optimization ការធ្វើឱ្យប្រសើរឡើងនូវប្រព័ន្ធ AI ទាំងមូលដោយការកែសម្រួលផ្នែកជាច្រើនក្នុងពេលតែមួយ និងធ្វើការសហការគ្នា (តាំងពីកម្រិតកម្មវិធី កម្រិតម៉ូដែល រហូតដល់កម្រិតហាតវែរ) ដើម្បីសម្រេចបាននូវល្បឿនលឿន និងស៊ីភ្លើងតិចបំផុត។ ដូចជាការផ្លាស់ប្តូរទាំងម៉ាស៊ីនរថយន្ត កង់រថយន្ត និងរបៀបបើកបររបស់អ្នកបើកបរក្នុងពេលតែមួយ ដើម្បីឱ្យរថយន្តប្រណាំងរត់បានលឿនបំផុត។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖