បញ្ហា (The Problem)៖ ការកើនឡើងនៃឧបករណ៍ IoT ទាមទារឱ្យមានដំណើរការទិន្នន័យ និងការសម្គាល់វត្ថុក្នុងពេលវេលាជាក់ស្តែងនៅជាយបណ្ដាញ (Network Edge) ប៉ុន្តែវិធីសាស្ត្រផ្អែកលើក្លោដ (Cloud-based) បែបប្រពៃណីតែងជួបប្រទះបញ្ហាប្រឈមទាក់ទងនឹងភាពយឺតយ៉ាវ កម្រិតបញ្ជូនទិន្នន័យ និងការរក្សាឯកជនភាព។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះធ្វើការត្រួតពិនិត្យយ៉ាងទូលំទូលាយអំពីការរួមបញ្ចូលបញ្ញាសិប្បនិម្មិត (Edge AI) និងវាយតម្លៃលើករណីសិក្សាជាក់ស្តែងស្តីពីការត្រួតពិនិត្យខ្សែបញ្ជូនថាមពល ដោយប្រើប្រាស់ឧបករណ៍ Edge និងម៉ូដែល Deep Learning ធុនស្រាលផ្សេងៗ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| YOLOv7 (FP32) on Raspberry Pi 4B ម៉ូដែល YOLOv7 (FP32) ដំណើរការលើ Raspberry Pi 4B |
ចំណាយលើផ្នែករឹងតិច ងាយស្រួលក្នុងការស្វែងរកឧបករណ៍ និងការរៀបចំដំបូង។ | ដំណើរការយឺតខ្លាំង (មិនអាចប្រើសម្រាប់ពេលវេលាជាក់ស្តែងបានទេ) និងប្រើប្រាស់ថាមពលច្រើនធៀបនឹងទិន្នផលដែលទទួលបាន។ | ទទួលបានពិន្ទុ EADS ទាបបំផុត (០.០០០) ជាមួយនឹងពេលវេលាអង្កេត (Inference Time) ១៦.៤០ វិនាទី។ |
| YOLOv7-Tiny (FP16) on Jetson Nano using TensorRT ម៉ូដែល YOLOv7-Tiny (FP16) ដំណើរការលើ Jetson Nano ជាមួយបច្ចេកវិទ្យា TensorRT |
មានតុល្យភាពល្អរវាងតម្លៃឧបករណ៍ និងល្បឿនដំណើរការ ព្រមទាំងរក្សាបានភាពត្រឹមត្រូវខ្ពស់។ | ទាមទារចំណេះដឹងក្នុងការធ្វើឱ្យប្រសើរម៉ូដែល (Optimization) តាមរយៈក្របខ័ណ្ឌ TensorRT របស់ NVIDIA។ | ពេលវេលាអង្កេតត្រឹមតែ ០.០៦ វិនាទី ជាមួយនឹងភាពត្រឹមត្រូវ (mAP) ០.៩៤៩ និងពិន្ទុ EADS ០.១៣០។ |
| YOLOv7-Tiny (INT8) on Jetson Orin Nano using TensorRT ម៉ូដែល YOLOv7-Tiny (INT8) ដំណើរការលើ Jetson Orin Nano ជាមួយបច្ចេកវិទ្យា TensorRT |
មានដំណើរការលឿនបំផុត ស័ក្តិសមបំផុតសម្រាប់ការសម្គាល់វត្ថុក្នុងពេលវេលាជាក់ស្តែង (Real-time) ប្រកបដោយប្រសិទ្ធភាពខ្ពស់។ | ឧបករណ៍នេះមានតម្លៃថ្លៃជាងគេ និងទាមទារជំនាញកម្រិតខ្ពស់ក្នុងការសរសេរកូដ និងកំណត់រចនាសម្ព័ន្ធហាតវែរ។ | ទទួលបានពិន្ទុ EADS ខ្ពស់បំផុត (១.០០០) ជាមួយនឹងពេលវេលាអង្កេតត្រឹមតែ ០.០០៨ វិនាទី និងភាពត្រឹមត្រូវ ០.៩៣៦ mAP។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការដាក់ពង្រាយប្រព័ន្ធ Edge AI ទាមទារការវិនិយោគលើផ្នែករឹងពិសេស ក៏ដូចជាជំនាញបច្ចេកទេសក្នុងការបង្រួមម៉ូដែល ដើម្បីទទួលបានតុល្យភាពរវាងការចំណាយ និងប្រសិទ្ធភាពដំណើរការ។
ការសិក្សានេះផ្តោតលើការរកឃើញបញ្ហាខ្សែបញ្ជូនថាមពលអគ្គិសនី ដោយប្រើប្រាស់សំណុំទិន្នន័យជាក់លាក់។ សម្រាប់ប្រទេសកម្ពុជា លក្ខខណ្ឌបរិស្ថាន (ដូចជាដើមឈើក្រាស់ៗ ឬអាកាសធាតុត្រូពិច) និងប្រភេទនៃហេដ្ឋារចនាសម្ព័ន្ធខ្សែភ្លើងអាចមានភាពខុសគ្នា ដែលទាមទារឱ្យមានការប្រមូលទិន្នន័យក្នុងស្រុក និងការបង្ហាត់ម៉ូដែលឡើងវិញ (Retraining) ដើម្បីធានាបាននូវភាពត្រឹមត្រូវខ្ពស់ពេលយកមកអនុវត្ត។
វិធីសាស្ត្រនៃការប្រើប្រាស់ Edge AI នេះមានសក្តានុពលខ្ពស់ណាស់ក្នុងការជួយអភិវឌ្ឍហេដ្ឋារចនាសម្ព័ន្ធ និងប្រព័ន្ធស្វ័យប្រវត្តិកម្មនៅកម្ពុជាដោយមិនពឹងផ្អែកលើអ៊ីនធឺណិតខ្លាំង។
ការដាក់ពង្រាយបច្ចេកវិទ្យា Edge AI អាចជួយកម្ពុជាលោតផ្លោះទៅកាន់ការប្រើប្រាស់ដំណោះស្រាយឌីជីថលឆ្លាតវៃ ដោយកាត់បន្ថយការពឹងផ្អែកលើប្រព័ន្ធ Cloud ដែលមានតម្លៃថ្លៃ និងពង្រឹងសុវត្ថិភាពទិន្នន័យក្នុងស្រុក។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Edge Computing | បច្ចេកវិទ្យាដំណើរការទិន្នន័យដោយផ្ទាល់នៅលើឧបករណ៍ចុងក្រោយ (ដូចជាកាមេរ៉ា ឬស្មាតហ្វូន) ក្បែរប្រភពដែលបង្កើតទិន្នន័យនោះតែម្តង ដោយមិនចាំបាច់បញ្ជូនទិន្នន័យទាំងអស់ទៅកាន់ម៉ាស៊ីនមេ (Cloud) នោះទេ។ វាជួយកាត់បន្ថយភាពយឺតយ៉ាវ និងរក្សាឯកជនភាពទិន្នន័យបានល្អ។ | ដូចជាការគិតលេខដោយខ្លួនឯងផ្ទាល់ដៃ ជាជាងទូរស័ព្ទទៅសួរគ្រូនៅផ្ទះដើម្បីសុំចម្លើយ។ |
| Model Quantization | បច្ចេកទេសបង្រួមទំហំម៉ូដែលបញ្ញាសិប្បនិម្មិត (AI) ដោយបន្ថយកម្រិតភាពលម្អិតនៃតួលេខ (ឧទាហរណ៍៖ បំប្លែងពីទម្រង់ទសភាគ 32-bit ទៅជាចំនួនគត់ 8-bit) ដើម្បីឱ្យម៉ូដែលស៊ីទំហំផ្ទុកតិច និងអាចគណនាបានលឿននៅលើឧបករណ៍តូចៗដែលមានធនធានមានកម្រិត។ | ដូចជាការបង្រួមទំហំរូបភាព (Resize) ពីកម្រិត 4K មកត្រឹម HD ដើម្បីងាយស្រួលផ្ញើតាមតេឡេក្រាមបានលឿន តែរូបនោះនៅតែអាចមើលដឹងច្បាស់ថារូបអ្វី។ |
| Inference Time | រយៈពេលដែលម៉ូដែលបញ្ញាសិប្បនិម្មិតចំណាយពេលដើម្បីវិភាគទិន្នន័យថ្មី (ឧទាហរណ៍៖ រូបភាពមួយសន្លឹក) រួចបញ្ចេញលទ្ធផល ឬការទស្សន៍ទាយត្រឡប់មកវិញ។ សម្រាប់កម្មវិធី Real-time ពេលវេលានេះត្រូវតែខ្លីបំផុត។ | ដូចជាពេលវេលាដែលខួរក្បាលរបស់អ្នកចំណាយពេលគិត និងឆ្លើយតប បន្ទាប់ពីមានគេសួរទាយប្រាជ្ញា។ |
| Hardware Accelerator | បន្ទះឈីប ឬគ្រឿងម៉ាស៊ីនពិសេស (ដូចជា GPU, TPU, ឬ FPGA) ដែលត្រូវបានរចនាឡើងជាលក្ខណៈពិសេសដើម្បីគណនាប្រតិបត្តិការគណិតវិទ្យាស្មុគស្មាញនៃប្រព័ន្ធ AI ក្នុងល្បឿនលឿនខ្លាំង ដែលស៊ីភីយូ (CPU) ធម្មតាមិនអាចធ្វើបានប្រកបដោយប្រសិទ្ធភាព។ | ដូចជាការប្រើម៉ាស៊ីនគិតលេខដើម្បីបូកលេខរាប់ពាន់ខ្ទង់ ជំនួសឱ្យការបូកដោយប្រើក្រដាសនិងប៊ិចធម្មតា។ |
| Network Pruning | ការកាត់បន្ថយភាពស្មុគស្មាញរបស់សំណាញ់សរសៃប្រសាទសិប្បនិម្មិត (Neural Network) ដោយលុបចោលនូវប៉ារ៉ាម៉ែត្រ ឬការតភ្ជាប់ណាដែលមិនសូវសំខាន់ ឬមិនចូលរួមចំណែកធំដុំក្នុងការទស្សន៍ទាយ ដើម្បីឱ្យម៉ូដែលដំណើរការកាន់តែលឿននិងស៊ីធនធានតិច។ | ដូចជាការកាត់មែកឈើដែលស្ងួត ឬមិនចេញផ្លែចោល ដើម្បីឱ្យដើមឈើលូតលាស់បានល្អ និងមិនកកស្ទះទីធ្លា។ |
| Knowledge Distillation | វិធីសាស្ត្រផ្ទេរចំណេះដឹងពីម៉ូដែល AI ខ្នាតធំដែលមានភាពស្មុគស្មាញនិងឆ្លាតវៃខ្លាំង (ហៅថាគ្រូ) ទៅកាន់ម៉ូដែល AI ខ្នាតតូច (ហៅថាសិស្ស) ដើម្បីឱ្យម៉ូដែលតូចនោះអាចរក្សាបាននូវភាពត្រឹមត្រូវប្រហាក់ប្រហែលគ្នា តែងាយស្រួលយកទៅដាក់លើឧបករណ៍ Edge។ | ដូចជាសាស្ត្រាចារ្យម្នាក់បង្រួញសៀវភៅក្រាស់១ពាន់ទំព័រ មកសរសេរជាសេចក្តីសង្ខេប១០ទំព័រ ឱ្យសិស្សអានហើយយល់បានដូចគ្នាដោយចំណាយពេលតិចបំផុត។ |
| Cross-layer Optimization | ការធ្វើឱ្យប្រសើរឡើងនូវប្រព័ន្ធ AI ទាំងមូលដោយការកែសម្រួលផ្នែកជាច្រើនក្នុងពេលតែមួយ និងធ្វើការសហការគ្នា (តាំងពីកម្រិតកម្មវិធី កម្រិតម៉ូដែល រហូតដល់កម្រិតហាតវែរ) ដើម្បីសម្រេចបាននូវល្បឿនលឿន និងស៊ីភ្លើងតិចបំផុត។ | ដូចជាការផ្លាស់ប្តូរទាំងម៉ាស៊ីនរថយន្ត កង់រថយន្ត និងរបៀបបើកបររបស់អ្នកបើកបរក្នុងពេលតែមួយ ដើម្បីឱ្យរថយន្តប្រណាំងរត់បានលឿនបំផុត។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖