បញ្ហា (The Problem)៖ វិធីសាស្រ្តរៀនស៊ីជម្រៅបែបមជ្ឈការ (Centralized deep learning) មិនស័ក្តិសមសម្រាប់ការដាក់ពង្រាយក្នុងវិស័យកសិកម្មខ្នាតធំនោះទេ ដោយសារតែវាទាមទារការបញ្ជូនទិន្នន័យច្រើននិងថាមពលកុំព្យូទ័រខ្ពស់។ ឯកសារនេះដោះស្រាយបញ្ហានេះដោយស្នើឡើងនូវប្រព័ន្ធរៀនស៊ីជម្រៅបែបចែកចាយតាមរយៈបណ្តាញសេនស័រ IoT (IoT Sensor Network) សម្រាប់ការស្វែងរកជំងឺរុក្ខជាតិដោយមិនចាំបាច់បញ្ជូនទិន្នន័យឆៅទៅកាន់ម៉ាស៊ីនមេ (Cloud servers)។
វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះបានរៀបចំស្ថាបត្យកម្មរៀនស៊ីជម្រៅបែបចែកចាយដោយផ្អែកលើបច្ចេកវិទ្យារៀនសហព័ន្ធ (Federated Learning) និងបានវាយតម្លៃប្រៀបធៀបលើប្រព័ន្ធបណ្តុះបណ្តាលពីរប្រភេទផ្សេងគ្នា។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Standard Learning Pipeline ប្រព័ន្ធបណ្តុះបណ្តាលស្តង់ដារ (ម៉ូដែលតែមួយសម្រាប់ជំងឺទាំងអស់) |
ស៊ីថាមពលតិច (Lower power) ទាមទារអង្គចងចាំ (RAM) តិច និងដំណើរការបានលឿនព្រោះប្រើម៉ូដែលតែមួយសម្រាប់ការទស្សន៍ទាយចំណាត់ថ្នាក់ទាំងអស់។ | ភាពត្រឹមត្រូវក្នុងការធ្វើចំណាត់ថ្នាក់មានកម្រិតទាបជាងពេលជួបប្រទះរូបភាពដែលមានការប្រែប្រួលខ្លាំង (Degradations) និងងាយច្រឡំរវាងជំងឺនៃដំណាំខុសគ្នា។ | មានល្បឿនដំណើរការលឿន (~4.3ms/រូបភាព) និងប្រើប្រាស់ RAM ត្រឹមតែ ~894MB តែប៉ុណ្ណោះ។ |
| Hierarchical Learning Pipeline ប្រព័ន្ធបណ្តុះបណ្តាលតាមឋានានុក្រម (បំបែកការសម្គាល់ដំណាំ និងជំងឺ) |
មានភាពត្រឹមត្រូវខ្ពស់ជាង និងកាត់បន្ថយការភាន់ច្រឡំរវាងប្រភេទដំណាំផ្សេងៗគ្នា ជាពិសេសធន់នឹងបំរែបំរួលរូបភាពដែលកើតមានក្នុងបរិស្ថានជាក់ស្តែង។ | ទាមទារថាមពលច្រើនជាងពី ១.៦ ទៅ ១.៨ ដង និងប្រើប្រាស់អង្គចងចាំទ្វេដង ព្រមទាំងមានភាពស្មុគស្មាញក្នុងការគ្រប់គ្រងម៉ូដែលច្រើនក្នុងពេលតែមួយ។ | ទទួលបានពិន្ទុ F1 ខ្ពស់ជាង (ឧ. ជំងឺប៉ោមពី 0.664 ទៅ 0.821) ប៉ុន្តែប្រើពេលយូរជាង (~7.7ms/រូបភាព) និងស៊ី RAM រហូតដល់ ~1831MB។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះទាមទារនូវឧបករណ៍ IoT ដែលមានសមត្ថភាពគណនា (CPU/GPU) ព្រមទាំងកម្មវិធីសម្រាប់ដំណើរការរៀនសហព័ន្ធ (Federated Learning) ដោយមានកម្រិតការប្រើប្រាស់ថាមពលអគ្គិសនីតិចតួចសម្រាប់ការដាក់ពង្រាយនៅតាមចម្ការ។
ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យរូបភាពស្លឹករុក្ខជាតិដែលមាន ១៤ ប្រភេទដំណាំ (ដូចជាប៉ោម ទំពាំងបាយជូរ ប៉េងប៉ោះ...) ដែលបានបន្ថែមការក្លែងធ្វើពន្លឺ/កម្រិតរូបភាព ៥ ប្រភេទដើម្បីត្រាប់តាមបរិស្ថានជាក់ស្តែង។ ទោះជាយ៉ាងណាក៏ដោយ ដំណាំភាគច្រើននៅក្នុងសំណុំទិន្នន័យនេះមិនមែនជាដំណាំយុទ្ធសាស្ត្រចម្បងរបស់កម្ពុជា (ដូចជា ស្រូវ ដំឡូងមី ស្វាយ ឬកៅស៊ូ) នោះទេ ដូច្នេះម៉ូដែលនេះត្រូវតែប្រមូលទិន្នន័យបន្ថែមក្នុងស្រុក និងហ្វឹកហាត់ជាថ្មី ទើបអាចប្រើប្រាស់ប្រកបដោយប្រសិទ្ធភាពខ្ពស់នៅកម្ពុជា។
បច្ចេកវិទ្យា Federated Learning នេះមានសក្តានុពលខ្ពស់ខ្លាំងសម្រាប់វិស័យកសិកម្មនៅកម្ពុជា ជាពិសេសនៅតំបន់ដាច់ស្រយាលដែលមានបណ្តាញអ៊ីនធឺណិតខ្សោយ ដែលទាមទារការវិភាគទិន្នន័យផ្ទាល់នៅនឹងកន្លែង (Edge Computing)។
ជារួម ការប្រើប្រាស់បណ្តាញសេនស័រ IoT រួមផ្សំជាមួយបច្ចេកវិទ្យារៀនស៊ីជម្រៅបែបចែកចាយ អាចដោះស្រាយបញ្ហាខ្វះខាតហេដ្ឋារចនាសម្ព័ន្ធអ៉ីនធឺណិត និងជំរុញការអភិវឌ្ឍកសិកម្មវៃឆ្លាត (Smart Agriculture) នៅកម្ពុជាឱ្យកាន់តែមានភាពធន់និងប្រសិទ្ធភាពខ្ពស់។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Federated Learning (FL) | ជាវិធីសាស្ត្របង្វឹកម៉ូដែលបញ្ញាសិប្បនិម្មិត (AI) ដោយមិនចាំបាច់ប្រមូលទិន្នន័យពីគ្រប់ឧបករណ៍មកកាន់ម៉ាស៊ីនមេតែមួយនោះទេ។ ឧបករណ៍នីមួយៗ (ដូចជាកាមេរ៉ា IoT) រៀនពីទិន្នន័យផ្ទាល់ខ្លួនរបស់វា រួចបញ្ជូនតែ "ចំណេះដឹងឬទម្ងន់ម៉ូដែល" ទៅកាន់ម៉ាស៊ីនមេដើម្បីបូកបញ្ចូលគ្នាបង្កើតជាម៉ូដែលរួមមួយ។ វិធីនេះជួយរក្សាការសម្ងាត់ទិន្នន័យ និងសន្សំសំចៃកម្រិតបញ្ជូនអ៊ីនធឺណិត។ | ដូចជាសិស្សរៀនធ្វើលំហាត់រៀងៗខ្លួននៅផ្ទះ រួចយកតែ "ចម្លើយនិងគន្លឹះ" មកចែករំលែកប្រាប់គ្រូ ដើម្បីសង្ខេបជាមេរៀនរួម ដោយមិនបាច់យកសៀវភៅលំហាត់ទាំងមូលមកសាលាឡើយ។ |
| Federated Averaging (FedAvg) | ជាក្បួនដោះស្រាយ (Algorithm) គោលមួយក្នុងបច្ចេកវិទ្យា Federated Learning ដែលម៉ាស៊ីនមេកណ្តាលទទួលយកទម្ងន់ម៉ូដែល (Model Weights) ដែលបានហ្វឹកហាត់រួចពីឧបករណ៍នីមួយៗ មកគណនារកមធ្យមភាគបូកបញ្ចូលគ្នា ដើម្បីបង្កើតជាម៉ូដែលសកល (Global Model) មួយដែលឆ្លាតជាងមុន ហើយបញ្ជូនវាត្រលប់ទៅឧបករណ៍នីមួយៗវិញ។ | ដូចជាការយកបទពិសោធន៍ចំណេះដឹងរៀងៗខ្លួនរបស់មនុស្ស១០នាក់ មកបូកបញ្ចូលគ្នា រួចចែកជាមធ្យមភាគ ដើម្បីបង្កើតជាសៀវភៅណែនាំរួមមួយដ៏ល្អឥតខ្ចោះ។ |
| Edge Computing Node (ECN) | ជាកុំព្យូទ័រ ឬម៉ាស៊ីនមេទំហំមធ្យមដែលត្រូវបានដាក់ពង្រាយនៅក្បែរប្រភពទិន្នន័យបំផុត (ឧ. ដាក់នៅក្បែរចម្ការ) ដើម្បីទទួលនិងដំណើរការទិន្នន័យពីសេនស័រ (IoT) ភ្លាមៗ ដោយមិនចាំបាច់បញ្ជូនទិន្នន័យទៅកាន់ម៉ាស៊ីនមេធំៗ (Cloud) ឆ្ងាយៗ ដែលជួយកាត់បន្ថយភាពយឺតយ៉ាវ (Latency) និងធានាបាននូវដំណើរការក្នុងពេលជាក់ស្តែង (Real-time)។ | ដូចជាការមានប្រធានភូមិនៅចាំដោះស្រាយបញ្ហាប្រជាជនក្នុងភូមិភ្លាមៗ ដោយមិនបាច់ធ្វើដំណើរទៅប្តឹងអភិបាលខេត្តនៅឯទីក្រុងរាល់ពេលមានបញ្ហាតូចតាចនោះទេ។ |
| Hierarchical learning pipeline | ជាយុទ្ធសាស្ត្ររៀបចំម៉ូដែល AI ជាដំណាក់កាល។ ជំនួសឱ្យការប្រើម៉ូដែលតែមួយដើម្បីស្គាល់រាល់ជំងឺទាំងអស់ គេប្រើម៉ូដែលទីមួយដើម្បីស្គាល់ "ប្រភេទដំណាំ" សិន បន្ទាប់មកទើបបញ្ជូនទៅម៉ូដែលទីពីរដើម្បីវិភាគរក "ប្រភេទជំងឺ" សម្រាប់ដំណាំនោះជាពិសេស ដែលធ្វើឲ្យការទស្សន៍ទាយមានភាពច្បាស់លាស់ជាងមុន។ | ដូចជាពេលអ្នកទៅមន្ទីរពេទ្យ ដោយត្រូវជួបគ្រូពេទ្យទូទៅដើម្បីពិនិត្យអាការៈបឋមសិន រួចទើបពេទ្យទូទៅបញ្ជូនអ្នកបន្តទៅជួបគ្រូពេទ្យឯកទេសផ្នែកបេះដូង ឬក្រពះ ទៅតាមជំងឺរបស់អ្នកជាក់ស្តែង។ |
| Data Augmentation | ជាបច្ចេកទេសបង្កើតទិន្នន័យថ្មីៗបន្ថែមពីទិន្នន័យដើម ដោយការកែប្រែរូបភាពដូចជា បង្វិល ប្តូរពន្លឺ ធ្វើឲ្យព្រិល ឬបន្ថែមភាពរំខាន (Noise) ដើម្បីបង្វឹកម៉ូដែល AI ឱ្យមានភាពធន់ និងអាចចំណាំរូបភាពបានល្អក្នុងស្ថានភាពជាក់ស្តែងនៅតាមចម្ការដែលមានការប្រែប្រួលអាកាសធាតុនិងពន្លឺច្រើន។ | ដូចជាការហ្វឹកហាត់បើកបរឡានក្នុងពេលភ្លៀងធ្លាក់ ពេលផ្លូវកោង ឬពេលយប់ងងឹត ដើម្បីឱ្យអ្នកបើកបរអាចដោះស្រាយរាល់ស្ថានការណ៍ជាក់ស្តែងបាន មិនមែនចេះតែបើកលើផ្លូវត្រង់ក្នុងពេលថ្ងៃនោះទេ។ |
| EfficientNet-B0 | ជាស្ថាបត្យកម្មបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (Deep Neural Network) មួយប្រភេទសម្រាប់សម្គាល់រូបភាព ដែលត្រូវបានរចនាឡើងយ៉ាងពិសេសឱ្យមានទំហំតូច ដំណើរការលឿន និងស៊ីថាមពលអគ្គិសនីតិច ដែលស័ក្តិសមបំផុតសម្រាប់ដាក់ដំណើរការលើឧបករណ៍ខ្នាតតូចដូចជាទូរស័ព្ទ ឬឧបករណ៍ IoT។ | ដូចជាម៉ាស៊ីនឡានស៊េរីថ្មីដែលមានទំហំតូច ស៊ីសាំងតិច ប៉ុន្តែមានកម្លាំងខ្លាំងអាចអូសទាញបន្ទុកបានធ្ងន់ប្រហាក់ប្រហែលនឹងម៉ាស៊ីនធំៗជំនាន់ចាស់។ |
| IoT Sensor Network | ជាប្រព័ន្ធបណ្តាញដែលភ្ជាប់ឧបករណ៍អេឡិចត្រូនិកខ្នាតតូច (ដូចជាកាមេរ៉ា សេនស័រវាស់សីតុណ្ហភាព ឬសំណើមដី) ជាច្រើនទីតាំងទៅកាន់ប្រព័ន្ធកុំព្យូទ័រតាមរយៈប្រព័ន្ធឥតខ្សែ ដើម្បីប្រមូល ផ្លាស់ប្តូរ និងវិភាគទិន្នន័យដោយស្វ័យប្រវត្តិនៅក្នុងតំបន់កសិកម្ម។ | ដូចជាការដាក់ពង្រាយ "ភ្នែក និងត្រចៀកសិប្បនិម្មិត" នៅពាសពេញចម្ការ ដែលអាចរាយការណ៍ប្រាប់ម្ចាស់ចម្ការរាល់វិនាទីថាមានសត្វល្អិតស៊ីស្លឹក ឬរុក្ខជាតិកំពុងខ្វះទឹក ដោយកសិករមិនបាច់ដើរមើលផ្ទាល់កម្តៅថ្ងៃ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖