Original Title: Distributed Deep Learning in IoT Sensor Network for the Diagnosis of Plant Diseases
Source: doi.org/10.3390/s25247646
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការរៀនស៊ីជម្រៅបែបចែកចាយនៅក្នុងបណ្តាញសេនស័រ IoT សម្រាប់ការធ្វើរោគវិនិច្ឆ័យជំងឺរុក្ខជាតិ

ចំណងជើងដើម៖ Distributed Deep Learning in IoT Sensor Network for the Diagnosis of Plant Diseases

អ្នកនិពន្ធ៖ Athanasios Papanikolaou (University of Zagreb), Athanasios Tziouvaras (University of Thessaly), George Floros (Trinity College Dublin), Apostolos Xenakis (University of Thessaly), Fabio Bonsignorio (University of Zagreb)

ឆ្នាំបោះពុម្ព៖ 2025, Sensors

វិស័យសិក្សា៖ Precision Agriculture and Machine Learning

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ វិធីសាស្រ្តរៀនស៊ីជម្រៅបែបមជ្ឈការ (Centralized deep learning) មិនស័ក្តិសមសម្រាប់ការដាក់ពង្រាយក្នុងវិស័យកសិកម្មខ្នាតធំនោះទេ ដោយសារតែវាទាមទារការបញ្ជូនទិន្នន័យច្រើននិងថាមពលកុំព្យូទ័រខ្ពស់។ ឯកសារនេះដោះស្រាយបញ្ហានេះដោយស្នើឡើងនូវប្រព័ន្ធរៀនស៊ីជម្រៅបែបចែកចាយតាមរយៈបណ្តាញសេនស័រ IoT (IoT Sensor Network) សម្រាប់ការស្វែងរកជំងឺរុក្ខជាតិដោយមិនចាំបាច់បញ្ជូនទិន្នន័យឆៅទៅកាន់ម៉ាស៊ីនមេ (Cloud servers)។

វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះបានរៀបចំស្ថាបត្យកម្មរៀនស៊ីជម្រៅបែបចែកចាយដោយផ្អែកលើបច្ចេកវិទ្យារៀនសហព័ន្ធ (Federated Learning) និងបានវាយតម្លៃប្រៀបធៀបលើប្រព័ន្ធបណ្តុះបណ្តាលពីរប្រភេទផ្សេងគ្នា។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Standard Learning Pipeline
ប្រព័ន្ធបណ្តុះបណ្តាលស្តង់ដារ (ម៉ូដែលតែមួយសម្រាប់ជំងឺទាំងអស់)
ស៊ីថាមពលតិច (Lower power) ទាមទារអង្គចងចាំ (RAM) តិច និងដំណើរការបានលឿនព្រោះប្រើម៉ូដែលតែមួយសម្រាប់ការទស្សន៍ទាយចំណាត់ថ្នាក់ទាំងអស់។ ភាពត្រឹមត្រូវក្នុងការធ្វើចំណាត់ថ្នាក់មានកម្រិតទាបជាងពេលជួបប្រទះរូបភាពដែលមានការប្រែប្រួលខ្លាំង (Degradations) និងងាយច្រឡំរវាងជំងឺនៃដំណាំខុសគ្នា។ មានល្បឿនដំណើរការលឿន (~4.3ms/រូបភាព) និងប្រើប្រាស់ RAM ត្រឹមតែ ~894MB តែប៉ុណ្ណោះ។
Hierarchical Learning Pipeline
ប្រព័ន្ធបណ្តុះបណ្តាលតាមឋានានុក្រម (បំបែកការសម្គាល់ដំណាំ និងជំងឺ)
មានភាពត្រឹមត្រូវខ្ពស់ជាង និងកាត់បន្ថយការភាន់ច្រឡំរវាងប្រភេទដំណាំផ្សេងៗគ្នា ជាពិសេសធន់នឹងបំរែបំរួលរូបភាពដែលកើតមានក្នុងបរិស្ថានជាក់ស្តែង។ ទាមទារថាមពលច្រើនជាងពី ១.៦ ទៅ ១.៨ ដង និងប្រើប្រាស់អង្គចងចាំទ្វេដង ព្រមទាំងមានភាពស្មុគស្មាញក្នុងការគ្រប់គ្រងម៉ូដែលច្រើនក្នុងពេលតែមួយ។ ទទួលបានពិន្ទុ F1 ខ្ពស់ជាង (ឧ. ជំងឺប៉ោមពី 0.664 ទៅ 0.821) ប៉ុន្តែប្រើពេលយូរជាង (~7.7ms/រូបភាព) និងស៊ី RAM រហូតដល់ ~1831MB។

ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះទាមទារនូវឧបករណ៍ IoT ដែលមានសមត្ថភាពគណនា (CPU/GPU) ព្រមទាំងកម្មវិធីសម្រាប់ដំណើរការរៀនសហព័ន្ធ (Federated Learning) ដោយមានកម្រិតការប្រើប្រាស់ថាមពលអគ្គិសនីតិចតួចសម្រាប់ការដាក់ពង្រាយនៅតាមចម្ការ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យរូបភាពស្លឹករុក្ខជាតិដែលមាន ១៤ ប្រភេទដំណាំ (ដូចជាប៉ោម ទំពាំងបាយជូរ ប៉េងប៉ោះ...) ដែលបានបន្ថែមការក្លែងធ្វើពន្លឺ/កម្រិតរូបភាព ៥ ប្រភេទដើម្បីត្រាប់តាមបរិស្ថានជាក់ស្តែង។ ទោះជាយ៉ាងណាក៏ដោយ ដំណាំភាគច្រើននៅក្នុងសំណុំទិន្នន័យនេះមិនមែនជាដំណាំយុទ្ធសាស្ត្រចម្បងរបស់កម្ពុជា (ដូចជា ស្រូវ ដំឡូងមី ស្វាយ ឬកៅស៊ូ) នោះទេ ដូច្នេះម៉ូដែលនេះត្រូវតែប្រមូលទិន្នន័យបន្ថែមក្នុងស្រុក និងហ្វឹកហាត់ជាថ្មី ទើបអាចប្រើប្រាស់ប្រកបដោយប្រសិទ្ធភាពខ្ពស់នៅកម្ពុជា។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកវិទ្យា Federated Learning នេះមានសក្តានុពលខ្ពស់ខ្លាំងសម្រាប់វិស័យកសិកម្មនៅកម្ពុជា ជាពិសេសនៅតំបន់ដាច់ស្រយាលដែលមានបណ្តាញអ៊ីនធឺណិតខ្សោយ ដែលទាមទារការវិភាគទិន្នន័យផ្ទាល់នៅនឹងកន្លែង (Edge Computing)។

ជារួម ការប្រើប្រាស់បណ្តាញសេនស័រ IoT រួមផ្សំជាមួយបច្ចេកវិទ្យារៀនស៊ីជម្រៅបែបចែកចាយ អាចដោះស្រាយបញ្ហាខ្វះខាតហេដ្ឋារចនាសម្ព័ន្ធអ៉ីនធឺណិត និងជំរុញការអភិវឌ្ឍកសិកម្មវៃឆ្លាត (Smart Agriculture) នៅកម្ពុជាឱ្យកាន់តែមានភាពធន់និងប្រសិទ្ធភាពខ្ពស់។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះអភិវឌ្ឍន៍ AI (Learn AI Fundamentals): ចាប់ផ្តើមរៀនសរសេរកូដ Python និងប្រើប្រាស់បណ្ណាល័យ PyTorch ភ្ជាប់ជាមួយស្ថាបត្យកម្មកុំព្យូទ័រ EfficientNet-B0 ដើម្បីយល់ពីរបៀបដំណើរការម៉ូដែលវិភាគរូបភាព (Computer Vision)។
  2. រៀបចំសំណុំទិន្នន័យក្នុងស្រុក (Prepare Local Datasets): ប្រមូលរូបភាពជំងឺដំណាំយុទ្ធសាស្ត្រនៅកម្ពុជា (ឧទាហរណ៍ ជំងឺស្រូវ ឬដំឡូងមី) ដោយប្រើប្រាស់ប្រភពទិន្នន័យដូចជា PlantVillage ឬការចុះថតជាក់ស្តែង ហើយអនុវត្តបច្ចេកទេស Data Augmentation ដើម្បីត្រាប់តាមពន្លឺថ្ងៃនិងស្រមោល។
  3. សាកល្បងបច្ចេកវិទ្យារៀនសហព័ន្ធ (Test Federated Learning): ប្រើប្រាស់កម្មវិធី Flower (flwr) framework ដើម្បីហ្វឹកហាត់ម៉ូដែលជាលក្ខណៈចែកចាយ (Decentralized) នៅលើម៉ាស៊ីនកុំព្យូទ័រតែមួយរបស់អ្នកសិន (Simulation Mode) ដើម្បីយល់ពីយន្តការ FedAvg
  4. ដាក់ពង្រាយលើឧបករណ៍ Edge/IoT (Deploy on Edge/IoT Devices): ទិញឧបករណ៍ខ្នាតតូចដូចជា Raspberry Pi 4NVIDIA Jetson Nano ភ្ជាប់ជាមួយកាមេរ៉ា និងសាកល្បងដំណើរការម៉ូដែលធ្វើការទស្សន៍ទាយ (Inference) ដោយផ្ទាល់នៅនឹងកន្លែងចម្ការ។
  5. វាស់វែងប្រសិទ្ធភាព និងថាមពល (Measure Performance and Energy): ប្រើប្រាស់ឧបករណ៍វាស់ភ្លើង ឬកម្មវិធីវិភាគដូចជា psutil ដើម្បិវាស់ស្ទង់ការស៊ីថាមពលនិងអង្គចងចាំ (RAM) រួចធ្វើការប្រៀបធៀបរវាង Standard Pipeline និង Hierarchical Pipeline ថាមួយណាស័ក្តិសមជាងគេសម្រាប់គម្រោងពិតប្រាកដរបស់អ្នក។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Federated Learning (FL) ជាវិធីសាស្ត្របង្វឹកម៉ូដែលបញ្ញាសិប្បនិម្មិត (AI) ដោយមិនចាំបាច់ប្រមូលទិន្នន័យពីគ្រប់ឧបករណ៍មកកាន់ម៉ាស៊ីនមេតែមួយនោះទេ។ ឧបករណ៍នីមួយៗ (ដូចជាកាមេរ៉ា IoT) រៀនពីទិន្នន័យផ្ទាល់ខ្លួនរបស់វា រួចបញ្ជូនតែ "ចំណេះដឹងឬទម្ងន់ម៉ូដែល" ទៅកាន់ម៉ាស៊ីនមេដើម្បីបូកបញ្ចូលគ្នាបង្កើតជាម៉ូដែលរួមមួយ។ វិធីនេះជួយរក្សាការសម្ងាត់ទិន្នន័យ និងសន្សំសំចៃកម្រិតបញ្ជូនអ៊ីនធឺណិត។ ដូចជាសិស្សរៀនធ្វើលំហាត់រៀងៗខ្លួននៅផ្ទះ រួចយកតែ "ចម្លើយនិងគន្លឹះ" មកចែករំលែកប្រាប់គ្រូ ដើម្បីសង្ខេបជាមេរៀនរួម ដោយមិនបាច់យកសៀវភៅលំហាត់ទាំងមូលមកសាលាឡើយ។
Federated Averaging (FedAvg) ជាក្បួនដោះស្រាយ (Algorithm) គោលមួយក្នុងបច្ចេកវិទ្យា Federated Learning ដែលម៉ាស៊ីនមេកណ្តាលទទួលយកទម្ងន់ម៉ូដែល (Model Weights) ដែលបានហ្វឹកហាត់រួចពីឧបករណ៍នីមួយៗ មកគណនារកមធ្យមភាគបូកបញ្ចូលគ្នា ដើម្បីបង្កើតជាម៉ូដែលសកល (Global Model) មួយដែលឆ្លាតជាងមុន ហើយបញ្ជូនវាត្រលប់ទៅឧបករណ៍នីមួយៗវិញ។ ដូចជាការយកបទពិសោធន៍ចំណេះដឹងរៀងៗខ្លួនរបស់មនុស្ស១០នាក់ មកបូកបញ្ចូលគ្នា រួចចែកជាមធ្យមភាគ ដើម្បីបង្កើតជាសៀវភៅណែនាំរួមមួយដ៏ល្អឥតខ្ចោះ។
Edge Computing Node (ECN) ជាកុំព្យូទ័រ ឬម៉ាស៊ីនមេទំហំមធ្យមដែលត្រូវបានដាក់ពង្រាយនៅក្បែរប្រភពទិន្នន័យបំផុត (ឧ. ដាក់នៅក្បែរចម្ការ) ដើម្បីទទួលនិងដំណើរការទិន្នន័យពីសេនស័រ (IoT) ភ្លាមៗ ដោយមិនចាំបាច់បញ្ជូនទិន្នន័យទៅកាន់ម៉ាស៊ីនមេធំៗ (Cloud) ឆ្ងាយៗ ដែលជួយកាត់បន្ថយភាពយឺតយ៉ាវ (Latency) និងធានាបាននូវដំណើរការក្នុងពេលជាក់ស្តែង (Real-time)។ ដូចជាការមានប្រធានភូមិនៅចាំដោះស្រាយបញ្ហាប្រជាជនក្នុងភូមិភ្លាមៗ ដោយមិនបាច់ធ្វើដំណើរទៅប្តឹងអភិបាលខេត្តនៅឯទីក្រុងរាល់ពេលមានបញ្ហាតូចតាចនោះទេ។
Hierarchical learning pipeline ជាយុទ្ធសាស្ត្ររៀបចំម៉ូដែល AI ជាដំណាក់កាល។ ជំនួសឱ្យការប្រើម៉ូដែលតែមួយដើម្បីស្គាល់រាល់ជំងឺទាំងអស់ គេប្រើម៉ូដែលទីមួយដើម្បីស្គាល់ "ប្រភេទដំណាំ" សិន បន្ទាប់មកទើបបញ្ជូនទៅម៉ូដែលទីពីរដើម្បីវិភាគរក "ប្រភេទជំងឺ" សម្រាប់ដំណាំនោះជាពិសេស ដែលធ្វើឲ្យការទស្សន៍ទាយមានភាពច្បាស់លាស់ជាងមុន។ ដូចជាពេលអ្នកទៅមន្ទីរពេទ្យ ដោយត្រូវជួបគ្រូពេទ្យទូទៅដើម្បីពិនិត្យអាការៈបឋមសិន រួចទើបពេទ្យទូទៅបញ្ជូនអ្នកបន្តទៅជួបគ្រូពេទ្យឯកទេសផ្នែកបេះដូង ឬក្រពះ ទៅតាមជំងឺរបស់អ្នកជាក់ស្តែង។
Data Augmentation ជាបច្ចេកទេសបង្កើតទិន្នន័យថ្មីៗបន្ថែមពីទិន្នន័យដើម ដោយការកែប្រែរូបភាពដូចជា បង្វិល ប្តូរពន្លឺ ធ្វើឲ្យព្រិល ឬបន្ថែមភាពរំខាន (Noise) ដើម្បីបង្វឹកម៉ូដែល AI ឱ្យមានភាពធន់ និងអាចចំណាំរូបភាពបានល្អក្នុងស្ថានភាពជាក់ស្តែងនៅតាមចម្ការដែលមានការប្រែប្រួលអាកាសធាតុនិងពន្លឺច្រើន។ ដូចជាការហ្វឹកហាត់បើកបរឡានក្នុងពេលភ្លៀងធ្លាក់ ពេលផ្លូវកោង ឬពេលយប់ងងឹត ដើម្បីឱ្យអ្នកបើកបរអាចដោះស្រាយរាល់ស្ថានការណ៍ជាក់ស្តែងបាន មិនមែនចេះតែបើកលើផ្លូវត្រង់ក្នុងពេលថ្ងៃនោះទេ។
EfficientNet-B0 ជាស្ថាបត្យកម្មបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (Deep Neural Network) មួយប្រភេទសម្រាប់សម្គាល់រូបភាព ដែលត្រូវបានរចនាឡើងយ៉ាងពិសេសឱ្យមានទំហំតូច ដំណើរការលឿន និងស៊ីថាមពលអគ្គិសនីតិច ដែលស័ក្តិសមបំផុតសម្រាប់ដាក់ដំណើរការលើឧបករណ៍ខ្នាតតូចដូចជាទូរស័ព្ទ ឬឧបករណ៍ IoT។ ដូចជាម៉ាស៊ីនឡានស៊េរីថ្មីដែលមានទំហំតូច ស៊ីសាំងតិច ប៉ុន្តែមានកម្លាំងខ្លាំងអាចអូសទាញបន្ទុកបានធ្ងន់ប្រហាក់ប្រហែលនឹងម៉ាស៊ីនធំៗជំនាន់ចាស់។
IoT Sensor Network ជាប្រព័ន្ធបណ្តាញដែលភ្ជាប់ឧបករណ៍អេឡិចត្រូនិកខ្នាតតូច (ដូចជាកាមេរ៉ា សេនស័រវាស់សីតុណ្ហភាព ឬសំណើមដី) ជាច្រើនទីតាំងទៅកាន់ប្រព័ន្ធកុំព្យូទ័រតាមរយៈប្រព័ន្ធឥតខ្សែ ដើម្បីប្រមូល ផ្លាស់ប្តូរ និងវិភាគទិន្នន័យដោយស្វ័យប្រវត្តិនៅក្នុងតំបន់កសិកម្ម។ ដូចជាការដាក់ពង្រាយ "ភ្នែក និងត្រចៀកសិប្បនិម្មិត" នៅពាសពេញចម្ការ ដែលអាចរាយការណ៍ប្រាប់ម្ចាស់ចម្ការរាល់វិនាទីថាមានសត្វល្អិតស៊ីស្លឹក ឬរុក្ខជាតិកំពុងខ្វះទឹក ដោយកសិករមិនបាច់ដើរមើលផ្ទាល់កម្តៅថ្ងៃ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖