Original Title: Federated Learning for IoT and Edge Computing: A Comprehensive Review of Models, Optimization Strategies, Security, and Real-World Applications
Source: doi.org/10.63680/ijsate0524112.06
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការរៀនសូត្របែបសហព័ន្ធសម្រាប់ IoT និងកុំព្យូទ័រជាយបណ្តាញ៖ ការពិនិត្យឡើងវិញយ៉ាងទូលំទូលាយអំពីម៉ូដែល យុទ្ធសាស្រ្តបង្កើនប្រសិទ្ធភាព សុវត្ថិភាព និងការអនុវត្តក្នុងពិភពពិត

ចំណងជើងដើម៖ Federated Learning for IoT and Edge Computing: A Comprehensive Review of Models, Optimization Strategies, Security, and Real-World Applications

អ្នកនិពន្ធ៖ Funminiyi Olagunju (Department of Electrical Engineering, North Carolina A & T State University)

ឆ្នាំបោះពុម្ព៖ 2024, International Journal of Science, Architecture, Technology, and Environment

វិស័យសិក្សា៖ Computer Engineering / Machine Learning

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការប្រើប្រាស់បច្ចេកវិទ្យា Cloud Computing ជាប្រពៃណីសម្រាប់ឧបករណ៍ IoT ប្រឈមនឹងបញ្ហាយឺតយ៉ាវ កម្រិតបញ្ជូនទិន្នន័យ និងហានិភ័យឯកជនភាព ដែលទាមទារនូវវិធីសាស្រ្តរៀនសូត្ររបស់ម៉ាស៊ីនបែបវិមជ្ឈការសម្រាប់ឧបករណ៍ដែលមានធនធានមានកម្រិត។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានពិនិត្យឡើងវិញយ៉ាងទូលំទូលាយអំពីគំរូនៃការរៀនសូត្របែបសហព័ន្ធ (Federated Learning) យុទ្ធសាស្រ្តបង្កើនប្រសិទ្ធភាព និងយន្តការសុវត្ថិភាពដែលអាចអនុវត្តបានចំពោះបរិស្ថានកុំព្យូទ័រជាយបណ្តាញ និង IoT ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Horizontal FL
ការរៀនសូត្របែបសហព័ន្ធផ្តេក
ងាយស្រួលក្នុងការបែងចែកទិន្នន័យ និងការប្រមូលផ្តុំម៉ូដែលពីឧបករណ៍ដែលមានលក្ខណៈ (Features) ស្រដៀងគ្នា។ សន្មតថាទិន្នន័យទាំងអស់មានលក្ខណៈដូចគ្នា ដែលមិនតែងតែពិតជាក់ស្តែងនៅក្នុងបណ្តាញចម្រុះឡើយ។ ស័ក្តិសមបំផុតសម្រាប់បណ្តាញឧបករណ៍ IoT ដូចគ្នា ដូចជាប្រព័ន្ធកាមេរ៉ាសុវត្ថិភាព ឬផ្ទះឆ្លាតវៃ។
Vertical FL
ការរៀនសូត្របែបសហព័ន្ធបញ្ឈរ
អនុញ្ញាតឱ្យស្ថាប័នផ្សេងគ្នាអាចសហការគ្នាលើទិន្នន័យបំពេញបន្ថែម (ឧ. មន្ទីរពេទ្យ និងក្រុមហ៊ុនធានារ៉ាប់រង)។ ទាមទារការតម្រឹមទិន្នន័យ (Feature Alignment) ស្មុគស្មាញ និងចំណាយធនធានគណនាខ្ពស់។ ផ្តល់លទ្ធភាពក្នុងការប្រើប្រាស់ទិន្នន័យឆ្លងស្ថាប័នដោយមិនបំពានលើគោលការណ៍ឯកជនភាពទិន្នន័យ។
Model Compression (Quantization & Pruning)
ការបង្រួមម៉ូដែល
កាត់បន្ថយការប្រើប្រាស់កម្រិតបញ្ជូនទិន្នន័យ (Bandwidth) និងជួយឲ្យការបញ្ជូនមានភាពរហ័ស។ អាចប្រឈមនឹងការថយចុះនៃភាពត្រឹមត្រូវនៃម៉ូដែល (Accuracy Loss) ប្រសិនបើធ្វើការបង្រួមខ្លាំងពេក។ អាចកាត់បន្ថយចំណាយលើការទំនាក់ទំនងតាមបណ្តាញបានរហូតដល់ ៩០% ជាមួយការរក្សាបាននូវដំណើរការល្អ។
Hierarchical FL (Edge-Cloud Split)
ការរៀនសូត្រតាមឋានានុក្រម (បែងចែក Edge និង Cloud)
កាត់បន្ថយភាពយឺតយ៉ាវ (Latency) និងមានភាពងាយស្រួលក្នុងការពង្រីកទំហំបណ្តាញប្រព័ន្ធប្រកបដោយប្រសិទ្ធភាព។ ទាមទារឱ្យមានការរៀបចំហេដ្ឋារចនាសម្ព័ន្ធ Edge Server បន្ថែមនៅចន្លោះឧបករណ៍ និង Cloud កណ្តាល។ កាត់បន្ថយបន្ទុកបញ្ជូនទិន្នន័យ និងបង្កើនល្បឿនសមកាលកម្ម ស័ក្តិសមសម្រាប់កម្មវិធីក្នុងទីក្រុងឆ្លាតវៃ។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្ត Federated Learning (FL) សម្រាប់ IoT តម្រូវឱ្យមានការវិនិយោគលើផ្នែករឹងនៅតាមទីតាំងកាមេរ៉ាឬសេនស័រ និងកម្មវិធីឯកទេសដែលអាចគ្រប់គ្រងការគណនាបែបវិមជ្ឈការ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះពឹងផ្អែកលើការស្រាវជ្រាវក្នុងបរិបទប្រទេសអភិវឌ្ឍន៍ដែលមានហេដ្ឋារចនាសម្ព័ន្ធ 5G និង IoT ទំនើប។ សម្រាប់ប្រទេសកម្ពុជា បញ្ហាអស្ថិរភាពអ៊ីនធឺណិត និងភាពខុសគ្នានៃទិន្នន័យនិងឧបករណ៍ (Data Imbalance/Non-IID) រវាងទីក្រុងនិងតំបន់ជនបទ នឹងជះឥទ្ធិពលខ្លាំងដល់ប្រសិទ្ធភាពនិងល្បឿននៃការបង្វឹកម៉ូដែលកម្រិតមូលដ្ឋាន។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្រ្ត Federated Learning នេះមានសក្តានុពលខ្ពស់សម្រាប់ជំរុញនវានុវត្តន៍ឌីជីថលនៅកម្ពុជា ជាពិសេសក្នុងការជម្នះឧបសគ្គផ្នែកកម្រិតបញ្ជូនអ៊ីនធឺណិត និងការរក្សាការសម្ងាត់។

ការជ្រើសរើសប្រភេទម៉ូដែល FL ដែលមានទំហំតូច និងអាចដំណើរការដោយមិនសមកាលកម្ម (Asynchronous FL) គឺជាគន្លឹះដ៏សំខាន់សម្រាប់ការអនុវត្តជាក់ស្តែងឲ្យស្របនឹងបរិបទហេដ្ឋារចនាសម្ព័ន្ធបច្ចុប្បន្ននៅក្នុងប្រទេសកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃការរៀនសូត្របែបសហព័ន្ធ: ចាប់ផ្តើមស្វែងយល់ពីគោលការណ៍នៃ FL និងឯកជនភាពទិន្នន័យ (Data Privacy) តាមរយៈការអនុវត្តផ្ទាល់ជាមួយ TensorFlow Federated (TFF) លើគម្រោង AI តូចៗ។
  2. អនុវត្តការក្លែងធ្វើ (Simulation) បណ្តាញ IoT: ប្រើប្រាស់ក្របខ័ណ្ឌ Flower ដើម្បីបង្កើតការក្លែងធ្វើបណ្តាញ Clients នៅលើកុំព្យូទ័រតែមួយ ដោយសាកល្បងបង្វឹកម៉ូដែលជាមួយការបែងចែកទិន្នន័យមិនស្មើគ្នា (Non-IID data)។
  3. សាកល្បងជាមួយឧបករណ៍ Edge ពិតប្រាកដ: ដាក់បញ្ចូលម៉ូដែលដែលប្រើប្រាស់បច្ចេកទេស TinyMLMobileNets ទៅក្នុងឧបករណ៍ NVIDIA Jetson Nano ឬ Raspberry Pi ដើម្បីវាស់ស្ទង់ការប្រើប្រាស់ថាមពលនិងប្រសិទ្ធភាព។
  4. អនុវត្តបច្ចេកទេសការពារសុវត្ថិភាពទិន្នន័យ: សិក្សាពីការការពារការវាយប្រហារ (Model Poisoning) នៅក្នុងបណ្តាញ ដោយសាកល្បងបញ្ចូលមុខងារ Differential Privacy ទៅលើការបញ្ជូនទិន្នន័យ (Gradients) រវាងឧបករណ៍កូន និង Server កណ្តាល។
  5. បង្កើតគម្រោងសាកល្បងផ្ទាល់ (Pilot Project): សហការគ្នាបង្កើតប្រព័ន្ធសេនស័រវាស់គុណភាពខ្យល់ (IoT Sensors) ច្រើនទីតាំង ដោយប្រើប្រាស់យុទ្ធសាស្រ្ត Event-Triggered Updates ដើម្បីសន្សំសំចៃការប្រើប្រាស់អ៊ីនធឺណិត។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Horizontal Federated Learning (HFL) ជាទម្រង់នៃការរៀនសូត្របែបសហព័ន្ធដែលឧបករណ៍កូន (Clients) ទាំងអស់មានប្រភេទនៃទិន្នន័យ (Features) ដូចៗគ្នា ប៉ុន្តែប្រមូលពីប្រភពឬអ្នកប្រើប្រាស់ផ្សេងៗគ្នា។ វាស័ក្តិសមសម្រាប់ឧបករណ៍ IoT ដូចគ្នាដូចជាសេនស័រវាស់សីតុណ្ហភាពតាមផ្ទះផ្សេងៗគ្នា។ ដូចជាសិស្សជាច្រើននាក់ប្រើប្រាស់សៀវភៅពុម្ពគណិតវិទ្យាដូចគ្នា ដើម្បីរៀនដោះស្រាយលំហាត់ខុសៗគ្នា។
Vertical Federated Learning (VFL) ជាគំរូដែលស្ថាប័នផ្សេងគ្នាមានទិន្នន័យរបស់អ្នកប្រើប្រាស់តែមួយ ប៉ុន្តែមានប្រភេទព័ត៌មាន (Features) ខុសៗគ្នា សហការគ្នាបង្វឹកម៉ូដែលតែមួយដោយមិនចែករំលែកទិន្នន័យឆៅឲ្យគ្នាទៅវិញទៅមកឡើយ។ ដូចជាមន្ទីរពេទ្យ (មានទិន្នន័យសុខភាព) និងធនាគារ (មានទិន្នន័យហិរញ្ញវត្ថុ) សហការគ្នាវាយតម្លៃបុគ្គលម្នាក់ដោយមិនបង្ហាញឯកសារផ្ទៃក្នុងឲ្យគ្នា។
Model Compression (Quantization and Pruning) បច្ចេកទេសបង្រួមទំហំនៃម៉ូដែល AI តាមរយៈការកាត់បន្ថយកម្រិតលម្អិតនៃទិន្នន័យ (Quantization) ឬលុបចោលការតភ្ជាប់ដែលមិនសំខាន់នៅក្នុងបណ្តាញសរសៃប្រសាទ (Pruning) ដើម្បីកាត់បន្ថយទំហំបញ្ជូនទិន្នន័យតាមបណ្តាញ។ ដូចជាការបង្រួមទំហំរូបភាព (Compress) មុននឹងផ្ញើតាមតេឡេក្រាម ដើម្បីសន្សំអ៊ីនធឺណិតនិងផ្ញើបានលឿន។
Differential Privacy (DP) យន្តការការពារឯកជនភាពដោយការបញ្ចូល "សំឡេងរំខាន" (Noise) ទៅក្នុងទិន្នន័យដែលបានធ្វើបច្ចុប្បន្នភាព មុននឹងបញ្ជូនទៅកាន់ម៉ាស៊ីនមេ ដើម្បីកុំឱ្យគេអាចទាញយកព័ត៌មានដើមរបស់បុគ្គលណាម្នាក់បានទោះបីជាទិន្នន័យត្រូវបែកធ្លាយក៏ដោយ។ ដូចជាការលាយគ្រាប់សណ្តែកពណ៌ផ្សេងបន្តិចបន្តួចចូលទៅក្នុងកន្ត្រកសណ្តែករបស់អ្នក ដើម្បីកុំឲ្យគេដឹងច្បាស់ថាអ្នកមានសណ្តែកពណ៌អ្វីខ្លះពិតប្រាកដ។
Model Poisoning ការវាយប្រហារផ្នែកសុវត្ថិភាពដែលជនខិលខូច (Adversaries) បញ្ជូនទិន្នន័យម៉ូដែល (Gradients) ដែលខុស ឬមានផ្ទុកមេរោគទៅកាន់ម៉ាស៊ីនមេកណ្តាល ដើម្បីធ្វើឱ្យម៉ូដែលរួម (Global Model) ទាំងមូលដំណើរការខុសប្រក្រតី ឬលម្អៀង។ ដូចជាចុងភៅម្នាក់លួចដាក់អំបិលច្រើនពេកចូលក្នុងស៊ុបរួម ធ្វើឲ្យខូចរសជាតិស៊ុបទាំងមូលដែលអ្នកគ្រប់គ្នាត្រូវញ៉ាំ។
Homomorphic Encryption (HE) បច្ចេកវិទ្យាអ៊ិនគ្រីបកម្រិតខ្ពស់ដែលអនុញ្ញាតឲ្យម៉ាស៊ីនកុំព្យូទ័រអាចធ្វើការគណនាដោយផ្ទាល់នៅលើទិន្នន័យដែលបានធ្វើកូដនីយកម្ម (Encrypted Data) រួចរាល់ ដោយមិនចាំបាច់បំបែកកូដ (Decrypt) ជាមុនឡើយ ដែលជួយការពារការលេចធ្លាយទិន្នន័យ។ ដូចជាការឱ្យជាងជួសជុលគ្រឿងអលង្ការដែលនៅក្នុងប្រអប់កញ្ចក់បិទជិត ដោយគាត់អាចលូកដៃចូលធ្វើការបានតាមស្រោមដៃ ប៉ុន្តែមិនអាចយករបស់នោះចេញមកក្រៅបាន។
Asynchronous FL ការរៀនសូត្របែបសហព័ន្ធដែលមិនសមកាលកម្ម អនុញ្ញាតឲ្យឧបករណ៍នីមួយៗបញ្ជូនទិន្នន័យអាប់ដេតទៅម៉ាស៊ីនមេដោយឯករាជ្យ ដោយមិនចាំបាច់រង់ចាំឧបករណ៍ផ្សេងទៀតរួចរាល់ឡើយ ដែលជួយដោះស្រាយបញ្ហាអ៊ីនធឺណិតយឺត ឬរអាក់រអួល។ ដូចជាសិស្សប្រគល់កិច្ចការផ្ទះទៅគ្រូភ្លាមៗនៅពេលធ្វើរួច ដោយមិនចាំបាច់រង់ចាំមិត្តរួមថ្នាក់ផ្សេងទៀតធ្វើរួចទើបប្រគល់ព្រមគ្នានោះទេ។
Federated Transfer Learning (FTL) ការរួមបញ្ចូលគ្នារវាងការរៀនសូត្របែបសហព័ន្ធ និងការផ្ទេរចំណេះដឹង (Transfer Learning) សម្រាប់ប្រើក្នុងករណីដែលឧបករណ៍ឬស្ថាប័នទាំងឡាយមានទាំងទិន្នន័យ និងអ្នកប្រើប្រាស់ខុសគ្នាច្រើន ប៉ុន្តែនៅតែអាចចែករំលែកចំណេះដឹងទូទៅបាន។ ដូចជាការរៀនជិះកង់អាចជួយឲ្យអ្នករៀនជិះម៉ូតូបានលឿនជាងមុន ទោះបីជាយានយន្តនិងរបៀបបញ្ជាទាំងពីរនេះខុសគ្នាក៏ដោយ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖