Original Title: Federated Learning-Based Intrusion Detection in Industrial IoT Networks
Source: doi.org/10.3390/fi18010002
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការរកឃើញការលុកលុយដោយផ្អែកលើការរៀនបែបសហព័ន្ធនៅក្នុងបណ្តាញ IoT ឧស្សាហកម្ម

ចំណងជើងដើម៖ Federated Learning-Based Intrusion Detection in Industrial IoT Networks

អ្នកនិពន្ធ៖ George Dominic Pecherle (University of Oradea), Robert Ștefan Győrödi (University of Oradea), Cornelia Aurora Győrödi (University of Oradea)

ឆ្នាំបោះពុម្ព៖ 2025

វិស័យសិក្សា៖ Computer Science / Cybersecurity

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ បណ្តាញ IoT ឧស្សាហកម្ម (IIoT) ប្រឈមមុខនឹងការគំរាមកំហែងផ្នែកសន្តិសុខតាមអ៊ីនធឺណិត ប៉ុន្តែប្រព័ន្ធរកឃើញការលុកលុយបែបប្រមូលផ្តុំ (Centralized IDS) បង្កហានិភ័យដល់ឯកជនភាពទិន្នន័យ និងត្រូវការកម្រិតបញ្ជូនអ៊ីនធឺណិតខ្ពស់ពេក។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់វិធីសាស្ត្រការរៀនបែបសហព័ន្ធ (Federated Learning) ដោយប្រើក្របខ័ណ្ឌ Flower ដើម្បីបង្វឹកគំរូ AI លើឧបករណ៍ជាច្រើនដោយមិនចែករំលែកទិន្នន័យដើម។

Flower Framework Simulation (ការពិសោធន៍លើក្របខ័ណ្ឌ Flower)
Synthetic IIoT Dataset (សំណុំទិន្នន័យ IIoT សំយោគចំនួន ៥០,០០០ គំរូ)
Multilayer Perceptron Model (គំរូ MLP សម្រាប់ចាត់ថ្នាក់ចរាចរណ៍បណ្តាញ)
Federated Averaging Algorithm (ក្បួនដោះស្រាយ FedAvg សម្រាប់ការបូកសរុបគំរូ)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ការរៀនបែបសហព័ន្ធទទួលបានភាពត្រឹមត្រូវ ៩៧.២% ដែលប្រហាក់ប្រហែលនឹងគំរូកណ្តាល (៩៨.៩%) ប៉ុន្តែមានសុវត្ថិភាពទិន្នន័យខ្ពស់ជាង។
កាត់បន្ថយការប្រើប្រាស់កម្រិតបញ្ជូន (Bandwidth) យ៉ាងខ្លាំង ដោយចំណាយទិន្នន័យក្រោម ១ មេកាបៃ ក្នុងការផ្លាស់ប្តូរទិន្នន័យគំរូ។
ប្រព័ន្ធនៅតែរក្សាបាននូវប្រសិទ្ធភាពខ្ពស់ ទោះបីជាទិន្នន័យនៅលើឧបករណ៍នីមួយៗមានភាពខុសប្លែកគ្នា (non-IID) ក៏ដោយ។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Centralized Machine Learning ការរៀនម៉ាស៊ីនបែបប្រមូលផ្តុំ (ទិន្នន័យទាំងអស់ត្រូវបញ្ជូនទៅកន្លែងតែមួយ)	មានភាពត្រឹមត្រូវខ្ពស់បំផុតដោយសារម៉ាស៊ីនមេមើលឃើញទិន្នន័យទាំងអស់។	ត្រូវការកម្រិតបញ្ជូន (Bandwidth) ខ្ពស់ដើម្បីបញ្ជូនទិន្នន័យដើម និងមានហានិភ័យបែកធ្លាយទិន្នន័យសម្ងាត់។	ភាពត្រឹមត្រូវ ៩៨.៩% (Accuracy)
Federated Learning (FedAvg) ការរៀនបែបសហព័ន្ធ (បង្វឹកគំរូនៅនឹងកន្លែង ហើយបញ្ជូនតែប៉ារ៉ាម៉ែត្រទៅម៉ាស៊ីនមេ)	ការពារឯកជនភាពទិន្នន័យបានល្អ និងកាត់បន្ថយការប្រើប្រាស់អ៊ីនធឺណិតយ៉ាងខ្លាំង។	ភាពត្រឹមត្រូវទាបជាងគំរូកណ្តាលបន្តិច (ប្រហែល ១-២%) និងមានភាពស្មុគស្មាញក្នុងការគ្រប់គ្រង។	ភាពត្រឹមត្រូវ ៩៧.២% (Accuracy) ដោយប្រើទិន្នន័យក្រោម ១ មេកាបៃ

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះប្រើប្រាស់ធនធានកុំព្យូទ័រ កម្រិតមធ្យម ដែលបង្ហាញថាវាអាចអនុវត្តបាននៅលើកុំព្យូទ័រយួរដៃធម្មតា ឬឧបករណ៍ Edge ក្នុងរោងចក្រ។

Hardware: កុំព្យូទ័រដែលមាន CPU AMD Ryzen 7 5700U និង RAM 16 GB (អាចដំណើរការលើកុំព្យូទ័រយួរដៃទូទៅ)។
Software: ភាសា Python 3.11, បណ្ណាល័យ PyTorch 2.2 និងក្របខ័ណ្ឌ Flower 1.8.0។
Dataset: ទិន្នន័យ IIoT សំយោគ (Synthetic Dataset) ចំនួន ៥០,០០០ គំរូ ដែលបង្កើតឡើងដោយ Scikit-learn។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់ទិន្នន័យសំយោគ (Synthetic Data) ជំនួសឱ្យទិន្នន័យពិតពីរោងចក្រ ដែលអាចធ្វើឱ្យលទ្ធផលមានភាពល្អប្រសើរជាងការអនុវត្តជាក់ស្តែង។ សម្រាប់កម្ពុជា នេះមានន័យថាយើងត្រូវតែសាកល្បងជាមួយទិន្នន័យចរាចរណ៍បណ្តាញពិតប្រាកដពីហេដ្ឋារចនាសម្ព័ន្ធក្នុងស្រុក ដើម្បីធានាប្រសិទ្ធភាព។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកវិទ្យានេះមានសារៈសំខាន់ណាស់សម្រាប់វិស័យឧស្សាហកម្ម ៤.០ (Industry 4.0) នៅកម្ពុជា ដែលកំពុងត្រូវការប្រព័ន្ធសុវត្ថិភាពដោយមិនប៉ះពាល់ដល់ល្បឿនអ៊ីនធឺណិត។

តំបន់សេដ្ឋកិច្ចពិសេស (SEZs): រោងចក្រក្នុងតំបន់សេដ្ឋកិច្ចពិសេស (ដូចជាភ្នំពេញ ឬព្រះសីហនុ) អាចប្រើប្រព័ន្ធនេះដើម្បីការពារបណ្តាញម៉ាស៊ីនស្វ័យប្រវត្តិ ដោយមិនចាំបាច់បញ្ជូនទិន្នន័យផលិតកម្មសម្ងាត់ចេញទៅក្រៅ។
វិស័យថាមពល (អគ្គិសនីកម្ពុជា - EDC): ការការពារប្រព័ន្ធ Smart Grid ពីការវាយប្រហារតាមអ៊ីនធឺណិត ដោយប្រើឧបករណ៍ Edge នៅតាមអនុស្ថានីយ៍ដើម្បីចាប់យកសកម្មភាពមិនប្រក្រតី។
សហគ្រាសធុនតូច និងមធ្យម (SMEs): សាកសមសម្រាប់រោងចក្រកិនស្រូវ ឬកែច្នៃអាហារដែលមានអ៊ីនធឺណិតមានកម្រិត ដោយសារបច្ចេកវិទ្យានេះមិនត្រូវការបញ្ជូនទិន្នន័យធំៗ។

វាជាដំណោះស្រាយដែលមានតម្លៃសមរម្យ និងមានសុវត្ថិភាពខ្ពស់សម្រាប់ការការពារហេដ្ឋារចនាសម្ព័ន្ធឌីជីថលដែលកំពុងរីកចម្រើននៅកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះ: និស្សិតគួរចាប់ផ្តើមរៀនភាសា Python និងបណ្ណាល័យ Deep Learning ដូចជា PyTorch ឬ TensorFlow ជាមុនសិន។
ពិសោធន៍ជាមួយ Flower Framework: ដំឡើងនិងរៀនប្រើប្រាស់ក្របខ័ណ្ឌ Flower (flwr) ដើម្បីបង្កើតការពិសោធន៍ Federated Learning ខ្នាតតូចនៅលើកុំព្យូទ័រផ្ទាល់ខ្លួន។
បង្កើតទិន្នន័យសាកល្បង: ប្រើប្រាស់ Scikit-learn ដើម្បីបង្កើតទិន្នន័យចរាចរណ៍បណ្តាញ (Network Traffic) ឬទាញយកទិន្នន័យសាធារណៈដូចជា UNSW-NB15 ដើម្បីយកមកបង្វឹក។
ការអនុវត្តលើឧបករណ៍ជាក់ស្តែង (Edge Deployment): សាកល្បងដំណើរការកូដ Client នៅលើកុំព្យូទ័រតូចៗដូចជា Raspberry Pi ដើម្បីតំណាងឱ្យឧបករណ៍ IoT នៅក្នុងរោងចក្រពិតប្រាកដ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Federated Learning (FL)	ជាបច្ចេកទេសបង្វឹកម៉ាស៊ីនរៀន (Machine Learning) បែបថ្មី ដែលអនុញ្ញាតឱ្យឧបករណ៍នីមួយៗ (ដូចជាកុំព្យូទ័រ ឬទូរស័ព្ទ) រៀនពីទិន្នន័យរបស់ខ្លួន ហើយបញ្ជូនតែចំណេះដឹង (Parameter Updates) ទៅកាន់ម៉ាស៊ីនមេ ដោយមិនចាំបាច់បញ្ជូនទិន្នន័យដើមចេញក្រៅឡើយ។	ដូចជាការដែលសិស្សម្នាក់ៗរៀនដោះស្រាយលំហាត់នៅផ្ទះរៀងៗខ្លួន ហើយគ្រាន់តែផ្ញើចម្លើយសង្ខេបទៅគ្រូដើម្បីកែសម្រួលវិញ្ញាសារួម ដោយមិនបាច់យកសៀវភៅមកសាលា។
Industrial Internet of Things (IIoT)	សំដៅលើបណ្តាញនៃឧបករណ៍ឆ្លាតវៃ សេនស័រ និងម៉ាស៊ីននៅក្នុងវិស័យឧស្សាហកម្ម ដែលភ្ជាប់គ្នាទៅវិញទៅមកតាមរយៈអ៊ីនធឺណិត ដើម្បីប្រមូលទិន្នន័យ និងគ្រប់គ្រងដំណើរការផលិតកម្មដោយស្វ័យប្រវត្តិ។	ដូចជាការបំពាក់ប្រព័ន្ធសរសៃប្រសាទឱ្យរោងចក្រ ដើម្បីឱ្យម៉ាស៊ីនអាចនិយាយគ្នា និងរាយការណ៍បញ្ហាដោយខ្លួនឯង។
Intrusion Detection System (IDS)	ជាកម្មវិធី ឬឧបករណ៍ដែលតាមដានចរាចរណ៍បណ្តាញ ឬសកម្មភាពក្នុងប្រព័ន្ធជាប្រចាំ ដើម្បីស្វែងរកសញ្ញានៃការវាយប្រហារ ការលុកលុយ ឬសកម្មភាពមិនប្រក្រតីពីឧក្រិដ្ឋជនបច្ចេកវិទ្យា។	ប្រៀបដូចជាកាមេរ៉ាសុវត្ថិភាព និងសន្តិសុខដែលយាមនៅច្រកទ្វារ ដើម្បីចាប់អ្នកបន្លំចូលផ្ទះ ឬសកម្មភាពដែលគួរឱ្យសង្ស័យ។
Non-IID (Non-Independent and Identically Distributed)	ជាពាក្យបច្ចេកទេសស្ថិតិដែលប្រើក្នុងបរិបទនេះដើម្បីពណ៌នាថា ទិន្នន័យនៅលើឧបករណ៍នីមួយៗមានលក្ខណៈខុសប្លែកគ្នាខ្លាំង (ឧទាហរណ៍ ឧបករណ៍មួយជួបតែការវាយប្រហារម្យ៉ាង ឯឧបករណ៍មួយទៀតជួបតែចរាចរណ៍ធម្មតា) ដែលធ្វើឱ្យការបង្វឹក AI មានការលំបាកជាងទិន្នន័យដែលមានលក្ខណៈដូចគ្នា។	ដូចជាការបង្រៀនសិស្សអំពីសត្វ ប៉ុន្តែសិស្សម្នាក់ធ្លាប់ឃើញតែរូបឆ្កែ ហើយសិស្សម្នាក់ទៀតធ្លាប់ឃើញតែរូបឆ្មា ធ្វើឱ្យពួកគេពិបាកយល់អំពី 'សត្វ' ជារួមដូចគ្នា។
Federated Averaging (FedAvg)	ជាក្បួនដោះស្រាយ (Algorithm) ស្តង់ដារនៅក្នុង Federated Learning ដែលម៉ាស៊ីនមេប្រើដើម្បីប្រមូលយកគំរូ (Model Weights) ពីឧបករណ៍ជាច្រើន មកគណនារកមធ្យមភាគ ដើម្បីបង្កើតជាគំរូសកលមួយដែលមានសមត្ថភាពខ្លាំង។	ដូចជាការយករសជាតិសម្លពីចុងភៅជាច្រើននាក់មកលាយបញ្ចូលគ្នា និងភ្លក់រករសជាតិកណ្តាលមួយដែលឆ្ងាញ់ និងទទួលយកបានដោយមនុស្សគ្រប់គ្នា។
Edge Computing	ជាការគណនា និងដំណើរការទិន្នន័យនៅជិតប្រភពដែលបង្កើតទិន្នន័យនោះ (ដូចជានៅលើម៉ាស៊ីន ឬឧបករណ៍ Gateway) ជាជាងបញ្ជូនទៅ Cloud ឆ្ងាយៗ ដើម្បីកាត់បន្ថយការយឺតយ៉ាវ (Latency) និងសន្សំសំចៃអ៊ីនធឺណិត។	ដូចជាការមានប្រអប់សង្គ្រោះបឋមនៅផ្ទះដើម្បីព្យាបាលរបួសភ្លាមៗ ជំនួសឱ្យការរត់ទៅមន្ទីរពេទ្យរាល់ពេលមានមុតដៃបន្តិចបន្តួច។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖