Original Title: SecFedDNN: A Secure Federated Deep Learning Framework for Edge–Cloud Environments
Source: doi.org/10.3390/systems13060463
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

SecFedDNN៖ ក្របខណ្ឌការរៀនស៊ីជម្រៅសហព័ន្ធប្រកបដោយសុវត្ថិភាពសម្រាប់បរិស្ថាន Edge-Cloud

ចំណងជើងដើម៖ SecFedDNN: A Secure Federated Deep Learning Framework for Edge–Cloud Environments

អ្នកនិពន្ធ៖ Roba H. Alamir (Taibah University), Ayman Noor, Hanan Almukhalfi, Reham Almukhlifi, Talal H. Noor

ឆ្នាំបោះពុម្ព៖ 2025, Systems

វិស័យសិក្សា៖ Cybersecurity / Machine Learning

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការគំរាមកំហែងតាមអ៊ីនធឺណិតដែលកំណត់គោលដៅលើឧបករណ៍ IoT និងបរិស្ថាន Edge Computing កំពុងកើនឡើង ដែលទាមទារឱ្យមានប្រព័ន្ធរកឃើញការវាយប្រហារ (Intrusion Detection Systems) ដែលមានភាពរឹងមាំ និងអាចរក្សាឯកជនភាពទិន្នន័យបានល្អជាងប្រព័ន្ធកណ្តាល (Centralized IDS) បែបប្រពៃណី។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានណែនាំនូវក្របខណ្ឌ SecFedDNN ដោយប្រើប្រាស់ការរៀនស៊ីជម្រៅសហព័ន្ធ (Federated Deep Learning) ដើម្បីស្វែងរកការវាយប្រហារតាមអ៊ីនធឺណិត ខណៈពេលដែលរក្សាទិន្នន័យដើមនៅតាមមូលដ្ឋាន (Local) ដដែល។

ការប្រើប្រាស់បណ្តាញសរសៃប្រសាទស៊ីជម្រៅ (Deep Neural Network - DNN) ជាម៉ូដែលគោល
ការបណ្តុះបណ្តាលសហព័ន្ធដោយប្រើប្រាស់ពិធីការមធ្យមភាគ (Federated Averaging - FedAvg)
ការចម្រោះទិន្នន័យមុនការប្រមូលផ្តុំ (Pre-aggregation filtering) តាមរយៈ Layer-Adaptive Sparsified Model Aggregation (LASA)
ការធ្វើការក្លែងធ្វើ និងវាយតម្លៃលើសំណុំទិន្នន័យ TON_IoT សម្រាប់ការវាយប្រហារប្រភេទ DDoS, DoS, និង Injection

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ការធ្វើតេស្តដំបូងបានបង្ហាញថា ម៉ូដែល DNN មានដំណើរការល្អជាងម៉ូដែល LSTM និង SimpleNN នៅក្នុងមជ្ឈដ្ឋានកណ្តាល (Centralized environments) ដោយផ្តល់នូវភាពត្រឹមត្រូវខ្ពស់ និងចំណាយធនធានកុំព្យូទ័រតិចជាង។
ក្របខណ្ឌ SecFedDNN សម្រេចបាននូវភាពត្រឹមត្រូវ (Accuracy និង Precision) ជាមធ្យមលើសពី ៨៤% ព្រមទាំងកម្រិត Recall និង F1-score លើសពី ៨២% សម្រាប់អ្នកប្រើប្រាស់ (Clients) ទាំងអស់។
ក្របខណ្ឌនេះអាចរក្សាបាននូវពេលវេលាឆ្លើយតបដ៏ស័ក្តិសមសម្រាប់ការដាក់ពង្រាយប្រើប្រាស់ក្នុងពេលវេលាជាក់ស្តែង (Real-time deployment) ដែលបង្ហាញថាការរៀនសហព័ន្ធ (FDL) អាចពង្រឹងការរកឃើញការវាយប្រហារដោយមិនប៉ះពាល់ដល់ឯកជនភាពទិន្នន័យឡើយ។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Deep Neural Network (DNN) បណ្តាញសរសៃប្រសាទស៊ីជម្រៅ (DNN)	មានស្ថិរភាពខ្ពស់ក្នុងការរកឃើញការវាយប្រហារ និងមានតុល្យភាពល្អបំផុតរវាងភាពត្រឹមត្រូវ (Accuracy) និងពេលវេលាឆ្លើយតប (Response Time)។ អាចបំបែកលក្ខណៈពិសេសរបស់ទិន្នន័យបានល្អ។	នៅតែជួបប្រទះភាពលំបាកខ្លះៗក្នុងការកត់សម្គាល់ការវាយប្រហារបែប DDoS នៅក្នុងបរិស្ថានចែកចាយ (Distributed Setting) ដោយសារទិន្នន័យមានភាពស្មុគស្មាញ។	សម្រេចបាននូវភាពត្រឹមត្រូវ និង Precision ជាមធ្យមលើសពី ៨៤% និងក្លាយជាម៉ូដែលស្នូលសម្រាប់ក្របខណ្ឌ SecFedDNN។
Long Short-Term Memory (LSTM) ម៉ូដែលអង្គចងចាំរយៈពេលខ្លី-វែង (LSTM)	មានសមត្ថភាពក្នុងការចងចាំ និងរកឃើញភាពមិនប្រក្រតីនៃទិន្នន័យតាមពេលវេលា (Time-series data) នៅក្នុងបរិស្ថាន IoT។	ប្រើប្រាស់ធនធានកុំព្យូទ័រច្រើន ពេលវេលាឆ្លើយតបយឺត (៣៧ ទៅ ៣៩ វិនាទី) និងមានការភាន់ច្រឡំច្រើនរវាងការវាយប្រហារ DDoS និង Injection។	ទទួលបាន Precision ត្រឹមតែ ០.៨៣៨ និងមានដំណើរការទាបជាង DNN ក្នុងការធ្វើតេស្តនេះ។
Simple Neural Network (SimpleNN) បណ្តាញសរសៃប្រសាទសាមញ្ញ (SimpleNN)	មានរចនាសម្ព័ន្ធសាមញ្ញ ងាយស្រួលក្នុងការអនុវត្តដំបូង និងអាចចាប់ផ្តើមរៀនពីទិន្នន័យបានលឿន។	ខ្វះសមត្ថភាពក្នុងការរៀនលក្ខណៈស្មុគស្មាញ (Plateaued quickly) ធ្វើឱ្យមានអត្រាការចាត់ថ្នាក់ខុស (Misclassification) ខ្ពស់សម្រាប់ការវាយប្រហារ DDoS។	ទទួលបាន Precision ០.៨៤២ ប៉ុន្តែសមត្ថភាពស្វែងរក (Recall) ធ្លាក់ចុះទាបជាលំដាប់ប្រៀបធៀបជាមួយ DNN។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តក្របខណ្ឌនេះទាមទារហេដ្ឋារចនាសម្ព័ន្ធ Cloud និង Edge ដែលមានសមត្ថភាពគណនាខ្ពស់ និងផ្នែកទន់ឯកទេសសម្រាប់ការរៀនសហព័ន្ធ (Federated Learning)។

Hardware: ម៉ាស៊ីនមេ (Cloud Server) ប្រើប្រាស់ Google Cloud Platform (GCP) Compute Engine e2-standard-4 (4 vCPUs, 16 GB RAM) និងសម្រាប់ Client ប្រើប្រាស់ NVIDIA Tesla T4 GPU ជាមួយ RAM 12 GB តាមរយៈ Google Colab។
Software: ប្រើប្រាស់ Python 3.10 រួមជាមួយបណ្ណាល័យ TensorFlow, Keras និង TensorFlow Federated (TFF) សម្រាប់ការបណ្តុះបណ្តាលសហព័ន្ធ។ Keycloak ប្រើសម្រាប់គ្រប់គ្រងការចូលប្រើ (Access Management) និង TensorBoard សម្រាប់ត្រួតពិនិត្យដំណើរការ។
Dataset: សំណុំទិន្នន័យ TON_IoT ចំនួន ៩០០០ គំរូ (ថយចុះនិងថ្លឹងថ្លែងរួចរាល់ សម្រាប់ការវាយប្រហារប្រភេទ DDoS, DoS, និង Injection) ដោយបែងចែកជា IID (Independent and Identically Distributed) សម្រាប់ Clients ទាំង ៥។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យ TON_IoT ដែលបង្កើតឡើងដោយមន្ទីរពិសោធន៍ UNSW Canberra ប្រទេសអូស្ត្រាលី ដែលក្លែងធ្វើបរិស្ថាន IoT ទំនើប និងឧបករណ៍ឧស្សាហកម្ម។ ទិន្នន័យត្រូវបានរៀបចំជាប្រភេទ IID (ចែកចាយស្មើគ្នា) វាមិនឆ្លុះបញ្ចាំងទាំងស្រុងពីទិន្នន័យជាក់ស្តែងក្នុងពិភពលោក (Non-IID) ដែលមានភាពរាត់រាយនោះទេ។ សម្រាប់កម្ពុជា ការយល់ដឹងពីគំរូទិន្នន័យបរទេសនេះគឺល្អ ប៉ុន្តែចាំបាច់ត្រូវមានការកែសម្រួលដើម្បីឱ្យស្របទៅនឹងលំហូរចរាចរណ៍អ៊ីនធឺណិត និងបរិក្ខារ IoT ក្នុងស្រុកដែលមានលក្ខណៈចម្រុះនិងកម្រិតទាបជាង។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ក្របខណ្ឌ SecFedDNN នេះមានសារៈសំខាន់ និងអាចយកមកអនុវត្តបានយ៉ាងមានប្រសិទ្ធភាពសម្រាប់ប្រទេសកម្ពុជា ជាពិសេសក្នុងបរិបទនៃការផ្លាស់ប្តូរទៅរកសេដ្ឋកិច្ចនិងសង្គមឌីជីថល។

វិស័យទូរគមនាគមន៍ (Telecom & ISPs): ក្រុមហ៊ុនដូចជា Smart, Cellcard អាចប្រើប្រាស់ក្របខណ្ឌនេះដើម្បីការពារប្រព័ន្ធបណ្តាញនៅតាមមូលដ្ឋាន (Edge Network) ពីការវាយប្រហារ DDoS ដោយមិនចាំបាច់ប្រមូលទិន្នន័យឯកជនរបស់អតិថិជនមកកាន់ម៉ាស៊ីនមេកណ្តាលឡើយ។
ប្រព័ន្ធហិរញ្ញវត្ថុ និងធនាគារ (Financial Sector): ធនាគារពាណិជ្ជ ឬប្រព័ន្ធទូទាត់កណ្តាល (ឧ. បាគង) អាចប្រើប្រាស់ Federated Learning ដើម្បីចាប់យកប្រតិបត្តិការគួរឱ្យសង្ស័យនៅតាមសាខា (Edge nodes) នីមួយៗ ខណៈពេលដែលគោរពតាមគោលការណ៍រក្សាការសម្ងាត់ទិន្នន័យហិរញ្ញវត្ថុរបស់អតិថិជន។
គម្រោងទីក្រុងឆ្លាតវៃ (Smart City Initiatives): រាជធានីភ្នំពេញ ឬក្រុងព្រះសីហនុ ដែលកំពុងបំពាក់កាមេរ៉ាសុវត្ថិភាព និងភ្លើងស្តុបឆ្លាតវៃ (IoT) អាចដាក់ពង្រាយ IDS នេះដើម្បីការពារប្រព័ន្ធពីការលួចចូលគ្រប់គ្រង (Injection Attacks) ដោយឆ្លើយតបបានរហ័សទាន់ពេលវេលា (Real-time)។

ជារួម ការរៀនសហព័ន្ធ (Federated Learning) ផ្តល់នូវដំណោះស្រាយប្រកបដោយនវានុវត្តន៍សម្រាប់ស្ថាប័នរដ្ឋ និងឯកជននៅកម្ពុជា ក្នុងការធានាសន្តិសុខតាមអ៊ីនធឺណិតដោយមិនបំពានលើឯកជនភាពទិន្នន័យ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

ជំហានទី១៖ សិក្សាមូលដ្ឋានគ្រឹះនៃ Federated Learning និង TFF: និស្សិតត្រូវស្វែងយល់ពីរបៀបដំណើរការរបស់បណ្តាញសរសៃប្រសាទស៊ីជម្រៅ (DNN) និងការរៀនសហព័ន្ធ ដោយអនុវត្តកូដសាកល្បងដោយប្រើប្រាស់ TensorFlow Federated (TFF) ដើម្បីយល់ពីការបំបែកម៉ូដែល (Local vs Global Model)។
ជំហានទី២៖ រៀបចំបរិស្ថានក្លែងធ្វើ (Simulation Environment): រៀបចំបង្កើតប្រព័ន្ធកូនកាត់ (Hybrid) ដោយប្រើប្រាស់ Google Colab ជាឧបករណ៍តំណាងឲ្យ Edge Clients និងកំណត់រចនាសម្ព័ន្ធកុំព្យូទ័រនិម្មិត (VM) លើ Google Cloud Platform (GCP) ដើម្បីដើរតួជា Central Server សម្រាប់ការប្រមូលផ្តុំទិន្នន័យ។
ជំហានទី៣៖ ទាញយក និងរៀបចំទិន្នន័យ (Data Preprocessing): ទាញយកសំណុំទិន្នន័យ TON_IoT Dataset រួចធ្វើការសម្អាត និងបែងចែកទិន្នន័យ (Data Partitioning) ជាផ្នែកៗស្មើគ្នា (IID) សម្រាប់បញ្ជូនទៅកាន់ Client នីមួយៗ ដោយធានាថាវាមានផ្ទុកប្រភេទការវាយប្រហារគ្រប់ប្រភេទ (DDoS, DoS, Injection)។
ជំហានទី៤៖ សាងសង់ម៉ូដែល និងដំណើរការបណ្តុះបណ្តាល: សរសេរកូដបង្កើតម៉ូដែល Deep Neural Network (DNN) ដោយប្រើ Keras និងចាប់ផ្តើមដំណើរការបណ្តុះបណ្តាលសហព័ន្ធ ដោយប្រើប្រាស់ក្បួនដោះស្រាយ Federated Averaging (FedAvg) ដើម្បីបូកបញ្ចូលទម្ងន់ម៉ូដែល (Model Weights) រៀងរាល់ជុំ (Rounds)។
ជំហានទី៥៖ ការវាយតម្លៃ និងការកែលម្អ (Evaluation & Optimization): ប្រើប្រាស់ TensorBoard ដើម្បីតាមដានលទ្ធផលភាពត្រឹមត្រូវ (Accuracy, Precision, Recall)។ ព្យាយាមកែលម្អប្រសិទ្ធភាពនៃការរកឃើញប្រភេទ DDoS ដោយសិក្សាស្រាវជ្រាវបន្ថែមលើបច្ចេកទេស Layer-Adaptive Sparsified Model Aggregation (LASA)។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Federated Learning (FL)	ជាវិធីសាស្ត្របណ្តុះបណ្តាលម៉ូដែលបញ្ញាសិប្បនិម្មិត (AI) ដោយមិនចាំបាច់ប្រមូលទិន្នន័យឆៅពីឧបករណ៍អ្នកប្រើប្រាស់មកកន្លែងកណ្តាលឡើយ។ ឧបករណ៍នីមួយៗរៀនពីទិន្នន័យរបស់ខ្លួន ហើយបញ្ជូនតែចំណេះដឹង (Model Weights) ទៅកាន់ម៉ាស៊ីនមេដើម្បីធ្វើបច្ចុប្បន្នភាពម៉ូដែលរួម បែបនេះជួយការពារឯកជនភាពទិន្នន័យ។	ដូចជាសិស្សរៀនមេរៀនរៀងៗខ្លួននៅផ្ទះ ហើយយកតែចម្លើយសង្ខេបមកប្រាប់គ្រូដោយមិនបាច់យកសៀវភៅសរសេរទាំងមូលមកសាលាឡើយ។
Edge Computing	ជាការនាំយកដំណើរការកុំព្យូទ័រ និងការផ្ទុកទិន្នន័យឱ្យមកនៅកៀកនឹងប្រភពដែលបង្កើតទិន្នន័យ (ដូចជាកាមេរ៉ាសុវត្ថិភាព ឬសេនស័រ IoT) ជាជាងបញ្ជូនទិន្នន័យទាំងអស់ទៅកាន់ម៉ាស៊ីនមេលើ Cloud ដ៏សែនឆ្ងាយ។ វាជួយកាត់បន្ថយភាពយឺតយ៉ាវ (Latency) និងបញ្ចៀសការស្ទះចរាចរណ៍អ៊ីនធឺណិត។	ដូចជាការសាងសង់រោងចក្រកែច្នៃផ្លែឈើនៅក្បែរចម្ការផ្ទាល់ ជាជាងដឹកផ្លែឈើស្រស់ៗរាប់រយគីឡូម៉ែត្រទៅរោងចក្រនៅរាជធានី។
Federated Averaging (FedAvg)	ជាក្បួនដោះស្រាយ (Algorithm) ស្នូលនៅក្នុង Federated Learning ដែលម៉ាស៊ីនមេកណ្តាលប្រើដើម្បីប្រមូលយកទម្ងន់ម៉ូដែល (Weights) ពីឧបករណ៍នីមួយៗ (Clients) មកបូកបញ្ចូលគ្នា រួចចែកជាមធ្យមភាគ ដើម្បីបង្កើតជាម៉ូដែលសកល (Global Model) មួយដែលឆ្លាតវៃជាងមុន។	ដូចជាមេគំនិតម្នាក់ប្រមូលយកមតិយោបល់ពីសមាជិកក្រុមនីមួយៗ រួចបូកសរុបបញ្ចូលគ្នាដើម្បីបង្កើតជាសេចក្តីសម្រេចចុងក្រោយមួយដែលល្អបំផុតសម្រាប់ទាំងអស់គ្នា។
Distributed Denial of Service (DDoS)	ជាប្រភេទនៃការវាយប្រហារតាមអ៊ីនធឺណិត ដែលឧក្រិដ្ឋជនប្រើប្រាស់កុំព្យូទ័រ ឬឧបករណ៍ IoT ដែលមានមេរោគរាប់ពាន់គ្រឿង ព្រួតគ្នាផ្ញើសំណើ (Requests) ទៅកាន់ម៉ាស៊ីនមេ ឬគេហទំព័រគោលដៅក្នុងពេលតែមួយ ធ្វើឱ្យប្រព័ន្ធគាំង មិនអាចបម្រើសេវាកម្មដល់អ្នកប្រើប្រាស់ទូទៅបាន។	ដូចជាមានមនុស្សអាក្រក់រាប់ពាន់នាក់តម្រង់ជួរចូលទិញទំនិញក្នុងហាងតូចមួយក្នុងពេលតែមួយ ធ្វើឲ្យអតិថិជនពិតប្រាកដមិនអាចចូលទិញបាន។
Layer-Adaptive Sparsified Model Aggregation (LASA)	ជាបច្ចេកទេសចម្រោះទិន្នន័យមុនការប្រមូលផ្តុំ ដែលវាយតម្លៃបម្រែបម្រួលទម្ងន់របស់ម៉ូដែលនីមួយៗ ដើម្បីកាត់បន្ថយឥទ្ធិពលពីប៉ារ៉ាម៉ែត្រដែលមានចេតនាអាក្រក់ (Malicious updates) និងជួយកាត់បន្ថយទំហំទិន្នន័យដែលត្រូវបញ្ជូនទៅកាន់ម៉ាស៊ីនមេ។	ដូចជាការរែងយកតែគ្រាប់ខ្សាច់ល្អៗ និងបោះចោលគ្រាប់ក្រួសឬសម្រាម មុននឹងយកខ្សាច់នោះទៅលាយស៊ីម៉ងត៍សាងសង់ផ្ទះ។
Independent and Identically Distributed (IID)	នៅក្នុងវិទ្យាសាស្ត្រទិន្នន័យ វាសំដៅលើសំណុំទិន្នន័យដែលត្រូវបានបែងចែកទៅឱ្យឧបករណ៍ផ្សេងៗគ្នា (Clients) ដោយឧបករណ៍នីមួយៗទទួលបានប្រភេទ និងចំនួនទិន្នន័យស្រដៀងៗគ្នា និងមានតុល្យភាព ដើម្បីកុំឱ្យម៉ូដែលរៀនលម្អៀង។	ដូចជាការចែកសន្លឹកបៀរឱ្យអ្នកលេងម្នាក់ៗដោយការច្របល់ស្មើៗគ្នា ធានាថាអ្នកគ្រប់គ្នាមានឱកាសទទួលបានសន្លឹកបៀរប្រភេទដូចៗគ្នា។
Deep Neural Network (DNN)	ជាបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតដែលមានស្រទាប់ជាច្រើន (Hidden layers) ជួយឱ្យកុំព្យូទ័រអាចរៀនពីលំនាំទិន្នន័យដ៏ស្មុគស្មាញ (Complex patterns) ដូចជារបៀបដែលការវាយប្រហារតាមអ៊ីនធឺណិតកើតឡើង ដើម្បីធ្វើការទស្សន៍ទាយ និងចាត់ថ្នាក់ប្រកបដោយភាពត្រឹមត្រូវខ្ពស់។	ដូចជាខួរក្បាលមនុស្សដែលប្រើកោសិកាសរសៃប្រសាទជាច្រើនតភ្ជាប់គ្នា ដើម្បីរៀនស្គាល់មុខមនុស្ស ឬរៀនពីបទពិសោធន៍កាលពីអតីតកាល។
Intrusion Detection System (IDS)	ជាប្រព័ន្ធសុវត្ថិភាពតាមដានចរាចរណ៍បណ្តាញកុំព្យូទ័រ ដើម្បីស្វែងរកសកម្មភាពគួរឱ្យសង្ស័យ ឬការបំពានគោលការណ៍សុវត្ថិភាព។ នៅពេលរកឃើញភាពមិនប្រក្រតី ប្រព័ន្ធនេះនឹងផ្តល់សញ្ញាព្រមានភ្លាមៗដើម្បីទប់ស្កាត់ការវាយប្រហារ។	ដូចជាកាមេរ៉ាសុវត្ថិភាព និងសំឡេងរោទិ៍ដែលបំពាក់ក្នុងផ្ទះ វានឹងរោទិ៍ឡើងនៅពេលមានចោរលួចគាស់ទ្វារចូលទាន់ហន់។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖