Original Title: 基于层次联邦与动态权重的卫星网络异常检测方法
Source: doi.org/10.19678/j.issn.1000-3428.0069214
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

វិធីសាស្ត្ររកឃើញភាពមិនប្រក្រតីសម្រាប់បណ្តាញផ្កាយរណប ដោយផ្អែកលើសហព័ន្ធឋានានុក្រម និងទម្ងន់ថាមវន្ត

ចំណងជើងដើម៖ 基于层次联邦与动态权重的卫星网络异常检测方法

អ្នកនិពន្ធ៖ NIU Xuanwen (Beijing Jiaotong University), DU Ye (Beijing Jiaotong University), YANG Mingsong (Beijing Jiaotong University), LI Ang (Beijing Jiaotong University), LI Meihong (Beijing Jiaotong University)

ឆ្នាំបោះពុម្ព៖ 2025, Computer Engineering

វិស័យសិក្សា៖ Cybersecurity / Computer Networks

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហានៃការតភ្ជាប់ទំនាក់ទំនងមិនស្ថិតស្ថេរ និងពេលវេលាប្រមូលផ្តុំយូរ នៅក្នុងការរកឃើញភាពមិនប្រក្រតីតាមបែបចែកចាយក្នុងបណ្តាញផ្កាយរណប ដោយប្រើប្រាស់ការរៀនសហព័ន្ធ (Federated Learning)។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានស្នើឡើងនូវក្របខ័ណ្ឌរកឃើញភាពមិនប្រក្រតីកម្រិតអវកាស-អាកាស-ដី (Space-air-ground) ចំនួនបីថ្នាក់ ដោយប្រើប្រាស់ស្ថានីយ៍វេទិកាកម្ពស់ខ្ពស់ (HAPS) និងក្បួនដោះស្រាយការប្រមូលផ្តុំសហព័ន្ធពាក់កណ្តាលអសមកាលបែបថាមវន្ត។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
FedAvg
ការរៀនសហព័ន្ធតាមបែបមធ្យមភាគ (Federated Averaging)
ជាក្បួនដោះស្រាយសហព័ន្ធស្តង់ដារដែលងាយស្រួលក្នុងការអនុវត្ត និងមានភាពសាមញ្ញក្នុងការគណនា។ ត្រូវការពេលវេលាប្រមូលផ្តុំយូរ និងងាយទទួលរងឥទ្ធិពលអវិជ្ជមានពីការដាច់តភ្ជាប់ (Straggler Effect) នៅក្នុងបណ្តាញផ្កាយរណប។ លើសំណុំទិន្នន័យ STIN: ភាពត្រឹមត្រូវ ៦០.៥៦%, ពេលវេលាប្រមូលផ្តុំ >៣៦ម៉ោង។
HierFAVG
ការរៀនសហព័ន្ធតាមបែបឋានានុក្រម (Hierarchical Federated Averaging)
កាត់បន្ថយថ្លៃដើមនៃការទំនាក់ទំនងបានល្អជាង FedAvg ដោយប្រើប្រាស់រចនាសម្ព័ន្ធឋានានុក្រម។ នៅតែប្រើប្រាស់ការប្រមូលផ្តុំបែបសមកាល (Synchronous) ដែលធ្វើឱ្យវានៅតែរងផលប៉ះពាល់នៅពេលផ្កាយរណបបាត់បង់ការតភ្ជាប់។ លើសំណុំទិន្នន័យ STIN: ភាពត្រឹមត្រូវ ៧៧.៧០%, ថ្លៃដើមទំនាក់ទំនង ១.០០។
FedISL
ការរៀនសហព័ន្ធសម្រាប់បណ្តាញផ្កាយរណបគន្លងទាប (Federated Learning for LEO)
ត្រូវបានរចនាឡើងពិសេសសម្រាប់បរិស្ថានផ្កាយរណប LEO ដោយមានការកែលម្អលើការធ្វើសមកាលកម្ម។ មានអត្រាភាពត្រឹមត្រូវទាប និងចំណាយពេលវេលាព្រមទាំងទំហំទំនាក់ទំនងខ្ពស់នៅពេលសាកល្បងជាមួយសំណុំទិន្នន័យ STIN។ លើសំណុំទិន្នន័យ STIN: ភាពត្រឹមត្រូវ ៤២.១៧%, ថ្លៃដើមទំនាក់ទំនង ៤.៣១។
FedIDSS (Proposed)
ក្បួនដោះស្រាយការប្រមូលផ្តុំសហព័ន្ធពាក់កណ្តាលអសមកាលបែបថាមវន្ត
ដោះស្រាយបញ្ហាយឺតយ៉ាវដោយប្រើ HAPS ជាកុំព្យូទ័រគែម និងកែតម្រូវទម្ងន់ម៉ូដែលតាមពេលវេលាជាក់ស្តែង។ ទាមទារការពង្រាយហេដ្ឋារចនាសម្ព័ន្ធស្មុគស្មាញ (ស្ថានីយ៍ដី ផ្កាយរណប និង HAPS) ដែលមានតម្លៃថ្លៃក្នុងការអនុវត្តផ្ទាល់។ លើសំណុំទិន្នន័យ STIN: ភាពត្រឹមត្រូវ ៨០.១៧%, ពេលវេលាប្រមូលផ្តុំ ៣២.៣១ម៉ោង, ថ្លៃដើមទំនាក់ទំនង ០.៩៥។

ការចំណាយលើធនធាន (Resource Cost)៖ ឯកសារនេះបានបញ្ជាក់យ៉ាងច្បាស់អំពីតម្រូវការផ្នែករឹង និងផ្នែកទន់សម្រាប់ការធ្វើត្រាប់តាម (Simulation) បរិស្ថានបណ្តាញផ្កាយរណប។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះពឹងផ្អែកលើសំណុំទិន្នន័យ STIN និង CIC-IDS-2017 ដែលត្រូវបានបង្កើតឡើងផ្អែកលើចរាចរណ៍បណ្តាញទូទៅ និងការធ្វើត្រាប់តាមនៅប្រទេសចិន និងកាណាដា។ សម្រាប់ប្រទេសកម្ពុជា ការខ្វះខាតទិន្នន័យចរាចរណ៍បណ្តាញផ្កាយរណបផ្ទាល់ខ្លួន និងការគំរាមកំហែងតាមតំបន់ជាក់លាក់ (Regional Cyber Threats) ព្រមទាំងលក្ខខណ្ឌអាកាសធាតុត្រូពិចដែលអាចរំខានដល់រលកសញ្ញា (Signal Interference) អាចធ្វើឱ្យម៉ូដែលនេះមានភាពលម្អៀង និងតម្រូវឱ្យមានការកែតម្រូវមុននឹងយកមកប្រើប្រាស់ពិត។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាកម្ពុជាមិនទាន់មានផ្កាយរណបផ្ទាល់ខ្លួនក៏ដោយ វិធីសាស្ត្រគណនាគែម (Edge Computing) និងការរៀនសហព័ន្ធនេះមានប្រយោជន៍យ៉ាងខ្លាំងសម្រាប់ការកសាងបណ្តាញទូរគមនាគមន៍ជំនាន់ថ្មី។

ជារួម ក្របខ័ណ្ឌសហព័ន្ធអសមកាលបែបថាមវន្តនេះ ផ្តល់នូវគំរូដ៏ល្អសម្រាប់ការអភិវឌ្ឍប្រព័ន្ធសន្តិសុខបណ្តាញចែកចាយ ដែលកម្ពុជាអាចអនុវត្តបានក្នុងយុទ្ធសាស្ត្ររដ្ឋាភិបាលឌីជីថល និងការតភ្ជាប់តំបន់ដាច់ស្រយាល។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃការរៀនសហព័ន្ធ (Federated Learning): ចាប់ផ្តើមដោយការយល់ដឹងពីគោលគំនិតនៃការបែងចែកទិន្នន័យ (Decentralized Data) តាមរយៈការអនុវត្តកូដសាមញ្ញដោយប្រើប្រាស់ PyTorchTensorFlow Federated ដើម្បីស្វែងយល់ពីរបៀបដំណើរការរបស់ FedAvg។
  2. រៀបចំសំណុំទិន្នន័យ និងស្វែងយល់ពីភាពមិនប្រក្រតី: ទាញយកសំណុំទិន្នន័យ CIC-IDS-2017 និងធ្វើការសម្អាតទិន្នន័យ (Data Preprocessing) ដោយបំប្លែងទិន្នន័យអក្សរទៅជាលេខ (One-Hot Encoding) និងប្រើប្រាស់បណ្ណាល័យ Scikit-Learn សម្រាប់ការទាញយកលក្ខណៈពិសេស (Feature Extraction)។
  3. ធ្វើត្រាប់តាមបរិស្ថានបណ្តាញផ្កាយរណប: សិក្សាពីការប្រើប្រាស់កម្មវិធី STK (Systems Tool Kit) ដើម្បីបង្កើតគន្លងផ្កាយរណប LEO និងយល់ដឹងពីការពន្យារពេលនៃសេវា (Latency) ដែលកើតឡើងរវាងផ្កាយរណប និងស្ថានីយ៍ដី។
  4. អភិវឌ្ឍក្បួនដោះស្រាយការប្រមូលផ្តុំពាក់កណ្តាលអសមកាល: សរសេរកូដបង្កើតម៉ូដែលស្រដៀងនឹង FedIDSS ដោយបន្ថែមមុខងារគណនាទម្ងន់ថាមវន្ត (Dynamic Weights) ផ្អែកលើពេលវេលាដែលម៉ូដែលត្រូវបានធ្វើបច្ចុប្បន្នភាព ដើម្បីដោះស្រាយបញ្ហាការតភ្ជាប់មិនស្ថិតស្ថេរ។
  5. វាយតម្លៃ និងប្រៀបធៀបដំណើរការម៉ូដែល: ដំណើរការម៉ូដែលរបស់អ្នកនៅក្នុងបរិស្ថាន Python រួចធ្វើការវាស់ស្ទង់នូវអត្រាភាពត្រឹមត្រូវ (Accuracy) ពេលវេលា (Aggregation Time) និងប្រៀបធៀបវាជាមួយវិធីសាស្ត្រប្រពៃណីដើម្បីចងក្រងជារបាយការណ៍ស្រាវជ្រាវ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Hierarchical Federated Learning ជាទម្រង់នៃការរៀនម៉ាស៊ីនបែបចែកចាយ ដោយបែងចែកការហ្វឹកហាត់ជាច្រើនថ្នាក់ (ឧទាហរណ៍៖ ថ្នាក់ក្រោមនៅស្ថានីយ៍ផ្ទាល់ ថ្នាក់កណ្តាលនៅទីតាំងគែម និងថ្នាក់លើនៅម៉ាស៊ីនមេ) ដើម្បីកាត់បន្ថយការបញ្ជូនទិន្នន័យផ្លូវឆ្ងាយ និងបង្កើនល្បឿនប្រមូលផ្តុំចំណេះដឹងដោយមិនបំពានឯកជនភាពទិន្នន័យ។ ដូចជាការធ្វើជំរឿនប្រជាជន ដែលមេភូមិប្រមូលព័ត៌មានពីកូនភូមិ (ថ្នាក់ក្រោម) រួចសង្ខេបបញ្ជូនទៅមេឃុំ (ថ្នាក់កណ្តាល) មុននឹងបញ្ជូនទិន្នន័យសរុបទៅថ្នាក់ជាតិ (ថ្នាក់លើ) ដោយមិនចាំបាច់បញ្ជូនឈ្មោះអ្នកភូមិម្នាក់ៗឡើយ។
High-Altitude Platform Stations (HAPS) ជាយាន ឬស្ថានីយ៍ដែលហោះហើរនៅស្រទាប់បរិយាកាសកម្ពស់ខ្ពស់ (ដូចជាប៉េងប៉ោងអាកាស ឬយន្តហោះគ្មានមនុស្សបើក) ដែលដើរតួជាចំណុចកណ្តាលសម្រាប់តភ្ជាប់ទំនាក់ទំនងរវាងផ្កាយរណបនៅលើទីអវកាស និងស្ថានីយ៍នៅលើដី ដើម្បីកាត់បន្ថយការពន្យារពេលនៃសេវា (Latency)។ ដូចជាបង្គោលអង់តែនទូរស័ព្ទដែលអណ្តែតលើអាកាសយ៉ាងខ្ពស់ ដើម្បីជួយចាប់សេវាពីផ្កាយរណបមកចែកចាយបន្តឱ្យអ្នកប្រើប្រាស់នៅលើដីបានលឿនជាងមុន។
Low Earth Orbit (LEO) ជាគន្លងផ្កាយរណបដែលស្ថិតនៅកៀកនឹងផែនដី (កម្ពស់ចន្លោះពី ១៦០ ទៅ ២០០០ គីឡូម៉ែត្រ) ដែលអនុញ្ញាតឱ្យការបញ្ជូនទិន្នន័យមានល្បឿនលឿន ប៉ុន្តែផ្កាយរណបទាំងនេះផ្លាស់ទីក្នុងល្បឿនលឿនណាស់ ដែលធ្វើឱ្យការតភ្ជាប់ជាមួយស្ថានីយ៍ដីតែងតែដាច់ញឹកញាប់។ ដូចជារថយន្តក្រុងដែលបើកបរក្នុងល្បឿនលឿនកាត់មុខផ្ទះអ្នក អ្នកអាចបោះឥវ៉ាន់ចូលបានតែក្នុងរយៈពេលខ្លីប៉ុណ្ណោះ មុនពេលវាបើកហួសបាត់។
Edge Computing ជាបច្ចេកវិទ្យាដែលនាំយកការគណនា និងការផ្ទុកទិន្នន័យឱ្យមកនៅជិតប្រភពនៃទិន្នន័យបំផុត (ដូចជានៅលើឧបករណ៍ ឬស្ថានីយ៍ក្បែរនោះ) ជាជាងបញ្ជូនទិន្នន័យទាំងអស់ទៅកាន់ម៉ាស៊ីនមេកណ្តាល (Cloud) ឆ្ងាយៗ ដើម្បីសន្សំសំចៃពេលវេលា និងកាត់បន្ថយការកកស្ទះបណ្តាញ។ ដូចជាការមានចុងភៅប្រចាំភោជនីយដ្ឋាននីមួយៗដើម្បីចម្អិនម្ហូបភ្លាមៗតាមការកម្ម៉ង់ ជាជាងត្រូវផ្ញើសាច់ និងបន្លែទាំងអស់ទៅចម្អិននៅរោងចក្រកណ្តាល រួចទើបដឹកជញ្ជូនមកវិញ។
Asynchronous Aggregation ជាវិធីសាស្ត្រក្នុងការធ្វើបច្ចុប្បន្នភាពម៉ូដែលរៀនម៉ាស៊ីន ដោយម៉ាស៊ីនមេមិនចាំបាច់រង់ចាំឱ្យឧបករណ៍ទាំងអស់បញ្ជូនទិន្នន័យមកគ្រប់គ្នានោះទេ ពោលគឺអ្នកណាបញ្ជូនមកមុន ម៉ាស៊ីនមេនឹងធ្វើការគណនាមុន ដែលជួយដោះស្រាយបញ្ហាយឺតយ៉ាវដោយសារឧបករណ៍មួយចំនួនដើរយឺត។ ដូចជាគ្រូបង្រៀនដែលកែសន្លឹកកិច្ចការសិស្សភ្លាមៗនៅពេលសិស្សណាម្នាក់ប្រគល់ឱ្យ ដោយមិនចាំបាច់រង់ចាំទាល់តែសិស្សគ្រប់គ្នាធ្វើចប់ទើបចាប់ផ្តើមកែនោះទេ។
Dynamic Weights ជាការកែតម្រូវកម្រិតឥទ្ធិពល ឬតម្លៃ (អត្រាភាគរយ) នៃទិន្នន័យឬម៉ូដែលនីមួយៗដោយស្វ័យប្រវត្តិ ដោយផ្អែកលើស្ថានភាពជាក់ស្តែង (ដូចជាភាពត្រឹមត្រូវនៃទិន្នន័យ ឬពេលវេលាដែលបានបញ្ជូនមក)។ ក្នុងបរិបទនេះ ម៉ូដែលដែលហួសពេលយូរនឹងត្រូវកាត់បន្ថយទម្ងន់ឥទ្ធិពលរបស់វា។ ដូចជាការផ្តល់ពិន្ទុលើការងារក្រុម ប្រសិនបើសមាជិកណាបញ្ជូនការងារយឺត ឬធ្វើមិនសូវបានល្អ អ្នកដឹកនាំក្រុមនឹងបន្ថយពិន្ទុ (ឥទ្ធិពល) របស់សមាជិកនោះលើពិន្ទុរួមដោយស្វ័យប្រវត្តិ។
Anomaly Detection ជានីតិវិធី ឬប្រព័ន្ធវិភាគដើម្បីស្វែងរកសកម្មភាព ឬទិន្នន័យដែលមានលក្ខណៈខុសប្រក្រតីពីទម្រង់ធម្មតា ដែលជាទូទៅត្រូវបានប្រើប្រាស់ដើម្បីស្វែងរកការវាយប្រហារតាមអ៊ីនធឺណិត (Cyberattacks) ឬកំហុសប្រព័ន្ធផ្សេងៗនៅក្នុងបណ្តាញ។ ដូចជាកាមេរ៉ាសុវត្ថិភាពឆ្លាតវៃដែលអាចសម្គាល់មុខមនុស្សក្នុងផ្ទះ ប្រសិនបើមានមនុស្សចម្លែកលួចចូល វាលោតសញ្ញាប្រកាសអាសន្នភ្លាមៗព្រោះវាជារឿងខុសប្រក្រតី។
Space-Air-Ground Integrated Network ជាស្ថាបត្យកម្មបណ្តាញទំនាក់ទំនងរួមបញ្ចូលគ្នាទ្រង់ទ្រាយធំ ដែលតភ្ជាប់ផ្កាយរណបក្នុងទីអវកាស យានហោះហើរលើអាកាស (HAPS/Drones) និងស្ថានីយ៍ទូរគមនាគមន៍នៅលើដី ដើម្បីផ្តល់សេវាអ៊ីនធឺណិត និងទំនាក់ទំនងគ្របដណ្តប់ទូទាំងពិភពលោក។ ដូចជាការរួមបញ្ចូលគ្នានៃសេវាដឹកជញ្ជូនតាមផ្លូវអាកាស (យន្តហោះ) ផ្លូវទឹក (កប៉ាល់) និងផ្លូវគោក (ឡានធំ) ឱ្យធ្វើការស៊ីចង្វាក់គ្នា ដើម្បីធានាថាទំនិញអាចផ្ញើទៅដល់គ្រប់ច្រកល្ហកទូទាំងពិភពលោក។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖