Original Title: CYBER ATTACK DETECTION AND MITIGATION USING MACHINE LEARNING IN SMART GRID SYSTEMS
Source: doi.org/10.70008/jeser.v1i01.43
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការរកឃើញនិងការកាត់បន្ថយការវាយប្រហារតាមអ៊ីនធឺណិតដោយប្រើម៉ាស៊ីនរៀននៅក្នុងប្រព័ន្ធបណ្តាញអគ្គិសនីឆ្លាតវៃ

ចំណងជើងដើម៖ CYBER ATTACK DETECTION AND MITIGATION USING MACHINE LEARNING IN SMART GRID SYSTEMS

អ្នកនិពន្ធ៖ Khorshed Alam (Lamar University), Md Al Imran (Lamar University), Upal Mahmud (Imperious Engineering), Abdullah Al Fathah (Lamar University)

ឆ្នាំបោះពុម្ព៖ 2024, Journal of Science and Engineering Research

វិស័យសិក្សា៖ Cybersecurity, Smart Grid, Machine Learning

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហាភាពងាយរងគ្រោះនៃប្រព័ន្ធបណ្តាញអគ្គិសនីឆ្លាតវៃ (Smart Grid) ចំពោះការវាយប្រហារតាមអ៊ីនធឺណិត ដោយសារភាពស្មុគស្មាញនិងការតភ្ជាប់គ្នាកាន់តែច្រើន ដែលវិធានការសន្តិសុខបែបប្រពៃណីមិនមានប្រសិទ្ធភាពគ្រប់គ្រាន់។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានប្រើប្រាស់វិធីសាស្រ្តពិនិត្យឡើងវិញជាប្រព័ន្ធ (Systematic Review) ដោយវិភាគលើឯកសារស្រាវជ្រាវដែលមានស្រាប់ដើម្បីវាយតម្លៃប្រសិទ្ធភាពនៃបច្ចេកវិទ្យា AI ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Supervised Learning (SVM, Random Forest, NN)
ការរៀនដោយមានការត្រួតពិនិត្យ (ដូចជា SVM, Random Forest, Neural Networks)
មានប្រសិទ្ធភាពខ្ពស់ក្នុងការចាត់ថ្នាក់ទម្រង់នៃការវាយប្រហារដែលស្គាល់ច្បាស់ និងផ្តល់នូវភាពជាក់លាក់ខ្ពស់នៅពេលមានទិន្នន័យបង្វឹកគ្រប់គ្រាន់។ ត្រូវការទិន្នន័យដែលមានស្លាក (Labeled Data) ច្រើន ហើយពឹងផ្អែកខ្លាំងលើគុណភាពទិន្នន័យទាំងនោះ មិនសូវមានប្រសិទ្ធភាពចំពោះការវាយប្រហារថ្មីៗ (Zero-day attacks)។ អាចរកឃើញនិងព្យាករណ៍ការវាយប្រហារដោយមានអត្រាត្រឹមត្រូវលើសពី ៩០% ក្នុងករណីជាច្រើន។
Unsupervised Learning (k-means, PCA)
ការរៀនដោយគ្មានការត្រួតពិនិត្យ (ដូចជា k-means Clustering, PCA)
មិនត្រូវការទិន្នន័យដែលមានស្លាក និងមានសមត្ថភាពរកឃើញភាពមិនប្រក្រតី (Anomalies) ឬការវាយប្រហារថ្មីៗដែលមិនមានក្នុងប្រវត្តិ។ អាចបង្កើតការជូនដំណឹងមិនពិត (False Positives) ច្រើន ដោយសារមិនអាចបែងចែកច្បាស់លាស់រវាងភាពមិនប្រក្រតីធម្មតា និងការវាយប្រហារដែលមានបំណងអាក្រក់។ មានប្រសិទ្ធភាពក្នុងការរកឃើញគំរូមិនធម្មតានៅក្នុងចរាចរណ៍បណ្តាញក្នុងបរិស្ថានដែលមានភាពប្រែប្រួលខ្ពស់។
Reinforcement Learning (RL)
ការរៀនបែបពង្រឹង (Reinforcement Learning)
អាចសម្របខ្លួនទៅនឹងការផ្លាស់ប្តូរនៃការវាយប្រហារ និងរៀនយុទ្ធសាស្ត្រការពារថ្មីៗដោយស្វ័យប្រវត្តិពីបរិស្ថានជាក់ស្តែងដោយមិនពឹងផ្អែកលើ Dataset ចាស់ៗ។ ត្រូវការធនធានកុំព្យូទ័រខ្ពស់ និងត្រូវការពេលវេលាដើម្បីបង្វឹកម៉ូដែលឱ្យមានស្ថេរភាពក្នុងការឆ្លើយតប។ ជួយបង្កើតប្រព័ន្ធការពារដែលអាចបត់បែនបាន និងឆ្លើយតបទៅនឹងការគំរាមកំហែងបានភ្លាមៗ (Real-time)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តប្រព័ន្ធនេះទាមទារធនធានកុំព្យូទ័រខ្លាំងសម្រាប់ការវិភាគទិន្នន័យពេលវេលាជាក់ស្តែង និងហេដ្ឋារចនាសម្ព័ន្ធប្រមូលទិន្នន័យដែលមានស្តង់ដារ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះគឺជាការពិនិត្យឡើងវិញជាប្រព័ន្ធ (Systematic Review) នៃឯកសារស្រាវជ្រាវចំនួន ១២៧ ពីប្រភពអន្តរជាតិ ដែលភាគច្រើនទំនងជាផ្អែកលើទិន្នន័យពីប្រទេសអភិវឌ្ឍន៍ដែលមានហេដ្ឋារចនាសម្ព័ន្ធ Smart Grid ពេញលេញ។ សម្រាប់កម្ពុជា ការខ្វះខាតទិន្នន័យប្រវត្តិសាស្រ្តនៃការវាយប្រហារ និងកម្រិតនៃបច្ចេកវិទ្យា Smart Grid ដែលកំពុងអភិវឌ្ឍ អាចជាឧបសគ្គក្នុងការអនុវត្តម៉ូដែលទាំងនេះភ្លាមៗ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកវិទ្យានេះមានសារៈសំខាន់ខ្លាំងសម្រាប់អនាគតនៃវិស័យថាមពលនៅកម្ពុជា ខណៈដែលប្រទេសកំពុងធ្វើទំនើបកម្មប្រព័ន្ធអគ្គិសនី។

ទោះបីជាមានបញ្ហាប្រឈមផ្នែកធនធាន និងទិន្នន័យក៏ដោយ ការចាប់ផ្តើមសិក្សា និងសាកល្បងបច្ចេកវិទ្យា AI ក្នុងវិស័យ cybersecurity គឺចាំបាច់ដើម្បីធានាស្ថេរភាពនិងសុវត្ថិភាពថាមពលជាតិ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃ Smart Grid និង Cybersecurity: ស្វែងយល់ពីសមាសភាគនៃ Smart Grid និងប្រភេទនៃការវាយប្រហារដូចជា DDoS, False Data Injection Attacks (FDIA) និង Spoofing ដោយប្រើប្រាស់ឯកសារយោង IEEE Xplore ។
  2. រៀនបង្កើតម៉ូដែល Machine Learning: ចាប់ផ្តើមរៀនភាសា Python និងប្រើប្រាស់បណ្ណាល័យសំខាន់ៗដូចជា Scikit-learn និង TensorFlow ដើម្បីបង្កើតម៉ូដែលសម្រាប់ស្វែងរកភាពមិនប្រក្រតី (Anomaly Detection)។
  3. ការពិសោធន៍ជាមួយទិន្នន័យបើកចំហ: ស្វែងរកនិងប្រើប្រាស់ Dataset សាធារណៈទាក់ទងនឹង Smart Grid security (ឧទាហរណ៍៖ KDD Cup 99 ឬ dataset ពីការស្រាវជ្រាវស្រដៀងគ្នា) ដើម្បីបង្វឹកនិងតេស្តម៉ូដែល។
  4. សិក្សាពីបច្ចេកវិទ្យាការពារឯកជនភាព និង Blockchain: ស្រាវជ្រាវបន្ថែមអំពី Federated Learning និងការប្រើប្រាស់ Blockchain ដើម្បីយល់ពីរបៀបការពារទិន្នន័យ និងធានាសុវត្ថិភាពនៃការផ្លាស់ប្តូរទិន្នន័យក្នុងប្រព័ន្ធ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Smart Grid Systems ជាប្រព័ន្ធបណ្តាញអគ្គិសនីដ៏ឆ្លាតវៃដែលធ្វើសមាហរណកម្មបច្ចេកវិទ្យាព័ត៌មាន និងការទំនាក់ទំនង ដើម្បីគ្រប់គ្រងការផលិត និងចែកចាយអគ្គិសនីពីប្រភពទៅកាន់អ្នកប្រើប្រាស់ដោយស្វ័យប្រវត្តិ និងមានប្រសិទ្ធភាពខ្ពស់។ ដូចជាប្រព័ន្ធផ្លូវថ្នល់ដែលបំពាក់កាមេរ៉ា និងភ្លើងស្តុបឆ្លាតវៃដែលអាចនិយាយជាមួយឡាន ដើម្បីកាត់បន្ថយការកកស្ទះចរាចរណ៍ និងបង្ការគ្រោះថ្នាក់។
False Data Injection ជាប្រភេទនៃការវាយប្រហារតាមអ៊ីនធឺណិត ដែលពួក Hacker បញ្ចូលទិន្នន័យក្លែងក្លាយទៅក្នុងប្រព័ន្ធ ដើម្បីបញ្ឆោតកុំព្យូទ័រគ្រប់គ្រងឱ្យធ្វើការសម្រេចចិត្តខុស ដែលអាចបង្កឱ្យដាច់ភ្លើង ឬខូចឧបករណ៍។ ដូចជាការលួចកែលេខនៅលើទែម៉ូម៉ែត្រ ដើម្បីឱ្យម៉ាស៊ីនត្រជាក់បិទ ទោះបីជាអាកាសធាតុកំពុងក្តៅក៏ដោយ។
Reinforcement Learning ជាបច្ចេកទេសមួយនៃបញ្ញាសិប្បនិម្មិត (AI) ដែលកុំព្យូទ័ររៀនពីកំហុស និងជោគជ័យរបស់ខ្លួនឯង ដោយការព្យាយាមធ្វើសកម្មភាពផ្សេងៗ និងទទួលបានពិន្ទុ (រង្វាន់) នៅពេលធ្វើត្រូវ ដើម្បីបង្កើតយុទ្ធសាស្ត្រការពារល្អបំផុត។ ដូចជាការបង្វឹកសត្វឆ្កែ ដោយឱ្យចំណីនៅពេលវាធ្វើតាមបញ្ជា ដូច្នេះវានឹងរៀនធ្វើតាមដើម្បីទទួលបានចំណីនៅពេលក្រោយ។
Federated Learning ជាវិធីសាស្ត្របង្រៀន AI ដោយមិនចាំបាច់ប្រមូលទិន្នន័យឯកជនរបស់អ្នកប្រើប្រាស់មកកន្លែងតែមួយទេ គឺឧបករណ៍នីមួយៗរៀនដោយឡែកពីគ្នា ហើយចែករំលែកតែចំណេះដឹងដែលរៀនបានទៅកាន់ប្រព័ន្ធកណ្តាល ដើម្បីការពារឯកជនភាព។ ដូចជាសិស្សរៀននៅផ្ទះរៀងៗខ្លួន ហើយផ្ញើតែចម្លើយលំហាត់ទៅគ្រូដើម្បីកែ ដោយមិនចាំបាច់ផ្ញើសៀវភៅសរសេរផ្ទាល់ខ្លួនទាំងមូលទៅនោះទេ។
Blockchain ជាបច្ចេកវិទ្យាបញ្ជីកត់ត្រាទិន្នន័យឌីជីថលដែលធ្វើឡើងដោយបណ្តាញកុំព្យូទ័រជាច្រើន ដែលធានាថាទិន្នន័យមិនអាចត្រូវបានកែប្រែ ឬលុបចោលដោយគ្មានការដឹងឮពីសមាជិកក្នុងប្រព័ន្ធឡើយ។ ដូចជាសៀវភៅកត់ត្រាសាធារណៈដែលសរសេរដោយទឹកខ្មៅ ដែលគ្មាននរណាម្នាក់អាចលុប ឬហែកទំព័រចោលបានដោយមិនឱ្យគេដឹង។
Distributed Denial of Service (DDoS) ជាការវាយប្រហារដោយប្រើកុំព្យូទ័រជាច្រើនដើម្បីបញ្ជូនទិន្នន័យយ៉ាងច្រើនសន្ធឹកសន្ធាប់ទៅកាន់គោលដៅតែមួយក្នុងពេលតែមួយ ក្នុងបំណងធ្វើឱ្យប្រព័ន្ធគាំង ឬមិនអាចដំណើរការបាន។ ដូចជាមនុស្សមួយក្រុមធំទៅឈររាំងផ្លូវចូលហាង ដើម្បីកុំឱ្យអតិថិជនពិតប្រាកដអាចចូលទិញអីវ៉ាន់បាន។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖