Original Title: Survey on Advanced Machine Learning Techniques for Predicting Smart Grid Stability
Source: www.ijsred.com
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការស្ទង់មតិលើបច្ចេកទេស Machine Learning កម្រិតខ្ពស់សម្រាប់ការព្យាករណ៍ស្ថិរភាពបណ្តាញអគ្គិសនីឆ្លាតវៃ (Smart Grid)

ចំណងជើងដើម៖ Survey on Advanced Machine Learning Techniques for Predicting Smart Grid Stability

អ្នកនិពន្ធ៖ Abdulaziz Salihu Aliero (Lovely Professional University, India / Kebbi State University of Science and Technology, Nigeria)

ឆ្នាំបោះពុម្ព៖ 2024 (International Journal of Scientific Research and Engineering Development)

វិស័យសិក្សា៖ Machine Learning

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហាប្រឈមក្នុងការគ្រប់គ្រង និងការព្យាករណ៍ស្ថិរភាពនៃបណ្តាញអគ្គិសនីឆ្លាតវៃ (Smart Grid) ដែលបង្កើតទិន្នន័យយ៉ាងច្រើនសន្ធឹកសន្ធាប់ដោយសារការធ្វើសមាហរណកម្មប្រភពថាមពលកកើតឡើងវិញ និងឧបករណ៍វៃឆ្លាតផ្សេងៗ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានធ្វើការស្ទង់មតិ និងប្រៀបធៀបដំណើរការនៃក្បួនដោះស្រាយ Machine Learning ចំនួន ៩ ផ្សេងគ្នា ដោយប្រើប្រាស់សំណុំទិន្នន័យត្រាប់តាមពីសាកលវិទ្យាល័យ California (UCI Machine Learning Repository)។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
XGBoost Classifier
ចំណាត់ថ្នាក់ XGBoost (Extreme Gradient Boosting)
មានដំណើរការល្អបំផុត ជាមួយនឹងភាពត្រឹមត្រូវខ្ពស់ និងល្បឿនព្យាករណ៍លឿនស័ក្តិសមសម្រាប់ការប្រើប្រាស់ជាក់ស្តែង។ ជាទូទៅម៉ូដែលប្រភេទនេះមានភាពស្មុគស្មាញ (Black-box) ដែលពិបាកក្នុងការពន្យល់ពីរបៀបដែលវាធ្វើការសម្រេចចិត្ត។ ទទួលបានភាពត្រឹមត្រូវ (Accuracy) 97.5%, F1-score 97.9%, ពេលវេលាបណ្តុះបណ្តាល 11.135s និងពេលវេលាព្យាករណ៍ 0.047s។
Logistic Regression
តម្រែតម្រង់ឡូជីស្ទីក (Logistic Regression)
មានល្បឿនលឿនបំផុតទាំងការបណ្តុះបណ្តាល និងការព្យាករណ៍ ព្រមទាំងងាយស្រួលយល់។ ប្រហែលជាមិនមានភាពត្រឹមត្រូវខ្ពស់លើទិន្នន័យដែលមានភាពស្មុគស្មាញ និងមិនមែនលីនេអ៊ែរ (Non-linear) នៃបណ្តាញអគ្គិសនី។ ប្រើពេលបណ្តុះបណ្តាលតិចបំផុតត្រឹមតែ 0.043s និងពេលវេលាព្យាករណ៍ត្រឹមតែ 0.001s ប៉ុណ្ណោះ។
Support Vector Machine (SVM)
ម៉ាស៊ីនវ៉ិចទ័រគាំទ្រ (SVM)
មានប្រសិទ្ធភាពក្នុងការបែងចែកទិន្នន័យដែលមានវិមាត្រខ្ពស់ (High-dimensional data)។ ប្រើប្រាស់ពេលវេលាយូរជាងគេបំផុតសម្រាប់ការបណ្តុះបណ្តាល និងការព្យាករណ៍ ដែលមិនស័ក្តិសមសម្រាប់ប្រព័ន្ធទាមទារពេលវេលាជាក់ស្តែង (Real-time)។ ប្រើពេលបណ្តុះបណ្តាលយូរបំផុត (102.53s) និងពេលវេលាព្យាករណ៍យឺតបំផុត (4.931s)។
K-Nearest Neighbors (KNN)
ក្បួនដោះស្រាយអ្នកជិតខាងជិតបំផុត (KNN)
ប្រើពេលវេលាបណ្តុះបណ្តាលលឿន និងងាយស្រួលក្នុងការអនុវត្ត។ ដំណើរការព្យាករណ៍មានភាពយឺតយ៉ាវខ្លាំងបំផុត ដោយសារវាត្រូវគណនាចម្ងាយរាល់ពេលមានទិន្នន័យថ្មីចូល។ ពេលវេលាបណ្តុះបណ្តាល 0.395s ប៉ុន្តែពេលវេលាព្យាករណ៍យឺតខ្លាំងរហូតដល់ 16.097s។

ការចំណាយលើធនធាន (Resource Cost)៖ ទោះបីជាឯកសារមិនបានបញ្ជាក់លម្អិតពីទំហំ Hardware ក៏ដោយ ផ្អែកលើពេលវេលាបណ្តុះបណ្តាល (គិតជាវិនាទី) ការអនុវត្តម៉ូដែលទាំងនេះទាមទារត្រឹមតែកុំព្យូទ័រដែលមានកម្លាំងមធ្យម ប៉ុន្តែប្រព័ន្ធអគ្គិសនីជាក់ស្តែងទាមទារហេដ្ឋារចនាសម្ព័ន្ធធំជាងនេះ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យត្រាប់តាម (Simulated dataset) ដែលផ្អែកលើប្រព័ន្ធអគ្គិសនីនៅប្រទេសអាល្លឺម៉ង់ (Germany)។ នេះជាចំណុចសំខាន់សម្រាប់ប្រទេសកម្ពុជា ពីព្រោះប្រព័ន្ធអគ្គិសនីកម្ពុជា (EDC) មានលក្ខណៈខុសប្លែកគ្នាទាំងផ្នែកហេដ្ឋារចនាសម្ព័ន្ធ ប្រភពថាមពល (វារីអគ្គិសនី និងធ្យូងថ្មច្រើនជាង) និងទម្រង់នៃការប្រើប្រាស់ ដូច្នេះម៉ូដែលនេះត្រូវតែមានការកែសម្រួលឡើងវិញដោយប្រើទិន្នន័យក្នុងស្រុក។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកទេស Machine Learning ទាំងនេះមានសារៈសំខាន់ និងអាចអនុវត្តបានសម្រាប់ប្រទេសកម្ពុជា ជាពិសេសស្របពេលដែលកម្ពុជាកំពុងពង្រីកការប្រើប្រាស់ថាមពលកកើតឡើងវិញ។

ការដាក់បញ្ចូលបច្ចេកវិទ្យា AI ទៅក្នុងហេដ្ឋារចនាសម្ព័ន្ធអគ្គិសនីរបស់កម្ពុជានឹងជួយជំរុញឱ្យមានការគ្រប់គ្រងថាមពលប្រកបដោយនិរន្តរភាព កាត់បន្ថយការចំណាយ និងបង្កើនស្ថិរភាពនៃការផ្គត់ផ្គង់។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ជំហានទី១៖ សិក្សាមូលដ្ឋានគ្រឹះនៃទិន្នន័យអគ្គិសនី និង Machine Learning: និស្សិតគួរចាប់ផ្តើមសិក្សាពីភាសា Python និងបណ្ណាល័យ Scikit-Learn, Pandas ព្រមទាំងស្វែងយល់ពីគោលគំនិតជាមូលដ្ឋាននៃ Smart Grid ដូចជាភាពញឹកញាប់ (Frequency) និងស្ថិរភាពនៃវ៉ុល។
  2. ជំហានទី២៖ ទាញយក និងវិភាគទិន្នន័យ (Data Preprocessing): ទាញយកសំណុំទិន្នន័យ Electrical Grid Stability Simulated Dataset ពី UCI Repository។ អនុវត្តការសម្អាតទិន្នន័យ និងវិភាគទំនាក់ទំនងរវាងអថេរនានា (Feature Engineering) ដើម្បីត្រៀមបញ្ចូលទៅក្នុងម៉ូដែល។
  3. ជំហានទី៣៖ បណ្តុះបណ្តាល និងប្រៀបធៀបម៉ូដែល: សរសេរកូដដើម្បីសាកល្បងម៉ូដែលយ៉ាងហោចណាស់ ៣ គឺ Logistic Regression, SVM និង XGBoost។ ប្រៀបធៀបលទ្ធផលដោយប្រើរង្វាស់ Accuracy, F1-score និងកត់ត្រាពេលវេលា Training/Prediction Time ដូចដែលបានបង្ហាញក្នុងឯកសារស្រាវជ្រាវ។
  4. ជំហានទី៤៖ ការកែសម្រួលសម្រាប់បរិបទកម្ពុជា: ស្វែងរកទិន្នន័យគំរូពីប្រភពក្នុងស្រុក (ឧ. ទិន្នន័យប្រើប្រាស់អគ្គិសនីប្រចាំថ្ងៃពី EDC ឬស្ថានីយសូឡា) មកសាកល្បងលើម៉ូដែល XGBoost ដែលមានស្រាប់ ដើម្បីមើលពីភាពខុសគ្នានៃប្រសិទ្ធភាព និងធ្វើការកែតម្រូវ (Fine-tuning)។
  5. ជំហានទី៥៖ សិក្សាពីការដាក់ឱ្យដំណើរការលើ Hardware (Deployment): ស្រាវជ្រាវពីរបៀបដាក់បញ្ចូលម៉ូដែលដែលបានហ្វឹកហាត់រួចទៅក្នុងឧបករណ៍ Edge Computing ដូចជា Raspberry PiFPGA ដើម្បីធ្វើការត្រួតពិនិត្យស្ថិរភាពអគ្គិសនីក្នុងពេលវេលាជាក់ស្តែង (Real-time monitoring)។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Smart Grid បណ្តាញអគ្គិសនីជំនាន់ថ្មីដែលបញ្ចូលបច្ចេកវិទ្យាព័ត៌មាន និងទំនាក់ទំនង (ICT) ដើម្បីអនុញ្ញាតឱ្យមានលំហូរទិន្នន័យ និងអគ្គិសនីទៅមក (two-way) រវាងអ្នកផលិត និងអ្នកប្រើប្រាស់ ជួយឱ្យការគ្រប់គ្រងថាមពលកាន់តែមានប្រសិទ្ធភាព។ ដូចជាផ្លូវហាយវ៉េទំនើបដែលមិនត្រឹមតែឱ្យឡាន (អគ្គិសនី) រត់បានទេ តែថែមទាំងប្រាប់ព័ត៌មានចរាចរណ៍ទៅវិញទៅមក (ទិន្នន័យ) ដើម្បីកុំឱ្យស្ទះ។
Demand Response ជាយន្តការមួយដែលលើកទឹកចិត្តឱ្យអ្នកប្រើប្រាស់កាត់បន្ថយ ឬផ្លាស់ប្តូរពេលវេលាប្រើប្រាស់អគ្គិសនីរបស់ពួកគេនៅពេលដែលមានតម្រូវការខ្ពស់ (Peak hours) ដើម្បីរក្សាស្ថិរភាពបណ្តាញអគ្គិសនី និងជៀសវាងការដាច់ភ្លើង។ ដូចជាការបញ្ចុះតម្លៃសំបុត្រកុននៅពេលព្រឹក ដើម្បីកាត់បន្ថយភាពកកកុញរបស់មនុស្សនៅពេលល្ងាច។
XGBoost ជាក្បួនដោះស្រាយ Machine Learning ដ៏មានអានុភាពដែលប្រើវិធីសាស្ត្ររួមបញ្ចូលគ្នានៃមែកធាងសេចក្តីសម្រេច (Decision Trees) ជាច្រើន ដោយកែតម្រូវកំហុសពីម៉ូដែលមុនៗជាបន្តបន្ទាប់ ដើម្បីផ្តល់នូវការព្យាករណ៍ដែលមានភាពត្រឹមត្រូវខ្ពស់បំផុត។ ដូចជាការប្រមូលផ្តុំក្រុមអ្នកជំនាញជាច្រើននាក់មកដោះស្រាយបញ្ហាមួយ ដោយអ្នកក្រោយរៀនពីកំហុសរបស់អ្នកមុន រហូតទទួលបានចម្លើយត្រឹមត្រូវបំផុត។
Black-box models សំដៅលើប្រព័ន្ធបញ្ញាសិប្បនិម្មិត ឬម៉ូដែល Machine Learning ដែលមានភាពស្មុគស្មាញខ្លាំង ដែលយើងអាចឃើញតែទិន្នន័យបញ្ចូល (Input) និងលទ្ធផលបញ្ចេញ (Output) ប៉ុន្តែមិនអាចយល់ច្បាស់ពីដំណើរការខាងក្នុងនៃការសម្រេចចិត្តរបស់វា។ ដូចជាម៉ាស៊ីនក្រឡុកទឹកផ្លែឈើបិទជិតមួយ ដែលយើងដឹងថាយើងដាក់ផ្លែប៉ោមចូល ហើយបានទឹកប៉ោមមកវិញ ប៉ុន្តែយើងមិនឃើញពីរបៀបដែលកាំបិតកាត់ខាងក្នុងនោះទេ។
Advanced Metering Infrastructure ជាប្រព័ន្ធបណ្តាញរួមបញ្ចូលគ្នានៃកុងទ័រឆ្លាតវៃ (Smart Meters) បណ្តាញទំនាក់ទំនង និងប្រព័ន្ធគ្រប់គ្រងទិន្នន័យ ដែលអនុញ្ញាតឱ្យមានការប្រាស្រ័យទាក់ទងពីរទិសដៅរវាងក្រុមហ៊ុនអគ្គិសនី និងអតិថិជន។ ដូចជាការបំពាក់នាឡិកាឆ្លាតវៃ (Smart Watch) ដល់ផ្ទះនីមួយៗ ដែលមិនត្រឹមតែវាស់ការប្រើភ្លើងទេ តែថែមទាំងអាចរាយការណ៍ប្រាប់ក្រុមហ៊ុនភ្លើងភ្លាមៗបើមានបញ្ហា។
Adversarial attacks ជាប្រភេទនៃការវាយប្រហារតាមប្រព័ន្ធសាយប័រ (Cyberattack) ដែលជនខិលខូចធ្វើការកែប្រែទិន្នន័យបញ្ចូលបន្តិចបន្តួចដោយចេតនា ដើម្បីបញ្ឆោតឱ្យម៉ូដែល Machine Learning ធ្វើការទស្សន៍ទាយ ឬសម្រេចចិត្តខុស។ ដូចជាការលួចបិទស្កុតលើផ្លាកសញ្ញាចរាចរណ៍ ដែលធ្វើឱ្យប្រព័ន្ធឡានបើកបរស្វ័យប្រវត្តិមើលខុសពីសញ្ញាឈប់ ទៅជាសញ្ញាឱ្យទៅមុខ។
Support Vector Machine (SVM) ជាក្បួនដោះស្រាយ Machine Learning សម្រាប់ចាត់ថ្នាក់ទិន្នន័យ ដោយវាព្យាយាមគូសបន្ទាត់ ឬបង្កើតប្លង់ (Hyperplane) ដែលបំបែកក្រុមទិន្នន័យខុសៗគ្នាឱ្យនៅឆ្ងាយពីគ្នាតាមដែលអាចធ្វើទៅបាន។ ដូចជាការគូសបន្ទាត់ព្រំដែនដ៏ធំទូលាយមួយ ដើម្បីញែកហ្វូងចៀម និងហ្វូងពពែឱ្យនៅដាច់ពីគ្នាបានល្អបំផុត។
Microgrids ជាប្រព័ន្ធបណ្តាញអគ្គិសនីខ្នាតតូចដែលរួមបញ្ចូលការផលិត ការរក្សាទុក និងការប្រើប្រាស់ថាមពលក្នុងតំបន់មួយកំណត់ ដែលវាអាចដំណើរការភ្ជាប់ជាមួយបណ្តាញជាតិធំ ឬកាត់ផ្តាច់ដំណើរការដោយឯករាជ្យនៅពេលមានអាសន្ន។ ដូចជាម៉ាស៊ីនភ្លើងបម្រុងប្រចាំភូមិ ឬសាលារៀនមួយ ដែលអាចផ្តាច់ខ្លួនប្រើតែឯងបាន ពេលដែលភ្លើងរដ្ឋរលត់។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖