Original Title: Machine Learning-Based Model for Prediction of Power Consumption in Smart Grid
Source: doi.org/10.34028/iajit/19/3/5
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

គំរូផ្អែកលើការរៀនរបស់ម៉ាស៊ីនសម្រាប់ការទស្សន៍ទាយការប្រើប្រាស់ថាមពលនៅក្នុងបណ្តាញអគ្គិសនីឆ្លាតវៃ

ចំណងជើងដើម៖ Machine Learning-Based Model for Prediction of Power Consumption in Smart Grid

អ្នកនិពន្ធ៖ Shamik Tiwari (University of Petroleum and Energy Studies, India), Anurag Jain (University of Petroleum and Energy Studies, India), Kusum Yadav (University of Hail, Saudi Arabia), Rabie Ramadan (University of Hail, Saudi Arabia)

ឆ្នាំបោះពុម្ព៖ 2022 (The International Arab Journal of Information Technology)

វិស័យសិក្សា៖ Computer Science & Electrical Engineering

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ បណ្តាញអគ្គិសនីបែបបុរាណមិនអាចទស្សន៍ទាយតម្រូវការប្រែប្រួលរបស់អ្នកប្រើប្រាស់បានទេ ហើយខ្វះភាពរឹងមាំដែលអាចបណ្តាលឱ្យមានការដាច់ចរន្តអគ្គិសនី ដូច្នេះការផ្លាស់ប្តូរទៅបណ្តាញឆ្លាតវៃទាមទារឱ្យមានគំរូទស្សន៍ទាយច្បាស់លាស់ដើម្បីរក្សាលំនឹង។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកនិពន្ធបានប្រើប្រាស់បណ្ដុំទិន្នន័យបើកចំហដើម្បីបណ្តុះបណ្តាល និងសាកល្បងក្បួនដោះស្រាយការរៀនរបស់ម៉ាស៊ីន (Machine Learning) ចំនួន ៧ ផ្សេងគ្នាសម្រាប់ការប៉ាន់ប្រមាណស្ថេរភាពបណ្តាញ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Bagging Classifier
ការចាត់ថ្នាក់បែប Bagging (ប្រើមូលដ្ឋាន SVC)
មានសមត្ថភាពខ្ពស់បំផុតក្នុងការកាត់បន្ថយភាពលំអៀង (Variance) និងទប់ស្កាត់ការរៀនលើសកម្រិត (Overfitting) ដោយការរួមបញ្ចូលលទ្ធផលពីគំរូជាច្រើន។ ត្រូវការពេលវេលាគណនាច្រើនជាងគំរូទោលបន្តិចបន្តួច ប៉ុន្តែមិនជាបញ្ហាធំសម្រាប់ទិន្នន័យនេះទេ។ ទទួលបានភាពត្រឹមត្រូវ (Accuracy) ខ្ពស់បំផុតគឺ ៩៧.៩% និង AUC ៩៩.៨%។
Extra Tree Classifier
ការចាត់ថ្នាក់បែបដើមឈើបន្ថែម (Extra Tree)
មានល្បឿនលឿន និងដំណើរការល្អជាមួយទិន្នន័យដែលមានវិមាត្រច្រើន (High-dimensional data)។ ភាពត្រឹមត្រូវទាបជាង Bagging Classifier បន្តិច។ ទទួលបានភាពត្រឹមត្រូវ ៩៥.៣%។
Random Forest
ព្រៃចៃដន្យ (Random Forest)
មានស្ថេរភាពល្អ និងពេញនិយមសម្រាប់ការដោះស្រាយបញ្ហាចាត់ថ្នាក់ស្មុគស្មាញ។ អាចយឺតក្នុងការទស្សន៍ទាយប្រសិនបើចំនួនដើមឈើក្នុងព្រៃច្រើនពេក។ ទទួលបានភាពត្រឹមត្រូវ ៩៥.០%។
Logistic Regression
តម្រែតម្រង់ឡូជីស្ទិក
ងាយស្រួលយល់ និងអនុវត្ត មានល្បឿនលឿន។ មិនអាចចាប់យកទំនាក់ទំនងដែលមិនមែនជាលីនេអ៊ែរ (Non-linear) នៃទិន្នន័យបណ្តាញអគ្គិសនីបានល្អ។ ទទួលបានភាពត្រឹមត្រូវទាបបំផុតគឺ ៨១.៤%។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះប្រើប្រាស់ធនធានកុំព្យូទ័រតិចតួច និងសាមញ្ញ ដែលអាចដំណើរការបានយ៉ាងងាយស្រួលនៅតាមសាកលវិទ្យាល័យនានាក្នុងប្រទេសកម្ពុជា។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់ទិន្នន័យសិប្បនិម្មិត (Synthetic Data) ពី Kaggle ដែលបង្កើតឡើងដោយ Vadim Arzamasov មិនមែនជាទិន្នន័យជាក់ស្តែងពីបណ្តាញអគ្គិសនីនៃប្រទេសណាមួយឡើយ។ នេះមានន័យថា ទោះបីជាម៉ូដែលដំណើរការល្អក្នុងលក្ខខណ្ឌពិសោធន៍ក៏ដោយ វាអាចនឹងជួបប្រទះបញ្ហានៅពេលអនុវត្តជាមួយទិន្នន័យជាក់ស្តែងដែលមានភាពរំខាន (Noise) និងភាពមិនប្រក្រតីច្រើន។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្រ្តនេះមានសារៈសំខាន់ខ្លាំងសម្រាប់កម្ពុជា ស្របពេលដែលយើងកំពុងធ្វើទំនើបកម្មទៅជាបណ្តាញអគ្គិសនីឆ្លាតវៃ (Smart Grid) ដើម្បីគ្រប់គ្រងតម្រូវការថាមពលដែលកើនឡើង។

ទោះបីជាលទ្ធផលបង្ហាញពីប្រសិទ្ធភាពខ្ពស់ក៏ដោយ ការអនុវត្តជាក់ស្តែងនៅកម្ពុជាតម្រូវឱ្យមានការប្រមូលទិន្នន័យពិតប្រាកដពីប្រព័ន្ធ SCADA របស់ EDC ដើម្បីបណ្តុះបណ្តាលម៉ូដែលឡើងវិញ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ការទាញយកនិងរៀបចំទិន្នន័យ: ចូលទៅកាន់គេហទំព័រ Kaggle ដើម្បីទាញយក 'Smart Grid Stability Dataset'។ ប្រើប្រាស់កម្មវិធី Python (Pandas) ដើម្បីពិនិត្យមើលលក្ខណៈទិន្នន័យ (Features) ទាំង ១៤ ដូចដែលបានរៀបរាប់ក្នុងក្រដាស។
  2. ការបង្កើតបរិស្ថានពិសោធន៍: ដំឡើង Jupyter Notebook និងបណ្ណាល័យសំខាន់ៗដូចជា Scikit-Learn, Matplotlib, និង Seaborn។ អនុវត្តការបែងចែកទិន្នន័យ (Train-Test Split) ក្នុងសមាមាត្រ ៧០:៣០ ដូចក្នុងឯកសារ។
  3. ការកសាងម៉ូដែល Bagging Classifier: សរសេរកូដដើម្បីបង្កើតម៉ូដែល Bagging Classifier ដោយប្រើ Support Vector Classifier (SVC) ជាមូលដ្ឋាន។ កំណត់ប៉ារ៉ាម៉ែត្រឱ្យដូចការពិសោធន៍ ដើម្បីផ្ទៀងផ្ទាត់លទ្ធផលថាទទួលបានភាពត្រឹមត្រូវប្រហែល ៩៧.៩% ដែរឬទេ។
  4. ការប្រៀបធៀបនិងវិភាគ: បង្កើត Confusion Matrix និង ROC Curve ដើម្បីវាស់វែងប្រសិទ្ធភាព។ សាកល្បងប្រៀបធៀបជាមួយម៉ូដែលផ្សេងទៀតដូចជា XGBoost ឬ LightGBM ដែលពេញនិយមនាពេលបច្ចុប្បន្ន។
  5. ការសិក្សាបន្ថែមសម្រាប់បរិបទកម្ពុជា: សិក្សាអំពីឥទ្ធិពលនៃអថេរ (Feature Importance) ថាតើកត្តាតម្លៃ (Price Elasticity) ឬកត្តាផលិតកម្មថាមពល មានឥទ្ធិពលខ្លាំងជាងគេលើស្ថេរភាព ដែលអាចផ្តល់ជាគំនិតសម្រាប់ការគ្រប់គ្រងថ្លៃអគ្គិសនីនៅកម្ពុជា។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Smart grid ជាប្រព័ន្ធបណ្តាញអគ្គិសនីទំនើបដែលប្រើប្រាស់បច្ចេកវិទ្យាឌីជីថល សេនស័រ និងប្រព័ន្ធទំនាក់ទំនង ដើម្បីតាមដាន និងគ្រប់គ្រងការដឹកជញ្ជូនអគ្គិសនីពីប្រភពផលិតទៅកាន់អ្នកប្រើប្រាស់ ដោយមានសមត្ថភាពឆ្លើយតបដោយស្វ័យប្រវត្តិទៅនឹងការផ្លាស់ប្តូរតម្រូវការ។ ដូចជាផ្លូវថ្នល់ដែលមានភ្លើងស្តុបឆ្លាតវៃចេះប្តូរពណ៌ដោយខ្លួនឯងភ្លាមៗនៅពេលឃើញមានឡានស្ទះ ដើម្បីសម្រួលចរាចរណ៍ដោយមិនចាំបាច់មានប៉ូលិស។
Bagging classifier ជាបច្ចេកទេសរៀនរបស់ម៉ាស៊ីន (Machine Learning) ដែលយកគំរូទស្សន៍ទាយតូចៗជាច្រើនមកបូកបញ្ចូលគ្នា ដើម្បីធ្វើការសម្រេចចិត្តចុងក្រោយមួយ។ វិធីនេះជួយកាត់បន្ថយភាពលំអៀង និងបង្កើនភាពត្រឹមត្រូវនៃការព្យាករណ៍។ ដូចជាការសួរយោបល់ពីអ្នកជំនាញ ១០នាក់ផ្សេងគ្នា ហើយយកមតិភាគច្រើនមកសម្រេចចិត្ត ជំនួសឱ្យការជឿលើមនុស្សតែម្នាក់ដែលអាចមានកំហុស។
Grid stability សំដៅលើសមត្ថភាពរបស់ប្រព័ន្ធអគ្គិសនីក្នុងការរក្សាតុល្យភាពរវាងការផលិត និងការប្រើប្រាស់ (Supply and Demand) ដើម្បីចៀសវាងការដាច់ភ្លើងទូទាំងតំបន់ (Blackout) នៅពេលមានការប្រែប្រួលភ្លាមៗ។ ដូចជាការជិះកង់ដែលត្រូវរក្សាលំនឹងមិនឱ្យដួល ទោះបីជាមានខ្យល់បក់ ឬផ្លូវរលាក់ក៏ដោយ។
Phasor Measurement Units (PMUs) ជាឧបករណ៍វាស់ស្ទង់កម្រិតខ្ពស់នៅក្នុងបណ្តាញអគ្គិសនី ដែលអាចតាមដានសុខភាព ល្បឿន និងទម្រង់នៃចរន្តអគ្គិសនីក្នុងពេលជាក់ស្តែង (Real-time) ដើម្បីឱ្យប្រតិបត្តិករដឹងថាបណ្តាញមានបញ្ហាឬអត់។ ដូចជាឧបករណ៍វាស់ចង្វាក់បេះដូងសម្រាប់ពិនិត្យសុខភាពបណ្តាញអគ្គិសនី ដើម្បីដឹងភ្លាមៗបើមានអាការៈមិនស្រួល។
Price elasticity coefficient ជាមេគុណដែលបង្ហាញពីកម្រិតនៃការផ្លាស់ប្តូរតម្រូវការប្រើប្រាស់អគ្គិសនីរបស់អតិថិជន នៅពេលដែលមានការផ្លាស់ប្តូរតម្លៃអគ្គិសនី (ក្នុងឯកសារនេះ វាជាអថេរមួយសម្រាប់វាស់វែងប្រតិកម្មរបស់អ្នកប្រើប្រាស់)។ ដូចជាពេលទំនិញចុះថ្លៃ មនុស្សទិញច្រើន តែពេលឡើងថ្លៃ មនុស្សទិញតិច។
Receiver Operating Characteristic (ROC) ជាក្រាហ្វដែលប្រើសម្រាប់វាស់វែងសមត្ថភាពរបស់ម៉ូដែលក្នុងការបែងចែករវាងថ្នាក់ពីរផ្សេងគ្នា (ឧទាហរណ៍៖ បណ្តាញមានស្ថេរភាព ឬគ្មានស្ថេរភាព)។ ផ្ទៃក្រោមក្រាហ្វនេះ (AUC) កាន់តែធំ បញ្ជាក់ថាម៉ូដែលកាន់តែល្អ។ ដូចជាតារាងពិន្ទុដែលបង្ហាញថាគ្រូពេទ្យម្នាក់ពូកែវិនិច្ឆ័យជំងឺត្រូវកម្រិតណា ធៀបនឹងការវិនិច្ឆ័យខុស។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖