Original Title: Machine Learning-Based Model for Prediction of Power Consumption in Smart Grid
Source: doi.org/10.34028/iajit/19/3/5
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

គំរូផ្អែកលើការរៀនរបស់ម៉ាស៊ីនសម្រាប់ការទស្សន៍ទាយការប្រើប្រាស់ថាមពលនៅក្នុងបណ្តាញអគ្គិសនីឆ្លាតវៃ

ចំណងជើងដើម៖ Machine Learning-Based Model for Prediction of Power Consumption in Smart Grid

អ្នកនិពន្ធ៖ Shamik Tiwari (University of Petroleum and Energy Studies, India), Anurag Jain (University of Petroleum and Energy Studies, India), Kusum Yadav (University of Hail, Saudi Arabia), Rabie Ramadan (University of Hail, Saudi Arabia)

ឆ្នាំបោះពុម្ព៖ 2022 (The International Arab Journal of Information Technology)

វិស័យសិក្សា៖ Computer Science & Electrical Engineering

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ បណ្តាញអគ្គិសនីបែបបុរាណមិនអាចទស្សន៍ទាយតម្រូវការប្រែប្រួលរបស់អ្នកប្រើប្រាស់បានទេ ហើយខ្វះភាពរឹងមាំដែលអាចបណ្តាលឱ្យមានការដាច់ចរន្តអគ្គិសនី ដូច្នេះការផ្លាស់ប្តូរទៅបណ្តាញឆ្លាតវៃទាមទារឱ្យមានគំរូទស្សន៍ទាយច្បាស់លាស់ដើម្បីរក្សាលំនឹង។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកនិពន្ធបានប្រើប្រាស់បណ្ដុំទិន្នន័យបើកចំហដើម្បីបណ្តុះបណ្តាល និងសាកល្បងក្បួនដោះស្រាយការរៀនរបស់ម៉ាស៊ីន (Machine Learning) ចំនួន ៧ ផ្សេងគ្នាសម្រាប់ការប៉ាន់ប្រមាណស្ថេរភាពបណ្តាញ។

បណ្ដុំទិន្នន័យស្ថេរភាពបណ្តាញឆ្លាតវៃ (Smart Grid Stability Dataset) ពី Kaggle ដែលមាន ៦០,០០០ ជួរទិន្នន័យ
ក្បួនដោះស្រាយការរៀនរបស់ម៉ាស៊ីន (Machine Learning Algorithms) ដូចជា Bagging Classifier, Random Forest, និង Gradient Boosting
ការពិសោធន៍តាមរយៈកម្មវិធី Python (Python Simulation Environment)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ម៉ូដែលដែលប្រើប្រាស់ Bagging Classifier ទទួលបានភាពត្រឹមត្រូវខ្ពស់បំផុតគឺ ៩៧.៩% ក្នុងការទស្សន៍ទាយបន្ទុកអគ្គិសនី។
ការទស្សន៍ទាយតម្រូវការថាមពលបានច្បាស់លាស់ ជួយបញ្ចៀសការបរាជ័យនៃបណ្តាញ និងបង្កើនស្ថេរភាពរបស់ប្រព័ន្ធ។
ម៉ូដែលផ្សេងទៀតដូចជា Logistic Regression មានភាពត្រឹមត្រូវទាបជាង (៨១.៤%) បើធៀបនឹង Bagging Classifier និង Random Forest។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Bagging Classifier ការចាត់ថ្នាក់បែប Bagging (ប្រើមូលដ្ឋាន SVC)	មានសមត្ថភាពខ្ពស់បំផុតក្នុងការកាត់បន្ថយភាពលំអៀង (Variance) និងទប់ស្កាត់ការរៀនលើសកម្រិត (Overfitting) ដោយការរួមបញ្ចូលលទ្ធផលពីគំរូជាច្រើន។	ត្រូវការពេលវេលាគណនាច្រើនជាងគំរូទោលបន្តិចបន្តួច ប៉ុន្តែមិនជាបញ្ហាធំសម្រាប់ទិន្នន័យនេះទេ។	ទទួលបានភាពត្រឹមត្រូវ (Accuracy) ខ្ពស់បំផុតគឺ ៩៧.៩% និង AUC ៩៩.៨%។
Extra Tree Classifier ការចាត់ថ្នាក់បែបដើមឈើបន្ថែម (Extra Tree)	មានល្បឿនលឿន និងដំណើរការល្អជាមួយទិន្នន័យដែលមានវិមាត្រច្រើន (High-dimensional data)។	ភាពត្រឹមត្រូវទាបជាង Bagging Classifier បន្តិច។	ទទួលបានភាពត្រឹមត្រូវ ៩៥.៣%។
Random Forest ព្រៃចៃដន្យ (Random Forest)	មានស្ថេរភាពល្អ និងពេញនិយមសម្រាប់ការដោះស្រាយបញ្ហាចាត់ថ្នាក់ស្មុគស្មាញ។	អាចយឺតក្នុងការទស្សន៍ទាយប្រសិនបើចំនួនដើមឈើក្នុងព្រៃច្រើនពេក។	ទទួលបានភាពត្រឹមត្រូវ ៩៥.០%។
Logistic Regression តម្រែតម្រង់ឡូជីស្ទិក	ងាយស្រួលយល់ និងអនុវត្ត មានល្បឿនលឿន។	មិនអាចចាប់យកទំនាក់ទំនងដែលមិនមែនជាលីនេអ៊ែរ (Non-linear) នៃទិន្នន័យបណ្តាញអគ្គិសនីបានល្អ។	ទទួលបានភាពត្រឹមត្រូវទាបបំផុតគឺ ៨១.៤%។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះប្រើប្រាស់ធនធានកុំព្យូទ័រតិចតួច និងសាមញ្ញ ដែលអាចដំណើរការបានយ៉ាងងាយស្រួលនៅតាមសាកលវិទ្យាល័យនានាក្នុងប្រទេសកម្ពុជា។

Hardware: កុំព្យូទ័រយួរដៃធម្មតាដែលមាន CPU i3 និង RAM 8GB (ដូចដែលបានប្រើក្នុងការពិសោធន៍របស់ក្រដាសនេះ)។
Software: ភាសា Python 3.7 និងបណ្ណាល័យ Scikit-Learn (Open Source)។
Dataset: ទិន្នន័យ Smart Grid Stability (CSV) ដែលមានប្រហែល ៦០,០០០ ជួរទិន្នន័យ (អាចទាញយកបានពី Kaggle)។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់ទិន្នន័យសិប្បនិម្មិត (Synthetic Data) ពី Kaggle ដែលបង្កើតឡើងដោយ Vadim Arzamasov មិនមែនជាទិន្នន័យជាក់ស្តែងពីបណ្តាញអគ្គិសនីនៃប្រទេសណាមួយឡើយ។ នេះមានន័យថា ទោះបីជាម៉ូដែលដំណើរការល្អក្នុងលក្ខខណ្ឌពិសោធន៍ក៏ដោយ វាអាចនឹងជួបប្រទះបញ្ហានៅពេលអនុវត្តជាមួយទិន្នន័យជាក់ស្តែងដែលមានភាពរំខាន (Noise) និងភាពមិនប្រក្រតីច្រើន។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្រ្តនេះមានសារៈសំខាន់ខ្លាំងសម្រាប់កម្ពុជា ស្របពេលដែលយើងកំពុងធ្វើទំនើបកម្មទៅជាបណ្តាញអគ្គិសនីឆ្លាតវៃ (Smart Grid) ដើម្បីគ្រប់គ្រងតម្រូវការថាមពលដែលកើនឡើង។

អគ្គិសនីកម្ពុជា (EDC): អាចប្រើប្រាស់គំរូ Bagging Classifier ដើម្បីព្យាករណ៍ពីស្ថេរភាពបណ្តាញ (Grid Stability) នៅពេលដែលមានតម្រូវការប្រើប្រាស់ខ្ពស់នៅរាជធានីភ្នំពេញ។
ការគ្រប់គ្រងថាមពលកកើតឡើងវិញ (Renewable Energy Integration): ជួយក្នុងការរក្សាលំនឹងបណ្តាញ នៅពេលដែលមានការប្រែប្រួលនៃការផ្គត់ផ្គង់ពីស្ថានីយ៍ថាមពលពន្លឺព្រះអាទិត្យ (Solar Farms) នៅខេត្តកំពង់ឆ្នាំង ឬពោធិ៍សាត់។
វិទ្យាស្ថានបច្ចេកវិទ្យាកម្ពុជា (ITC): សាកសមសម្រាប់ការស្រាវជ្រាវរបស់និស្សិត ដោយសារទិន្នន័យជាប្រភេទបើកចំហ (Open Access) និងមិនត្រូវការកុំព្យូទ័រដែលមានកម្លាំងខ្លាំង (High Performance Computing)។

ទោះបីជាលទ្ធផលបង្ហាញពីប្រសិទ្ធភាពខ្ពស់ក៏ដោយ ការអនុវត្តជាក់ស្តែងនៅកម្ពុជាតម្រូវឱ្យមានការប្រមូលទិន្នន័យពិតប្រាកដពីប្រព័ន្ធ SCADA របស់ EDC ដើម្បីបណ្តុះបណ្តាលម៉ូដែលឡើងវិញ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

ការទាញយកនិងរៀបចំទិន្នន័យ: ចូលទៅកាន់គេហទំព័រ Kaggle ដើម្បីទាញយក 'Smart Grid Stability Dataset'។ ប្រើប្រាស់កម្មវិធី Python (Pandas) ដើម្បីពិនិត្យមើលលក្ខណៈទិន្នន័យ (Features) ទាំង ១៤ ដូចដែលបានរៀបរាប់ក្នុងក្រដាស។
ការបង្កើតបរិស្ថានពិសោធន៍: ដំឡើង Jupyter Notebook និងបណ្ណាល័យសំខាន់ៗដូចជា Scikit-Learn, Matplotlib, និង Seaborn។ អនុវត្តការបែងចែកទិន្នន័យ (Train-Test Split) ក្នុងសមាមាត្រ ៧០:៣០ ដូចក្នុងឯកសារ។
ការកសាងម៉ូដែល Bagging Classifier: សរសេរកូដដើម្បីបង្កើតម៉ូដែល Bagging Classifier ដោយប្រើ Support Vector Classifier (SVC) ជាមូលដ្ឋាន។ កំណត់ប៉ារ៉ាម៉ែត្រឱ្យដូចការពិសោធន៍ ដើម្បីផ្ទៀងផ្ទាត់លទ្ធផលថាទទួលបានភាពត្រឹមត្រូវប្រហែល ៩៧.៩% ដែរឬទេ។
ការប្រៀបធៀបនិងវិភាគ: បង្កើត Confusion Matrix និង ROC Curve ដើម្បីវាស់វែងប្រសិទ្ធភាព។ សាកល្បងប្រៀបធៀបជាមួយម៉ូដែលផ្សេងទៀតដូចជា XGBoost ឬ LightGBM ដែលពេញនិយមនាពេលបច្ចុប្បន្ន។
ការសិក្សាបន្ថែមសម្រាប់បរិបទកម្ពុជា: សិក្សាអំពីឥទ្ធិពលនៃអថេរ (Feature Importance) ថាតើកត្តាតម្លៃ (Price Elasticity) ឬកត្តាផលិតកម្មថាមពល មានឥទ្ធិពលខ្លាំងជាងគេលើស្ថេរភាព ដែលអាចផ្តល់ជាគំនិតសម្រាប់ការគ្រប់គ្រងថ្លៃអគ្គិសនីនៅកម្ពុជា។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Smart grid	ជាប្រព័ន្ធបណ្តាញអគ្គិសនីទំនើបដែលប្រើប្រាស់បច្ចេកវិទ្យាឌីជីថល សេនស័រ និងប្រព័ន្ធទំនាក់ទំនង ដើម្បីតាមដាន និងគ្រប់គ្រងការដឹកជញ្ជូនអគ្គិសនីពីប្រភពផលិតទៅកាន់អ្នកប្រើប្រាស់ ដោយមានសមត្ថភាពឆ្លើយតបដោយស្វ័យប្រវត្តិទៅនឹងការផ្លាស់ប្តូរតម្រូវការ។	ដូចជាផ្លូវថ្នល់ដែលមានភ្លើងស្តុបឆ្លាតវៃចេះប្តូរពណ៌ដោយខ្លួនឯងភ្លាមៗនៅពេលឃើញមានឡានស្ទះ ដើម្បីសម្រួលចរាចរណ៍ដោយមិនចាំបាច់មានប៉ូលិស។
Bagging classifier	ជាបច្ចេកទេសរៀនរបស់ម៉ាស៊ីន (Machine Learning) ដែលយកគំរូទស្សន៍ទាយតូចៗជាច្រើនមកបូកបញ្ចូលគ្នា ដើម្បីធ្វើការសម្រេចចិត្តចុងក្រោយមួយ។ វិធីនេះជួយកាត់បន្ថយភាពលំអៀង និងបង្កើនភាពត្រឹមត្រូវនៃការព្យាករណ៍។	ដូចជាការសួរយោបល់ពីអ្នកជំនាញ ១០នាក់ផ្សេងគ្នា ហើយយកមតិភាគច្រើនមកសម្រេចចិត្ត ជំនួសឱ្យការជឿលើមនុស្សតែម្នាក់ដែលអាចមានកំហុស។
Grid stability	សំដៅលើសមត្ថភាពរបស់ប្រព័ន្ធអគ្គិសនីក្នុងការរក្សាតុល្យភាពរវាងការផលិត និងការប្រើប្រាស់ (Supply and Demand) ដើម្បីចៀសវាងការដាច់ភ្លើងទូទាំងតំបន់ (Blackout) នៅពេលមានការប្រែប្រួលភ្លាមៗ។	ដូចជាការជិះកង់ដែលត្រូវរក្សាលំនឹងមិនឱ្យដួល ទោះបីជាមានខ្យល់បក់ ឬផ្លូវរលាក់ក៏ដោយ។
Phasor Measurement Units (PMUs)	ជាឧបករណ៍វាស់ស្ទង់កម្រិតខ្ពស់នៅក្នុងបណ្តាញអគ្គិសនី ដែលអាចតាមដានសុខភាព ល្បឿន និងទម្រង់នៃចរន្តអគ្គិសនីក្នុងពេលជាក់ស្តែង (Real-time) ដើម្បីឱ្យប្រតិបត្តិករដឹងថាបណ្តាញមានបញ្ហាឬអត់។	ដូចជាឧបករណ៍វាស់ចង្វាក់បេះដូងសម្រាប់ពិនិត្យសុខភាពបណ្តាញអគ្គិសនី ដើម្បីដឹងភ្លាមៗបើមានអាការៈមិនស្រួល។
Price elasticity coefficient	ជាមេគុណដែលបង្ហាញពីកម្រិតនៃការផ្លាស់ប្តូរតម្រូវការប្រើប្រាស់អគ្គិសនីរបស់អតិថិជន នៅពេលដែលមានការផ្លាស់ប្តូរតម្លៃអគ្គិសនី (ក្នុងឯកសារនេះ វាជាអថេរមួយសម្រាប់វាស់វែងប្រតិកម្មរបស់អ្នកប្រើប្រាស់)។	ដូចជាពេលទំនិញចុះថ្លៃ មនុស្សទិញច្រើន តែពេលឡើងថ្លៃ មនុស្សទិញតិច។
Receiver Operating Characteristic (ROC)	ជាក្រាហ្វដែលប្រើសម្រាប់វាស់វែងសមត្ថភាពរបស់ម៉ូដែលក្នុងការបែងចែករវាងថ្នាក់ពីរផ្សេងគ្នា (ឧទាហរណ៍៖ បណ្តាញមានស្ថេរភាព ឬគ្មានស្ថេរភាព)។ ផ្ទៃក្រោមក្រាហ្វនេះ (AUC) កាន់តែធំ បញ្ជាក់ថាម៉ូដែលកាន់តែល្អ។	ដូចជាតារាងពិន្ទុដែលបង្ហាញថាគ្រូពេទ្យម្នាក់ពូកែវិនិច្ឆ័យជំងឺត្រូវកម្រិតណា ធៀបនឹងការវិនិច្ឆ័យខុស។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖