Original Title: 机器学习在能源与电力系统领域的应用和展望
Source: dx.doi.org
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការអនុវត្ត និងទស្សនវិស័យនៃម៉ាស៊ីនរៀន (Machine Learning) ក្នុងវិស័យថាមពល និងប្រព័ន្ធអគ្គិសនី

ចំណងជើងដើម៖ 机器学习在能源与电力系统领域的应用和展望

អ្នកនិពន្ធ៖ CHENG Lefeng (South China University of Technology), YU Tao (South China University of Technology), ZHANG Xiaoshun (Shantou University), YIN Linfei (Guangxi University)

ឆ្នាំបោះពុម្ព៖ 2019, Automation of Electric Power Systems

វិស័យសិក្សា៖ Artificial Intelligence, Electrical Engineering

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយពីបញ្ហាប្រឈមនៃការបំប្លែងប្រព័ន្ធថាមពល និងអគ្គិសនី (EEPS) ប្រពៃណីទៅជាប្រព័ន្ធឆ្លាតវៃទំនើប (Smart-EEPS) ដើម្បីគ្រប់គ្រងទិន្នន័យដ៏ធំ និងភាពស្មុគស្មាញនៃថាមពលកកើតឡើងវិញ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានធ្វើការត្រួតពិនិត្យ និងវិភាគយ៉ាងទូលំទូលាយនូវប្រភេទក្បួនដោះស្រាយម៉ាស៊ីនរៀន (Machine Learning) សំខាន់ៗចំនួន ៧ ដែលជាតំណាងនៃបញ្ញាសិប្បនិម្មិតជំនាន់ថ្មី (AI 2.0)។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Reinforcement Learning (RL)
ការរៀនពង្រឹង (Reinforcement Learning)
មិនត្រូវការទិន្នន័យដែលមានស្លាក (Labels) ទុកជាមុន មានសមត្ថភាពរៀនដោយខ្លួនឯង និងធ្វើការសម្រេចចិត្តជាបន្តបន្ទាប់ (Sequential decision-making) ក្នុងពេលជាក់ស្តែង។ ងាយជួបបញ្ហា "Curse of dimensionality" (វិមាត្រទិន្នន័យធំពេក) ដែលធ្វើឱ្យការគណនាមានភាពយឺតយ៉ាវ និងទាមទារការសាកល្បងច្រើនជាមួយបរិស្ថាន។ ត្រូវបានអនុវត្តយ៉ាងជោគជ័យ និងទទួលបានផ្កាយ ៥ ក្នុងការគ្រប់គ្រងស្ថិរភាពសុវត្ថិភាពអគ្គិសនី (AGC) និងការគ្រប់គ្រងវ៉ុល/ថាមពលអសកម្ម (VQC)។
Deep Learning (DL)
ការរៀនស៊ីជម្រៅ (Deep Learning)
មានសមត្ថភាពខ្លាំងក្នុងការទាញយកលក្ខណៈពិសេស (Feature extraction) ពីទិន្នន័យធំៗ និងអាចដោះស្រាយបញ្ហាដែលមានទំនាក់ទំនងមិនស្របគ្នា (Non-linear mapping)។ ទាមទារសំណុំទិន្នន័យធំមហាសាល និងថាមពលកុំព្យូទ័រខ្លាំង (GPU) ហើយជារឿយៗវាមានទម្រង់ជា "Black-box" ដែលពិបាកក្នុងការពន្យល់ពីមូលហេតុនៃការសម្រេចចិត្ត។ ទទួលបានការអនុវត្តខ្ពស់ (ផ្កាយ ៥) ក្នុងការធ្វើរោគវិនិច្ឆ័យកំហុសឧបករណ៍អគ្គិសនី ការព្យាករណ៍បន្ទុករយៈពេលខ្លី និងការរកឃើញការវាយប្រហារតាមបណ្តាញ។
Transfer Learning (TL)
ការរៀនផ្ទេរ (Transfer Learning)
ជួយដោះស្រាយបញ្ហាខ្វះទិន្នន័យ (Small data) ដោយទាញយកចំណេះដឹងពីកិច្ចការចាស់មកអនុវត្តលើកិច្ចការថ្មី ដែលជួយបង្កើនល្បឿនហ្វឹកហាត់។ អាចប្រឈមនឹងបញ្ហាផ្ទេរខុស (Negative transfer) ប្រសិនបើកិច្ចការទាំងពីរមិនសូវមានទំនាក់ទំនងគ្នា ហើយការបញ្ជាក់ពីទ្រឹស្តីនៅមានការលំបាក។ ទទួលបានការចាប់អារម្មណ៍កម្រិតផ្កាយ ៤ ក្នុងការជួយពន្លឿនការបង្កើនប្រសិទ្ធភាពទូទៅនៃបណ្តាញអគ្គិសនីខ្នាតធំ និងការព្យាករណ៍ល្បឿនខ្យល់។
Adversarial Learning (AL / GANs)
ការរៀនប្រឆាំង ឬបណ្តាញបង្កើតប្រឆាំង (Adversarial Learning / GANs)
អាចបង្កើតទិន្នន័យសិប្បនិម្មិតថ្មីៗដែលមានលក្ខណៈដូចទិន្នន័យពិត ដែលជួយដោះស្រាយបញ្ហាកង្វះទិន្នន័យសម្រាប់ហ្វឹកហាត់។ ដំណើរការនៃការហ្វឹកហាត់មានភាពមិនស្ថិតស្ថេរ ងាយនឹងមានបញ្ហា "Mode collapse" (ការបង្កើតទិន្នន័យដដែលៗ)។ ស្ថិតក្នុងដំណាក់កាលចាប់ផ្តើម (ផ្កាយ ១) ប៉ុន្តែមានសក្តានុពលខ្ពស់ក្នុងការបង្កើតទិន្នន័យសេណារីយ៉ូនៃថាមពលកកើតឡើងវិញ (ខ្យល់ និងពន្លឺព្រះអាទិត្យ) ចំនួនច្រើន។
Ensemble Learning (EL)
ការរៀនប្រមូលផ្តុំ (Ensemble Learning)
មានភាពជាក់លាក់ខ្ពស់ និងភាពជឿជាក់ខ្ពស់តាមរយៈការប្រមូលផ្តុំលទ្ធផលពីម៉ូដែលតូចៗជាច្រើនចូលគ្នា កាត់បន្ថយបញ្ហា Overfitting។ ងាយរងឥទ្ធិពលពីទិន្នន័យរំខាន (Noise) ហើយអាចមានបញ្ហា Overfitting ឬ Underfitting ប្រសិនបើមិនបានកែសម្រួលបានល្អ។ ទទួលបានការវាយតម្លៃផ្កាយ ៣ សម្រាប់ការប្រើប្រាស់យ៉ាងទូលំទូលាយក្នុងការទស្សន៍ទាយកម្រិតបន្ទុកអគ្គិសនី និងការវាយតម្លៃសុវត្ថិភាពប្រព័ន្ធ។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តក្បួនដោះស្រាយបញ្ញាសិប្បនិម្មិតជំនាន់ថ្មី (AI 2.0) នៅក្នុងប្រព័ន្ធអគ្គិសនី ទាមទារការវិនិយោគធនធានយ៉ាងច្រើនទាំងផ្នែកទិន្នន័យ ផ្នែករឹង និងកម្មវិធី។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះគឺជាការស្រាវជ្រាវបែបត្រួតពិនិត្យ (Review paper) ដែលផ្អែកលើការវិវត្តនៃបណ្តាញអគ្គិសនីឆ្លាតវៃ (Smart Grids) ភាគច្រើននៅក្នុងប្រទេសចិន (ឧទាហរណ៍ ក្រុមហ៊ុន State Grid) និងទិន្នន័យពីប្រទេសអភិវឌ្ឍន៍។ សម្រាប់ប្រទេសកម្ពុជា ទិន្នន័យប្រវត្តិសាស្រ្តស្តីពីការប្រើប្រាស់ និងការគ្រប់គ្រងអគ្គិសនីប្រហែលជានៅមានកម្រិត មិនទាន់មានទម្រង់ឌីជីថលពេញលេញ ឬខ្វះទិន្នន័យដែលមានគុណភាព ដែលធ្វើឱ្យការហ្វឹកហាត់ម៉ូដែលធំៗ (Deep Learning) អាចនឹងជួបឧបសគ្គធំនៅដំណាក់កាលដំបូង។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាមានបញ្ហាប្រឈមផ្នែកហេដ្ឋារចនាសម្ព័ន្ធទិន្នន័យក៏ដោយ បច្ចេកទេស Machine Learning ទាំងនេះមានសក្តានុពលធំធេងក្នុងការជួយធ្វើទំនើបកម្ម និងដោះស្រាយបញ្ហាថាមពលនៅកម្ពុជា។

ការចាប់ផ្តើមពីការប្រើប្រាស់ម៉ូដែលសាមញ្ញ (ដូចជា Ensemble Learning) និងការធ្វើឱ្យប្រសើរឡើងនូវការប្រមូលទិន្នន័យ គឺជាជំហានចាំបាច់មុននឹងកម្ពុជាអាចទាញយកអត្ថប្រយោជន៍ពេញលេញពី AI ជំនាន់ទី២ ក្នុងវិស័យថាមពល។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ជំហានទី១៖ កសាងមូលដ្ឋានគ្រឹះអគ្គិសនី និងវិទ្យាសាស្ត្រទិន្នន័យ: និស្សិតគួរសិក្សារួមគ្នានូវមុខវិជ្ជាប្រព័ន្ធអគ្គិសនី (Power Systems) និងមូលដ្ឋានគ្រឹះ AI ដោយចាប់ផ្តើមរៀនសរសេរកូដភាសា Python និងប្រើប្រាស់បណ្ណាល័យសាមញ្ញដូចជា Scikit-learn ដើម្បីអនុវត្តម៉ូដែល Regression ឬ Random Forest។
  2. ជំហានទី២៖ អភិវឌ្ឍម៉ូដែលការព្យាករណ៍បន្ទុកអគ្គិសនី (Load Forecasting): ចាប់ផ្តើមគម្រោងជាក់ស្តែងដោយប្រើប្រាស់ទិន្នន័យអាកាសធាតុ និងទិន្នន័យប្រើប្រាស់អគ្គិសនី (អាចជាទិន្នន័យគំរូ ឬទិន្នន័យបើកចំហ) ដើម្បីសាងសង់ម៉ូដែល Deep Learning (LSTM) តាមរយៈ TensorFlow/Keras
  3. ជំហានទី៣៖ សាកល្បងការគ្រប់គ្រងបណ្តាញអគ្គិសនីឆ្លាតវៃតាមរយៈ RL: សិក្សាពីការកាត់បន្ថយហានិភ័យ និងការបញ្ជូនអគ្គិសនី (Grid Dispatch) ដោយធ្វើការពិសោធន៍ម៉ូដែល Reinforcement Learning ក្នងបរិស្ថានត្រាប់តាម (Simulation) ដូចជាការប្រើប្រាស់ OpenAI GymGrid2Op framework
  4. ជំហានទី៤៖ ដោះស្រាយបញ្ហាខ្វះទិន្នន័យជាក់ស្តែងនៅកម្ពុជា: ដោយសារតែខេត្តជាច្រើនអាចមិនទាន់មានទិន្នន័យគ្រប់គ្រាន់ និស្សិតគួរប្រើប្រាស់បណ្ណាល័យ PyTorch ដើម្បីហ្វឹកហាត់បច្ចេកទេស Transfer Learning ដោយយកទិន្នន័យដែលបានហ្វឹកហាត់រួចពីប្រទេសអភិវឌ្ឍន៍ មកកែសម្រួលប្រើប្រាស់សម្រាប់គម្រោងថាមពលពន្លឺព្រះអាទិត្យក្នុងស្រុក។
  5. ជំហានទី៥៖ សហការ និងអនុវត្តគម្រោងសាកល្បង (Pilot Projects): ធ្វើការស្នើសុំទិន្នន័យសម្រាប់គម្រោងស្រាវជ្រាវ (Thesis) ពីស្ថាប័នពាក់ព័ន្ធដូចជា អគ្គិសនីកម្ពុជា (EDC) ឬ អាជ្ញាធរអគ្គិសនីកម្ពុជា (EAC) រួចអភិវឌ្ឍប្រព័ន្ធ AI តូចមួយដើម្បីរកកំហុសឧបករណ៍ ឬព្យាករណ៍ការខ្វះខាតថាមពល និងបោះពុម្ពផ្សាយលទ្ធផលការងារ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Reinforcement Learning (RL) ជាប្រភេទក្បួនដោះស្រាយម៉ាស៊ីនរៀនដែលអនុញ្ញាតឱ្យកុំព្យូទ័ររៀនធ្វើការសម្រេចចិត្តតាមរយៈការសាកល្បងនិងកំហុស (Trial and Error) ដោយទទួលបានរង្វាន់ពេលធ្វើត្រូវ និងពិន័យពេលធ្វើខុស ដើម្បីស្វែងរកយុទ្ធសាស្ត្របញ្ជូនអគ្គិសនីល្អបំផុតក្នងប្រព័ន្ធស្មុគស្មាញ។ ដូចជាការបង្ហាត់សត្វឆ្កែឱ្យចេះចាប់បាល់ ដោយផ្តល់នំចំណីពេលវាធ្វើបានល្អ ដើម្បីឱ្យវារៀនពីសកម្មភាពដែលនាំឱ្យទទួលបានរង្វាន់។
Deep Learning (DL) ជាបច្ចេកទេសបញ្ញាសិប្បនិម្មិតដែលប្រើប្រាស់បណ្តាញសរសៃប្រសាទសិប្បនិម្មិតមានស្រទាប់ច្រើន (Multi-layer neural networks) ដើម្បីទាញយកលក្ខណៈពិសេសលាក់កំបាំងពីទិន្នន័យទំហំធំ ដូចជាការវិភាគកំហុសឧបករណ៍ ឬទស្សន៍ទាយបន្ទុកអគ្គិសនី។ ដូចជាក្រុមអ្នកស៊ើបអង្កេតជាច្រើនជាន់ថ្នាក់ ដែលអ្នកទីមួយមើលឃើញតែទម្រង់ទូទៅ រួចបញ្ជូនព័ត៌មានទៅអ្នកបន្ទាប់ដើម្បីវិភាគលម្អិតបន្តបន្ទាប់រហូតដល់រកឃើញមុខសញ្ញាពិតប្រាកដ។
Transfer Learning (TL) ជាវិធីសាស្ត្រដែលទាញយកចំណេះដឹង ឬម៉ូដែលដែលបានហ្វឹកហាត់រួចលើកិច្ចការមួយ ទៅអនុវត្តលើកិច្ចការថ្មីមួយទៀតដែលមានលក្ខណៈស្រដៀងគ្នា ដើម្បីសន្សំពេលវេលា និងដោះស្រាយបញ្ហាខ្វះទិន្នន័យប្រវត្តិសាស្រ្តសម្រាប់ការហ្វឹកហាត់ម៉ូដែលថ្មី។ ដូចជាមនុស្សដែលចេះជិះកង់ស្រាប់ ពេលប្តូរទៅរៀនជិះម៉ូតូ គឺគាត់អាចរៀនចេះលឿនជាងអ្នកដែលមិនធ្លាប់ជិះកង់សោះ ព្រោះគាត់មានមូលដ្ឋានរក្សាលំនឹងរួចហើយ។
Generative Adversarial Networks (GANs) ជាប្រព័ន្ធម៉ាស៊ីនរៀនដែលមានបណ្តាញពីរប្រកួតប្រជែងគ្នា គឺមួយមានតួនាទីបង្កើតទិន្នន័យក្លែងក្លាយ (Generator) ហើយមួយទៀតមានតួនាទីចាប់កំហុសទិន្នន័យនោះ (Discriminator) រហូតទាល់តែទិន្នន័យក្លែងក្លាយនោះមានលក្ខណៈដូចទិន្នន័យពិតបេះបិទ ដែលមានប្រយោជន៍ក្នុងការបង្កើតទិន្នន័យសេណារីយ៉ូថាមពលកកើតឡើងវិញ។ ដូចជាការប្រកួតប្រជែងរវាងអ្នកផលិតលុយក្លែងក្លាយ និងប៉ូលីស ដោយអ្នកក្លែងបន្លំខិតខំធ្វើឱ្យដូចពិតបំផុត ហើយប៉ូលីសខិតខំចាប់កំហុស រហូតដល់លុយក្លែងក្លាយនោះមើលលែងដឹង។
Parallel Learning (PL) ជាទ្រឹស្តីម៉ាស៊ីនរៀនដែលបង្កើតប្រព័ន្ធនិម្មិត (Artificial System) ដំណើរការស្របគ្នាជាមួយប្រព័ន្ធពិត ដើម្បីបង្កើតទិន្នន័យក្លែងធ្វើ (Simulated data) យ៉ាងច្រើនមហាសាល ជួយបង្វឹកម៉ូដែលឱ្យធ្វើការសម្រេចចិត្តបានល្អមុននឹងអនុវត្តការបញ្ជាក្នុងបណ្តាញអគ្គិសនីពិត។ ដូចជាអាកាសយានិកហាត់ហោះហើរក្នុងបន្ទប់ត្រាប់តាម (Flight Simulator) ជាច្រើនពាន់ដង ដើម្បីត្រៀមខ្លួនដោះស្រាយគ្រប់ស្ថានការណ៍ មុននឹងទៅបើកយន្តហោះពិតប្រាកដ។
Ensemble Learning (EL) ជាបច្ចេកទេសប្រមូលផ្តុំលទ្ធផលពីម៉ូដែលម៉ាស៊ីនរៀនតូចៗ (Weak learners) ជាច្រើនបញ្ចូលគ្នា ដើម្បីធ្វើការទស្សន៍ទាយឬសម្រេចចិត្តរួមមួយ ដែលផ្តល់នូវភាពជាក់លាក់ និងគួរឱ្យទុកចិត្តជាងការពឹងផ្អែកលើម៉ូដែលតែមួយ។ ដូចជាការធ្វើការសម្រេចចិត្តក្នុងក្រុមប្រឹក្សាភិបាល ដែលការបោះឆ្នោតសួរយោបល់ពីសមាជិកជាច្រើននាក់ ផ្តល់លទ្ធផលល្អជាងការសម្រេចចិត្តដោយបុគ្គលតែម្នាក់។
Automatic Generation Control (AGC) ជាប្រព័ន្ធគ្រប់គ្រងដោយស្វ័យប្រវត្តិនៅក្នុងបណ្តាញអគ្គិសនី ដែលជួយកែតម្រូវកម្រិតថាមពលផលិតចេញពីរោងចក្រឱ្យមានតុល្យភាពជាមួយនឹងតម្រូវការប្រើប្រាស់អគ្គិសនីជាក់ស្តែងក្នុងពេលភ្លាមៗ ដើម្បីរក្សាស្ថិរភាពប្រេកង់បណ្តាញជាតិ។ ដូចជាប្រព័ន្ធគ្រប់គ្រងល្បឿនស្វ័យប្រវត្តិ (Cruise Control) ក្នុងរថយន្ត ដែលបន្ថែមឬបន្ថយហ្គែរដោយខ្លួនឯង ដើម្បីរក្សាល្បឿនថេរ ទោះបីជាបើកបរលើផ្លូវទួលឬចុះចំណោតក៏ដោយ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖