បញ្ហា (The Problem)៖ បណ្តាញអគ្គិសនីបែបបុរាណមិនអាចទស្សន៍ទាយតម្រូវការប្រែប្រួលរបស់អ្នកប្រើប្រាស់បានទេ ហើយខ្វះភាពរឹងមាំដែលអាចបណ្តាលឱ្យមានការដាច់ចរន្តអគ្គិសនី ដូច្នេះការផ្លាស់ប្តូរទៅបណ្តាញឆ្លាតវៃទាមទារឱ្យមានគំរូទស្សន៍ទាយច្បាស់លាស់ដើម្បីរក្សាលំនឹង។
វិធីសាស្ត្រ (The Methodology)៖ អ្នកនិពន្ធបានប្រើប្រាស់បណ្ដុំទិន្នន័យបើកចំហដើម្បីបណ្តុះបណ្តាល និងសាកល្បងក្បួនដោះស្រាយការរៀនរបស់ម៉ាស៊ីន (Machine Learning) ចំនួន ៧ ផ្សេងគ្នាសម្រាប់ការប៉ាន់ប្រមាណស្ថេរភាពបណ្តាញ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Bagging Classifier ការចាត់ថ្នាក់បែប Bagging (ប្រើមូលដ្ឋាន SVC) |
មានសមត្ថភាពខ្ពស់បំផុតក្នុងការកាត់បន្ថយភាពលំអៀង (Variance) និងទប់ស្កាត់ការរៀនលើសកម្រិត (Overfitting) ដោយការរួមបញ្ចូលលទ្ធផលពីគំរូជាច្រើន។ | ត្រូវការពេលវេលាគណនាច្រើនជាងគំរូទោលបន្តិចបន្តួច ប៉ុន្តែមិនជាបញ្ហាធំសម្រាប់ទិន្នន័យនេះទេ។ | ទទួលបានភាពត្រឹមត្រូវ (Accuracy) ខ្ពស់បំផុតគឺ ៩៧.៩% និង AUC ៩៩.៨%។ |
| Extra Tree Classifier ការចាត់ថ្នាក់បែបដើមឈើបន្ថែម (Extra Tree) |
មានល្បឿនលឿន និងដំណើរការល្អជាមួយទិន្នន័យដែលមានវិមាត្រច្រើន (High-dimensional data)។ | ភាពត្រឹមត្រូវទាបជាង Bagging Classifier បន្តិច។ | ទទួលបានភាពត្រឹមត្រូវ ៩៥.៣%។ |
| Random Forest ព្រៃចៃដន្យ (Random Forest) |
មានស្ថេរភាពល្អ និងពេញនិយមសម្រាប់ការដោះស្រាយបញ្ហាចាត់ថ្នាក់ស្មុគស្មាញ។ | អាចយឺតក្នុងការទស្សន៍ទាយប្រសិនបើចំនួនដើមឈើក្នុងព្រៃច្រើនពេក។ | ទទួលបានភាពត្រឹមត្រូវ ៩៥.០%។ |
| Logistic Regression តម្រែតម្រង់ឡូជីស្ទិក |
ងាយស្រួលយល់ និងអនុវត្ត មានល្បឿនលឿន។ | មិនអាចចាប់យកទំនាក់ទំនងដែលមិនមែនជាលីនេអ៊ែរ (Non-linear) នៃទិន្នន័យបណ្តាញអគ្គិសនីបានល្អ។ | ទទួលបានភាពត្រឹមត្រូវទាបបំផុតគឺ ៨១.៤%។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះប្រើប្រាស់ធនធានកុំព្យូទ័រតិចតួច និងសាមញ្ញ ដែលអាចដំណើរការបានយ៉ាងងាយស្រួលនៅតាមសាកលវិទ្យាល័យនានាក្នុងប្រទេសកម្ពុជា។
ការសិក្សានេះប្រើប្រាស់ទិន្នន័យសិប្បនិម្មិត (Synthetic Data) ពី Kaggle ដែលបង្កើតឡើងដោយ Vadim Arzamasov មិនមែនជាទិន្នន័យជាក់ស្តែងពីបណ្តាញអគ្គិសនីនៃប្រទេសណាមួយឡើយ។ នេះមានន័យថា ទោះបីជាម៉ូដែលដំណើរការល្អក្នុងលក្ខខណ្ឌពិសោធន៍ក៏ដោយ វាអាចនឹងជួបប្រទះបញ្ហានៅពេលអនុវត្តជាមួយទិន្នន័យជាក់ស្តែងដែលមានភាពរំខាន (Noise) និងភាពមិនប្រក្រតីច្រើន។
វិធីសាស្រ្តនេះមានសារៈសំខាន់ខ្លាំងសម្រាប់កម្ពុជា ស្របពេលដែលយើងកំពុងធ្វើទំនើបកម្មទៅជាបណ្តាញអគ្គិសនីឆ្លាតវៃ (Smart Grid) ដើម្បីគ្រប់គ្រងតម្រូវការថាមពលដែលកើនឡើង។
ទោះបីជាលទ្ធផលបង្ហាញពីប្រសិទ្ធភាពខ្ពស់ក៏ដោយ ការអនុវត្តជាក់ស្តែងនៅកម្ពុជាតម្រូវឱ្យមានការប្រមូលទិន្នន័យពិតប្រាកដពីប្រព័ន្ធ SCADA របស់ EDC ដើម្បីបណ្តុះបណ្តាលម៉ូដែលឡើងវិញ។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Smart grid | ជាប្រព័ន្ធបណ្តាញអគ្គិសនីទំនើបដែលប្រើប្រាស់បច្ចេកវិទ្យាឌីជីថល សេនស័រ និងប្រព័ន្ធទំនាក់ទំនង ដើម្បីតាមដាន និងគ្រប់គ្រងការដឹកជញ្ជូនអគ្គិសនីពីប្រភពផលិតទៅកាន់អ្នកប្រើប្រាស់ ដោយមានសមត្ថភាពឆ្លើយតបដោយស្វ័យប្រវត្តិទៅនឹងការផ្លាស់ប្តូរតម្រូវការ។ | ដូចជាផ្លូវថ្នល់ដែលមានភ្លើងស្តុបឆ្លាតវៃចេះប្តូរពណ៌ដោយខ្លួនឯងភ្លាមៗនៅពេលឃើញមានឡានស្ទះ ដើម្បីសម្រួលចរាចរណ៍ដោយមិនចាំបាច់មានប៉ូលិស។ |
| Bagging classifier | ជាបច្ចេកទេសរៀនរបស់ម៉ាស៊ីន (Machine Learning) ដែលយកគំរូទស្សន៍ទាយតូចៗជាច្រើនមកបូកបញ្ចូលគ្នា ដើម្បីធ្វើការសម្រេចចិត្តចុងក្រោយមួយ។ វិធីនេះជួយកាត់បន្ថយភាពលំអៀង និងបង្កើនភាពត្រឹមត្រូវនៃការព្យាករណ៍។ | ដូចជាការសួរយោបល់ពីអ្នកជំនាញ ១០នាក់ផ្សេងគ្នា ហើយយកមតិភាគច្រើនមកសម្រេចចិត្ត ជំនួសឱ្យការជឿលើមនុស្សតែម្នាក់ដែលអាចមានកំហុស។ |
| Grid stability | សំដៅលើសមត្ថភាពរបស់ប្រព័ន្ធអគ្គិសនីក្នុងការរក្សាតុល្យភាពរវាងការផលិត និងការប្រើប្រាស់ (Supply and Demand) ដើម្បីចៀសវាងការដាច់ភ្លើងទូទាំងតំបន់ (Blackout) នៅពេលមានការប្រែប្រួលភ្លាមៗ។ | ដូចជាការជិះកង់ដែលត្រូវរក្សាលំនឹងមិនឱ្យដួល ទោះបីជាមានខ្យល់បក់ ឬផ្លូវរលាក់ក៏ដោយ។ |
| Phasor Measurement Units (PMUs) | ជាឧបករណ៍វាស់ស្ទង់កម្រិតខ្ពស់នៅក្នុងបណ្តាញអគ្គិសនី ដែលអាចតាមដានសុខភាព ល្បឿន និងទម្រង់នៃចរន្តអគ្គិសនីក្នុងពេលជាក់ស្តែង (Real-time) ដើម្បីឱ្យប្រតិបត្តិករដឹងថាបណ្តាញមានបញ្ហាឬអត់។ | ដូចជាឧបករណ៍វាស់ចង្វាក់បេះដូងសម្រាប់ពិនិត្យសុខភាពបណ្តាញអគ្គិសនី ដើម្បីដឹងភ្លាមៗបើមានអាការៈមិនស្រួល។ |
| Price elasticity coefficient | ជាមេគុណដែលបង្ហាញពីកម្រិតនៃការផ្លាស់ប្តូរតម្រូវការប្រើប្រាស់អគ្គិសនីរបស់អតិថិជន នៅពេលដែលមានការផ្លាស់ប្តូរតម្លៃអគ្គិសនី (ក្នុងឯកសារនេះ វាជាអថេរមួយសម្រាប់វាស់វែងប្រតិកម្មរបស់អ្នកប្រើប្រាស់)។ | ដូចជាពេលទំនិញចុះថ្លៃ មនុស្សទិញច្រើន តែពេលឡើងថ្លៃ មនុស្សទិញតិច។ |
| Receiver Operating Characteristic (ROC) | ជាក្រាហ្វដែលប្រើសម្រាប់វាស់វែងសមត្ថភាពរបស់ម៉ូដែលក្នុងការបែងចែករវាងថ្នាក់ពីរផ្សេងគ្នា (ឧទាហរណ៍៖ បណ្តាញមានស្ថេរភាព ឬគ្មានស្ថេរភាព)។ ផ្ទៃក្រោមក្រាហ្វនេះ (AUC) កាន់តែធំ បញ្ជាក់ថាម៉ូដែលកាន់តែល្អ។ | ដូចជាតារាងពិន្ទុដែលបង្ហាញថាគ្រូពេទ្យម្នាក់ពូកែវិនិច្ឆ័យជំងឺត្រូវកម្រិតណា ធៀបនឹងការវិនិច្ឆ័យខុស។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖