បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហានៃតម្រូវការការព្យាករណ៍បន្ទុកអគ្គិសនីសម្រាប់ថ្ងៃបន្ទាប់ដែលមានភាពជាក់លាក់ខ្ពស់ ដើម្បីបង្កើនប្រសិទ្ធភាពនៃការគ្រប់គ្រងថាមពលនៅកម្រិតអ្នកប្រើប្រាស់ (Behind-the-Meter) ដោយផ្តោតលើការដោះស្រាយទិន្នន័យដែលមានលក្ខណៈមិនលីនេអ៊ែរ និងទិន្នន័យមិនប្រក្រតី។
វិធីសាស្ត្រ (The Methodology)៖ អ្នកនិពន្ធបានបង្កើតវិធីសាស្រ្តរួមបញ្ចូលគ្នាមួយដោយប្រើប្រាស់បច្ចេកទេសរៀនសូត្រស៊ីជម្រៅ (Deep Learning) និងការរៀបចំទិន្នន័យកម្រិតខ្ពស់ ដើម្បីធ្វើតេស្តលើសំណុំទិន្នន័យចំនួន ៧ ផ្សេងៗគ្នា។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| LSTM-EMD (Long Short-Term Memory with Empirical Mode Decomposition) គំរូ LSTM រួមបញ្ចូលជាមួយបច្ចេកទេសបំបែកសញ្ញា EMD |
មានសមត្ថភាពខ្ពស់ក្នុងការចាប់យកលំនាំទិន្នន័យដែលមានភាពស្មុគស្មាញ និងមិនលីនេអ៊ែរ (Non-linear)។ ផ្តល់លទ្ធផលល្អបំផុតចំពោះទិន្នន័យដែលមានការប្រែប្រួលខ្លាំង ដូចជារោងចក្រ និងបណ្តាញចែកចាយ។ | ទាមទារធនធានកុំព្យូទ័រខ្ពស់ក្នុងការបណ្តុះបណ្តាល (Training) និងមានភាពស្មុគស្មាញក្នុងការកំណត់ប៉ារ៉ាម៉ែត្រ (Hyperparameter tuning)។ | ទទួលបានពិន្ទុជំនាញ (Skill Score) រហូតដល់ ៧៣% លើសពីគំរូស្តង់ដារចំពោះទិន្នន័យរោងចក្រឧស្សាហកម្ម។ |
| SARIMA (Seasonal Auto-Regressive Integrated Moving Average) គំរូស្ថិតិសម្រាប់ការវិភាគស계៊េរីពេលវេលាដែលមានរដូវកាល |
ងាយស្រួលយល់ មានតម្លាភាព និងចំណាយពេលតិចក្នុងការបណ្តុះបណ្តាល។ មានប្រសិទ្ធភាពល្អចំពោះទិន្នន័យដែលមានលំនាំទៀងទាត់ខ្លាំង។ | មិនអាចចាប់យកលំនាំទិន្នន័យដែលមានភាពស្មុគស្មាញ ឬការប្រែប្រួលរហ័សបានល្អដូច Deep Learning ទេ។ | ផ្តល់លទ្ធផលល្អប្រសើរជាង ឬប្រហាក់ប្រហែលនឹង LSTM ចំពោះទិន្នន័យសណ្ឋាគារដែលមានលំនាំប្រើប្រាស់ថាមពលទៀងទាត់។ |
| Seasonal Naive Persistence (NP) វិធីសាស្រ្តសាមញ្ញដោយយកទិន្នន័យពីអតីតកាលមកប្រើផ្ទាល់ |
មិនត្រូវការការបណ្តុះបណ្តាល ងាយស្រួលបំផុត និងប្រើជាបន្ទាត់មូលដ្ឋាន (Baseline) សម្រាប់ប្រៀបធៀប។ | មានកម្រិតលំអៀងខ្ពស់ និងមិនអាចព្យាករណ៍ការផ្លាស់ប្តូរដែលមិនធ្លាប់កើតឡើង។ | ត្រូវបានប្រើជាមូលដ្ឋានប្រៀបធៀប (Benchmark) ដោយគំរូ LSTM-EMD អាចកាត់បន្ថយកំហុស RMSE បានយ៉ាងច្រើនធៀបនឹងវិធីសាស្រ្តនេះ។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះប្រើប្រាស់ធនធានកុំព្យូទ័រកម្រិតមធ្យម ដែលអាចដំណើរការបាននៅលើសេវាកម្មក្លោដ (Cloud) ដោយមិនចាំបាច់មានហេដ្ឋារចនាសម្ព័ន្ធធំដុំ។
ការសិក្សានេះប្រើប្រាស់ទិន្នន័យពីសហរដ្ឋអាមេរិក (USA) និងអ៊ីតាលី (Italy) ដែលមានអាកាសធាតុនិងលំនាំនៃការប្រើប្រាស់ថាមពលខុសពីប្រទេសកម្ពុជា។ ទោះជាយ៉ាងណាក៏ដោយ លក្ខណៈនៃបន្ទុកឧស្សាហកម្ម និងពាណិជ្ជកម្ម (ដូចជាសណ្ឋាគារ) អាចមានលក្ខណៈស្រដៀងគ្នាដែលអាចយកមកអនុវត្តបាន។
វិធីសាស្រ្តនេះមានសារៈសំខាន់ និងអាចអនុវត្តបានខ្ពស់សម្រាប់វិស័យថាមពលនៅកម្ពុជា ជាពិសេសក្នុងបរិបទនៃការកើនឡើងនៃការប្រើប្រាស់ថាមពលសូឡា។
ការអនុវត្តវិធីសាស្រ្ត LSTM-EMD អាចជួយបង្កើនប្រសិទ្ធភាពនៃការគ្រប់គ្រងថាមពលនៅកម្ពុជា ប៉ុន្តែចាំបាច់ត្រូវមានការប្រមូលទិន្នន័យដែលមានគុណភាពក្នុងស្រុកជាមុនសិន។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Long Short-Term Memory (LSTM) | ជាប្រភេទនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (Recurrent Neural Network) ដែលមានសមត្ថភាពពិសេសក្នុងការចងចាំព័ត៌មានពីអតីតកាលរយៈពេលយូរ ដើម្បីយកមកវិភាគនិងធ្វើការព្យាករណ៍ទិន្នន័យបន្តបន្ទាប់គ្នា (Time Series)។ វាដោះស្រាយបញ្ហាដែលបណ្តាញធម្មតាមិនអាចចងចាំព្រឹត្តិការណ៍ឆ្ងាយៗបាន។ | ដូចជាការអានសៀវភៅដែលយើងចងចាំសាច់រឿងតាំងពីជំពូកទី ១ ដើម្បីយល់ពីជំពូកទី ១០ មិនមែនគ្រាន់តែអានប្រយោគចុងក្រោយហើយយល់នោះទេ។ |
| Empirical Mode Decomposition (EMD) | ជាបច្ចេកទេសបំបែកសញ្ញាដ៏ស្មុគស្មាញទៅជាផ្នែកតូចៗដែលហៅថា Intrinsic Mode Functions (IMFs) ដើម្បីងាយស្រួលក្នុងការវិភាគរកមើលលំនាំ ឬនិន្នាការនៅក្នុងទិន្នន័យដែលមានភាពមិនទៀងទាត់។ | ប្រៀបដូចជាការបំបែកសំឡេងតន្ត្រីចម្រុះ ទៅជាសំឡេងឧបករណ៍នីមួយៗ (ដូចជា ស្គរ ហ្គីតា និងព្យាណូ) ដាច់ដោយឡែកពីគ្នា ដើម្បីងាយស្រួលស្តាប់។ |
| Behind-the-Meter (BTM) | សំដៅលើប្រព័ន្ធថាមពល (ដូចជាផ្ទាំងសូឡា ឬអាគុយផ្ទុកភ្លើង) ដែលត្រូវបានដំឡើងនៅទីតាំងរបស់អ្នកប្រើប្រាស់ផ្ទាល់ (នៅខាងក្រោយកុងទ័រភ្លើង) ជាជាងនៅខាងក្រុមហ៊ុនផ្គត់ផ្គង់អគ្គិសនី។ | ដូចជាការដាំបន្លែហូបខ្លួនឯងនៅក្នុងសួនក្រោយផ្ទះ ជំនួសឱ្យការទៅទិញបន្លែពីផ្សាររាល់ថ្ងៃ។ |
| Concept Drift | ជាបាតុភូតដែលលំនាំស្ថិតិនៃទិន្នន័យគោលដៅមានការផ្លាស់ប្តូរតាមពេលវេលា (ឧទាហរណ៍៖ ឥរិយាបថប្រើប្រាស់ភ្លើងប្រែប្រួលដោយសារបច្ចេកវិទ្យាថ្មី) ធ្វើឱ្យគំរូដែលធ្លាប់បណ្តុះបណ្តាលពីមុន លែងសូវមានប្រសិទ្ធភាព។ | ដូចជាការព្យាករណ៍ម៉ូដសម្លៀកបំពាក់បច្ចុប្បន្ន ដោយផ្អែកលើទិន្នន័យពីទសវត្សរ៍ឆ្នាំ ៩០ ដែលច្បាប់នៃការស្លៀកពាក់បានផ្លាស់ប្តូរអស់ទៅហើយ។ |
| Hyperband | ជាក្បួនដោះស្រាយ (Algorithm) សម្រាប់ស្វែងរកការកំណត់ប៉ារ៉ាម៉ែត្រ (Hyperparameters) ដ៏ល្អបំផុតសម្រាប់គំរូកុំព្យូទ័រ ដោយប្រើវិធីសាស្ត្រកាត់ចោលនូវជម្រើសណាដែលមិនល្អបានឆាប់រហ័ស ដើម្បីសន្សំពេល។ | ដូចជាការប្រកួតចម្រៀងដែលគណៈកម្មការឱ្យអ្នកច្រៀងមិនល្អឈប់ភ្លាមៗក្នុងរយៈពេល ១០ វិនាទីដំបូង ដើម្បីទុកពេលឱ្យអ្នកពូកែបានបង្ហាញសមត្ថភាព។ |
| Stationarity | ជាលក្ខណៈនៃទិន្នន័យស៊េរីពេលវេលា (Time Series) ដែលមានតម្លៃមធ្យម (Mean) និងបម្រែបម្រួល (Variance) នៅថេរមិនប្រែប្រួលតាមពេលវេលា។ ទិន្នន័យដែលមាន Stationarity ងាយស្រួលធ្វើការព្យាករណ៍ជាង។ | ដូចជាផ្ទៃទឹកទន្លេដែលហូរស្មោះត្រង់ក្នុងកម្ពស់ថេរ មិនមែនហូរចុះឡើងវឹកវរដូចទឹកជ្រោះនោះទេ។ |
| Dropout | ជាបច្ចេកទេសមួយក្នុង Deep Learning ដែលបិទដំណើរការផ្នែកខ្លះនៃបណ្តាញសរសៃប្រសាទដោយចៃដន្យអំឡុងពេលបណ្តុះបណ្តាល ដើម្បីបង្ការកុំឱ្យកុំព្យូទ័រទន្ទេញទិន្នន័យ (Overfitting) ជំនួសឱ្យការរៀនលំនាំពិតប្រាកដ។ | ដូចជាការរៀនត្រៀមប្រឡងដោយយកដៃបិទចម្លើយខ្លះៗ ដើម្បីបង្ខំឱ្យខួរក្បាលគិតរកហេតុផល មិនមែនគ្រាន់តែទន្ទេញចាំមាត់។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖