បញ្ហា (The Problem)៖ ការស្រាវជ្រាវនេះដោះស្រាយបញ្ហានៃទិន្នន័យវិទ្យុសកម្មពន្លឺព្រះអាទិត្យសកល (Global DSWR) ដែលខ្វះនូវកម្រិតម៉ត់ចត់ផ្នែកពេលវេលា (Temporal Resolution) សម្រាប់យកទៅប្រើប្រាស់ក្នុងការរៀបចំផែនការប្រព័ន្ធថាមពលអគ្គិសនីក្នុងតំបន់ឱ្យមានប្រសិទ្ធភាព។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះស្នើឡើងនូវវិធីសាស្ត្រកូនកាត់ថ្មីមួយឈ្មោះថា NN-XGBoost ដែលរួមបញ្ចូលបច្ចេកទេស Nearest-Neighbor ជាមួយនឹងសមត្ថភាពទស្សន៍ទាយរបស់ XGBoost ដើម្បីធ្វើឱ្យទិន្នន័យមានកម្រិតម៉ត់ចត់ជាងមុន។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| ARIMAX (AutoRegressive Integrated Moving Average with Exogenous Variables) ម៉ូដែលស្ថិតិបែបប្រពៃណីដែលប្រើទំនាក់ទំនងលីនេអ៊ែររវាងទិន្នន័យអតីតកាល និងកត្តាខាងក្រៅ |
ចំណាយពេលគណនាលឿនបំផុត (ប្រហែល ២-៥ វិនាទី) និងងាយស្រួលក្នុងការអនុវត្តសម្រាប់ទិន្នន័យដែលមានគំរូសាមញ្ញ។ | មិនអាចចាប់យកទំនាក់ទំនងដែលមិនមែនជាលីនេអ៊ែរ (Non-linear dynamics) នៃវិទ្យុសកម្មព្រះអាទិត្យបានល្អទេ ដែលបណ្តាលឱ្យមានកំហុសឆ្គងខ្ពស់។ | ទទួលបានលទ្ធផលមិនល្អខ្លាំងជាមួយនឹង R² ទាបបំផុត (-0.0214 ដល់ 0.0066) និង RMSE ខ្ពស់ (ជាង 310 W/m²)。 |
| XGBoost (eXtreme Gradient Boosting) ម៉ូដែលរៀនម៉ាស៊ីន (Machine Learning) ដ៏ពេញនិយមដែលប្រើបច្ចេកទេស Ensemble នៃដើមឈើសម្រេចចិត្ត (Decision Trees) |
មានសមត្ថភាពចាប់យកទំនាក់ទំនងស្មុគស្មាញ និងមិនមែនលីនេអ៊ែរបានល្អប្រសើរជាង ARIMAX ឆ្ងាយណាស់។ | ជារឿយៗមិនបានគិតគូរដល់ការពឹងផ្អែកលើពេលវេលា និងទីកន្លែង (Spatiotemporal dependencies) ជាក់លាក់នៃទិន្នន័យអាកាសធាតុ។ | ទទួលបាន R² ប្រហែល 0.9592 និង RMSE 62.83 W/m² សម្រាប់ការប្រើប្រាស់អថេរច្រើន។ |
| NN-XGBoost (Nearest Neighbor - XGBoost) វិធីសាស្ត្រកូនកាត់ដែលស្នើឡើង ដោយប្រើ Nearest Neighbor ដើម្បីចាប់យកលំនាំក្នុងតំបន់ មុននឹងបញ្ចូលទៅក្នុង XGBoost |
កាត់បន្ថយភាពរំខាន (Noise) និងចាប់យកទំនាក់ទំនងពេលវេលាបានល្អបំផុត ធ្វើឱ្យការទស្សន៍ទាយមានភាពជាក់លាក់ខ្ពស់ជាង XGBoost ធម្មតា។ | ត្រូវការពេលវេលាគណនាយូរជាង XGBoost បន្តិច (ប្រហែល ២ ដង) ប៉ុន្តែនៅតែស្ថិតក្នុងកម្រិតដែលអាចទទួលយកបាន។ | មានប្រសិទ្ធភាពខ្ពស់បំផុតដោយទទួលបាន R² 0.9743 និង RMSE ទាបបំផុតត្រឹម 49.93 W/m²។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តវិធីសាស្ត្រនេះមិនតម្រូវឱ្យមានធនធានកុំព្យូទ័រធំដុំទេ គឺអាចដំណើរការបានលើកុំព្យូទ័រទូទៅ ប៉ុន្តែត្រូវការការគ្រប់គ្រងទិន្នន័យដែលមានគុណភាព។
ការសិក្សានេះប្រើប្រាស់ទិន្នន័យពីទីក្រុង Brookings រដ្ឋ South Dakota សហរដ្ឋអាមេរិក ក្នុងខែមីនា (រដូវផ្ការីក)។ នេះគឺជាចំណុចដែលត្រូវប្រុងប្រយ័ត្នសម្រាប់កម្ពុជា ព្រោះលក្ខខណ្ឌអាកាសធាតុនៅទីនោះមានភាពខុសគ្នាពីតំបន់ត្រូពិកដូចកម្ពុជាដែលមានរដូវវស្សា និងប្រាំងច្បាស់លាស់ ព្រមទាំងមានពពកច្រើននៅរដូវភ្លៀង។
វិធីសាស្ត្រនេះមានប្រយោជន៍យ៉ាងខ្លាំងសម្រាប់វិស័យថាមពលកកើតឡើងវិញនៅកម្ពុជា ជាពិសេសដោយសារយើងខ្វះខាតស្ថានីយវាស់វែងដែលមានកម្រិតម៉ត់ចត់ខ្ពស់។
ម៉ូដែលនេះផ្តល់នូវដំណោះស្រាយដែលមានតម្លៃទាប និងប្រសិទ្ធភាពខ្ពស់ក្នុងការបំពេញចន្លោះខ្វះខាតនៃទិន្នន័យអាកាសធាតុនៅកម្ពុជា ដោយគ្រាន់តែត្រូវការការកែសម្រួល Hyperparameters ឱ្យសមស្របនឹងអាកាសធាតុតំបន់ត្រូពិក។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Spatiotemporal Downscaling | ដំណើរការនៃការបំបែកទិន្នន័យដែលមានកម្រិតគុណភាពទាប (គ្របដណ្តប់ផ្ទៃដីធំ ឬមានចន្លោះពេលវែង) ឱ្យទៅជាទិន្នន័យដែលមានកម្រិតគុណភាពខ្ពស់ និងលម្អិតសម្រាប់ទីតាំង និងពេលវេលាជាក់លាក់ណាមួយ ដើម្បីឱ្យសមស្របនឹងការប្រើប្រាស់ក្នុងតំបន់។ | ដូចជាការយកផែនទីពិភពលោកមកពង្រីកមើលផ្លូវតូចៗក្នុងភូមិមួយឱ្យច្បាស់ និងលម្អិត។ |
| Downward Shortwave Radiation (DSWR) | ថាមពលវិទ្យុសកម្មសរុបពីព្រះអាទិត្យដែលមកដល់ផ្ទៃផែនដី រួមទាំងពន្លឺផ្ទាល់ និងពន្លឺដែលបែកខ្ញែកតាមពពក ឬបរិយាកាស។ វាជាអថេរចម្បងដែលត្រូវបានវាស់វែង និងទស្សន៍ទាយនៅក្នុងការសិក្សានេះសម្រាប់ផលិតថាមពលសូឡា។ | គឺជាបរិមាណកំដៅ និងពន្លឺព្រះអាទិត្យសរុបដែលធ្លាក់មកដល់ដី ដែលបន្ទះសូឡាអាចស្រូបយកបាន។ |
| Nearest-Neighbor (NN) | បច្ចេកទេសមួយដែលស្វែងរកទិន្នន័យដែលមានលក្ខណៈស្រដៀងគ្នាបំផុត (អ្នកជិតខាង) នៅក្នុងប្រវត្តិទិន្នន័យ ដើម្បីយកមកប្រើជាមូលដ្ឋានក្នុងការទស្សន៍ទាយ ឬកែសម្រួលតម្លៃសម្រាប់ទិន្នន័យថ្មី។ ក្នុងឯកសារនេះ វាត្រូវបានប្រើដើម្បីបង្កើតលក្ខណៈពិសេសថ្មី (Feature Engineering) មុននឹងបញ្ជូនទៅឱ្យម៉ូដែល XGBoost។ | ដូចជាការសួរតម្លៃដីរបស់អ្នកជិតខាងដែលមានទំហំ និងទីតាំងដូចគ្នា ដើម្បីប៉ាន់ស្មានតម្លៃដីរបស់អ្នក។ |
| eXtreme Gradient Boosting (XGBoost) | ជាក្បួនដោះស្រាយម៉ាស៊ីនរៀន (Machine Learning) ដែលបង្កើតគំរូជាច្រើនបន្តបន្ទាប់គ្នា (Ensemble of Decision Trees) ដោយគំរូថ្មីនីមួយៗព្យាយាមកែតម្រូវកំហុសដែលគំរូមុនបានបង្កើត ដើម្បីឱ្យលទ្ធផលចុងក្រោយមានភាពត្រឹមត្រូវខ្ពស់បំផុត និងកាត់បន្ថយភាពលំអៀង។ | ដូចជាការសរសេរអត្ថបទមួយ ដោយមានមនុស្សច្រើននាក់ជួយកែតម្រូវកំហុសគ្នាទៅវិញទៅមកជាបន្តបន្ទាប់រហូតដល់អត្ថបទនោះល្អឥតខ្ចោះ។ |
| ARIMAX | ម៉ូដែលស្ថិតិសម្រាប់វិភាគទិន្នន័យតាមពេលវេលា (Time Series) ដែលប្រើប្រាស់ទិន្នន័យអតីតកាល (AutoRegressive) កំហុសអតីតកាល (Moving Average) និងកត្តាខាងក្រៅ (Exogenous variables) ដូចជាសីតុណ្ហភាព ឬល្បឿនខ្យល់ ដើម្បីបង្កើនភាពត្រឹមត្រូវនៃការទស្សន៍ទាយ។ | ដូចជាការទស្សន៍ទាយថាស្អែកនឹងភ្លៀងឬអត់ ដោយផ្អែកលើប្រវត្តិភ្លៀងពីម្សិលមិញ បូករួមនឹងការមើលពពកនៅលើមេឃថ្ងៃនេះ។ |
| Hyperparameter Tuning | ដំណើរការនៃការស្វែងរកការកំណត់ (Settings) ដ៏ល្អបំផុតសម្រាប់ម៉ូដែលកុំព្យូទ័រ (ដូចជាចំនួនដើមឈើក្នុង XGBoost ឬចំនួន Neighbors ក្នុង NN) ដើម្បីឱ្យវាដំណើរការបានលទ្ធផលល្អបំផុត មុនពេលចាប់ផ្តើមបណ្តុះបណ្តាលវា។ | ដូចជាការសារ៉េប៊ូតុងវិទ្យុ ឬការកែសម្រួលខ្សែហ្គីតា ដើម្បីឱ្យសម្លេងចេញមកពិរោះ និងច្បាស់បំផុត។ |
| Residual Mean Squared Error (RMSE) | រង្វាស់ស្ថិតិដែលប្រើដើម្បីវាយតម្លៃកម្រិតនៃកំហុសរបស់ម៉ូដែល ដោយវាស់គម្លាតរវាងតម្លៃដែលម៉ូដែលបានទស្សន៍ទាយ និងតម្លៃជាក់ស្តែង។ តម្លៃ RMSE កាន់តែតូច បង្ហាញថាមូដែលកាន់តែមានភាពត្រឹមត្រូវ។ | ជាពិន្ទុដែលប្រាប់ថាតើការព្យាករណ៍របស់យើងខុសពីការពិតកម្រិតណា (ពិន្ទុកាន់តែទាប កាន់តែល្អ)។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖