បញ្ហា (The Problem)៖ ទិន្នន័យទឹកភ្លៀងពីផ្កាយរណបមានកម្រិតភាពច្បាស់ទាប (Coarse Resolution) ដែលធ្វើឱ្យពិបាកក្នុងការប្រើប្រាស់សម្រាប់ការសិក្សាកម្រិតតំបន់ និងការគ្រប់គ្រងគ្រោះមហន្តរាយ ជាពិសេសនៅតំបន់ដែលខ្វះខាតស្ថានីយវាស់វែង។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះធ្វើការវាស់វែងប្រៀបធៀបប្រសិទ្ធភាពនៃក្បួនដោះស្រាយការរៀនរបស់ម៉ាស៊ីន (Machine Learning) ចំនួនបួន និងស្នើឡើងនូវក្របខ័ណ្ឌថ្មីសម្រាប់ការកាត់បន្ថយមាត្រដ្ឋាន និងការផ្ទេរចំណេះដឹងទៅកាន់តំបន់ខ្វះទិន្នន័យ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| XGBoost (eXtreme Gradient Boosting) ការជំរុញជម្រាលខ្លាំង (XGBoost) |
មានប្រសិទ្ធភាពខ្ពស់ក្នុងការចាប់យកទំនាក់ទំនងមិនលីនេអ៊ែរ និងគ្រប់គ្រងទិន្នន័យដែលមានភាពស្មុគស្មាញបានល្អជាងម៉ូដែលផ្សេងទៀត។ | ទាមទារការកំណត់ប៉ារ៉ាម៉ែត្រ (Hyperparameter tuning) យ៉ាងប្រុងប្រយ័ត្នដើម្បីទទួលបានលទ្ធផលល្អបំផុត។ | ទទួលបានពិន្ទុប្រសិទ្ធភាព KGE ខ្ពស់បំផុត (ចន្លោះពី ០.៤៦ ដល់ ០.៧៩) ក្នុងការពិសោធន៍កាត់បន្ថយមាត្រដ្ឋាន។ |
| SRF (Spatial Random Forest) ព្រៃចៃដន្យតាមលំហ (Spatial Random Forest) |
រួមបញ្ចូលព័ត៌មានលំហ (Spatial autocorrelation) ទៅក្នុងម៉ូដែល ដែលជួយកាត់បន្ថយការពឹងផ្អែកលើការសន្មតនៃឯករាជ្យភាពទិន្នន័យ។ | នៅតែមានកម្រិតទាបជាង XGBoost បន្តិចក្នុងការចាប់យកភាពខុសគ្នានៃទឹកភ្លៀងក្នុងតំបន់ជាក់លាក់។ | មានប្រសិទ្ធភាពល្អជាងវិធីសាស្ត្របុរាណ ប៉ុន្តែនៅតែទាបជាង XGBoost បន្តិចបន្តួច។ |
| Spline Interpolation ការប៉ាន់ស្មាន Spline (វិធីសាស្ត្របុរាណ) |
ងាយស្រួលអនុវត្ត និងមិនទាមទារធនធានកុំព្យូទ័រខ្ពស់។ | បង្កើតលទ្ធផលដែលមានភាពរលូនពេក (Too smooth) និងបរាជ័យក្នុងការចាប់យកកម្រិតទឹកភ្លៀងខ្ពស់បំផុត (Extreme events)។ | មានកម្រិតភាពត្រឹមត្រូវទាបបំផុតបើធៀបនឹងវិធីសាស្ត្ររៀនរបស់ម៉ាស៊ីន (Machine Learning)។ |
| Transfer Learning (CNN-based Fine-tuning) ការរៀនបន្តដោយប្រើបណ្តាញសរសៃប្រសាទ (CNN) |
មានប្រសិទ្ធភាពខ្ពស់សម្រាប់តំបន់ដែលខ្វះខាតទិន្នន័យ (Data-scarce areas) ដោយប្រើប្រាស់ចំណេះដឹងពីតំបន់ដែលមានទិន្នន័យសម្បូរបែប។ | ទាមទារចំណេះដឹងខ្ពស់ក្នុងការរចនាម៉ូដែល Deep Learning និងធនធានកុំព្យូទ័រ។ | ម៉ូដែលដែលបានផ្ទេរចំណេះដឹង (Fine-tuned models) ផ្តល់លទ្ធផលល្អជាងការបណ្តុះបណ្តាលដោយទិន្នន័យក្នុងស្រុកតែមួយមុខ។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារធនធានកុំព្យូទ័រកម្រិតមធ្យមទៅខ្ពស់ និងជំនាញផ្នែកវិទ្យាសាស្ត្រទិន្នន័យដើម្បីអនុវត្តក្បួនដោះស្រាយ។
ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងខេត្តក្វាងទុង និងអាងទន្លេយ៉ង់សេ ប្រទេសចិន ដែលមានលក្ខណៈអាកាសធាតុ (Monsoon) និងភូមិសាស្ត្រស្រដៀងនឹងកម្ពុជា។ ទោះបីជាយ៉ាងណាក៏ដោយ ការប្រើប្រាស់បណ្តាញស្ថានីយវាស់វែងទឹកភ្លៀងដែលមានដង់ស៊ីតេខ្ពស់នៅក្នុងការសិក្សានេះ អាចជាចំណុចខុសគ្នាពីស្ថានភាពនៅកម្ពុជាដែលមានស្ថានីយតិចតួច។
វិធីសាស្ត្រដែលបានរកឃើញនៅក្នុងការស្រាវជ្រាវនេះមានប្រយោជន៍យ៉ាងខ្លាំងសម្រាប់ប្រទេសកម្ពុជា ជាពិសេសក្នុងការគ្រប់គ្រងធនធានទឹក និងព្យាករណ៍គ្រោះមហន្តរាយ។
ការអនុវត្តបច្ចេកទេស Transfer Learning គឺជាដំណោះស្រាយដ៏មានសក្តានុពលបំផុតសម្រាប់កម្ពុជា ដើម្បីជម្នះបញ្ហាខ្វះខាតទិន្នន័យពីស្ថានីយវាស់វែងផ្ទាល់ដី។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Spatial Downscaling | ជាដំណើរការបច្ចេកទេសក្នុងការបំប្លែងទិន្នន័យដែលមានកម្រិតភាពច្បាស់ទាប (ដូចជាទិន្នន័យពីផ្កាយរណបដែលគ្របដណ្តប់ផ្ទៃដីធំៗ ១០០ គីឡូម៉ែត្រការ៉េ) ឱ្យទៅជាទិន្នន័យដែលមានកម្រិតភាពច្បាស់ខ្ពស់ (១ គីឡូម៉ែត្រការ៉េ) ដោយប្រើប្រាស់ទំនាក់ទំនងជាមួយកត្តាបរិស្ថានដូចជា កម្ពស់ដី និងរុក្ខជាតិ។ | ដូចជាការយក្សរូបថតដែលស្រពិចស្រពិល (Blurry) មកកែឱ្យច្បាស់ (Sharp) ដើម្បីមើលឃើញព័ត៌មានលម្អិតដូចជា ដើមឈើ ឬផ្ទះជាដើម។ |
| eXtreme Gradient Boosting (XGBoost) | ជាក្បួនដោះស្រាយការរៀនរបស់ម៉ាស៊ីន (Machine Learning) ដ៏មានឥទ្ធិពលដែលបង្កើតគំរូព្យាករណ៍ជាច្រើនបន្តបន្ទាប់គ្នា ដោយគំរូថ្មីនីមួយៗព្យាយាមកែតម្រូវកំហុសដែលគំរូមុនបានបង្កើត ដើម្បីទទួលបានលទ្ធផលចុងក្រោយដែលត្រឹមត្រូវបំផុត។ | ដូចជាក្រុមសិស្សធ្វើលំហាត់រួមគ្នា ដោយសិស្សទីពីរជួយកែកំហុសសិស្សទីមួយ ហើយសិស្សទីបីកែកំហុសសិស្សទីពីរ បន្តរហូតដល់បានចម្លើយត្រឹមត្រូវបំផុត។ |
| Transfer Learning | ជាបច្ចេកទេសក្នុងវិទ្យាសាស្ត្រកុំព្យូទ័រ ដែលអនុញ្ញាតឱ្យយកចំណេះដឹង ឬគំរូដែលកុំព្យូទ័របានរៀនពីតំបន់ដែលមានទិន្នន័យច្រើន (Source Domain) ទៅអនុវត្តលើតំបន់ថ្មីដែលខ្វះខាតទិន្នន័យ (Target Domain) ដោយមិនចាំបាច់បណ្តុះបណ្តាលពីចំណុចចាប់ផ្តើម។ | ដូចជាអ្នកចេះជិះកង់រួចហើយ អាចរៀនជិះម៉ូតូបានលឿនជាងអ្នកមិនចេះសោះ ព្រោះពួកគេមានបំណិនតុល្យភាពស្រាប់ពីការជិះកង់។ |
| Fine-tuning | ជាដំណាក់កាលមួយនៃ Transfer Learning ដែលអ្នកស្រាវជ្រាវធ្វើការកែតម្រូវប៉ារ៉ាម៉ែត្រមួយចំនួនតូចនៃគំរូដែលមានស្រាប់ ដើម្បីឱ្យវាដំណើរការល្អ និងស៊ីគ្នាជាមួយទិន្នន័យថ្មីនៅក្នុងតំបន់សិក្សាជាក់លាក់។ | ដូចជាការរឹតខ្សែហ្គីតាដែលបានរឹតរួច ឱ្យត្រូវនឹងសំឡេងនៃបទចម្រៀងជាក់លាក់ណាមួយបន្ថែមទៀត។ |
| Geographical Difference Analysis (GDA) | ជាវិធីសាស្ត្រកែតម្រូវទិន្នន័យដោយគណនាភាពខុសគ្នារវាងទិន្នន័យផ្កាយរណប និងទិន្នន័យវាស់វែងជាក់ស្តែងនៅស្ថានីយ រួចយកតម្លៃភាពខុសគ្នានោះទៅបូក ឬដកបន្ថែមលើផ្ទៃដីទាំងមូល ដើម្បីកាត់បន្ថយលំអៀង។ | ដូចជាការដឹងថានាឡិការបស់អ្នកដើរយឺត ៥ នាទី ដូច្នេះរាល់ពេលមើលម៉ោង អ្នកត្រូវបូកបន្ថែម ៥ នាទីជានិច្ច ដើម្បីឱ្យត្រូវនឹងម៉ោងពិត។ |
| Spatial Autocorrelation | ជាគោលគំនិតស្ថិតិដែលបញ្ជាក់ថា ទីតាំងដែលនៅជិតគ្នាទំនងជាមានលក្ខណៈ និងតម្លៃ (ដូចជាបរិមាណទឹកភ្លៀង) ស្រដៀងគ្នាខ្លាំងជាងទីតាំងដែលនៅឆ្ងាយពីគ្នា ដែលត្រូវបានប្រើដើម្បីកែលម្អការព្យាករណ៍នៅក្នុងម៉ូដែល SRF។ | ដូចជាតម្លៃដីធ្លីដែរ ដីដែលនៅជាប់របងគ្នាជាធម្មតាមានតម្លៃប្រហាក់ប្រហែលគ្នាជាងដីដែលនៅឆ្ងាយពីគ្នា។ |
| Convolutional Neural Network (CNN) | ជាប្រភេទបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (Artificial Neural Network) ដែលមានជំនាញពិសេសក្នុងការវិភាគទិន្នន័យជារូបភាព ឬជាក្រឡា (Grid data) ដោយវាអាចចាប់យកលំនាំនៃទឹកភ្លៀងក្នុងលំហបានយ៉ាងល្អ។ | ដូចជាភ្នែក និងខួរក្បាលរបស់មនុស្សដែលមើលរូបភាពមួយ ហើយអាចសម្គាល់ថាផ្នែកណាជាពពក និងផ្នែកណាជាភ្លៀង ដោយផ្អែកលើរូបរាង និងពណ៌។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖