បញ្ហា (The Problem)៖ ម៉ូដែលប៉ាន់ប្រមាណគុណភាពទឹកពីចម្ងាយតែងតែជួបប្រទះបញ្ហាធ្លាក់ចុះភាពត្រឹមត្រូវនៅពេលអនុវត្តក្នុងពេលវេលាខុសគ្នា ដោយសារការប្រែប្រួលបរិស្ថាន។ ការសិក្សានេះដោះស្រាយបញ្ហានេះដោយប្រើបច្ចេកវិទ្យា Transfer Learning ដើម្បីបង្កើនសមត្ថភាពទូទៅតាមពេលវេលា (Temporal Generalization) សម្រាប់ការតាមដានអុកស៊ីហ្សែនរលាយ (DO) ក្នុងស្រះវារីវប្បកម្មទឹកសាប។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់ទិន្នន័យរូបភាពពហុវិសាលគមពីដ្រូន (UAV) និងទិន្នន័យវាស់វែងផ្ទាល់ពីឆ្នាំ ២០២៣ និង ២០២៤ ដោយរួមបញ្ចូលម៉ូដែល Machine Learning ជាមូលដ្ឋានជាមួយនឹងយុទ្ធសាស្ត្រ Transfer Learning ផ្សេងៗដើម្បីបង្កើនភាពសុក្រឹតតាមពេលវេលា។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Baseline Machine Learning (RF, XGBoost, LightGBM) ម៉ូដែលរៀនម៉ាស៊ីនមូលដ្ឋាន (RF, XGBoost, LightGBM) |
ងាយស្រួលក្នុងការបង្កើតម៉ូដែលសម្រាប់សំណុំទិន្នន័យក្នុងពេលតែមួយ និងមានសមត្ថភាពចាប់យកទំនាក់ទំនងមិនលីនេអ៊ែររវាងទិន្នន័យ។ | ខ្សោយក្នុងការរក្សាភាពត្រឹមត្រូវនៅពេលអនុវត្តលើទិន្នន័យក្នុងឆ្នាំ ឬរដូវកាលផ្សេងគ្នា ដោយសារតែការប្រែប្រួលបរិស្ថាន។ | មានកម្រិត R² ទាបជាងគេ និងកំហុស (RMSE, MAE) ខ្ពស់បំផុតនៅពេលតេស្តលើសំណុំទិន្នន័យឆ្លងឆ្នាំ (២០២៤)។ |
| Instance Reweighting (IR) Transfer Learning ការរៀនបន្តដោយផ្តល់ទម្ងន់លើសំណាក (IR) |
ជួយកាត់បន្ថយភាពខុសគ្នានៃការចែកចាយទិន្នន័យ ដោយផ្តល់ទម្ងន់ដល់សំណាកទិន្នន័យចាស់ៗដែលស្រដៀងនឹងទិន្នន័យថ្មី។ | ប្រសិទ្ធភាពនៅមានកម្រិត និងមិនទាន់បានតម្រឹមលក្ខណៈពិសេស (Feature alignment) ដោយផ្ទាល់រវាងទិន្នន័យចាស់និងថ្មីនោះទេ។ | បង្កើនមេគុណ R² ជាមធ្យម ១២% និងកាត់បន្ថយ RMSE ៤% និង MAE ៤.៥% បើធៀបនឹងម៉ូដែលមូលដ្ឋាន។ |
| Maximum Mean Discrepancy (MMD) Transfer Learning ការរៀនបន្តដោយប្រើគម្លាតមធ្យមអតិបរមា (MMD) |
មានប្រសិទ្ធភាពខ្ពស់ក្នុងការកាត់បន្ថយការផ្លាស់ប្តូរទិន្នន័យតាមពេលវេលា ដោយតម្រឹមលក្ខណៈពិសេសរវាងទិន្នន័យនៃប្រភពដើមនិងប្រភពគោលដៅ។ | ត្រូវការការគណនាស្មុគស្មាញជាងបច្ចេកទេស IR ដោយសារវាត្រូវទាញយកចម្ងាយ MMD នៅក្នុងលំហ RKHS។ | ទទួលបាន R² ប្រសើរជាង IR ដោយបង្កើន R² ជាមធ្យម ៣២% និងកាត់បន្ថយ RMSE ១១% និង MAE ១៥% បើធៀបនឹងម៉ូដែលមូលដ្ឋាន។ |
| Hybrid IR-MMD Transfer Learning (Proposed) យុទ្ធសាស្ត្ររៀនបន្តចម្រុះ (Hybrid IR-MMD) |
រួមបញ្ចូលចំណុចខ្លាំងទាំងការថ្លឹងទម្ងន់សំណាក (Local) និងការតម្រឹមលក្ខណៈពិសេស (Global) ធ្វើឱ្យមានភាពសុក្រឹតខ្ពស់បំផុតសម្រាប់ការប្រែប្រួលតាមពេលវេលា។ | ទាមទារកម្លាំងម៉ាស៊ីនគណនាខ្ពស់ និងការកំណត់ប៉ារ៉ាម៉ែត្ររួមបញ្ចូលគ្នាដែលស្មុគស្មាញជាងគេ។ | ទទួលបានលទ្ធផលល្អបំផុត ដោយបង្កើន R² ៣៨% និងបន្ថយ RMSE ១៨% និង MAE ២១% (ម៉ូដែល RF សម្រេចបាន R² = ០.៥៨ និង RMSE = ៣.០១ mg/L)។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តបច្ចេកវិទ្យានេះទាមទារការវិនិយោគលើបរិក្ខារផ្នែករឹងកម្រិតខ្ពស់សម្រាប់ការហោះហើរប្រមូលទិន្នន័យ និងកម្លាំងម៉ាស៊ីនកុំព្យូទ័រសម្រាប់ដំណើរការម៉ូដែលបញ្ញាសិប្បនិម្មិត។
ការសិក្សានេះត្រូវបានធ្វើឡើងនៅតំបន់ចិញ្ចឹមក្តាមនីងជាំង (Gaochun District) ប្រទេសចិន ដែលមានអាកាសធាតុស៊ុបត្រូពិចមូសុង និងផ្តោតលើពូជសត្វទឹកជាក់លាក់។ សម្រាប់កម្ពុជាដែលមានអាកាសធាតុត្រូពិចក្តៅហើយសើម (រដូវប្រាំងនិងវស្សាច្បាស់លាស់) ព្រមទាំងមានប្រភេទវារីវប្បកម្មខុសគ្នា (ដូចជាការចិញ្ចឹមត្រីប្រា ត្រីពោធិ៍ និងត្រីទីឡាព្យា) លក្ខណៈនៃការប្រែប្រួលអុកស៊ីហ្សែនអាចមានទម្រង់ខុសគ្នា ដែលតម្រូវឱ្យមានការប្រមូលទិន្នន័យ និងហ្វឹកហាត់ម៉ូដែលឡើងវិញនៅក្នុងស្រុក។
ទោះបីជាមានភាពខុសគ្នានៃបរិស្ថានភូមិសាស្ត្រក៏ដោយ បច្ចេកវិទ្យា និងវិធីសាស្ត្ររៀនបន្ត (Transfer Learning) នេះមានសក្តានុពលខ្លាំងក្នុងការអភិវឌ្ឍវិស័យវារីវប្បកម្មឆ្លាតវៃនៅកម្ពុជា។
ការរួមបញ្ចូលគ្នារវាងបច្ចេកវិទ្យាដ្រូនពហុវិសាលគម និង Transfer Learning នឹងជួយកាត់បន្ថយហានិភ័យនៃជំងឺឬការងាប់របស់មច្ឆាជាតិ និងជួយលើកកម្ពស់ទិន្នផលវារីវប្បកម្មប្រកបដោយនិរន្តរភាពនៅកម្ពុជា។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Transfer Learning | ជាបច្ចេកទេសនៃបញ្ញាសិប្បនិម្មិត (AI) ដែលយកចំណេះដឹងពីម៉ូដែលដែលបានហ្វឹកហាត់រួចលើទិន្នន័យបរិបទចាស់ (ឧទាហរណ៍៖ ទិន្នន័យឆ្នាំ២០២៣) មកកែសម្រួលដើម្បីប្រើប្រាស់លើទិន្នន័យបរិបទថ្មី (ឆ្នាំ២០២៤) ដើម្បីរក្សាភាពត្រឹមត្រូវទោះបីជាស្ថានភាពបរិស្ថានប្រែប្រួលក៏ដោយ។ | ដូចជាអ្នកចេះជិះកង់ស្រាប់ ពេលប្តូរទៅរៀនជិះម៉ូតូ គឺងាយស្រួល និងរៀនឆាប់ចេះជាងអ្នកដែលមិនធ្លាប់ជិះអ្វីសោះ។ |
| Temporal Generalization | គឺជាសមត្ថភាពរបស់ម៉ូដែលកុំព្យូទ័រក្នុងការរក្សាភាពសុក្រឹតនៃការទស្សន៍ទាយរបស់វា នៅពេលយកទៅអនុវត្តលើទិន្នន័យដែលប្រមូលបាននៅពេលវេលាខុសគ្នា (ឧទាហរណ៍៖ រដូវកាល ឬឆ្នាំបន្ទាប់) ដែលមានការប្រែប្រួលលក្ខខណ្ឌអាកាសធាតុ។ | ដូចជាសិស្សដែលយល់មេរៀនពិតប្រាកដ អាចធ្វើវិញ្ញាសាប្រឡងបានល្អគ្រប់ពេល ទោះបីជាវិញ្ញាសាចេញនៅឆ្នាំណាក៏ដោយ មិនមែនគ្រាន់តែទន្ទេញចាំមាត់សម្រាប់តែប្រឡងថ្ងៃនេះនោះទេ។ |
| Multispectral Imagery | ជារូបភាពថតដោយកាមេរ៉ាពិសេស ដែលអាចចាប់យករលកពន្លឺច្រើនប្រភេទដាច់ៗពីគ្នា រួមទាំងពន្លឺដែលភ្នែកមនុស្សមើលមិនឃើញ (ដូចជាពន្លឺក្រហមអាំងហ្វ្រា ឬ Near-Infrared) ដើម្បីយកមកវិភាគរកសារធាតុ ឬលក្ខណៈកំបាំងផ្សេងៗនៅក្នុងទឹក ឬរុក្ខជាតិ។ | ដូចជាការពាក់វ៉ែនតាវេទមន្តដែលអាចឱ្យយើងមើលធ្លុះឃើញកម្រិតអុកស៊ីហ្សែននៅក្នុងទឹក ដែលភ្នែកទទេមិនអាចមើលឃើញ។ |
| Instance Reweighting (IR) | ជាវិធីសាស្ត្រក្នុងការបង្រៀនម៉ូដែល ដោយផ្តល់ពិន្ទុ (ទម្ងន់) ខ្ពស់ដល់ទិន្នន័យចាស់ណាដែលមានលក្ខណៈស្រដៀងនឹងទិន្នន័យថ្មី និងបន្ថយពិន្ទុទិន្នន័យណាដែលខុសគ្នាខ្លាំង ដើម្បីឱ្យម៉ូដែលផ្តោតលើព័ត៌មានដែលមានប្រយោជន៍បំផុត។ | ដូចជាគ្រូបង្រៀនប្រាប់សិស្សឱ្យចំណាយពេលអានមេរៀនណាដែលទំនងជានឹងចេញប្រឡង ច្រើនជាងអានមេរៀនដែលហួសសម័យ។ |
| Maximum Mean Discrepancy (MMD) | ជារូបមន្តគណិតវិទ្យាប្រើសម្រាប់វាស់វែងគម្លាត និងកែតម្រូវភាពខុសគ្នានៃការចែកចាយទិន្នន័យរវាងបណ្តុំទិន្នន័យពីរ (ឧទាហរណ៍៖ ទិន្នន័យឆ្នាំចាស់ និងឆ្នាំថ្មី) ដើម្បីទាញលក្ខណៈទិន្នន័យទាំងពីរនោះឱ្យមកស៊ីចង្វាក់គ្នាបំផុត មុននឹងបញ្ជូនឲ្យម៉ូដែលវិភាគ។ | ដូចជាការតម្រឹមជញ្ជីងពីរដែលលំអៀងឱ្យមកនៅកម្រិតសូន្យស្មើគ្នា ដើម្បីធានាថាការថ្លឹងរបស់នៅកន្លែងទាំងពីរទទួលបានលទ្ធផលត្រឹមត្រូវដូចគ្នា។ |
| Normalized Difference Water Index (NDWI) | ជាសន្ទស្សន៍ដែលគណនាចេញពីរលកពន្លឺពណ៌បៃតង និងពន្លឺអាំងហ្វ្រាក្រហមជិត (Near-Infrared) ដើម្បីកាត់ផ្តាច់តំបន់ជាផ្ទៃទឹក ចេញពីរុក្ខជាតិ ដី ឬច្រាំងស្រះ ដើម្បីងាយស្រួលក្នុងការវិភាគតែលើផ្ទៃទឹកសុទ្ធ។ | ដូចជាការប្រើតម្រង (Filter) កាត់តរូបភាពក្នុងទូរស័ព្ទដៃ ដែលលុបផ្ទៃខាងក្រោយចោល និងរក្សាទុកតែរូបកែវទឹកប៉ុណ្ណោះ។ |
| SHAP (SHapley Additive exPlanations) | ជាបច្ចេកទេសគណិតវិទ្យាសម្រាប់ពន្យល់ពីការសម្រេចចិត្តរបស់ម៉ូដែល AI ដោយវាស់វែងយ៉ាងសុក្រឹតថាតើអថេរនីមួយៗ (ឧទាហរណ៍៖ ពន្លឺពណ៌ក្រហម ពន្លឺពណ៌ខៀវ) បានចូលរួមចំណែកប៉ុន្មានភាគរយ ក្នុងការជំរុញឱ្យម៉ូដែលទាយលទ្ធផលចុងក្រោយនោះ។ | ដូចជាការវិភាគរកមើលថាតើកីឡាករម្នាក់ៗក្នុងក្រុមបាល់ទាត់ មានស្នាដៃជួយក្រុមឱ្យឈ្នះប៉ុន្មានភាគរយ មិនមែនគ្រាន់តែមើលលទ្ធផលឈ្នះរួមគ្នានោះទេ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖