បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយតម្រូវការចាំបាច់ក្នុងការតាមដានយ៉ាងច្បាស់លាស់នូវជីវម៉ាសលើដី (Aboveground Biomass - AGB) និងសមត្ថភាពស្រូបយក CO2 នៃព្រៃស្រោងក្នុងខេត្ត Dak Lak ប្រទេសវៀតណាម ដើម្បីគាំទ្រដល់ការកាត់បន្ថយបម្រែបម្រួលអាកាសធាតុ និងគំនិតផ្តួចផ្តើមទីផ្សារកាបូន (REDD+, PFES)។
វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះបានធ្វើសមាហរណកម្មទិន្នន័យអង្កេតផ្ទាល់ជាមួយទិន្នន័យពីចម្ងាយពហុប្រភព (Multi-source Remote Sensing) ដោយប្រើប្រាស់គំរូស្ថិតិ និងការរៀនដោយម៉ាស៊ីន (Machine Learning)។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Ordinary Least Squares (OLS) តំរែតំរង់លីនេអ៊ែរ (OLS Linear Regression) |
ងាយស្រួលក្នុងការគណនា យល់ និងបកស្រាយលទ្ធផលអំពីទំនាក់ទំនងរវាងអថេរ។ | មិនអាចដោះស្រាយទំនាក់ទំនងមិនលីនេអ៊ែរ (non-linear) ដ៏ស្មុគស្មាញរវាងទិន្នន័យពីចម្ងាយ និងជីវម៉ាសបានល្អ និងងាយរងឥទ្ធិពលពីបញ្ហា Collinearity។ | ទទួលបានភាពត្រឹមត្រូវទាបជាងគេ ដោយមាន R² = 0.510 លើទិន្នន័យហ្វឹកហាត់ និង R² = 0.480 សម្រាប់ការធ្វើតេស្តអន្តរកម្ម (10-fold CV)។ |
| Generalized Additive Model (GAM) គំរូសរុបទូទៅ (Generalized Additive Model) |
អាចចាប់យកទំនាក់ទំនងមិនលីនេអ៊ែរបានប្រសើរជាង OLS ដោយប្រើប្រាស់អនុគមន៍រលោង (smooth functions) ដោយមិនចាំបាច់សន្មតទម្រង់សមីការទុកជាមុន។ | នៅតែមានកម្រិតក្នុងការចាប់យកអន្តរកម្មពហុវិមាត្រដ៏ស្មុគស្មាញរវាងអថេរច្រើន ធៀបនឹងម៉ាស៊ីនរៀន (Machine Learning)។ | ផ្តល់លទ្ធផលកម្រិតមធ្យម ដោយមាន R² = 0.590 លើទិន្នន័យហ្វឹកហាត់ និងកំហុស RMSE = 0.817 ក្នុង 10-fold CV។ |
| Random Forest (RF) ក្បួនដោះស្រាយម៉ាស៊ីនរៀនព្រៃចៃដន្យ (Random Forest) |
មានសមត្ថភាពខ្ពស់ក្នុងការដោះស្រាយទិន្នន័យស្មុគស្មាញ អន្តរកម្មមិនលីនេអ៊ែរ និងជួយកាត់បន្ថយបញ្ហា Overfitting បានយ៉ាងល្អតាមរយៈការប្រើប្រាស់មែកធាងជាច្រើន។ | ជាទូទៅមានលក្ខណៈជា "ប្រអប់ខ្មៅ" (Black-box) ដែលធ្វើឱ្យពិបាកពន្យល់ពីទំនាក់ទំនងនៃអថេរនីមួយៗលម្អិតដូចម៉ូដែលស្ថិតិប្រពៃណី។ | ផ្តល់លទ្ធផលល្អបំផុតនិងមានស្ថិរភាពខ្ពស់ ដោយមាន R² = 0.884 លើទិន្នន័យហ្វឹកហាត់ និង R² = 0.632 លើទិន្នន័យធ្វើតេស្ត (ជាមួយអថេរចម្រាញ់) ព្រមទាំងមានកំហុសទាបបំផុត។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះពឹងផ្អែកយ៉ាងខ្លាំងលើទិន្នន័យឥតគិតថ្លៃ និងឧបករណ៍កូដបើកចំហ (Open-source) ប៉ុន្តែទាមទារការចំណាយកម្លាំងពលកម្ម និងថវិកាខ្ពស់សម្រាប់ការប្រមូលទិន្នន័យផ្ទាល់នៅតាមទីវាលព្រៃឈើ។
ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងខេត្ត Dak Lak ប្រទេសវៀតណាម ដែលជាតំបន់ខ្ពង់រាបកណ្តាលសម្បូរទៅដោយប្រភេទព្រៃស្រោង និងព្រៃពាក់កណ្តាលស្រោង។ ទិន្នន័យមូលដ្ឋាន និងទម្រង់ព្រៃឈើនេះមានលក្ខណៈស្រដៀងគ្នាខ្លាំងទៅនឹងតំបន់ព្រៃភ្នំនៅក្នុងប្រទេសកម្ពុជា ដែលធ្វើឱ្យវិធីសាស្រ្តក្នុងក្រដាសស្រាវជ្រាវនេះមានភាពពាក់ព័ន្ធ និងអាចយកមកប្រៀបធៀបអនុវត្តបាន។
វិធីសាស្រ្តរួមបញ្ចូលគ្នារវាងទិន្នន័យ Remote Sensing និង Machine Learning នេះមានសារៈសំខាន់ និងមានប្រយោជន៍ខ្លាំងណាស់សម្រាប់ប្រទេសកម្ពុជា ក្នុងការវាយតម្លៃស្តុកកាបូន។
ជារួម ការអនុវត្តគំរូនិងបច្ចេកទេសទាំងនេះអាចជួយស្ថាប័នកម្ពុជាសន្សំសំចៃពេលវេលា និងថវិកាលើការអង្កេតផ្ទាល់ ព្រមទាំងបង្កើនភាពជឿជាក់និងតម្លាភាពនៅក្នុងទីផ្សារកាបូនអន្តរជាតិ។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Aboveground Biomass (AGB) | ទម្ងន់សរុបនៃសារពាង្គកាយមានជីវិតដែលនៅពីលើផ្ទៃដី (ដូចជា ដើម មែក និងស្លឹកឈើ) ក្នុងមួយឯកតាផ្ទៃដី ដែលត្រូវបានប្រើប្រាស់ដើម្បីគណនាបរិមាណកាបូនដែលព្រៃឈើអាចស្តុកទុកបាន។ | វាដូចជាការថ្លឹងទម្ងន់ផ្នែកខាងលើនៃដើមឈើទាំងអស់នៅក្នុងព្រៃ ដើម្បីដឹងថាពួកវាធំធាត់និងអាចស្តុកទុកជាតិកាបូនបានកម្រិតណា។ |
| Random Forest (RF) | ជាក្បួនដោះស្រាយម៉ាស៊ីនរៀន (Machine Learning) ដែលបង្កើតមែកធាងសម្រេចចិត្ត (Decision Trees) ជាច្រើន ហើយរួមបញ្ចូលលទ្ធផលរបស់វាចូលគ្នា ដើម្បីកាត់បន្ថយកំហុស និងដោះស្រាយទំនាក់ទំនងស្មុគស្មាញរវាងទិន្នន័យ។ | វាដូចជាការសួរមតិពីក្រុមអ្នកជំនាញរាប់រយនាក់ ហើយយកចម្លើយដែលភាគច្រើនឯកភាពគ្នា ដើម្បីធានាថាការសម្រេចចិត្តនោះត្រឹមត្រូវបំផុត ជាជាងជឿលើមនុស្សតែម្នាក់។ |
| Synthetic Aperture Radar (SAR) | បច្ចេកវិទ្យាបញ្ជូនរលកសញ្ញាពីផ្កាយរណប (ដូចជា Sentinel-1) ទៅកាន់ផែនដី និងវាស់ស្ទង់ការចំណាំងត្រឡប់មកវិញ។ វាអាចបាញ់ទម្លុះពពក និងដំបូលព្រៃឈើដើម្បីចាប់យករចនាសម្ព័ន្ធលម្អិតដូចជាទំហំដើមឈើ និងមែកឈើ។ | វាដូចជាសត្វប្រចៀវប្រើរលកសំឡេងដើម្បីមើលឃើញក្នុងទីងងឹត អញ្ចឹងដែរ រ៉ាដាបាញ់រលកសញ្ញាដើម្បីមើលធ្លុះពពកនិងវាស់រចនាសម្ព័ន្ធព្រៃឈើទោះបីជាអាកាសធាតុអាក្រក់ក៏ដោយ។ |
| Generalized Additive Model (GAM) | គំរូស្ថិតិដែលអាចបត់បែនបាន ដែលអនុញ្ញាតឱ្យមានការគណនាទំនាក់ទំនងមិនលីនេអ៊ែរ (non-linear) រវាងអថេរព្យាករណ៍ (ទិន្នន័យផ្កាយរណប) និងគោលដៅ (ជីវម៉ាស) ដោយប្រើប្រាស់ខ្សែកោងរលោងជំនួសឱ្យបន្ទាត់ត្រង់។ | វាដូចជាការគូសខ្សែកោងបត់បែនតាមរាងនៃចំណុចទិន្នន័យជាក់ស្តែង ជាជាងការបង្ខំគូសខ្សែបន្ទាត់ត្រង់រឹងស្តូកដែលមិនតំណាងឱ្យទិន្នន័យពិតប្រាកដ។ |
| Spectral Saturation | ដែនកំណត់នៅក្នុងទិន្នន័យផ្កាយរណបអុបទិក នៅពេលដែលដង់ស៊ីតេរុក្ខជាតិមានកម្រិតក្រាស់ពេក ធ្វើឱ្យសន្ទស្សន៍ផ្កាយរណបឈប់កើនឡើង ទោះបីជាជីវម៉ាសព្រៃឈើពិតប្រាកដនៅតែកើនឡើងក៏ដោយ។ | វាដូចជាការមើលកែវទឹកដែលពោរពេញដោយពណ៌ខ្មៅងងឹត ទោះបីជាអ្នកថែមថ្នាំពណ៌ខ្មៅចូលទៅទៀត ក៏ភ្នែករបស់អ្នកមិនអាចមើលឃើញពីភាពខុសគ្នាទៀតដែរ។ |
| K-fold Cross-Validation | បច្ចេកទេសសម្រាប់សាកល្បងភាពត្រឹមត្រូវនៃគំរូទស្សន៍ទាយ ដោយបែងចែកទិន្នន័យជា 'K' ផ្នែក (groups) រួចប្រើប្រាស់ផ្នែកខ្លះដើម្បីបង្រៀនគំរូ និងផ្នែកដែលនៅសល់ដើម្បីធ្វើតេស្ត ដោយផ្លាស់ប្តូរវេនគ្នារហូតដល់គ្រប់ផ្នែកទាំងអស់។ | វាដូចជាការបែងចែកសិស្សជាក្រុម ហើយឱ្យក្រុមនីមួយៗផ្លាស់ប្តូរវេនគ្នាតេស្តសាកល្បងវិញ្ញាសាផ្សេងៗគ្នា ដើម្បីប្រាកដថាចំណេះដឹងរបស់ពួកគេពិតជាអាចប្រើបានគ្រប់កាលៈទេសៈ។ |
| Overfitting | កំហុសនៅក្នុងការសាងសង់គំរូម៉ាស៊ីនរៀន នៅពេលដែលគំរូនោះរៀនទន្ទេញទិន្នន័យហ្វឹកហាត់ (training data) លម្អិតពេក រហូតដល់មិនអាចធ្វើការទស្សន៍ទាយបានត្រឹមត្រូវចំពោះទិន្នន័យថ្មីដែលវាមិនធ្លាប់ជួប។ | វាដូចជាសិស្សដែលទន្ទេញចាំមាត់តែវិញ្ញាសាចាស់ៗប្រឡងធ្លាប់ចេញ តែនៅពេលប្រឡងជួបវិញ្ញាសាថ្មីមានលំនាំស្រដៀងគ្នា បែរជាមិនអាចដោះស្រាយបាន។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖