បញ្ហា (The Problem)៖ ការវាស់វែងជីវម៉ាសព្រៃឈើផ្នែកខាងលើដី (Aboveground Biomass) ដោយផ្ទាល់មានការលំបាកនិងចំណាយថវិកាច្រើន ដែលទាមទារឱ្យមានការប្រើប្រាស់រូបភាពផ្កាយរណបជំនួសវិញសម្រាប់តំបន់ព្រៃភ្នំធំៗក្នុងរដ្ឋ Durango ប្រទេសម៉ិកស៊ិក។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់ទិន្នន័យរូបភាព Landsat-5 TM រួមបញ្ចូលជាមួយបច្ចេកទេសរៀនដោយម៉ាស៊ីន (Machine Learning) និងវិធីសាស្ត្រស្ថិតិផ្សេងៗ ដើម្បីបង្កើតម៉ូដែលប៉ាន់ប្រមាណជីវម៉ាសព្រៃឈើ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Multiple Linear Regression (MLR) ម៉ូដែលតម្រែតម្រង់លីនេអ៊ែរពហុគុណ (វិធីសាស្ត្រប៉ារ៉ាម៉ែត្រគ្រឹះ) |
ងាយស្រួលយល់ និងត្រូវបានប្រើប្រាស់យ៉ាងទូលំទូលាយក្នុងការស្រាវជ្រាវវិទ្យាសាស្ត្រទូទៅ។ | ទាមទារលក្ខខណ្ឌតឹងរ៉ឹងដូចជាទំនាក់ទំនងលីនេអ៊ែរ ហើយងាយរងឥទ្ធិពលពីបញ្ហា Multicollinearity ។ | ពន្យល់បាន R2 = 0.54 ជាមួយនឹងកម្រិតកំហុស RMSE ស្មើនឹង 29.61 Mg/ha (សម្រាប់ម៉ូដែលល្អបំផុត)។ |
| k-Nearest Neighbor (kNN) ក្បួនដោះស្រាយរៀនដោយម៉ាស៊ីន kNN (ផ្អែកលើទិន្នន័យដែលនៅជិតបំផុត) |
ជាវិធីសាស្ត្រមិនប្រើប៉ារ៉ាម៉ែត្រ (Non-parametric) ងាយស្រួលយល់ពីគំនិតជាមូលដ្ឋាន និងដំណើរការបានល្អបំផុតក្នុងការទស្សន៍ទាយជារួម។ | ត្រូវការការជ្រើសរើសលក្ខណៈពិសេស (Feature selection) ឱ្យបានត្រឹមត្រូវ បើមិនដូច្នោះទេអាចជួបបញ្ហា Hughes effect ធ្វើឱ្យភាពសុក្រឹតធ្លាក់ចុះ។ | ផ្តល់លទ្ធផលល្អជាងគេជារួម ដោយពន្យល់បាន R2 = 0.66 និងកំហុស RMSE ទាបបំផុតត្រឹម 26.64 Mg/ha ។ |
| Support Vector Machine (SVM) ក្បួនដោះស្រាយ SVM ប្រើប្រាស់សម្រាប់ការបែងចែកប្លង់ទិន្នន័យ |
មានសក្តានុពលខ្ពស់ខ្លាំងក្នុងការចាប់យកទំនាក់ទំនងទិន្នន័យស្មុគស្មាញ (Non-linear) ប្រសិនបើកំណត់ប៉ារ៉ាម៉ែត្របានល្អប្រសើរ។ | មានភាពស្មុគស្មាញខ្លាំងក្នុងការប្រើប្រាស់ និងងាយរងឥទ្ធិពល (Sensitive) បំផុតពីការកំណត់ប៉ារ៉ាម៉ែត្រខុស (Parameterization)។ | ផ្តល់លទ្ធផលល្អិតល្អន់ R2 = 0.62 និងកំហុស RMSE 27.28 Mg/ha នៅពេលអ្នកជំនាញកំណត់ប៉ារ៉ាម៉ែត្របានត្រឹមត្រូវបំផុត។ |
| Random Forest (RF) ក្បួនដោះស្រាយព្រៃចៃដន្យ (ប្រើមែកធាងការសម្រេចចិត្តច្រើនរួមបញ្ចូលគ្នា) |
រឹងមាំចំពោះទិន្នន័យច្រើន ងាយស្រួលប្រើប្រាស់ជាង SVM សម្រាប់អ្នកមិនសូវមានជំនាញ (Non-experts) និងមិនងាយជួបបញ្ហា Overfitting ។ | ដំណើរការដូចប្រអប់ខ្មៅ (Black box) ដែលពិបាកបកស្រាយពីរបៀបដែលម៉ូដែលទាញយកលទ្ធផល។ | ពន្យល់បានត្រឹមតែ R2 = 0.48 និងមានកម្រិតកំហុស RMSE ខ្ពស់រហូតដល់ 31.61 Mg/ha នៅក្នុងការធ្វើតេស្តម៉ូដែលល្អបំផុត។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះទាមទារការប្រើប្រាស់ទិន្នន័យរូបភាពផ្កាយរណបដែលអាចទាញយកបានដោយឥតគិតថ្លៃ ប៉ុន្តែទាមទារការចំណាយខ្ពស់ក្នុងការចុះវាស់វែងទិន្នន័យផ្ទាល់នៅកន្លែង និងកម្លាំងម៉ាស៊ីនកុំព្យូទ័រក្នុងការវិភាគ។
ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងតំបន់ព្រៃស្រល់និងដើមអុក (Pine-oak temperate forest) នៃរដ្ឋ Durango ប្រទេសម៉ិកស៊ិក ដែលមានលក្ខណៈភូមិសាស្ត្រនិងអាកាសធាតុខុសប្លែកពីកម្ពុជា។ ដោយសារព្រៃកម្ពុជាភាគច្រើនជាព្រៃត្រូពិច (Tropical rainforest និង Dry dipterocarp) ការទាញយកលំនាំឆ្លុះពន្លឺពីការសិក្សានេះប្រហែលជាមិនអាចអនុវត្តផ្ទាល់បានទេ ព្រោះព្រៃត្រូពិចមានដង់ស៊ីតេខ្ពស់ ដែលងាយនឹងធ្វើឱ្យសន្ទស្សន៍ NDVI ឆាប់ឆ្អែត (Saturation) សម្រាប់កម្រិតជីវម៉ាសធំៗ។
ទោះបីជាលក្ខណៈព្រៃឈើខុសគ្នាក៏ដោយ វិធីសាស្ត្រប្រើប្រាស់ Machine Learning រួមជាមួយការកែតម្រូវរូបភាពផ្កាយរណបនេះ មានសក្តានុពលខ្លាំងក្នុងការអនុវត្តនៅប្រទេសកម្ពុជា ពិសេសក្នុងគម្រោងឥណទានកាបូន។
ការចាប់យកបច្ចេកវិទ្យា Machine Learning រួមផ្សំជាមួយទិន្នន័យផ្កាយរណប នឹងជួយឱ្យកម្ពុជាអាចតាមដានធនធានព្រៃឈើនិងកាបូនបានរហ័ស សន្សំសំចៃថវិកាជាតិ និងធានាបាននូវតម្លាភាពសម្រាប់ទីផ្សារកាបូនអន្តរជាតិ។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Aboveground Biomass | គឺជាបរិមាណសរុបនៃរុក្ខជាតិដែលមានជីវិត (ដូចជាគល់ មែក ស្លឹក) ដែលនៅពីលើដី គិតជាទម្ងន់ស្ងួត។ នៅក្នុងបរិបទព្រៃឈើ វាត្រូវបានប្រើដើម្បីវាយតម្លៃកម្រិតកាបូនដែលព្រៃឈើអាចស្រូបយកបានពីបរិយាកាស។ | ដូចជាការថ្លឹងទម្ងន់សរុបនៃផ្នែកខាងលើដីរបស់ដើមឈើទាំងអស់នៅក្នុងព្រៃមួយដុំ ដើម្បីចង់ដឹងថាវាស្តុកទុកកាបូននិងសារធាតុចិញ្ចឹមប៉ុន្មាន។ |
| Atmospheric Correction | ជាដំណើរការកែសម្រួលទិន្នន័យរូបភាពផ្កាយរណប ដើម្បីលុបបំបាត់ការរំខាន ឬកំហុសដែលបង្កឡើងដោយភាគិតក្នុងបរិយាកាស (ដូចជាអ័ព្ទ ពពក ធូលី) ដើម្បីឱ្យយើងទទួលបានតម្លៃចំណាំងផ្លាតពន្លឺពិតប្រាកដពីផ្ទៃដី។ | ដូចជាការជូតកញ្ចក់វ៉ែនតាដែលមានធូលីដីឬស្រអាប់ ដើម្បីឱ្យយើងអាចមើលឃើញទេសភាពពិតប្រាកដនៅខាងក្រៅបានច្បាស់ល្អ។ |
| Support Vector Machine (SVM) | ជាក្បួនដោះស្រាយផ្នែករៀនដោយម៉ាស៊ីន (Machine Learning) ដែលព្យាយាមគូសបន្ទាត់ ឬប្លង់មួយនៅក្នុងលំហទិន្នន័យ ដើម្បីបែងចែកក្រុមទិន្នន័យ ឬស្វែងរកទំនាក់ទំនងស្មុគស្មាញរវាងអថេរ (ដូចជាពណ៌ពន្លឺរបស់រូបភាព និងបរិមាណជីវម៉ាសជាក់ស្តែង)។ | ដូចជាការព្យាយាមគូសបន្ទាត់ត្រង់មួយនៅលើតុ ដើម្បីបំបែកគ្រាប់ឃ្លីពណ៌ក្រហម និងពណ៌ខៀវឱ្យនៅដាច់ពីគ្នាឱ្យបានល្អបំផុត។ |
| Random Forest (RF) | ជាក្បួនដោះស្រាយបញ្ញាសិប្បនិម្មិតដែលបង្កើតមែកធាងនៃការសម្រេចចិត្ត (Decision Trees) ជាច្រើនដោយចៃដន្យ រួចយកលទ្ធផលរបស់មែកធាងទាំងអស់នោះមកបូកបញ្ចូលគ្នា ដើម្បីធ្វើការទស្សន៍ទាយលទ្ធផលចុងក្រោយដែលមានភាពសុក្រឹតខ្ពស់ និងមិនងាយមានកំហុស (Overfitting)។ | ដូចជាការសាកសួរយោបល់ពីអ្នកជំនាញ ១០០ នាក់ផ្សេងៗគ្នា រួចយកចម្លើយដែលភាគច្រើនឯកភាពគ្នាដើម្បីសម្រេចចិត្ត ជាជាងជឿលើអ្នកជំនាញតែម្នាក់។ |
| Normalized Difference Vegetation Index (NDVI) | ជាសន្ទស្សន៍គណិតវិទ្យាដែលប្រើប្រាស់កម្រិតចំណាំងផ្លាតនៃពន្លឺពណ៌ក្រហម (ដែលរុក្ខជាតិស្រូបយក) និងពន្លឺអ៊ីនហ្វ្រារ៉េដ (ដែលស្លឹករុក្ខជាតិជះត្រឡប់មកវិញ) ដើម្បីវាស់ស្ទង់ភាពខៀវស្រងាត់ និងដង់ស៊ីតេរុក្ខជាតិនៅក្នុងតំបន់មួយ។ | ដូចជាម៉ាស៊ីនស្កេនដែលអាចប្រាប់យើងថារុក្ខជាតិនៅកន្លែងនោះមានសុខភាពល្អ និងដុះក្រាស់កម្រិតណា ដោយសម្លឹងមើលលើប្រភេទពន្លឺដែលវាភាយចេញមកក្រៅ។ |
| Cross-Validation | ជាបច្ចេកទេសវាយតម្លៃម៉ូដែលស្ថិតិ ដោយបំបែកទិន្នន័យជាច្រើនចំណែក រួចប្រើប្រាស់ចំណែកមួយចំនួនសម្រាប់បង្រៀនម៉ូដែល (Train) និងចំណែកដែលនៅសល់សម្រាប់ធ្វើតេស្ត (Test) ឆ្លាស់គ្នា ដើម្បីធានាថាម៉ូដែលនោះដំណើរការបានល្អលើទិន្នន័យថ្មីដែលវាមិនធ្លាប់ឃើញ។ | ដូចជាការរៀនវិញ្ញាសាប្រឡង ដោយលាក់សំណួរមួយចំនួនទុកសម្រាប់ធ្វើតេស្តសមត្ថភាពខ្លួនឯងនៅថ្ងៃក្រោយ ដើម្បីប្រាកដថាខ្លួនពិតជាចេះមែន មិនមែនគ្រាន់តែទន្ទេញចាំមាត់។ |
| Digital Elevation Model (DEM) | ជាទិន្នន័យតំណាងឱ្យសណ្ឋានដី ៣ វិមាត្រ (កម្ពស់ ជម្រាល ទិសដៅជម្រាល) ក្នុងទម្រង់ជាកុំព្យូទ័រ ដែលជួយក្នុងការគណនាពីលំហូរទឹក សំណើមដី និងកត្តាដទៃទៀតដែលជះឥទ្ធិពលដោយប្រយោលដល់ការលូតលាស់របស់ព្រៃឈើ។ | ដូចជាការសូនរូបដីឥដ្ឋធ្វើជាគំរូនៃភ្នំនិងជ្រលងដី ដើម្បីមើលថាតើកន្លែងណាខ្ពស់ កន្លែងណាទាប និងដឹងថាទឹកភ្លៀងនឹងហូរទៅប្រមូលផ្តុំនៅកន្លែងណា។ |
| Multivariate Adaptive Regression Splines (MARS) | ជាវិធីសាស្ត្រទស្សន៍ទាយបែបមិនប្រើប៉ារ៉ាម៉ែត្រ (Non-parametric regression) ដែលអាចចាប់យកទំនាក់ទំនងកោង ឬបត់បែនរវាងទិន្នន័យ ដោយបំបែកទិន្នន័យជាផ្នែកៗ រួចបង្កើតសមីការបន្ទាត់តូចៗភ្ជាប់គ្នា ដើម្បីទស្សន៍ទាយបរិមាណជីវម៉ាសបានកាន់តែត្រឹមត្រូវ។ | ដូចជាការយកបន្ទាត់ត្រង់ខ្លីៗជាច្រើនកំណាត់ មកតម្រៀបតភ្ជាប់គ្នាឱ្យចេញជារាងកោង ដើម្បីតម្រង់តាមរាងនៃផ្លូវភ្នំដែលមានភាពបត់បែនច្រើន។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖