Original Title: Estimación de la biomasa aérea forestal a nivel rodal mediante sensores remotos pasivos en el estado de Durango
Source: 10.3390
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការប៉ាន់ប្រមាណជីវម៉ាសព្រៃឈើផ្នែកខាងលើដីនៅកម្រិតតំបន់ព្រៃដោយប្រើប្រាស់សេនស័រចាប់សញ្ញាពីចម្ងាយអកម្មក្នុងរដ្ឋ Durango

ចំណងជើងដើម៖ Estimación de la biomasa aérea forestal a nivel rodal mediante sensores remotos pasivos en el estado de Durango

អ្នកនិពន្ធ៖ Pablito Marcelo López Serrano, Universidad Juárez del Estado de Durango, Carlos Antonio López Sánchez, Universidad Juárez del Estado de Durango

ឆ្នាំបោះពុម្ព៖ 2016

វិស័យសិក្សា៖ Forestry & Remote Sensing

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការវាស់វែងជីវម៉ាសព្រៃឈើផ្នែកខាងលើដី (Aboveground Biomass) ដោយផ្ទាល់មានការលំបាកនិងចំណាយថវិកាច្រើន ដែលទាមទារឱ្យមានការប្រើប្រាស់រូបភាពផ្កាយរណបជំនួសវិញសម្រាប់តំបន់ព្រៃភ្នំធំៗក្នុងរដ្ឋ Durango ប្រទេសម៉ិកស៊ិក។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់ទិន្នន័យរូបភាព Landsat-5 TM រួមបញ្ចូលជាមួយបច្ចេកទេសរៀនដោយម៉ាស៊ីន (Machine Learning) និងវិធីសាស្ត្រស្ថិតិផ្សេងៗ ដើម្បីបង្កើតម៉ូដែលប៉ាន់ប្រមាណជីវម៉ាសព្រៃឈើ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Multiple Linear Regression (MLR)
ម៉ូដែលតម្រែតម្រង់លីនេអ៊ែរពហុគុណ (វិធីសាស្ត្រប៉ារ៉ាម៉ែត្រគ្រឹះ)
ងាយស្រួលយល់ និងត្រូវបានប្រើប្រាស់យ៉ាងទូលំទូលាយក្នុងការស្រាវជ្រាវវិទ្យាសាស្ត្រទូទៅ។ ទាមទារលក្ខខណ្ឌតឹងរ៉ឹងដូចជាទំនាក់ទំនងលីនេអ៊ែរ ហើយងាយរងឥទ្ធិពលពីបញ្ហា Multicollinearity ។ ពន្យល់បាន R2 = 0.54 ជាមួយនឹងកម្រិតកំហុស RMSE ស្មើនឹង 29.61 Mg/ha (សម្រាប់ម៉ូដែលល្អបំផុត)។
k-Nearest Neighbor (kNN)
ក្បួនដោះស្រាយរៀនដោយម៉ាស៊ីន kNN (ផ្អែកលើទិន្នន័យដែលនៅជិតបំផុត)
ជាវិធីសាស្ត្រមិនប្រើប៉ារ៉ាម៉ែត្រ (Non-parametric) ងាយស្រួលយល់ពីគំនិតជាមូលដ្ឋាន និងដំណើរការបានល្អបំផុតក្នុងការទស្សន៍ទាយជារួម។ ត្រូវការការជ្រើសរើសលក្ខណៈពិសេស (Feature selection) ឱ្យបានត្រឹមត្រូវ បើមិនដូច្នោះទេអាចជួបបញ្ហា Hughes effect ធ្វើឱ្យភាពសុក្រឹតធ្លាក់ចុះ។ ផ្តល់លទ្ធផលល្អជាងគេជារួម ដោយពន្យល់បាន R2 = 0.66 និងកំហុស RMSE ទាបបំផុតត្រឹម 26.64 Mg/ha ។
Support Vector Machine (SVM)
ក្បួនដោះស្រាយ SVM ប្រើប្រាស់សម្រាប់ការបែងចែកប្លង់ទិន្នន័យ
មានសក្តានុពលខ្ពស់ខ្លាំងក្នុងការចាប់យកទំនាក់ទំនងទិន្នន័យស្មុគស្មាញ (Non-linear) ប្រសិនបើកំណត់ប៉ារ៉ាម៉ែត្របានល្អប្រសើរ។ មានភាពស្មុគស្មាញខ្លាំងក្នុងការប្រើប្រាស់ និងងាយរងឥទ្ធិពល (Sensitive) បំផុតពីការកំណត់ប៉ារ៉ាម៉ែត្រខុស (Parameterization)។ ផ្តល់លទ្ធផលល្អិតល្អន់ R2 = 0.62 និងកំហុស RMSE 27.28 Mg/ha នៅពេលអ្នកជំនាញកំណត់ប៉ារ៉ាម៉ែត្របានត្រឹមត្រូវបំផុត។
Random Forest (RF)
ក្បួនដោះស្រាយព្រៃចៃដន្យ (ប្រើមែកធាងការសម្រេចចិត្តច្រើនរួមបញ្ចូលគ្នា)
រឹងមាំចំពោះទិន្នន័យច្រើន ងាយស្រួលប្រើប្រាស់ជាង SVM សម្រាប់អ្នកមិនសូវមានជំនាញ (Non-experts) និងមិនងាយជួបបញ្ហា Overfitting ។ ដំណើរការដូចប្រអប់ខ្មៅ (Black box) ដែលពិបាកបកស្រាយពីរបៀបដែលម៉ូដែលទាញយកលទ្ធផល។ ពន្យល់បានត្រឹមតែ R2 = 0.48 និងមានកម្រិតកំហុស RMSE ខ្ពស់រហូតដល់ 31.61 Mg/ha នៅក្នុងការធ្វើតេស្តម៉ូដែលល្អបំផុត។

ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះទាមទារការប្រើប្រាស់ទិន្នន័យរូបភាពផ្កាយរណបដែលអាចទាញយកបានដោយឥតគិតថ្លៃ ប៉ុន្តែទាមទារការចំណាយខ្ពស់ក្នុងការចុះវាស់វែងទិន្នន័យផ្ទាល់នៅកន្លែង និងកម្លាំងម៉ាស៊ីនកុំព្យូទ័រក្នុងការវិភាគ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងតំបន់ព្រៃស្រល់និងដើមអុក (Pine-oak temperate forest) នៃរដ្ឋ Durango ប្រទេសម៉ិកស៊ិក ដែលមានលក្ខណៈភូមិសាស្ត្រនិងអាកាសធាតុខុសប្លែកពីកម្ពុជា។ ដោយសារព្រៃកម្ពុជាភាគច្រើនជាព្រៃត្រូពិច (Tropical rainforest និង Dry dipterocarp) ការទាញយកលំនាំឆ្លុះពន្លឺពីការសិក្សានេះប្រហែលជាមិនអាចអនុវត្តផ្ទាល់បានទេ ព្រោះព្រៃត្រូពិចមានដង់ស៊ីតេខ្ពស់ ដែលងាយនឹងធ្វើឱ្យសន្ទស្សន៍ NDVI ឆាប់ឆ្អែត (Saturation) សម្រាប់កម្រិតជីវម៉ាសធំៗ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាលក្ខណៈព្រៃឈើខុសគ្នាក៏ដោយ វិធីសាស្ត្រប្រើប្រាស់ Machine Learning រួមជាមួយការកែតម្រូវរូបភាពផ្កាយរណបនេះ មានសក្តានុពលខ្លាំងក្នុងការអនុវត្តនៅប្រទេសកម្ពុជា ពិសេសក្នុងគម្រោងឥណទានកាបូន។

ការចាប់យកបច្ចេកវិទ្យា Machine Learning រួមផ្សំជាមួយទិន្នន័យផ្កាយរណប នឹងជួយឱ្យកម្ពុជាអាចតាមដានធនធានព្រៃឈើនិងកាបូនបានរហ័ស សន្សំសំចៃថវិកាជាតិ និងធានាបាននូវតម្លាភាពសម្រាប់ទីផ្សារកាបូនអន្តរជាតិ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ជំហានទី១៖ សិក្សាមូលដ្ឋានគ្រឹះ GIS និងទិន្នន័យផ្កាយរណប: និស្សិតត្រូវរៀនប្រើប្រាស់កម្មវិធី QGIS ដើម្បីទាញយកទិន្នន័យរូបភាព Landsat-8Sentinel-2 ពីប្រភព USGS EarthExplorer រួចធ្វើការកាត់ (Clip) តំបន់សិក្សាណាមួយនៅក្នុងប្រទេសកម្ពុជា។
  2. ជំហានទី២៖ អនុវត្តការកែតម្រូវបរិយាកាស (Atmospheric Correction): ប្រើប្រាស់កម្មវិធី R ជាមួយកញ្ចប់កូដ landsat ឬប្រើ Plugin Semi-Automatic Classification Plugin (SCP) នៅក្នុង QGIS ដើម្បីបំប្លែងទិន្នន័យ Digital Numbers (DN) ទៅជា Surface Reflectance ដើម្បកាត់បន្ថយបញ្ហាស្រមោលពពក និងអ័ព្ទ។
  3. ជំហានទី៣៖ គណនាសន្ទស្សន៍រុក្ខជាតិ និងទិន្នន័យរចនាសម្ព័ន្ធដី: រៀនសរសេរកូដដើម្បីគណនាសន្ទស្សន៍ NDVI និង MSAVI2 ព្រមទាំងទាញយកទិន្នន័យ DEM ដើម្បីបង្កើតអថេរទាក់ទងនឹងចំណោតដី (Slope) ដែលមានសារៈសំខាន់ក្នុងការទស្សន៍ទាយជីវម៉ាស។
  4. ជំហានទី៤៖ ដំណើរការម៉ូដែល Machine Learning: ប្រើប្រាស់កម្មវិធី WEKA ឬសរសេរកូដក្នុង Python ជាមួយ Scikit-Learn ដើម្បីបញ្ចូលអថេរខាងលើជាមួយទិន្នន័យវាស់វែងសន្មត់ រួចសាកល្បងហ្វឹកហាត់ម៉ូដែល Random Forest និង kNN
  5. ជំហានទី៥៖ វាយតម្លៃម៉ូដែលជាមួយទីវាលជាក់ស្តែង: អនុវត្តបច្ចេកទេស Cross-Validation ដើម្បីវាស់ស្ទង់កំហុសរបស់ម៉ូដែលតាមរយៈ RMSE និង R-squared រួចបង្កើតជាផែនទីជីវម៉ាស (Biomass Map) សម្រាប់តំបន់សិក្សា និងសរសេររបាយការណ៍សន្និដ្ឋាន។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Aboveground Biomass គឺជាបរិមាណសរុបនៃរុក្ខជាតិដែលមានជីវិត (ដូចជាគល់ មែក ស្លឹក) ដែលនៅពីលើដី គិតជាទម្ងន់ស្ងួត។ នៅក្នុងបរិបទព្រៃឈើ វាត្រូវបានប្រើដើម្បីវាយតម្លៃកម្រិតកាបូនដែលព្រៃឈើអាចស្រូបយកបានពីបរិយាកាស។ ដូចជាការថ្លឹងទម្ងន់សរុបនៃផ្នែកខាងលើដីរបស់ដើមឈើទាំងអស់នៅក្នុងព្រៃមួយដុំ ដើម្បីចង់ដឹងថាវាស្តុកទុកកាបូននិងសារធាតុចិញ្ចឹមប៉ុន្មាន។
Atmospheric Correction ជាដំណើរការកែសម្រួលទិន្នន័យរូបភាពផ្កាយរណប ដើម្បីលុបបំបាត់ការរំខាន ឬកំហុសដែលបង្កឡើងដោយភាគិតក្នុងបរិយាកាស (ដូចជាអ័ព្ទ ពពក ធូលី) ដើម្បីឱ្យយើងទទួលបានតម្លៃចំណាំងផ្លាតពន្លឺពិតប្រាកដពីផ្ទៃដី។ ដូចជាការជូតកញ្ចក់វ៉ែនតាដែលមានធូលីដីឬស្រអាប់ ដើម្បីឱ្យយើងអាចមើលឃើញទេសភាពពិតប្រាកដនៅខាងក្រៅបានច្បាស់ល្អ។
Support Vector Machine (SVM) ជាក្បួនដោះស្រាយផ្នែករៀនដោយម៉ាស៊ីន (Machine Learning) ដែលព្យាយាមគូសបន្ទាត់ ឬប្លង់មួយនៅក្នុងលំហទិន្នន័យ ដើម្បីបែងចែកក្រុមទិន្នន័យ ឬស្វែងរកទំនាក់ទំនងស្មុគស្មាញរវាងអថេរ (ដូចជាពណ៌ពន្លឺរបស់រូបភាព និងបរិមាណជីវម៉ាសជាក់ស្តែង)។ ដូចជាការព្យាយាមគូសបន្ទាត់ត្រង់មួយនៅលើតុ ដើម្បីបំបែកគ្រាប់ឃ្លីពណ៌ក្រហម និងពណ៌ខៀវឱ្យនៅដាច់ពីគ្នាឱ្យបានល្អបំផុត។
Random Forest (RF) ជាក្បួនដោះស្រាយបញ្ញាសិប្បនិម្មិតដែលបង្កើតមែកធាងនៃការសម្រេចចិត្ត (Decision Trees) ជាច្រើនដោយចៃដន្យ រួចយកលទ្ធផលរបស់មែកធាងទាំងអស់នោះមកបូកបញ្ចូលគ្នា ដើម្បីធ្វើការទស្សន៍ទាយលទ្ធផលចុងក្រោយដែលមានភាពសុក្រឹតខ្ពស់ និងមិនងាយមានកំហុស (Overfitting)។ ដូចជាការសាកសួរយោបល់ពីអ្នកជំនាញ ១០០ នាក់ផ្សេងៗគ្នា រួចយកចម្លើយដែលភាគច្រើនឯកភាពគ្នាដើម្បីសម្រេចចិត្ត ជាជាងជឿលើអ្នកជំនាញតែម្នាក់។
Normalized Difference Vegetation Index (NDVI) ជាសន្ទស្សន៍គណិតវិទ្យាដែលប្រើប្រាស់កម្រិតចំណាំងផ្លាតនៃពន្លឺពណ៌ក្រហម (ដែលរុក្ខជាតិស្រូបយក) និងពន្លឺអ៊ីនហ្វ្រារ៉េដ (ដែលស្លឹករុក្ខជាតិជះត្រឡប់មកវិញ) ដើម្បីវាស់ស្ទង់ភាពខៀវស្រងាត់ និងដង់ស៊ីតេរុក្ខជាតិនៅក្នុងតំបន់មួយ។ ដូចជាម៉ាស៊ីនស្កេនដែលអាចប្រាប់យើងថារុក្ខជាតិនៅកន្លែងនោះមានសុខភាពល្អ និងដុះក្រាស់កម្រិតណា ដោយសម្លឹងមើលលើប្រភេទពន្លឺដែលវាភាយចេញមកក្រៅ។
Cross-Validation ជាបច្ចេកទេសវាយតម្លៃម៉ូដែលស្ថិតិ ដោយបំបែកទិន្នន័យជាច្រើនចំណែក រួចប្រើប្រាស់ចំណែកមួយចំនួនសម្រាប់បង្រៀនម៉ូដែល (Train) និងចំណែកដែលនៅសល់សម្រាប់ធ្វើតេស្ត (Test) ឆ្លាស់គ្នា ដើម្បីធានាថាម៉ូដែលនោះដំណើរការបានល្អលើទិន្នន័យថ្មីដែលវាមិនធ្លាប់ឃើញ។ ដូចជាការរៀនវិញ្ញាសាប្រឡង ដោយលាក់សំណួរមួយចំនួនទុកសម្រាប់ធ្វើតេស្តសមត្ថភាពខ្លួនឯងនៅថ្ងៃក្រោយ ដើម្បីប្រាកដថាខ្លួនពិតជាចេះមែន មិនមែនគ្រាន់តែទន្ទេញចាំមាត់។
Digital Elevation Model (DEM) ជាទិន្នន័យតំណាងឱ្យសណ្ឋានដី ៣ វិមាត្រ (កម្ពស់ ជម្រាល ទិសដៅជម្រាល) ក្នុងទម្រង់ជាកុំព្យូទ័រ ដែលជួយក្នុងការគណនាពីលំហូរទឹក សំណើមដី និងកត្តាដទៃទៀតដែលជះឥទ្ធិពលដោយប្រយោលដល់ការលូតលាស់របស់ព្រៃឈើ។ ដូចជាការសូនរូបដីឥដ្ឋធ្វើជាគំរូនៃភ្នំនិងជ្រលងដី ដើម្បីមើលថាតើកន្លែងណាខ្ពស់ កន្លែងណាទាប និងដឹងថាទឹកភ្លៀងនឹងហូរទៅប្រមូលផ្តុំនៅកន្លែងណា។
Multivariate Adaptive Regression Splines (MARS) ជាវិធីសាស្ត្រទស្សន៍ទាយបែបមិនប្រើប៉ារ៉ាម៉ែត្រ (Non-parametric regression) ដែលអាចចាប់យកទំនាក់ទំនងកោង ឬបត់បែនរវាងទិន្នន័យ ដោយបំបែកទិន្នន័យជាផ្នែកៗ រួចបង្កើតសមីការបន្ទាត់តូចៗភ្ជាប់គ្នា ដើម្បីទស្សន៍ទាយបរិមាណជីវម៉ាសបានកាន់តែត្រឹមត្រូវ។ ដូចជាការយកបន្ទាត់ត្រង់ខ្លីៗជាច្រើនកំណាត់ មកតម្រៀបតភ្ជាប់គ្នាឱ្យចេញជារាងកោង ដើម្បីតម្រង់តាមរាងនៃផ្លូវភ្នំដែលមានភាពបត់បែនច្រើន។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖