Original Title: Remote Sensing based Estimation of Forest Biophysical Variables using Machine Learning Algorithm
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការប៉ាន់ប្រមាណអថេរជីវរូបវិទ្យាព្រៃឈើផ្អែកលើការចាប់សញ្ញាពីចម្ងាយដោយប្រើក្បួនដោះស្រាយការរៀនរបស់ម៉ាស៊ីន

ចំណងជើងដើម៖ Remote Sensing based Estimation of Forest Biophysical Variables using Machine Learning Algorithm

អ្នកនិពន្ធ៖ Ritika Srinet (Indian Institute of Remote Sensing, ISRO), Subrata Nandy (Indian Institute of Remote Sensing, ISRO), NR Patel (Indian Institute of Remote Sensing, ISRO)

ឆ្នាំបោះពុម្ព៖ N/A

វិស័យសិក្សា៖ Forestry and Remote Sensing

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហានៃការគូសផែនទីបម្រែបម្រួលលំហនៃអថេរជីវរូបវិទ្យាព្រៃឈើសំខាន់ៗ (LAI, fIPAR, និង AGB) ដែលចាំបាច់សម្រាប់ការយល់ដឹងពីផលិតកម្មបឋម និងការផ្លាស់ប្តូរកាបូននៅក្នុងប្រព័ន្ធអេកូឡូស៊ី។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានប្រើប្រាស់ទិន្នន័យផ្កាយរណប Sentinel-2 រួមផ្សំជាមួយទិន្នន័យវាល ដោយអនុវត្តក្បួនដោះស្រាយ Random Forest ដើម្បីស្វែងរកម៉ូដែលទស្សន៍ទាយដែលល្អបំផុត។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Random Forest with Spectral Variables (Model 1)
ម៉ូដែល Random Forest ដោយប្រើប្រាស់តែអថេរវិសាលគម (Model 1)
ងាយស្រួលក្នុងការទាញយកទិន្នន័យពីចំណាំងផ្លាតនៃកម្រិតពន្លឺ (Band reflectance) និងសន្ទស្សន៍រុក្ខជាតិ ដោយមានភាពសាមញ្ញក្នុងការអនុវត្ត។ មិនបានរួមបញ្ចូលព័ត៌មានពីរចនាសម្ព័ន្ធលំហ (Spatial structure) នៃព្រៃឈើ ដែលធ្វើឱ្យភាពសុក្រឹតនៅមានកម្រិតបន្តិចធៀបនឹងម៉ូដែលរួមបញ្ចូលគ្នា។ LAI: R²=0.92, fIPAR: R²=0.91, AGB: R²=0.91 (ផ្អែកលើទិន្នន័យបង្វឹក)
Random Forest with Texture Variables (Model 2)
ម៉ូដែល Random Forest ដោយប្រើប្រាស់តែអថេរវាយនភាព (Model 2)
អាចចាប់យកលក្ខណៈពិសេសនៃរចនាសម្ព័ន្ធ និងភាពរដិបរដុបនៃដំបូលព្រៃ (Canopy structure) តាមរយៈការវិភាគ GLCM បានយ៉ាងល្អ។ ខ្វះព័ត៌មានអំពីពណ៌និងជីវសាស្ត្រគីមីរបស់ស្លឹកឈើ ដែលអាចកាត់បន្ថយសមត្ថភាពទស្សន៍ទាយលើប្រភេទព្រៃខុសៗគ្នា។ LAI: R²=0.92, fIPAR: R²=0.92, AGB: R²=0.92 (ផ្អែកលើទិន្នន័យបង្វឹក)
Random Forest with Spectral & Texture Variables (Model 3)
ម៉ូដែល Random Forest រួមបញ្ចូលអថេរវិសាលគមនិងវាយនភាព (Model 3)
ផ្តល់លទ្ធផលល្អបំផុតដោយរួមបញ្ចូលទាំងព័ត៌មានពណ៌ និងរចនាសម្ព័ន្ធលំហនៃព្រៃឈើ ធ្វើឱ្យការប៉ាន់ស្មានមានភាពសុក្រឹតខ្ពស់បំផុត។ ទាមទារកម្លាំងកុំព្យូទ័រ និងពេលវេលាច្រើនជាងមុនក្នុងការគណនាអថេររហូតដល់ ១៤២ មុននឹងធ្វើការចម្រាញ់ (Optimization)។ LAI: R²=0.83, fIPAR: R²=0.87, AGB: R²=0.85 (ផ្អែកលើលទ្ធផលផ្ទៀងផ្ទាត់ Validation)

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារការរួមបញ្ចូលគ្នារវាងទិន្នន័យផ្កាយរណបឥតគិតថ្លៃ និងការចុះវាស់វែងផ្ទាល់នៅទីវាល ដែលត្រូវការធនធានឧបករណ៍ និងកម្មវិធីកុំព្យូទ័រជាក់លាក់។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងតំបន់ព្រៃបម្រុង Barkot ក្នុងប្រទេសឥណ្ឌា ដែលជាប្រភេទព្រៃល្បោះសើមតំបន់ត្រូពិក (Tropical Moist Deciduous Forest) ដុះលាយឡំដោយដើម Sal ភាគច្រើន។ ទិន្នន័យនេះឆ្លុះបញ្ចាំងពីលក្ខណៈអេកូឡូស៊ីជាក់លាក់នៃតំបន់នោះ ដែលវាមានសារៈសំខាន់ណាស់សម្រាប់កម្ពុជាក្នុងការប្រមូលទិន្នន័យទីវាលក្នុងស្រុក ដើម្បីបង្វឹកម៉ូដែលឡើងវិញឱ្យស្របតាមប្រភេទព្រៃឈើនៅកម្ពុជាមុននឹងយកទៅអនុវត្ត។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់ និងអាចយកមកអនុវត្តយ៉ាងមានប្រសិទ្ធភាពសម្រាប់ការគ្រប់គ្រង និងតាមដានធនធានព្រៃឈើនៅប្រទេសកម្ពុជា។

ជារួម ការប្រើប្រាស់ទិន្នន័យផ្កាយរណបឥតគិតថ្លៃរួមជាមួយក្បួនដោះស្រាយ Machine Learning គឺជាដំណោះស្រាយដែលមានតម្លៃសមរម្យ ចំណេញពេលវេលា និងមានប្រសិទ្ធភាពខ្ពស់សម្រាប់ការគូសផែនទីធនធានព្រៃឈើនៅកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាពីមូលដ្ឋានគ្រឹះនៃ Remote Sensing និងទិន្នន័យផ្កាយរណប: និស្សិតគួរចាប់ផ្តើមរៀនពីរបៀបទាញយកទិន្នន័យ Sentinel-2 និងការប្រើប្រាស់កម្មវិធី ESA SNAPQGIS ដើម្បីដំណើរការរូបភាពបឋម និងទាញយកសន្ទស្សន៍រុក្ខជាតិ (Spectral Indices ដូចជា NDVI, EVI)។
  2. ស្វែងយល់ និងអនុវត្តការទាញយកអថេរវាយនភាព (Texture Variables): អនុវត្តការទាញយក Grey Level Co-Occurrence Matrix (GLCM) ពីរូបភាពផ្កាយរណប ដើម្បីវិភាគពីរចនាសម្ព័ន្ធលំហនៃព្រៃឈើ ដោយប្រើប្រាស់កូដ Python (scikit-image) ឬកម្មវិធី GIS។
  3. រៀបចំ និងដំណើរការក្បួនដោះស្រាយ Machine Learning: សិក្សាភាសា PythonR ដោយផ្តោតលើបណ្ណាល័យ scikit-learnrandomForest package ដើម្បីចេះរៀបចំម៉ូដែល Random Forest Regression សម្រាប់ទស្សន៍ទាយទិន្នន័យ។
  4. ការធ្វើសមាហរណកម្មទិន្នន័យវាល និងការវាយតម្លៃម៉ូដែល (Model Validation): ប្រមូលទិន្នន័យសំណាកគំរូពីទីវាលពិតប្រាកដ (Ground truth) បន្ទាប់មកអនុវត្តបច្ចេកទេស Cross-validation ដើម្បីជ្រើសរើសអថេរដែលល្អបំផុត និងគណនាតម្លៃ និង RMSE សម្រាប់បញ្ជាក់ភាពត្រឹមត្រូវនៃម៉ូដែល។
  5. ការផលិតផែនទីជីវរូបវិទ្យាព្រៃឈើ (Biophysical Mapping): ប្រើប្រាស់ម៉ូដែលដែលទទួលបានលទ្ធផលល្អបំផុត ដើម្បីទស្សន៍ទាយតម្លៃទៅលើរូបភាពផ្កាយរណបទាំងមូល និងបង្កើតជាផែនទីចែកចាយលំហនៃ LAI, fIPAR និង Aboveground Biomass ដោយប្រើប្រាស់ QGISArcGIS Pro

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Leaf Area Index (LAI) ជារង្វាស់ទំហំផ្ទៃស្លឹកឈើពណ៌បៃតងសរុបធៀបនឹងផ្ទៃដីមួយឯកតាខាងក្រោម។ វាជួយបញ្ជាក់ពីបរិមាណស្លឹកដែលធ្វើរស្មីសំយោគ ផ្លាស់ប្តូរឧស្ម័ន និងស្រូបយកពន្លឺនៅក្នុងប្រព័ន្ធអេកូឡូស៊ីព្រៃឈើ។ ប្រៀបដូចជាការវាស់ថាតើមានដំបូលស្លឹកឈើក្រាស់ប៉ុនណាសម្រាប់បាំងពន្លឺថ្ងៃនៅលើផ្ទៃដីមួយម៉ែត្រការ៉េ។
Aboveground Biomass (AGB) ជាម៉ាស ឬទម្ងន់សរុបនៃផ្នែករុក្ខជាតិដែលមានជីវិតទាំងអស់នៅពីលើដី (ដូចជាតួដើម មែក និងស្លឹក) ដែលគិតជាទម្ងន់ស្ងួត។ វាត្រូវបានប្រើដើម្បីវាយតម្លៃបរិមាណកាបូនដែលព្រៃឈើអាចស្តុកទុកបាន។ ដូចជាការថ្លឹងទម្ងន់ដើមឈើ មែក និងស្លឹកទាំងអស់នៅក្នុងព្រៃ ដើម្បីដឹងថាវាធំធាត់ និងស្តុកកាបូនបានកម្រិតណា។
fIPAR តំណាងឱ្យប្រភាគនៃពន្លឺព្រះអាទិត្យ (ក្នុងកម្រិតរលកដែលអាចធ្វើរស្មីសំយោគបាន) ដែលត្រូវបានស្រូប ឬស្ទាក់ជាប់ដោយដំបូលព្រៃឈើ មុនពេលវាធ្លាក់ដល់ដី។ ប្រៀបដូចជាការគណនាថាតើឆ័ត្រមួយអាចបាំងតំណក់ទឹកភ្លៀងបានប៉ុន្មានភាគរយមិនឲ្យធ្លាក់ដល់ដីអញ្ចឹងដែរ (គ្រាន់តែជំនួសទឹកភ្លៀងដោយពន្លឺ)។
Random Forest (RF) algorithm ជាក្បួនដោះស្រាយរៀនដោយម៉ាស៊ីន (Machine Learning) ដែលបង្កើត "ដើមឈើសម្រេចចិត្ត" (Decision Trees) ជាច្រើនបញ្ចូលគ្នា ដើម្បីធ្វើការទស្សន៍ទាយលទ្ធផលឱ្យបានកាន់តែសុក្រឹត និងកាត់បន្ថយកំហុសឆ្គង។ ដូចជាការសួរមតិពីមនុស្ស១០០នាក់ (ដើមឈើ១០០) ដើម្បីសម្រេចចិត្តលើរឿងមួយ ជាជាងជឿលើការសម្រេចចិត្តរបស់មនុស្សតែម្នាក់។
Grey Level Co-Occurrence Matrix(GLCM) ជាវិធីសាស្ត្រស្ថិតិប្រើក្នុងរូបភាពផ្កាយរណប ដើម្បីវិភាគពី "វាយនភាព" (Texture) ឬភាពរដិបរដុបនៃផ្ទៃដំបូលព្រៃ ដោយពិនិត្យមើលទំនាក់ទំនងនៃកម្រិតពណ៌របស់ភីកសែល (Pixels) ដែលនៅក្បែរៗគ្នា។ ប្រៀបដូចជាការស្ទាបក្រណាត់មួយផ្ទាំង ដើម្បីដឹងថាវាគ្រើម ឬរលោង ដោយមិនបាច់មើលពណ៌របស់វា។
Spectral Variables ជាទិន្នន័យអថេរដែលទាញចេញពីចំណាំងផ្លាតនៃពន្លឺលើផ្ទៃផែនដី តាមរយៈកម្រិតរលកពន្លឺផ្សេងៗគ្នា (Bands) របស់សេនស័រផ្កាយរណប រួមទាំងការគណនាជាសន្ទស្សន៍រុក្ខជាតិ។ ដូចជាការប្រើប្រាស់កាមេរ៉ាដែលអាចចាប់យកពណ៌ ឬពន្លឺដែលភ្នែកមនុស្សមើលមិនឃើញ ដើម្បីស្គាល់ពីលក្ខណៈ និងសុខភាពរុក្ខជាតិ។
RMSE កំហុសមធ្យមការ៉េ (Root Mean Square Error) ជារង្វាស់គណិតវិទ្យាដែលបង្ហាញពីកម្រិតនៃភាពខុសគ្នា (កំហុស) រវាងតម្លៃដែលម៉ូដែលបានទស្សន៍ទាយ និងតម្លៃពិតប្រាកដដែលបានវាស់ផ្ទាល់នៅទីវាល។ តម្លៃ RMSE កាន់តែតូច បង្ហាញថាម៉ូដែលកាន់តែសុក្រឹត។ ដូចជាការវាស់ថាតើព្រួញដែលយើងបាញ់ទៅនោះ ឃ្លាតពីចំណុចកណ្តាលនៃផ្ទាំងស៊ីបជាមធ្យមប៉ុន្មានសង់ទីម៉ែត្រ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖