Original Title: Remote Sensing based Estimation of Forest Biophysical Variables using Machine Learning Algorithm
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការប៉ាន់ប្រមាណអថេរជីវរូបវិទ្យាព្រៃឈើផ្អែកលើការចាប់សញ្ញាពីចម្ងាយដោយប្រើក្បួនដោះស្រាយការរៀនរបស់ម៉ាស៊ីន

ចំណងជើងដើម៖ Remote Sensing based Estimation of Forest Biophysical Variables using Machine Learning Algorithm

អ្នកនិពន្ធ៖ Ritika Srinet (Indian Institute of Remote Sensing, ISRO), Subrata Nandy (Indian Institute of Remote Sensing, ISRO), NR Patel (Indian Institute of Remote Sensing, ISRO)

ឆ្នាំបោះពុម្ព៖ N/A

វិស័យសិក្សា៖ Forestry and Remote Sensing

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហានៃការគូសផែនទីបម្រែបម្រួលលំហនៃអថេរជីវរូបវិទ្យាព្រៃឈើសំខាន់ៗ (LAI, fIPAR, និង AGB) ដែលចាំបាច់សម្រាប់ការយល់ដឹងពីផលិតកម្មបឋម និងការផ្លាស់ប្តូរកាបូននៅក្នុងប្រព័ន្ធអេកូឡូស៊ី។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានប្រើប្រាស់ទិន្នន័យផ្កាយរណប Sentinel-2 រួមផ្សំជាមួយទិន្នន័យវាល ដោយអនុវត្តក្បួនដោះស្រាយ Random Forest ដើម្បីស្វែងរកម៉ូដែលទស្សន៍ទាយដែលល្អបំផុត។

ការប្រមូលទិន្នន័យផ្កាយរណប Sentinel-2 និងការទាញយកអថេរវិសាលគម ព្រមទាំងវាយនភាព (Spectral and Texture Variables)
ការចុះវាស់វែងផ្ទាល់នៅទីវាលសម្រាប់ LAI, fIPAR និង ជីវម៉ាសលើដី (Field Sampling for LAI, fIPAR and AGB)
ការប្រើប្រាស់ក្បួនដោះស្រាយ Random Forest សម្រាប់ការធ្វើម៉ូដែល និងផ្ទៀងផ្ទាត់ខ្វែង (Random Forest based modeling and cross-validation)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ម៉ូដែលទី៣ ដែលរួមបញ្ចូលទាំងអថេរវិសាលគម និងវាយនភាព (Spectral + Texture Variables) ផ្តល់លទ្ធផលល្អបំផុតសម្រាប់ការប៉ាន់ស្មានអថេរទាំងបី។
ការប៉ាន់ប្រមាណមានភាពសុក្រឹតខ្ពស់ ដោយទទួលបានតម្លៃ R²=0.83 សម្រាប់ LAI, R²=0.87 សម្រាប់ fIPAR និង R²=0.85 សម្រាប់ AGB។
អថេរ SWIR, Red-edge និងអថេរវាយនភាព (Texture variables) ត្រូវបានរកឃើញថាមានសារៈសំខាន់បំផុតក្នុងការទស្សន៍ទាយអថេរជីវរូបវិទ្យាព្រៃឈើទាំងនេះ។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Random Forest with Spectral Variables (Model 1) ម៉ូដែល Random Forest ដោយប្រើប្រាស់តែអថេរវិសាលគម (Model 1)	ងាយស្រួលក្នុងការទាញយកទិន្នន័យពីចំណាំងផ្លាតនៃកម្រិតពន្លឺ (Band reflectance) និងសន្ទស្សន៍រុក្ខជាតិ ដោយមានភាពសាមញ្ញក្នុងការអនុវត្ត។	មិនបានរួមបញ្ចូលព័ត៌មានពីរចនាសម្ព័ន្ធលំហ (Spatial structure) នៃព្រៃឈើ ដែលធ្វើឱ្យភាពសុក្រឹតនៅមានកម្រិតបន្តិចធៀបនឹងម៉ូដែលរួមបញ្ចូលគ្នា។	LAI: R²=0.92, fIPAR: R²=0.91, AGB: R²=0.91 (ផ្អែកលើទិន្នន័យបង្វឹក)
Random Forest with Texture Variables (Model 2) ម៉ូដែល Random Forest ដោយប្រើប្រាស់តែអថេរវាយនភាព (Model 2)	អាចចាប់យកលក្ខណៈពិសេសនៃរចនាសម្ព័ន្ធ និងភាពរដិបរដុបនៃដំបូលព្រៃ (Canopy structure) តាមរយៈការវិភាគ GLCM បានយ៉ាងល្អ។	ខ្វះព័ត៌មានអំពីពណ៌និងជីវសាស្ត្រគីមីរបស់ស្លឹកឈើ ដែលអាចកាត់បន្ថយសមត្ថភាពទស្សន៍ទាយលើប្រភេទព្រៃខុសៗគ្នា។	LAI: R²=0.92, fIPAR: R²=0.92, AGB: R²=0.92 (ផ្អែកលើទិន្នន័យបង្វឹក)
Random Forest with Spectral & Texture Variables (Model 3) ម៉ូដែល Random Forest រួមបញ្ចូលអថេរវិសាលគមនិងវាយនភាព (Model 3)	ផ្តល់លទ្ធផលល្អបំផុតដោយរួមបញ្ចូលទាំងព័ត៌មានពណ៌ និងរចនាសម្ព័ន្ធលំហនៃព្រៃឈើ ធ្វើឱ្យការប៉ាន់ស្មានមានភាពសុក្រឹតខ្ពស់បំផុត។	ទាមទារកម្លាំងកុំព្យូទ័រ និងពេលវេលាច្រើនជាងមុនក្នុងការគណនាអថេររហូតដល់ ១៤២ មុននឹងធ្វើការចម្រាញ់ (Optimization)។	LAI: R²=0.83, fIPAR: R²=0.87, AGB: R²=0.85 (ផ្អែកលើលទ្ធផលផ្ទៀងផ្ទាត់ Validation)

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារការរួមបញ្ចូលគ្នារវាងទិន្នន័យផ្កាយរណបឥតគិតថ្លៃ និងការចុះវាស់វែងផ្ទាល់នៅទីវាល ដែលត្រូវការធនធានឧបករណ៍ និងកម្មវិធីកុំព្យូទ័រជាក់លាក់។

Dataset: ទិន្នន័យផ្កាយរណប Sentinel-2 (ឥតគិតថ្លៃ) និងទិន្នន័យវាស់វែងផ្ទាល់នៅទីវាល (Field inventory) សម្រាប់ LAI, fIPAR ព្រមទាំងទំហំដើមឈើ (DBH)។
Hardware: ឧបករណ៍វាស់ស្ទង់រុក្ខជាតិ CI-110 Plant Canopy Imager សម្រាប់ការវាស់ LAI និង PAR នៅទីវាល ព្រមទាំងកុំព្យូទ័រដែលមានកម្លាំងមធ្យមសម្រាប់ដំណើរការ Machine Learning។
Software: កម្មវិធីសម្រាប់ដំណើរការទិន្នន័យ GIS/Remote Sensing (ឧទាហរណ៍ QGIS, SNAP) និងភាសាសរសេរកូដ (R ឬ Python) សម្រាប់ដំណើរការក្បួនដោះស្រាយ Random Forest។
Expertise: អ្នកជំនាញខាងរុក្ខាប្រមាញ់ដើម្បីធ្វើការគណនាជីវម៉ាស និងអ្នកជំនាញផ្នែក Machine Learning ដើម្បីរៀបចំម៉ូដែល។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងតំបន់ព្រៃបម្រុង Barkot ក្នុងប្រទេសឥណ្ឌា ដែលជាប្រភេទព្រៃល្បោះសើមតំបន់ត្រូពិក (Tropical Moist Deciduous Forest) ដុះលាយឡំដោយដើម Sal ភាគច្រើន។ ទិន្នន័យនេះឆ្លុះបញ្ចាំងពីលក្ខណៈអេកូឡូស៊ីជាក់លាក់នៃតំបន់នោះ ដែលវាមានសារៈសំខាន់ណាស់សម្រាប់កម្ពុជាក្នុងការប្រមូលទិន្នន័យទីវាលក្នុងស្រុក ដើម្បីបង្វឹកម៉ូដែលឡើងវិញឱ្យស្របតាមប្រភេទព្រៃឈើនៅកម្ពុជាមុននឹងយកទៅអនុវត្ត។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់ និងអាចយកមកអនុវត្តយ៉ាងមានប្រសិទ្ធភាពសម្រាប់ការគ្រប់គ្រង និងតាមដានធនធានព្រៃឈើនៅប្រទេសកម្ពុជា។

គម្រោងឥណទានកាបូន (REDD+ Projects in Cambodia): អាចប្រើប្រាស់វិធីសាស្ត្រនេះនៅតំបន់ព្រៃឡង់ ជួរភ្នំក្រវាញ និងកែវសីមា ដើម្បីតាមដាន និងវាយតម្លៃកម្រិតជីវម៉ាសលើដី (AGB) និងបរិមាណកាបូនដែលបានស្តុកទុកដោយភាពសុក្រឹត។
ក្រសួងបរិស្ថាន និងរដ្ឋបាលព្រៃឈើ (MoE and Forestry Administration): ជួយក្នុងការគូសផែនទីសន្ទស្សន៍ LAI និង fIPAR ប្រចាំឆ្នាំ ដើម្បីតាមដានសុខភាពព្រៃឈើ និងផលិតកម្មបឋមដោយមិនចាំបាច់ចំណាយកម្លាំងចុះវាស់វែងផ្ទាល់ច្រើនលើសលប់ទូទាំងប្រទេស។
ការតាមដានចម្ការឈើដាំ (Plantation Monitoring): អាចអនុវត្តនៅតំបន់ភូមិភាគឦសាន (មណ្ឌលគិរី រតនគិរី) ដើម្បីវាយតម្លៃការលូតលាស់នៃចម្ការកៅស៊ូ ឬចម្ការឈើដាំផ្សេងៗតាមរយៈការតាមដានបម្រែបម្រួលអថេរជីវរូបវិទ្យា។

ជារួម ការប្រើប្រាស់ទិន្នន័យផ្កាយរណបឥតគិតថ្លៃរួមជាមួយក្បួនដោះស្រាយ Machine Learning គឺជាដំណោះស្រាយដែលមានតម្លៃសមរម្យ ចំណេញពេលវេលា និងមានប្រសិទ្ធភាពខ្ពស់សម្រាប់ការគូសផែនទីធនធានព្រៃឈើនៅកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាពីមូលដ្ឋានគ្រឹះនៃ Remote Sensing និងទិន្នន័យផ្កាយរណប: និស្សិតគួរចាប់ផ្តើមរៀនពីរបៀបទាញយកទិន្នន័យ Sentinel-2 និងការប្រើប្រាស់កម្មវិធី ESA SNAP ឬ QGIS ដើម្បីដំណើរការរូបភាពបឋម និងទាញយកសន្ទស្សន៍រុក្ខជាតិ (Spectral Indices ដូចជា NDVI, EVI)។
ស្វែងយល់ និងអនុវត្តការទាញយកអថេរវាយនភាព (Texture Variables): អនុវត្តការទាញយក Grey Level Co-Occurrence Matrix (GLCM) ពីរូបភាពផ្កាយរណប ដើម្បីវិភាគពីរចនាសម្ព័ន្ធលំហនៃព្រៃឈើ ដោយប្រើប្រាស់កូដ Python (scikit-image) ឬកម្មវិធី GIS។
រៀបចំ និងដំណើរការក្បួនដោះស្រាយ Machine Learning: សិក្សាភាសា Python ឬ R ដោយផ្តោតលើបណ្ណាល័យ scikit-learn ឬ randomForest package ដើម្បីចេះរៀបចំម៉ូដែល Random Forest Regression សម្រាប់ទស្សន៍ទាយទិន្នន័យ។
ការធ្វើសមាហរណកម្មទិន្នន័យវាល និងការវាយតម្លៃម៉ូដែល (Model Validation): ប្រមូលទិន្នន័យសំណាកគំរូពីទីវាលពិតប្រាកដ (Ground truth) បន្ទាប់មកអនុវត្តបច្ចេកទេស Cross-validation ដើម្បីជ្រើសរើសអថេរដែលល្អបំផុត និងគណនាតម្លៃ R² និង RMSE សម្រាប់បញ្ជាក់ភាពត្រឹមត្រូវនៃម៉ូដែល។
ការផលិតផែនទីជីវរូបវិទ្យាព្រៃឈើ (Biophysical Mapping): ប្រើប្រាស់ម៉ូដែលដែលទទួលបានលទ្ធផលល្អបំផុត ដើម្បីទស្សន៍ទាយតម្លៃទៅលើរូបភាពផ្កាយរណបទាំងមូល និងបង្កើតជាផែនទីចែកចាយលំហនៃ LAI, fIPAR និង Aboveground Biomass ដោយប្រើប្រាស់ QGIS ឬ ArcGIS Pro។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Leaf Area Index (LAI)	ជារង្វាស់ទំហំផ្ទៃស្លឹកឈើពណ៌បៃតងសរុបធៀបនឹងផ្ទៃដីមួយឯកតាខាងក្រោម។ វាជួយបញ្ជាក់ពីបរិមាណស្លឹកដែលធ្វើរស្មីសំយោគ ផ្លាស់ប្តូរឧស្ម័ន និងស្រូបយកពន្លឺនៅក្នុងប្រព័ន្ធអេកូឡូស៊ីព្រៃឈើ។	ប្រៀបដូចជាការវាស់ថាតើមានដំបូលស្លឹកឈើក្រាស់ប៉ុនណាសម្រាប់បាំងពន្លឺថ្ងៃនៅលើផ្ទៃដីមួយម៉ែត្រការ៉េ។
Aboveground Biomass (AGB)	ជាម៉ាស ឬទម្ងន់សរុបនៃផ្នែករុក្ខជាតិដែលមានជីវិតទាំងអស់នៅពីលើដី (ដូចជាតួដើម មែក និងស្លឹក) ដែលគិតជាទម្ងន់ស្ងួត។ វាត្រូវបានប្រើដើម្បីវាយតម្លៃបរិមាណកាបូនដែលព្រៃឈើអាចស្តុកទុកបាន។	ដូចជាការថ្លឹងទម្ងន់ដើមឈើ មែក និងស្លឹកទាំងអស់នៅក្នុងព្រៃ ដើម្បីដឹងថាវាធំធាត់ និងស្តុកកាបូនបានកម្រិតណា។
fIPAR	តំណាងឱ្យប្រភាគនៃពន្លឺព្រះអាទិត្យ (ក្នុងកម្រិតរលកដែលអាចធ្វើរស្មីសំយោគបាន) ដែលត្រូវបានស្រូប ឬស្ទាក់ជាប់ដោយដំបូលព្រៃឈើ មុនពេលវាធ្លាក់ដល់ដី។	ប្រៀបដូចជាការគណនាថាតើឆ័ត្រមួយអាចបាំងតំណក់ទឹកភ្លៀងបានប៉ុន្មានភាគរយមិនឲ្យធ្លាក់ដល់ដីអញ្ចឹងដែរ (គ្រាន់តែជំនួសទឹកភ្លៀងដោយពន្លឺ)។
Random Forest (RF) algorithm	ជាក្បួនដោះស្រាយរៀនដោយម៉ាស៊ីន (Machine Learning) ដែលបង្កើត "ដើមឈើសម្រេចចិត្ត" (Decision Trees) ជាច្រើនបញ្ចូលគ្នា ដើម្បីធ្វើការទស្សន៍ទាយលទ្ធផលឱ្យបានកាន់តែសុក្រឹត និងកាត់បន្ថយកំហុសឆ្គង។	ដូចជាការសួរមតិពីមនុស្ស១០០នាក់ (ដើមឈើ១០០) ដើម្បីសម្រេចចិត្តលើរឿងមួយ ជាជាងជឿលើការសម្រេចចិត្តរបស់មនុស្សតែម្នាក់។
Grey Level Co-Occurrence Matrix(GLCM)	ជាវិធីសាស្ត្រស្ថិតិប្រើក្នុងរូបភាពផ្កាយរណប ដើម្បីវិភាគពី "វាយនភាព" (Texture) ឬភាពរដិបរដុបនៃផ្ទៃដំបូលព្រៃ ដោយពិនិត្យមើលទំនាក់ទំនងនៃកម្រិតពណ៌របស់ភីកសែល (Pixels) ដែលនៅក្បែរៗគ្នា។	ប្រៀបដូចជាការស្ទាបក្រណាត់មួយផ្ទាំង ដើម្បីដឹងថាវាគ្រើម ឬរលោង ដោយមិនបាច់មើលពណ៌របស់វា។
Spectral Variables	ជាទិន្នន័យអថេរដែលទាញចេញពីចំណាំងផ្លាតនៃពន្លឺលើផ្ទៃផែនដី តាមរយៈកម្រិតរលកពន្លឺផ្សេងៗគ្នា (Bands) របស់សេនស័រផ្កាយរណប រួមទាំងការគណនាជាសន្ទស្សន៍រុក្ខជាតិ។	ដូចជាការប្រើប្រាស់កាមេរ៉ាដែលអាចចាប់យកពណ៌ ឬពន្លឺដែលភ្នែកមនុស្សមើលមិនឃើញ ដើម្បីស្គាល់ពីលក្ខណៈ និងសុខភាពរុក្ខជាតិ។
RMSE	កំហុសមធ្យមការ៉េ (Root Mean Square Error) ជារង្វាស់គណិតវិទ្យាដែលបង្ហាញពីកម្រិតនៃភាពខុសគ្នា (កំហុស) រវាងតម្លៃដែលម៉ូដែលបានទស្សន៍ទាយ និងតម្លៃពិតប្រាកដដែលបានវាស់ផ្ទាល់នៅទីវាល។ តម្លៃ RMSE កាន់តែតូច បង្ហាញថាម៉ូដែលកាន់តែសុក្រឹត។	ដូចជាការវាស់ថាតើព្រួញដែលយើងបាញ់ទៅនោះ ឃ្លាតពីចំណុចកណ្តាលនៃផ្ទាំងស៊ីបជាមធ្យមប៉ុន្មានសង់ទីម៉ែត្រ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖