Original Title: ƯỚC LƯỢNG KHẢ NĂNG HẤP THỤ CO2 CỦA KIỂU RỪNG THƯỜNG XANH TRÊN ĐỊA BÀN TỈNH ĐẮK LẮK DỰA VÀO DỮ LIỆU VIỄN THÁM VÀ KỸ THUẬT GIS
Source: www.ttn.edu.vn
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការប៉ាន់ប្រមាណសមត្ថភាពស្រូបយកឧស្ម័ន CO2 នៃប្រភេទព្រៃស្រោងនៅខេត្ត Dak Lak ដោយផ្អែកលើទិន្នន័យពីចម្ងាយ (Remote Sensing) និងបច្ចេកទេស GIS

ចំណងជើងដើម៖ ƯỚC LƯỢNG KHẢ NĂNG HẤP THỤ CO2 CỦA KIỂU RỪNG THƯỜNG XANH TRÊN ĐỊA BÀN TỈNH ĐẮK LẮK DỰA VÀO DỮ LIỆU VIỄN THÁM VÀ KỸ THUẬT GIS

អ្នកនិពន្ធ៖ Hồ Đình Bảo (Trường Đại học Tây Nguyên)

ឆ្នាំបោះពុម្ព៖ 2026

វិស័យសិក្សា៖ Forestry / Remote Sensing

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយតម្រូវការចាំបាច់ក្នុងការតាមដានយ៉ាងច្បាស់លាស់នូវជីវម៉ាសលើដី (Aboveground Biomass - AGB) និងសមត្ថភាពស្រូបយក CO2 នៃព្រៃស្រោងក្នុងខេត្ត Dak Lak ប្រទេសវៀតណាម ដើម្បីគាំទ្រដល់ការកាត់បន្ថយបម្រែបម្រួលអាកាសធាតុ និងគំនិតផ្តួចផ្តើមទីផ្សារកាបូន (REDD+, PFES)។

វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះបានធ្វើសមាហរណកម្មទិន្នន័យអង្កេតផ្ទាល់ជាមួយទិន្នន័យពីចម្ងាយពហុប្រភព (Multi-source Remote Sensing) ដោយប្រើប្រាស់គំរូស្ថិតិ និងការរៀនដោយម៉ាស៊ីន (Machine Learning)។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Ordinary Least Squares (OLS)
តំរែតំរង់លីនេអ៊ែរ (OLS Linear Regression)
ងាយស្រួលក្នុងការគណនា យល់ និងបកស្រាយលទ្ធផលអំពីទំនាក់ទំនងរវាងអថេរ។ មិនអាចដោះស្រាយទំនាក់ទំនងមិនលីនេអ៊ែរ (non-linear) ដ៏ស្មុគស្មាញរវាងទិន្នន័យពីចម្ងាយ និងជីវម៉ាសបានល្អ និងងាយរងឥទ្ធិពលពីបញ្ហា Collinearity។ ទទួលបានភាពត្រឹមត្រូវទាបជាងគេ ដោយមាន R² = 0.510 លើទិន្នន័យហ្វឹកហាត់ និង R² = 0.480 សម្រាប់ការធ្វើតេស្តអន្តរកម្ម (10-fold CV)។
Generalized Additive Model (GAM)
គំរូសរុបទូទៅ (Generalized Additive Model)
អាចចាប់យកទំនាក់ទំនងមិនលីនេអ៊ែរបានប្រសើរជាង OLS ដោយប្រើប្រាស់អនុគមន៍រលោង (smooth functions) ដោយមិនចាំបាច់សន្មតទម្រង់សមីការទុកជាមុន។ នៅតែមានកម្រិតក្នុងការចាប់យកអន្តរកម្មពហុវិមាត្រដ៏ស្មុគស្មាញរវាងអថេរច្រើន ធៀបនឹងម៉ាស៊ីនរៀន (Machine Learning)។ ផ្តល់លទ្ធផលកម្រិតមធ្យម ដោយមាន R² = 0.590 លើទិន្នន័យហ្វឹកហាត់ និងកំហុស RMSE = 0.817 ក្នុង 10-fold CV។
Random Forest (RF)
ក្បួនដោះស្រាយម៉ាស៊ីនរៀនព្រៃចៃដន្យ (Random Forest)
មានសមត្ថភាពខ្ពស់ក្នុងការដោះស្រាយទិន្នន័យស្មុគស្មាញ អន្តរកម្មមិនលីនេអ៊ែរ និងជួយកាត់បន្ថយបញ្ហា Overfitting បានយ៉ាងល្អតាមរយៈការប្រើប្រាស់មែកធាងជាច្រើន។ ជាទូទៅមានលក្ខណៈជា "ប្រអប់ខ្មៅ" (Black-box) ដែលធ្វើឱ្យពិបាកពន្យល់ពីទំនាក់ទំនងនៃអថេរនីមួយៗលម្អិតដូចម៉ូដែលស្ថិតិប្រពៃណី។ ផ្តល់លទ្ធផលល្អបំផុតនិងមានស្ថិរភាពខ្ពស់ ដោយមាន R² = 0.884 លើទិន្នន័យហ្វឹកហាត់ និង R² = 0.632 លើទិន្នន័យធ្វើតេស្ត (ជាមួយអថេរចម្រាញ់) ព្រមទាំងមានកំហុសទាបបំផុត។

ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះពឹងផ្អែកយ៉ាងខ្លាំងលើទិន្នន័យឥតគិតថ្លៃ និងឧបករណ៍កូដបើកចំហ (Open-source) ប៉ុន្តែទាមទារការចំណាយកម្លាំងពលកម្ម និងថវិកាខ្ពស់សម្រាប់ការប្រមូលទិន្នន័យផ្ទាល់នៅតាមទីវាលព្រៃឈើ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងខេត្ត Dak Lak ប្រទេសវៀតណាម ដែលជាតំបន់ខ្ពង់រាបកណ្តាលសម្បូរទៅដោយប្រភេទព្រៃស្រោង និងព្រៃពាក់កណ្តាលស្រោង។ ទិន្នន័យមូលដ្ឋាន និងទម្រង់ព្រៃឈើនេះមានលក្ខណៈស្រដៀងគ្នាខ្លាំងទៅនឹងតំបន់ព្រៃភ្នំនៅក្នុងប្រទេសកម្ពុជា ដែលធ្វើឱ្យវិធីសាស្រ្តក្នុងក្រដាសស្រាវជ្រាវនេះមានភាពពាក់ព័ន្ធ និងអាចយកមកប្រៀបធៀបអនុវត្តបាន។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្រ្តរួមបញ្ចូលគ្នារវាងទិន្នន័យ Remote Sensing និង Machine Learning នេះមានសារៈសំខាន់ និងមានប្រយោជន៍ខ្លាំងណាស់សម្រាប់ប្រទេសកម្ពុជា ក្នុងការវាយតម្លៃស្តុកកាបូន។

ជារួម ការអនុវត្តគំរូនិងបច្ចេកទេសទាំងនេះអាចជួយស្ថាប័នកម្ពុជាសន្សំសំចៃពេលវេលា និងថវិកាលើការអង្កេតផ្ទាល់ ព្រមទាំងបង្កើនភាពជឿជាក់និងតម្លាភាពនៅក្នុងទីផ្សារកាបូនអន្តរជាតិ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. រៀនសូត្រពីបច្ចេកវិទ្យា Cloud-based GIS: ចាប់ផ្តើមសិក្សាពីការសរសេរកូដនៅលើ Google Earth Engine (GEE) ដើម្បីចេះទាញយក សម្អាត និងចងក្រងទិន្នន័យផ្កាយរណបដូចជា Landsat 8 និង Sentinel-1 សម្រាប់ការវិភាគសន្ទស្សន៍រុក្ខជាតិ (NDVI, EVI)។
  2. អនុវត្តការចុះប្រមូលទិន្នន័យវាល (Field Sampling): រៀបចំផែនការនិងចុះវាស់វែងទំហំដើមឈើ (DBH) និងកម្ពស់ (H) នៅតាមសហគមន៍ព្រៃឈើណាមួយក្នុងប្រទេសកម្ពុជា រួចប្រើប្រាស់សមីការ Allometric Equations ដើម្បីគណនាទម្ងន់ជីវម៉ាសលើដី (AGB) ជាស្តង់ដារយោង។
  3. អភិវឌ្ឍជំនាញស្ថិតិនិង Machine Learning: រៀនប្រើប្រាស់កម្មវិធី RStudio ឬ Python ដោយផ្តោតលើកញ្ចប់កូដ randomForest សម្រាប់ការសាងសង់គំរូទស្សន៍ទាយ (Predictive Models) និងការធ្វើ Cross-Validation ដើម្បីវាយតម្លៃភាពត្រឹមត្រូវនៃគំរូ។
  4. សមាហរណកម្មទិន្នន័យចូលទៅក្នុង GIS: ប្រើប្រាស់កម្មវិធី QGIS ដើម្បីរួមបញ្ចូលលទ្ធផលដែលគណនាបាន បង្កើតជាផែនទីបង្ហាញពីរបាយជីវម៉ាស និងកម្រិតនៃការស្រូបយកឧស្ម័នកាបូនិចនៅក្នុងតំបន់សិក្សា។
  5. សាកល្បងនិងពង្រីកទំហំគម្រោង: ធ្វើតេស្តសាកល្បងលទ្ធផលបឋមនៅតំបន់ជម្រកសត្វព្រៃតូចមួយជាមុន ដើម្បីកែសម្រួលប៉ារ៉ាម៉ែត្រម៉ូដែល មុននឹងពង្រីកការវិភាគទៅកាន់ទំហំខេត្ត ឬតំបន់ធំៗដូចជាតំបន់ព្រៃឡង់ទាំងមូល។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Aboveground Biomass (AGB) ទម្ងន់សរុបនៃសារពាង្គកាយមានជីវិតដែលនៅពីលើផ្ទៃដី (ដូចជា ដើម មែក និងស្លឹកឈើ) ក្នុងមួយឯកតាផ្ទៃដី ដែលត្រូវបានប្រើប្រាស់ដើម្បីគណនាបរិមាណកាបូនដែលព្រៃឈើអាចស្តុកទុកបាន។ វាដូចជាការថ្លឹងទម្ងន់ផ្នែកខាងលើនៃដើមឈើទាំងអស់នៅក្នុងព្រៃ ដើម្បីដឹងថាពួកវាធំធាត់និងអាចស្តុកទុកជាតិកាបូនបានកម្រិតណា។
Random Forest (RF) ជាក្បួនដោះស្រាយម៉ាស៊ីនរៀន (Machine Learning) ដែលបង្កើតមែកធាងសម្រេចចិត្ត (Decision Trees) ជាច្រើន ហើយរួមបញ្ចូលលទ្ធផលរបស់វាចូលគ្នា ដើម្បីកាត់បន្ថយកំហុស និងដោះស្រាយទំនាក់ទំនងស្មុគស្មាញរវាងទិន្នន័យ។ វាដូចជាការសួរមតិពីក្រុមអ្នកជំនាញរាប់រយនាក់ ហើយយកចម្លើយដែលភាគច្រើនឯកភាពគ្នា ដើម្បីធានាថាការសម្រេចចិត្តនោះត្រឹមត្រូវបំផុត ជាជាងជឿលើមនុស្សតែម្នាក់។
Synthetic Aperture Radar (SAR) បច្ចេកវិទ្យាបញ្ជូនរលកសញ្ញាពីផ្កាយរណប (ដូចជា Sentinel-1) ទៅកាន់ផែនដី និងវាស់ស្ទង់ការចំណាំងត្រឡប់មកវិញ។ វាអាចបាញ់ទម្លុះពពក និងដំបូលព្រៃឈើដើម្បីចាប់យករចនាសម្ព័ន្ធលម្អិតដូចជាទំហំដើមឈើ និងមែកឈើ។ វាដូចជាសត្វប្រចៀវប្រើរលកសំឡេងដើម្បីមើលឃើញក្នុងទីងងឹត អញ្ចឹងដែរ រ៉ាដាបាញ់រលកសញ្ញាដើម្បីមើលធ្លុះពពកនិងវាស់រចនាសម្ព័ន្ធព្រៃឈើទោះបីជាអាកាសធាតុអាក្រក់ក៏ដោយ។
Generalized Additive Model (GAM) គំរូស្ថិតិដែលអាចបត់បែនបាន ដែលអនុញ្ញាតឱ្យមានការគណនាទំនាក់ទំនងមិនលីនេអ៊ែរ (non-linear) រវាងអថេរព្យាករណ៍ (ទិន្នន័យផ្កាយរណប) និងគោលដៅ (ជីវម៉ាស) ដោយប្រើប្រាស់ខ្សែកោងរលោងជំនួសឱ្យបន្ទាត់ត្រង់។ វាដូចជាការគូសខ្សែកោងបត់បែនតាមរាងនៃចំណុចទិន្នន័យជាក់ស្តែង ជាជាងការបង្ខំគូសខ្សែបន្ទាត់ត្រង់រឹងស្តូកដែលមិនតំណាងឱ្យទិន្នន័យពិតប្រាកដ។
Spectral Saturation ដែនកំណត់នៅក្នុងទិន្នន័យផ្កាយរណបអុបទិក នៅពេលដែលដង់ស៊ីតេរុក្ខជាតិមានកម្រិតក្រាស់ពេក ធ្វើឱ្យសន្ទស្សន៍ផ្កាយរណបឈប់កើនឡើង ទោះបីជាជីវម៉ាសព្រៃឈើពិតប្រាកដនៅតែកើនឡើងក៏ដោយ។ វាដូចជាការមើលកែវទឹកដែលពោរពេញដោយពណ៌ខ្មៅងងឹត ទោះបីជាអ្នកថែមថ្នាំពណ៌ខ្មៅចូលទៅទៀត ក៏ភ្នែករបស់អ្នកមិនអាចមើលឃើញពីភាពខុសគ្នាទៀតដែរ។
K-fold Cross-Validation បច្ចេកទេសសម្រាប់សាកល្បងភាពត្រឹមត្រូវនៃគំរូទស្សន៍ទាយ ដោយបែងចែកទិន្នន័យជា 'K' ផ្នែក (groups) រួចប្រើប្រាស់ផ្នែកខ្លះដើម្បីបង្រៀនគំរូ និងផ្នែកដែលនៅសល់ដើម្បីធ្វើតេស្ត ដោយផ្លាស់ប្តូរវេនគ្នារហូតដល់គ្រប់ផ្នែកទាំងអស់។ វាដូចជាការបែងចែកសិស្សជាក្រុម ហើយឱ្យក្រុមនីមួយៗផ្លាស់ប្តូរវេនគ្នាតេស្តសាកល្បងវិញ្ញាសាផ្សេងៗគ្នា ដើម្បីប្រាកដថាចំណេះដឹងរបស់ពួកគេពិតជាអាចប្រើបានគ្រប់កាលៈទេសៈ។
Overfitting កំហុសនៅក្នុងការសាងសង់គំរូម៉ាស៊ីនរៀន នៅពេលដែលគំរូនោះរៀនទន្ទេញទិន្នន័យហ្វឹកហាត់ (training data) លម្អិតពេក រហូតដល់មិនអាចធ្វើការទស្សន៍ទាយបានត្រឹមត្រូវចំពោះទិន្នន័យថ្មីដែលវាមិនធ្លាប់ជួប។ វាដូចជាសិស្សដែលទន្ទេញចាំមាត់តែវិញ្ញាសាចាស់ៗប្រឡងធ្លាប់ចេញ តែនៅពេលប្រឡងជួបវិញ្ញាសាថ្មីមានលំនាំស្រដៀងគ្នា បែរជាមិនអាចដោះស្រាយបាន។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖