Original Title: The Finnish Multisource National Forest Inventory: Small-Area Estimation and Map Production
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

សារពើភ័ណ្ឌព្រៃឈើជាតិពហុប្រភពរបស់ប្រទេសហ្វាំងឡង់៖ ការប៉ាន់ស្មានតំបន់តូច និងការផលិតផែនទី

ចំណងជើងដើម៖ The Finnish Multisource National Forest Inventory: Small-Area Estimation and Map Production

អ្នកនិពន្ធ៖ Erkki Tomppo (Finnish Forest Research Institute)

ឆ្នាំបោះពុម្ព៖ 2006 Proceedings of the Eighth Annual Forest Inventory and Analysis Symposium

វិស័យសិក្សា៖ Forestry and Remote Sensing

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយតម្រូវការក្នុងការទទួលបានការប៉ាន់ស្មានធនធានព្រៃឈើប្រកបដោយភាពត្រឹមត្រូវ និងចំណាយតិច (ដូចជាបរិមាណ និងប្រភេទដើមឈើ) សម្រាប់តំបន់តូចៗ ដែលមិនអាចធ្វើទៅបានដោយការប្រើប្រាស់ទិន្នន័យវាលតែមួយមុខ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់វិធីសាស្រ្តពហុប្រភពដែលរួមបញ្ចូលទិន្នន័យវាល រូបភាពផ្កាយរណប និងផែនទីឌីជីថល ដោយប្រើប្រាស់វិធីសាស្រ្តប៉ាន់ស្មានមិនប្រើប៉ារ៉ាម៉ែត្រ k-Nearest Neighbor (ik-NN) ដែលត្រូវបានធ្វើឱ្យប្រសើរឡើងដោយក្បួនដោះស្រាយហ្សែន។

Field Plot Data (ទិន្នន័យវាល): ការប្រើប្រាស់ទិន្នន័យវាលពីសារពើភ័ណ្ឌព្រៃឈើជាតិ ដើម្បីប៉ាន់ស្មានបរិមាណដើមឈើក្នុងមួយហិកតាតាមប្រភេទដើមឈើ។
Satellite Imagery (រូបភាពផ្កាយរណប): ការប្រើប្រាស់រូបភាពផ្កាយរណប Landsat 5 TM, Landsat 7 ETM+, Spot និង IRS-1 C LISS ដើម្បីទាញយកទិន្នន័យអុបទិក។
Digital Map Data (ទិន្នន័យផែនទីឌីជីថល): ការប្រើប្រាស់ផែនទីប្រើប្រាស់ដី និងគំរូកម្ពស់ឌីជីថល (Digital Elevation Model) ដើម្បីបែងចែកប្រភេទដីព្រៃ និងកែតម្រូវការជះពន្លឺព្រះអាទិត្យ។
ik-NN Estimation Method (វិធីសាស្រ្តប៉ាន់ស្មាន ik-NN): ការប្រើប្រាស់ក្បួនដោះស្រាយហ្សែន (Genetic Algorithm) ដើម្បីស្វែងរកទម្ងន់អថេរដ៏ប្រសើរបំផុតក្នុងការជ្រើសរើសទីតាំងជិតខាងបំផុតក្នុងការប៉ាន់ស្មាន។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

វិធីសាស្ត្រ ik-NN ដែលបានកែលម្អបានកាត់បន្ថយកំហុសនៃការទស្សន៍ទាយយ៉ាងសំខាន់រហូតដល់ជាង ៩០% សម្រាប់ទិន្នន័យបរិមាណសរុប ទាំងនៅកម្រិតភីកសែល (Pixel level) និងនៅទូទាំងទំហំតំបន់គោលដៅផ្សេងៗ បើប្រៀបធៀបទៅនឹងវិធីសាស្ត្រ k-NN មូលដ្ឋាន។
ការដាក់បញ្ចូលអថេរនៃការប្រែប្រួលតំបន់ធំទៅក្នុងវិធីសាស្រ្ត ik-NN បានដោះស្រាយបញ្ហាប្រឈមក្នុងការបែងចែករវាងតំបន់ព្រៃស្រល់ (Pine) និងតំបន់ព្រៃស្រល់ស្រួច (Spruce) បានយ៉ាងប្រសើរ។
ការរួមបញ្ចូលរូបភាពផ្កាយរណប និងទិន្នន័យវាល បានផ្តល់នូវមធ្យោបាយដែលមានតម្លៃថោក និងមានប្រសិទ្ធភាពក្នុងការផលិតផែនទីព្រៃឈើតំបន់តូចប្រកបដោយភាពត្រឹមត្រូវ ដែលមានសារៈសំខាន់សម្រាប់ការធ្វើសេចក្តីសម្រេចចិត្តក្នុងវិស័យរុក្ខាប្រមាញ់។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Basic k-NN វិធីសាស្ត្រ k-Nearest Neighbor (k-NN) ជាមូលដ្ឋាន	មានភាពសាមញ្ញក្នុងការអនុវត្ត និងអាចប្រើប្រាស់រូបភាពផ្កាយរណបគ្រប់ប្រភេទ។	មានភាពលម្អៀង (Biased) ខ្ពស់នៅពេលតំបន់ប៉ាន់ស្មានមានទំហំធំ និងមានតំបន់រុក្ខជាតិខុសៗគ្នា។ ប៉ាន់ស្មានបរិមាណឈើប្រភេទ Spruce ទាបជាងការពិតខ្លាំង។	កំហុសលម្អៀងសម្រាប់បរិមាណសរុប (Total Volume) គឺ -2.021 m³/ha និងសម្រាប់ប្រភេទឈើ Spruce គឺ -3.167 m³/ha។
k-NN with large-area variables (k-NN, la) វិធីសាស្ត្រ k-NN ដោយប្រើអថេរតំបន់ធំ	បញ្ចូលអថេរតំបន់ធំ (Large-area variables) ដើម្បីជួយកំណត់ព្រំដែនតំបន់ភូមិសាស្ត្រដែលស្រដៀងគ្នា។	ការបន្ថែមអថេរតំបន់ធំតែមួយមុខ មិនអាចកាត់បន្ថយភាពលម្អៀងបានច្រើននោះទេ ហើយកំហុសនៅតែខ្ពស់សម្រាប់ប្រភេទឈើមួយចំនួន។	កំហុសលម្អៀងសម្រាប់ប្រភេទឈើ Spruce កើនឡើងដល់ -4.725 m³/ha ដែលបង្ហាញថាវាមិនមានប្រសិទ្ធភាពដោយខ្លួនឯង។
Improved k-NN (ik-NN) វិធីសាស្ត្រ ik-NN ដែលបានកែលម្អ (ប្រើ Genetic Algorithm)	កាត់បន្ថយភាពលម្អៀងទាំងនៅកម្រិតភីកសែល និងកម្រិតតំបន់ធំបានយ៉ាងច្រើន ដោយប្រើក្បួនដោះស្រាយហ្សែនដើម្បីស្វែងរកទម្ងន់ដ៏ប្រសើរបំផុត។ ដោះស្រាយបញ្ហាច្រឡំរវាងប្រភេទព្រៃផ្សេងៗគ្នាបានល្អ។	ទាមទារការគណនាស្មុគស្មាញ និងពេលវេលាច្រើនក្នុងការដំណើរការ Genetic Algorithm និងការកំណត់ទម្ងន់អថេរ។	កាត់បន្ថយភាពលម្អៀងនៃបរិមាណសរុបបាន 94.15% (សល់ត្រឹម -0.259 m³/ha) និងប្រភេទឈើ Spruce បាន 99.89% (សល់ត្រឹម -0.005 m³/ha)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តវិធីសាស្ត្រ MS-NFI នេះទាមទារការវិនិយោគខ្ពស់លើការប្រមូលទិន្នន័យវាល សមត្ថភាពកុំព្យូទ័រ ក៏ដូចជាធនធានរូបភាពផ្កាយរណបគុណភាពខ្ពស់។

Dataset: ទិន្នន័យវាលរាប់ម៉ឺនកន្លែង (ជាង ៨ម៉ឺនកន្លែងនៅហ្វាំងឡង់), រូបភាពផ្កាយរណប (Landsat, Spot, IRS-1C), និងទិន្នន័យផែនទីឌីជីថល (DEM, ផែនទីប្រើប្រាស់ដី)។
Hardware: ម៉ាស៊ីនមេ (Servers) ឬកុំព្យូទ័រដែលមានសមត្ថភាពដំណើរការទិន្នន័យខ្ពស់ សម្រាប់ដំណើរការរូបភាពផ្កាយរណបទំហំធំ និងក្បួនដោះស្រាយ Genetic Algorithm។
Software: កម្មវិធីកែច្នៃរូបភាពផ្កាយរណប និងប្រព័ន្ធព័ត៌មានភូមិសាស្ត្រ (GIS), និងបរិស្ថានសរសេរកូដសម្រាប់ដំណើរការក្បួន Machine Learning។
Expertise: អ្នកជំនាញផ្នែករុក្ខាប្រមាញ់ (Forestry), អ្នកវិភាគទិន្នន័យពីចម្ងាយ (Remote Sensing), និងអ្នកវិទ្យាសាស្ត្រទិន្នន័យ (Data Scientists) សម្រាប់តម្លើង និងត្រួតពិនិត្យម៉ូដែល។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះផ្អែកលើទិន្នន័យព្រៃឈើប្រភេទ Boreal នៅប្រទេសហ្វាំងឡង់ (មានប្រភេទដើម Pine, Spruce, Birch ជាដើម)។ សម្រាប់ប្រទេសកម្ពុជាដែលមានព្រៃត្រូពិចចម្រុះ (Tropical Forests) ការអនុវត្តម៉ូដែលនេះផ្ទាល់អាចនឹងមានភាពលម្អៀងខ្ពស់ ដូច្នេះវាទាមទារឱ្យមានការប្រមូលទិន្នន័យវាលថ្មីទាំងស្រុងដែលតំណាងឱ្យប្រព័ន្ធអេកូឡូស៊ីក្នុងស្រុក។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាបរិបទព្រៃឈើខុសគ្នាក៏ពិតមែន ប៉ុន្តែវិធីសាស្ត្ររួមបញ្ចូលទិន្នន័យ (Multisource method) នេះមានសក្តានុពលខ្លាំងក្នុងការអនុវត្តសម្រាប់ការគ្រប់គ្រងធនធានធម្មជាតិនៅកម្ពុជា។

គម្រោងឥណទានកាបូន (REDD+ Projects): គម្រោងនៅតំបន់ព្រៃឡង់ និងជួរភ្នំក្រវាញ អាចប្រើប្រាស់វិធីសាស្ត្រ ik-NN ដើម្បីប៉ាន់ស្មានបរិមាណកាបូនក្នុងព្រៃ (Biomass estimation) នៅកម្រិតតំបន់តូចៗបានយ៉ាងមានប្រសិទ្ធភាពជាងការដើរវាស់វែងដោយផ្ទាល់។
ការធ្វើសារពើភ័ណ្ឌព្រៃឈើថ្នាក់ជាតិ (National Forest Inventory): រដ្ឋបាលព្រៃឈើ (FA) និងក្រសួងបរិស្ថាន (MoE) អាចប្រើបច្ចេកទេសនេះដើម្បីធ្វើបច្ចុប្បន្នភាពផែនទីគម្របព្រៃឈើ និងតាមដានការកាប់បំផ្លាញព្រៃឈើ ដោយកាត់បន្ថយចំណាយលើការចុះវាលទូទាំងប្រទេស។
ការធ្វើផែនការប្រើប្រាស់ដីថ្នាក់ឃុំ/ស្រុក: អាជ្ញាធរមូលដ្ឋានអាចទទួលបានទិន្នន័យព្រៃឈើលម្អិតតាមព្រំប្រទល់ភូមិសាស្ត្ររបស់ខ្លួន ដើម្បីងាយស្រួលក្នុងការធ្វើសេចក្តីសម្រេចចិត្ត និងការបែងចែកដីសហគមន៍។

ជារួម ការផ្លាស់ប្តូរមកប្រើប្រាស់ប្រព័ន្ធប៉ាន់ស្មានតាមរយៈរូបភាពផ្កាយរណបនិងទិន្នន័យវាល បែបពហុប្រភពនេះ នឹងជួយកម្ពុជាសន្សំសំចៃថវិកាជាតិ និងបង្កើនតម្លាភាពទិន្នន័យបរិស្ថានប្រកបដោយចីរភាព។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះ GIS និង Remote Sensing: និស្សិតត្រូវចាប់ផ្តើមសិក្សាពីការកែច្នៃរូបភាពផ្កាយរណប និងការវិភាគទិន្នន័យលំហរដោយប្រើកម្មវិធីឥតគិតថ្លៃដូចជា QGIS និង Google Earth Engine (GEE)។
ស្វែងយល់ពីក្បួនដោះស្រាយ Machine Learning សម្រាប់ទិន្នន័យលំហ: អនុវត្តការសរសេរកូដដោយប្រើប្រាស់បណ្ណាល័យ scikit-learn នៅក្នុង Python ដើម្បីរៀនពីរបៀបដំណើរការម៉ូដែល k-Nearest Neighbors (k-NN) ជាមូលដ្ឋានសម្រាប់ការចាត់ថ្នាក់ទិន្នន័យ។
រៀនពីបច្ចេកទេសបង្កើនប្រសិទ្ធភាពដោយ Genetic Algorithms: ស្រាវជ្រាវ និងសាកល្បងសរសេរកូដបញ្ចូល Genetic Algorithms ជាមួយ k-NN ដើម្បីស្វែងរកទម្ងន់អថេរ (Variable Weights) ដ៏ល្អបំផុត ដូចដែលបានអនុវត្តនៅក្នុងឯកសារ (វិធីសាស្ត្រ ik-NN)។
អនុវត្តគម្រោងសាកល្បង (Pilot Project) នៅតំបន់ព្រៃឈើកម្ពុជា: ទាញយករូបភាពផ្កាយរណប Landsat 8/9 ឬ Sentinel-2 ប្រចាំតំបន់ការពារណាមួយ (ឧ. ដែនជម្រកសត្វព្រៃកែវសីមា) រួចសាកល្បងប្រើម៉ូដែលដើម្បីទស្សន៍ទាយប្រភេទគម្របព្រៃ។
សហការ និងស្វែងរកទិន្នន័យវាលជាក់ស្តែង: ទំនាក់ទំនងទៅកាន់អង្គការក្រៅរដ្ឋាភិបាល (ឧ. WCS, CI, ឬ WWF) ឬក្រសួងបរិស្ថាន ដើម្បីស្នើសុំទិន្នន័យវាលមួយចំនួនតូច (Sample Plots) ដើម្បីយកមកផ្ទៀងផ្ទាត់ (Calibrate) ភាពត្រឹមត្រូវនៃម៉ូដែលរបស់ខ្លួន។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Multisource national forest inventory (MS-NFI)	គំរូនៃការប្រមូលនិងវិភាគទិន្នន័យព្រៃឈើថ្នាក់ជាតិ ដោយការរួមបញ្ចូលទិន្នន័យពីប្រភពផ្សេងៗគ្នា (ដូចជាទិន្នន័យវាស់វែងផ្ទាល់នៅកន្លែង រូបភាពផ្កាយរណប និងផែនទីឌីជីថល) ដើម្បីធ្វើការប៉ាន់ស្មានធនធានព្រៃឈើក្នុងតំបន់តូចៗបានកាន់តែច្បាស់លាស់និងសន្សំសំចៃថវិកា។	ដូចជាការសួរព័ត៌មានពីមនុស្សជាច្រើននាក់ (អ្នកឃើញផ្ទាល់ អ្នកមើលពីចម្ងាយ និងអ្នកមានផែនទី) ដើម្បីគូររូបភាពនៃទីតាំងមួយឱ្យបានលម្អិតនិងត្រឹមត្រូវបំផុត ជាជាងការពឹងលើអ្នកឃើញផ្ទាល់តែម្នាក់។
k-Nearest Neighbor (k-NN) estimation	ក្បួនដោះស្រាយគណិតវិទ្យាដែលប្រើសម្រាប់ទស្សន៍ទាយលក្ខណៈនៃតំបន់មួយ (ឧទាហរណ៍៖ បរិមាណឈើ) ដោយផ្អែកលើការស្វែងរកនិងប្រៀបធៀបតំបន់ជិតខាងចំនួន 'k' ដែលមានលក្ខណៈរូបភាពផ្កាយរណបស្រដៀងគ្នាបំផុត ហើយមានទិន្នន័យវាស់វែងរួចជាស្រេច។	ដូចជាការទស្សន៍ទាយចំណូលចិត្តនិងចរិតរបស់មនុស្សម្នាក់ ដោយសង្កេតមើលទៅលើមិត្តភក្តិជិតស្និទ្ធបំផុតរបស់គាត់ចំនួន ៥នាក់ (k=5)។
Genetic algorithm	ក្បួនដោះស្រាយបញ្ញាសិប្បនិម្មិត (AI) ដែលចម្លងតាមទ្រឹស្តីនៃការវិវត្តរបស់ធម្មជាតិ (Natural Selection) ដើម្បីស្វែងរកដំណោះស្រាយ ឬទម្ងន់អថេរ (Weights) ដ៏ល្អបំផុតក្នុងការកាត់បន្ថយកំហុសនៃការប៉ាន់ស្មានរបស់ម៉ូដែល ដោយការផ្សំផ្គុំលក្ខណៈល្អៗពីមួយជំនាន់ទៅមួយជំនាន់។	ដូចជាការបង្កាត់ពូជដំណាំដោយជ្រើសរើសយកតែពូជណាដែលធន់និងផ្ដល់ទិន្នផលខ្ពស់បំផុតយកមកបង្កាត់បន្ត រហូតទទួលបានពូជដ៏ល្អឯក។
Leave-one-out cross-validation	បច្ចេកទេសវាយតម្លៃភាពត្រឹមត្រូវនៃម៉ូដែល ដោយការដកទិន្នន័យមួយចេញពីសំណុំទិន្នន័យរួម រួចយកទិន្នន័យដែលនៅសល់ទាំងអស់ទៅបង្រៀនម៉ូដែល បន្ទាប់មកយកម៉ូដែលនោះមកទស្សន៍ទាយទិន្នន័យដែលបានដកចេញនោះវិញ រួចធ្វើបែបនេះត្រឡប់ចុះឡើងរហូតអស់គ្រប់ទិន្នន័យ។	ដូចជាការឱ្យសិស្សម្នាក់ចេញពីថ្នាក់ រួចបង្រៀនសិស្សទាំងអស់ដែលនៅសល់ បន្ទាប់មកហៅសិស្សនោះមកវិញដើម្បីធ្វើតេស្តមើលថាតើចំណេះដឹងដែលថ្នាក់រៀនទាំងមូលបានរៀន អាចទាយដឹងពីចម្លើយរបស់សិស្សម្នាក់នោះកម្រិតណា។
Digital elevation model	ទិន្នន័យគំរូកម្ពស់ដីបែបឌីជីថល (3D) ដែលត្រូវបានប្រើប្រាស់ដើម្បីកែតម្រូវការឆ្លុះពន្លឺព្រះអាទិត្យនៅលើរូបភាពផ្កាយរណប (ដើម្បីកុំឱ្យពន្លឺថ្ងៃជះលើជម្រាលភ្នំធ្វើឱ្យខូចពណ៌រូបភាព) និងជួយបែងចែកប្រភេទដីតាមរយៈកម្ពស់ធៀបនឹងនីវ៉ូទឹកសមុទ្រ។	ដូចជាការប្រើពុម្ពគំរូដីឥដ្ឋសូនជារូបរាងភ្នំ (3D Map) ដើម្បីដឹងថាកន្លែងណាជាកំពូលភ្នំ កន្លែងណាជាជ្រលងដី និងតំបន់ណាដែលត្រូវពន្លឺថ្ងៃខ្លាំងជាងគេ។
Spatial interpolation	ដំណើរការគណិតវិទ្យាក្នុងការប៉ាន់ស្មានតម្លៃទិន្នន័យនៅទីតាំងដែលយើងមិនបានចុះវាស់វែង ដោយផ្អែកលើការទាញយកនិងពង្រីកទិន្នន័យពីទីតាំងដែលយើងបានចុះវាស់វែងរួច ដែលស្ថិតនៅជុំវិញនោះ។	ដូចជាការដឹងថាសីតុណ្ហភាពនៅភ្នំពេញគឺ ៣០អង្សា និងនៅកំពង់ចាម ៣២អង្សា រួចយើងអាចទាយថាសីតុណ្ហភាពនៅពាក់កណ្តាលផ្លូវ (ឧ. ស្កន់) គឺប្រហែល ៣១អង្សា។
Distance metric	រូបមន្តគណិតវិទ្យាដែលប្រើសម្រាប់វាស់ស្ទង់កម្រិតនៃភាពស្រដៀងគ្នា ឬភាពខុសគ្នា រវាងទិន្នន័យពីរ (ឧទាហរណ៍ ការគណនាភាពស្រដៀងគ្នានៃពណ៌ភីកសែលរូបភាពផ្កាយរណប និងទិន្នន័យវាលជាក់ស្តែង ដើម្បីរកមើលចំណុចដែលកៀកគ្នាបំផុត)។	ដូចជាការប្រើបន្ទាត់វាស់ចម្ងាយរវាងផ្ទះពីរថាតើវានៅជិតគ្នាឬឆ្ងាយពីគ្នាប៉ុណ្ណា ប៉ុន្តែនៅក្នុងទីនេះគឺវាស់ចម្ងាយនៃ "លក្ខណៈសម្បត្តិ ឬពណ៌" ជាជាងការវាស់ចម្ងាយផ្លូវដោយផ្ទាល់។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖