បញ្ហា (The Problem)៖ ការសិក្សានេះផ្តោតលើការស្រាវជ្រាវថាតើគេអាចទស្សន៍ទាយកម្ពស់ដំបូលព្រៃឈើ (canopy heights) លើផ្ទៃដីធំទូលាយបានដោយសុក្រឹតដែរឬទេ ដោយប្រើប្រាស់ប្រភពទិន្នន័យ Lidar តាមយន្តហោះដែលប្រមូលបានពីគម្រោងផ្សេងៗគ្នា និងមានប៉ារ៉ាម៉ែត្រមិនដូចគ្នា។
វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានប្រើប្រាស់វិធីសាស្ត្រផ្អែកលើតំបន់ (Area-based approach) ដោយរៀបចំម៉ូដែលទស្សន៍ទាយប្រៀបធៀបទិន្នន័យ Lidar ចម្រុះជាមួយនឹងទិន្នន័យវាស់វែងផ្ទាល់ពីដី។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Ordinary Least Squares (OLS) Linear Regression តំរែតំរង់លីនេអ៊ែរ OLS (ម៉ូដែលចម្បង) |
មានលក្ខណៈសាមញ្ញ ងាយស្រួលបកស្រាយ និងមិនសូវរងគ្រោះដោយបញ្ហា Overfitting ដែលធ្វើឲ្យវាស័ក្តិសមសម្រាប់ការអនុវត្តលើផ្ទៃដីធំទូលាយ។ | សន្មតថាទិន្នន័យមានទំនាក់ទំនងជាបន្ទាត់ត្រង់ (Linear) ដែលអាចនឹងមិនចាប់យកអន្តរកម្មស្មុគស្មាញរវាងកត្តាផ្សេងៗបានល្អនោះទេ។ | ទទួលបានតម្លៃ R^2 = 0.74 និងកម្រិតលម្អៀង RMSE = 3.0 ម៉ែត្រ។ |
| Random Forest (RF) Regression ក្បួនដោះស្រាយ Random Forest |
មានភាពរឹងមាំក្នុងការគ្រប់គ្រងអថេរច្រើន អាចចាប់យកទំនាក់ទំនងស្មុគស្មាញ និងល្អប្រសើរសម្រាប់ការវិភាគរកសារៈសំខាន់នៃអថេរ (Variable Importance)។ | មានលក្ខណៈជា "ប្រអប់ខ្មៅ" ដែលពិបាកបកស្រាយជាងសមីការលីនេអ៊ែរ និងទាមទារកម្លាំងម៉ាស៊ីនគណនាខ្ពស់ជាង។ | ទទួលបានកម្រិតលម្អៀងតូចជាងបន្តិច គឺ RMSE = 2.87 ម៉ែត្រ។ |
| Subset Model (High Homogeneity: CV < 0.2) ម៉ូដែល OLS លើតំបន់មានភាពស្មើគ្នាខ្ពស់ (CV < 0.2) |
កាត់បន្ថយកំហុសឆ្គងបានយ៉ាងច្រើន (ប្រមាណ ២០%) និងមានភាពសុក្រឹតខ្ពស់បំផុតសម្រាប់តំបន់ព្រៃដែលមានរចនាសម្ព័ន្ធស្មើគ្នាល្អ។ | អាចអនុវត្តបានតែលើសំណុំទិន្នន័យមួយផ្នែកប៉ុណ្ណោះ ដែលធ្វើឲ្យទំហំនៃការគ្របដណ្តប់រួមមានការថយចុះ។ | ទទួលបានតម្លៃ R^2 = 0.84 និងកម្រិតលម្អៀង RMSE = 2.44 ម៉ែត្រ។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារធនធានកុំព្យូទ័រ និងទិន្នន័យយ៉ាងច្រើនសន្ធឹកសន្ធាប់ ដោយសារត្រូវដំណើរការសំណុំទិន្នន័យកម្រិតខ្ពស់ និងគ្របដណ្តប់លើផ្ទៃដីធំ។
ការសិក្សានេះត្រូវបានធ្វើឡើងនៅតំបន់ភាគអាគ្នេយ៍នៃសហរដ្ឋអាមេរិក ដោយប្រើប្រាស់ទិន្នន័យ Lidar ដែលភាគច្រើនប្រមូលនៅរដូវស្លឹកឈើជ្រុះ (Leaf-off conditions)។ សម្រាប់ប្រទេសកម្ពុជា លក្ខណៈព្រៃឈើភាគច្រើនជាព្រៃត្រូពិច និងមានស្លឹកខៀវស្រងាត់ពេញមួយឆ្នាំ (Leaf-on) ដែលអាចធ្វើឲ្យការជ្រៀតចូលនៃកាំរស្មី Lidar ដល់ដីមានភាពខុសគ្នា និងទាមទារការកែសម្រួលម៉ូដែលប្រមាណកម្មឡើងវិញ។
វិធីសាស្ត្រនៃការចងក្រងទិន្នន័យ Lidar បែកខ្ញែកនេះ គឺមានប្រយោជន៍ និងស័ក្តិសមខ្លាំងណាស់សម្រាប់បរិបទប្រទេសកម្ពុជា ដែលជារឿយៗជួបប្រទះបញ្ហាកង្វះខាតទិន្នន័យពេញលេញទូទាំងប្រទេស។
ការទាញយកអត្ថប្រយោជន៍ពីទិន្នន័យ Lidar ដែលមានស្រាប់ពីស្ថាប័នចម្រុះ គឺជាដំណោះស្រាយដ៏ឆ្លាតវៃ និងសន្សំសំចៃខ្ពស់ក្នុងការធ្វើបញ្ជីសារពើភ័ណ្ឌព្រៃឈើទំនើបនៅកម្ពុជា។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Airborne Lidar | បច្ចេកវិទ្យាប្រើប្រាស់ការបាញ់ពន្លឺឡាស៊ែរពីលើយន្តហោះចុះមកផ្ទៃដី ដើម្បីវាស់ចម្ងាយនៃការចំណាំងផ្លាតត្រឡប់មកវិញ រួចបង្កើតជារូបភាពត្រីមាត្រ (3D) ដែលបង្ហាញពីរចនាសម្ព័ន្ធកម្ពស់ព្រៃឈើ និងដី។ | ដូចជាសត្វប្រចៀវបញ្ចេញសំឡេងខ្ទាតត្រឡប់មកវិញដើម្បីដឹងពីទីតាំងឧបសគ្គនៅខាងមុខ តែបច្ចេកវិទ្យានេះប្រើពន្លឺឡាស៊ែរជំនួសវិញ។ |
| Area-based approach | វិធីសាស្ត្រគណនាទិន្នន័យព្រៃឈើ ដោយបង្កើតទំនាក់ទំនងស្ថិតិរវាងទិន្នន័យក្នុងប្លង់ដីតូចៗដែលវាស់ផ្ទាល់ និងទិន្នន័យ Lidar រួចយកទំនាក់ទំនងនោះទៅអនុវត្តដើម្បីទស្សន៍ទាយលើផ្ទៃដីព្រៃធំទាំងមូល។ | ដូចជាការភ្លក់ទឹកស៊ុបមួយស្លាបព្រា ដើម្បីដឹងពីរសជាតិនៃទឹកស៊ុបមួយឆ្នាំងធំទាំងមូល។ |
| Wall-to-wall maps | ការបង្កើតផែនទីឌីជីថលដែលបង្ហាញពីព័ត៌មានជាក់លាក់ណាមួយ (ដូចជាកម្ពស់ដើមឈើ) គ្របដណ្តប់លើផ្ទៃដីតំបន់ណាមួយទាំងស្រុង និងបន្តជាប់គ្នាដោយគ្មានចន្លោះប្រហោង។ | ដូចជាការលាបថ្នាំពណ៌លើជញ្ជាំងផ្ទះឱ្យជិតទាំងអស់ដោយមិនបន្សល់ទុកកន្លែងទំនេរ សូម្បីតែមួយសង់ទីម៉ែត្រ។ |
| Distributional metrics | រង្វាស់ស្ថិតិដែលបង្ហាញពីរបាយកម្ពស់នៃចំណុច Lidar ទាំងអស់។ នៅក្នុងការសិក្សានេះ គេប្រើភាគរយទី ៨៥ (85th percentile) ដែលតំណាងឲ្យកម្ពស់ចំណុច Lidar ជិតដល់កំពូលដើមឈើ ដើម្បីទស្សន៍ទាយកម្ពស់ព្រៃ។ | ប្រសិនបើយើងតម្រៀបសិស្ស ១០០ នាក់តាមកម្ពស់ សិស្សទី ៨៥ គឺជាតំណាងកម្ពស់របស់ក្រុមសិស្សដែលខ្ពស់ៗ។ |
| Random Forest | ក្បួនដោះស្រាយបញ្ញាសិប្បនិម្មិត (Machine Learning) ដែលបង្កើតក្បួនកាត់សេចក្តីឬដើមឈើការសម្រេចចិត្ត (Decision Trees) ជាច្រើនបញ្ចូលគ្នា ដើម្បីធ្វើការទស្សន៍ទាយលទ្ធផលឱ្យកាន់តែសុក្រឹត និងរកមើលកត្តាដែលជះឥទ្ធិពលខ្លាំងជាងគេ។ | ដូចជាការសួរសំណួរទៅកាន់ទីប្រឹក្សា ១០០ នាក់ រួចយកចម្លើយដែលភាគច្រើនឯកភាពគ្នា ដើម្បីសម្រេចចិត្តចុងក្រោយ ជាជាងជឿលើមនុស្សតែម្នាក់។ |
| Co-registration error | កំហុសឆ្គងដែលកើតឡើងនៅពេលទីតាំងកូអរដោនេផែនដី (GPS) នៃប្លង់វាស់វែងផ្ទាល់នៅទីវាល និងទីតាំងទិន្នន័យ Lidar លើប្រព័ន្ធកុំព្យូទ័រ មិនត្រួតស៊ីគ្នាបេះបិទ ដែលធ្វើឲ្យការបង្រៀនម៉ូដែលខុសគោលដៅ។ | ដូចជាការពាក់អាវដែលឡេវនិងរន្ធឡេវមិនចំគ្នា ធ្វើឱ្យខុសទម្រង់ដើម និងវៀចវេរ។ |
| Coefficient of variation | រង្វាស់គណិតវិទ្យា (តាងដោយ CV) ប្រើសម្រាប់វាស់កម្រិតនៃភាពខុសគ្នា ឬភាពមិនស្មើគ្នានៃកម្ពស់រុក្ខជាតិនៅក្នុងប្លង់ដីមួយ។ តម្លៃ CV តូច មានន័យថាព្រៃមានកម្ពស់ស្មើៗគ្នា។ | ដូចជាការវាស់ស្ទង់មើលថាតើសក់នៅលើក្បាលមនុស្សម្នាក់មានប្រវែងស្មើគ្នា (ម៉ូដសក់ទាហាន) ឬខ្លីវែងរញ៉េរញ៉ៃ (សក់មិនបានកាត់)។ |
| Discrete-return | ប្រព័ន្ធម៉ាស៊ីន Lidar ដែលកត់ត្រាការចំណាំងផ្លាតនៃពន្លឺត្រឡប់មកវិញជាចំណុចដាច់ៗពីគ្នា (ឧទាហរណ៍ ពន្លឺមួយខ្សែបាញ់ប៉ះស្លឹកឈើខាងលើប៉ះមែកឈើកណ្តាល និងប៉ះដី នោះវានឹងកត់ត្រាជាចំណុច ៣ ផ្សេងគ្នា)។ | ដូចជាការគប់គ្រាប់បាល់កាត់សំណាញ់ ៣ ជាន់ ដែលយើងលឺសំឡេង "ប៉ឹប" ចំនួន ៣ ដងនៅពេលវាទម្លុះកាត់សំណាញ់នីមួយៗ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖