បញ្ហា (The Problem)៖ ព័ត៌មានអំពីការប្រើប្រាស់ដីនិងគម្របដី (LULC) រួមទាំងគម្របព្រៃឈើ មានសារៈសំខាន់សម្រាប់ការរៀបចំផែនការ និងការគ្រប់គ្រងដីធ្លី ប៉ុន្តែការប្រើប្រាស់ទិន្នន័យផ្កាយរណបនៅក្នុងតំបន់ត្រូពិចតែងតែជួបប្រទះបញ្ហាប្រឈមដោយសារភាពស្មុគស្មាញនៃបរិស្ថាន ការបាំងដោយពពក និងសំណើមបរិយាកាស។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានធ្វើតេស្តសាកល្បងវិធីសាស្ត្រចំណាត់ថ្នាក់ចំនួនបួន ដោយប្រើប្រាស់រូបភាពផ្កាយរណប Sentinel-2 ក្នុងរដូវកាលផ្សេងៗគ្នា ដើម្បីបែងចែកប្រភេទការប្រើប្រាស់ដីនិងគម្របដីចំនួន ១១ នៅក្នុងខេត្ត Dak Nong ប្រទេសវៀតណាម។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Multinomial Logistic Regression (MLR) វិធីសាស្ត្រតំរែតំរង់ឡូជីស្ទីក (MLR) |
ជាវិធីសាស្ត្រ Parametric ស្តង់ដារដែលងាយស្រួលយល់ និងតែងតែប្រើជាគោលសម្រាប់ប្រៀបធៀបជាមួយវិធីសាស្ត្រផ្សេងៗ។ | ទទួលបានភាពត្រឹមត្រូវទាបជាងគេបំផុត (Least accurate) និងមិនសូវស័ក្តិសមសម្រាប់ធ្វើចំណាត់ថ្នាក់តំបន់ព្រៃត្រូពិចដែលមានភាពស្មុគស្មាញខ្ពស់នោះទេ។ | ភាពត្រឹមត្រូវរួម (Overall Accuracy) ទទួលបានត្រឹមតែ ៦៥.៩% និងមេគុណ Kappa ០.៦១១ ប៉ុណ្ណោះសម្រាប់ទិន្នន័យរូបភាពរដូវវស្សាបូកបញ្ចូលជាមួយរដូវប្រាំង (IMG 4)។ |
| Improved k-Nearest Neighbors (ik-NN) វិធីសាស្ត្រអ្នកជិតខាងកែលម្អ k (ik-NN) |
មានសមត្ថភាពអាចធ្វើបដិរូបកម្មទម្ងន់អថេរ (Variable weights) បានយ៉ាងល្អតាមរយៈការប្រើប្រាស់ Genetic Algorithms។ | ទាមទារកម្លាំងកុំព្យូទ័រខ្លាំងក្នុងការដំណើរការ Genetic algorithms ព្រមទាំងងាយនឹងជាប់នៅត្រឹមចំណុចប្រសើរបំផុតក្នុងតំបន់ (Local optimum)។ | ភាពត្រឹមត្រូវរួម (Overall Accuracy) ទទួលបាន ៧៤.៣% និងមេគុណ Kappa ០.៧៨១ សម្រាប់ទិន្នន័យ IMG 4។ |
| Support Vector Machine (SVM) ម៉ាស៊ីនវ៉ិចទ័រគាំទ្រ (SVM) |
ទទួលបានភាពត្រឹមត្រូវខ្ពស់បំផុត និងមានសមត្ថភាពដោះស្រាយព្រំដែនទិន្នន័យដែលមិនលីនេអ៊ែរ (Non-linear boundaries) តាមរយៈការប្រើ RBF Kernel។ | ចំណាយពេលវេលាយូរក្នុងការបង្វឹកម៉ូដែល (Computationally intensive) និងទាមទារការកំណត់ប៉ារ៉ាម៉ែត្ររចនាសម្ព័ន្ធ (C និង Gamma) ស្មុគស្មាញ។ | ទទួលបានលទ្ធផលល្អបំផុត ដោយមានភាពត្រឹមត្រូវរួម (Overall Accuracy) ៨០.៣% និងមេគុណ Kappa ០.៨១៣ សម្រាប់ទិន្នន័យ IMG 4។ |
| Random Forests (RF) វិធីសាស្ត្រព្រៃចៃដន្យ (RF) |
ងាយស្រួលក្នុងការបង្វឹក ចំណាយពេលគណនាតិចជាង SVM និងមានមុខងារសម្រាប់វាយតម្លៃសារៈសំខាន់នៃអថេរនីមួយៗ (Variable importance) បានយ៉ាងងាយ។ | ភាពត្រឹមត្រូវទាបជាង SVM បន្តិចតួច និងអាចមានដែនកំណត់ខ្លះនៅពេលដោះស្រាយជាមួយសំណុំទិន្នន័យដែលមិនមានតុល្យភាព (Imbalanced data) ខ្លាំង។ | ទទួលបានភាពត្រឹមត្រូវរួម (Overall Accuracy) ៨០.០% និងមេគុណ Kappa ០.៨០២ សម្រាប់ទិន្នន័យ IMG 4។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារធនធានកុំព្យូទ័រមធ្យមទៅខ្ពស់ និងជំនាញកូដក្នុងការរួមបញ្ចូលទិន្នន័យ Cloud Computing ជាមួយកម្មវិធីវិភាគទិន្នន័យក្នុងម៉ាស៊ីនកុំព្យូទ័រផ្ទាល់ (Local Machine)។
ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងខេត្ត Dak Nong ប្រទេសវៀតណាម ដែលជាតំបន់ខ្ពង់រាប មានអាកាសធាតុត្រូពិចមូសុង និងមានរដូវប្រាំងនិងរដូវវស្សាច្បាស់លាស់។ លក្ខខណ្ឌភូមិសាស្ត្រ ប្រភេទព្រៃឈើ និងដំណាំឧស្សាហកម្ម (កៅស៊ូ ស្វាយចន្ទី) នៅទីនោះ មានភាពស្រដៀងគ្នាខ្លាំងទៅនឹងតំបន់ឦសាន និងតំបន់ជួរភ្នំនៃប្រទេសកម្ពុជា ដែលធ្វើឱ្យរបកគំហើញនៃការស្រាវជ្រាវនេះមានតម្លៃខ្ពស់សម្រាប់ការយកមកអនុវត្តនៅកម្ពុជា។
វិធីសាស្ត្រនៃការរួមបញ្ចូលរូបភាពផ្កាយរណបពហុរដូវកាល (Multi-seasonal imagery) នេះគឺមានប្រយោជន៍ និងស័ក្តិសមបំផុតសម្រាប់កម្ពុជា ក្នុងការឆ្លើយតបទៅនឹងបញ្ហាពពកបាំងនៅរដូវវស្សា។
ការប្រើប្រាស់រូបភាពផ្កាយរណបឥតគិតថ្លៃ Sentinel-2 រួមជាមួយ Machine Learning ផ្តល់នូវដំណោះស្រាយដ៏រឹងមាំមួយក្នុងការធ្វើបច្ចុប្បន្នភាពផែនទីគម្របព្រៃឈើប្រចាំឆ្នាំរបស់កម្ពុជា ជំនួសឲ្យការចុះអង្កេតផ្ទាល់ដែលចំណាយពេលនិងថវិកាច្រើន។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Multitemporal Imagery | គឺជារូបភាពផ្កាយរណបដែលថតនៅទីតាំងដដែល ប៉ុន្តែនៅពេលវេលាឬរដូវកាលខុសៗគ្នា (ដូចជារដូវប្រាំង និងរដូវវស្សា)។ ការយកទិន្នន័យទាំងនេះមកត្រួតស៊ីគ្នា ជួយឱ្យកុំព្យូទ័រអាចតាមដានការប្រែប្រួលនៃរុក្ខជាតិ (ដូចជាការជ្រុះស្លឹកនៅរដូវប្រាំង) ដើម្បីញែកប្រភេទព្រៃឈើឬដំណាំដែលពិបាកមើលបំបែកនៅក្នុងរដូវតែមួយ។ | ដូចជាការថតរូបមនុស្សម្នាក់នៅពេលព្រឹក និងពេលយប់ ដើម្បីសិក្សាពីទម្លាប់នៃការផ្លាស់ប្តូរសម្លៀកបំពាក់របស់គាត់ប្រចាំថ្ងៃ។ |
| Support Vector Machine (SVM) | ជាក្បួនដោះស្រាយ (Algorithm) នៃម៉ាស៊ីនរៀន (Machine Learning) ដែលព្យាយាមគូសបន្ទាត់ ឬប្លង់ (Hyperplane) ដ៏ល្អបំផុតដើម្បីខណ្ឌចែកចំណុចទិន្នន័យ (Data points) ផ្សេងៗគ្នា ឱ្យនៅដាច់ពីគ្នាបានឆ្ងាយបំផុត។ វាយកមកប្រើដើម្បីបែងចែកភិចសែលប្រភេទដីនិងព្រៃឈើ ដោយផ្អែកលើទម្រង់ចំណាំងផ្លាតនៃពន្លឺ។ | ដូចជាការយកបន្ទាត់ទៅគូសខណ្ឌនៅកណ្តាលរវាងក្រុមគ្រាប់ឃ្លីពណ៌ក្រហម និងពណ៌ខៀវ ដើម្បីបែងចែកពួកវាឱ្យដាច់ស្រឡះពីគ្នាយ៉ាងច្បាស់លាស់។ |
| Random Forests (RF) | ជាវិធីសាស្ត្រចំណាត់ថ្នាក់ដែលបង្កើតជា "មែកធាងការសម្រេចចិត្ត" (Decision Trees) ជាច្រើន ហើយឱ្យមែកធាងទាំងនោះបោះឆ្នោតរួមគ្នាដើម្បីសម្រេចថា តើភិចសែល (Pixel) មួយនៃរូបភាពផ្កាយរណប គួរតែចាត់ចូលជាប្រភេទដីអ្វី (ឧទាហរណ៍៖ ជាព្រៃស្រោង ឬជាចម្ការកៅស៊ូ)។ | ដូចជាការសួរសំណួរទៅកាន់អ្នកជំនាញ១០០នាក់ ដើម្បីបោះឆ្នោតយករចម្លើយដែលភាគច្រើនឯកភាពគ្នា ជំនួសឱ្យការជឿលើចម្លើយរបស់មនុស្សតែម្នាក់។ |
| Confusion matrix | ជាតារាងស្ថិតិដែលប្រើសម្រាប់តម្រៀបនិងប្រៀបធៀបលទ្ធផលចំណាត់ថ្នាក់ដែលកុំព្យូទ័រទាយបាន ទៅនឹងទិន្នន័យពិតជាក់ស្តែងនៅលើដី (Ground truth)។ វាជួយបង្ហាញប្រាប់ថាតើម៉ូដែលទាយត្រូវប៉ុន្មានភាគរយ ហើយច្រឡំប្រភេទដីណាខ្លះចូលគ្នាជាញឹកញាប់។ | ដូចជាតារាងកត់ពិន្ទុសិស្សប្រឡង ដែលប្រៀបធៀបចម្លើយសិស្សរើស ទៅនឹងកូនសោរចម្លើយរបស់គ្រូ ដើម្បីវិភាគថាសិស្សតែងតែឆ្លើយខុស (ច្រឡំ) នៅសំណួរប្រភេទណាខ្លះ។ |
| Kappa coefficient | ជារង្វាស់ស្ថិតិដែលវាស់ស្ទង់ភាពត្រឹមត្រូវនៃម៉ូដែលចំណាត់ថ្នាក់ ដោយបានកាត់កងដកចេញនូវភាពត្រឹមត្រូវទាំងឡាយណាដែលកើតឡើងដោយសារភាពចៃដន្យ (Random chance)។ លទ្ធផលរឹតតែកៀកលេខ ១ មានន័យថាម៉ូដែលនោះកាន់តែអាចទុកចិត្តបានខ្ពស់។ | ដូចជារង្វាស់ដែលវាយតម្លៃថាតើសិស្សប្រឡងជាប់ដោយសារសមត្ថភាពចេះពិតប្រាកដ ឬជាប់ដោយសារតែការលួចទាយចម្លើយត្រូវដោយចៃដន្យ។ |
| Bidirectional reflectance distribution function (BRDF) | ជារូបមន្តគណិតវិទ្យាដ៏ស្មុគស្មាញដែលប្រើសម្រាប់កែតម្រូវតម្លៃចំណាំងផ្លាតពន្លឺព្រះអាទិត្យពីរូបភាពផ្កាយរណប ដោយសារតែពន្លឺអាចជះមកនិងផ្លាតទៅវិញខុសៗគ្នា អាស្រ័យលើមុំរបស់ព្រះអាទិត្យ និងទីតាំងមុំរបស់កាមេរ៉ាផ្កាយរណបនៅពេលថត។ | ដូចជាការប្រើកម្មវិធីកែពណ៌រូបថតដែលថតបញ្ច្រាសពន្លឺព្រះអាទិត្យ ឱ្យមើលទៅឃើញច្បាស់និងមានពណ៌ធម្មតាដូចរូបដែលថតស្របពន្លឺវិញ។ |
| Topographic correction | គឺជាដំណើរការកែតម្រូវឥទ្ធិពលនៃស្រមោលភ្នំ និងសណ្ឋានដីរដិបរដុបលើរូបភាពផ្កាយរណប។ វាជួយសម្រួលតម្លៃពណ៌នៃភិចសែល ដើម្បីកុំឱ្យផ្នែកព្រៃឈើដែលស្ថិតក្នុងទីងងឹត (ជម្រាលភ្នំបាំងពន្លឺ) ត្រូវបានកុំព្យូទ័រចាត់ថ្នាក់ខុសថាជាប្រភេទដីផ្សេង ឬជាទឹក។ | ដូចជាការប្រើភ្លើងពិលបញ្ចាំងបន្ថែមទៅលើកន្លែងដែលងងឹត (ស្រមោល) នៅក្នុងរូបថត ដើម្បីឱ្យគេអាចមើលឃើញវត្ថុនៅទីនោះបានច្បាស់ និងមានពណ៌ដូចទីកន្លែងដែលមានពន្លឺធម្មតា។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖