Original Title: Land Use/Land Cover Mapping Using Multitemporal Sentinel-2 Imagery and Four Classification Methods—A Case Study from Dak Nong, Vietnam
Source: doi.org/10.3390/rs12091367
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការគូសផែនទីការប្រើប្រាស់ដី/គម្របដីដោយប្រើប្រាស់រូបភាព Sentinel-2 ពហុពេលវេលា និងវិធីសាស្ត្រចំណាត់ថ្នាក់ចំនួនបួន — ការសិក្សាករណីនៅខេត្ត Dak Nong ប្រទេសវៀតណាម

ចំណងជើងដើម៖ Land Use/Land Cover Mapping Using Multitemporal Sentinel-2 Imagery and Four Classification Methods—A Case Study from Dak Nong, Vietnam

អ្នកនិពន្ធ៖ Huong Thi Thanh Nguyen (Tay Nguyen University), Trung Minh Doan (Tay Nguyen University), Erkki Tomppo (Aalto University / University of Helsinki), Ronald E. McRoberts (Raspberry Ridge Analytics)

ឆ្នាំបោះពុម្ព៖ 2020, Remote Sensing

វិស័យសិក្សា៖ Remote Sensing

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ព័ត៌មានអំពីការប្រើប្រាស់ដីនិងគម្របដី (LULC) រួមទាំងគម្របព្រៃឈើ មានសារៈសំខាន់សម្រាប់ការរៀបចំផែនការ និងការគ្រប់គ្រងដីធ្លី ប៉ុន្តែការប្រើប្រាស់ទិន្នន័យផ្កាយរណបនៅក្នុងតំបន់ត្រូពិចតែងតែជួបប្រទះបញ្ហាប្រឈមដោយសារភាពស្មុគស្មាញនៃបរិស្ថាន ការបាំងដោយពពក និងសំណើមបរិយាកាស។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានធ្វើតេស្តសាកល្បងវិធីសាស្ត្រចំណាត់ថ្នាក់ចំនួនបួន ដោយប្រើប្រាស់រូបភាពផ្កាយរណប Sentinel-2 ក្នុងរដូវកាលផ្សេងៗគ្នា ដើម្បីបែងចែកប្រភេទការប្រើប្រាស់ដីនិងគម្របដីចំនួន ១១ នៅក្នុងខេត្ត Dak Nong ប្រទេសវៀតណាម។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Multinomial Logistic Regression (MLR)
វិធីសាស្ត្រតំរែតំរង់ឡូជីស្ទីក (MLR)
ជាវិធីសាស្ត្រ Parametric ស្តង់ដារដែលងាយស្រួលយល់ និងតែងតែប្រើជាគោលសម្រាប់ប្រៀបធៀបជាមួយវិធីសាស្ត្រផ្សេងៗ។ ទទួលបានភាពត្រឹមត្រូវទាបជាងគេបំផុត (Least accurate) និងមិនសូវស័ក្តិសមសម្រាប់ធ្វើចំណាត់ថ្នាក់តំបន់ព្រៃត្រូពិចដែលមានភាពស្មុគស្មាញខ្ពស់នោះទេ។ ភាពត្រឹមត្រូវរួម (Overall Accuracy) ទទួលបានត្រឹមតែ ៦៥.៩% និងមេគុណ Kappa ០.៦១១ ប៉ុណ្ណោះសម្រាប់ទិន្នន័យរូបភាពរដូវវស្សាបូកបញ្ចូលជាមួយរដូវប្រាំង (IMG 4)។
Improved k-Nearest Neighbors (ik-NN)
វិធីសាស្ត្រអ្នកជិតខាងកែលម្អ k (ik-NN)
មានសមត្ថភាពអាចធ្វើបដិរូបកម្មទម្ងន់អថេរ (Variable weights) បានយ៉ាងល្អតាមរយៈការប្រើប្រាស់ Genetic Algorithms។ ទាមទារកម្លាំងកុំព្យូទ័រខ្លាំងក្នុងការដំណើរការ Genetic algorithms ព្រមទាំងងាយនឹងជាប់នៅត្រឹមចំណុចប្រសើរបំផុតក្នុងតំបន់ (Local optimum)។ ភាពត្រឹមត្រូវរួម (Overall Accuracy) ទទួលបាន ៧៤.៣% និងមេគុណ Kappa ០.៧៨១ សម្រាប់ទិន្នន័យ IMG 4។
Support Vector Machine (SVM)
ម៉ាស៊ីនវ៉ិចទ័រគាំទ្រ (SVM)
ទទួលបានភាពត្រឹមត្រូវខ្ពស់បំផុត និងមានសមត្ថភាពដោះស្រាយព្រំដែនទិន្នន័យដែលមិនលីនេអ៊ែរ (Non-linear boundaries) តាមរយៈការប្រើ RBF Kernel។ ចំណាយពេលវេលាយូរក្នុងការបង្វឹកម៉ូដែល (Computationally intensive) និងទាមទារការកំណត់ប៉ារ៉ាម៉ែត្ររចនាសម្ព័ន្ធ (C និង Gamma) ស្មុគស្មាញ។ ទទួលបានលទ្ធផលល្អបំផុត ដោយមានភាពត្រឹមត្រូវរួម (Overall Accuracy) ៨០.៣% និងមេគុណ Kappa ០.៨១៣ សម្រាប់ទិន្នន័យ IMG 4។
Random Forests (RF)
វិធីសាស្ត្រព្រៃចៃដន្យ (RF)
ងាយស្រួលក្នុងការបង្វឹក ចំណាយពេលគណនាតិចជាង SVM និងមានមុខងារសម្រាប់វាយតម្លៃសារៈសំខាន់នៃអថេរនីមួយៗ (Variable importance) បានយ៉ាងងាយ។ ភាពត្រឹមត្រូវទាបជាង SVM បន្តិចតួច និងអាចមានដែនកំណត់ខ្លះនៅពេលដោះស្រាយជាមួយសំណុំទិន្នន័យដែលមិនមានតុល្យភាព (Imbalanced data) ខ្លាំង។ ទទួលបានភាពត្រឹមត្រូវរួម (Overall Accuracy) ៨០.០% និងមេគុណ Kappa ០.៨០២ សម្រាប់ទិន្នន័យ IMG 4។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារធនធានកុំព្យូទ័រមធ្យមទៅខ្ពស់ និងជំនាញកូដក្នុងការរួមបញ្ចូលទិន្នន័យ Cloud Computing ជាមួយកម្មវិធីវិភាគទិន្នន័យក្នុងម៉ាស៊ីនកុំព្យូទ័រផ្ទាល់ (Local Machine)។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងខេត្ត Dak Nong ប្រទេសវៀតណាម ដែលជាតំបន់ខ្ពង់រាប មានអាកាសធាតុត្រូពិចមូសុង និងមានរដូវប្រាំងនិងរដូវវស្សាច្បាស់លាស់។ លក្ខខណ្ឌភូមិសាស្ត្រ ប្រភេទព្រៃឈើ និងដំណាំឧស្សាហកម្ម (កៅស៊ូ ស្វាយចន្ទី) នៅទីនោះ មានភាពស្រដៀងគ្នាខ្លាំងទៅនឹងតំបន់ឦសាន និងតំបន់ជួរភ្នំនៃប្រទេសកម្ពុជា ដែលធ្វើឱ្យរបកគំហើញនៃការស្រាវជ្រាវនេះមានតម្លៃខ្ពស់សម្រាប់ការយកមកអនុវត្តនៅកម្ពុជា។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនៃការរួមបញ្ចូលរូបភាពផ្កាយរណបពហុរដូវកាល (Multi-seasonal imagery) នេះគឺមានប្រយោជន៍ និងស័ក្តិសមបំផុតសម្រាប់កម្ពុជា ក្នុងការឆ្លើយតបទៅនឹងបញ្ហាពពកបាំងនៅរដូវវស្សា។

ការប្រើប្រាស់រូបភាពផ្កាយរណបឥតគិតថ្លៃ Sentinel-2 រួមជាមួយ Machine Learning ផ្តល់នូវដំណោះស្រាយដ៏រឹងមាំមួយក្នុងការធ្វើបច្ចុប្បន្នភាពផែនទីគម្របព្រៃឈើប្រចាំឆ្នាំរបស់កម្ពុជា ជំនួសឲ្យការចុះអង្កេតផ្ទាល់ដែលចំណាយពេលនិងថវិកាច្រើន។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ការទាញយក និងសម្អាតទិន្នន័យរូបភាព (Data Pre-processing): ប្រើប្រាស់ Google Earth Engine (GEE) ដើម្បីទាញយករូបភាព Sentinel-2 ពេញមួយឆ្នាំសម្រាប់តំបន់សិក្សា រួចសរសេរកូដដើម្បីលុបពពក និងស្រមោលពពក (Cloud & Shadow Masking) ក៏ដូចជាកែតម្រូវសណ្ឋានដី។
  2. ប្រមូលទិន្នន័យទីតាំងជាក់ស្តែង (Ground Truth Data Collection): ប្រើប្រាស់ Google Earth Pro ឬរូបភាពដローン រួមផ្សំជាមួយទិន្នន័យវាល (Field Surveys) ដើម្បីចង្អុលបង្ហាញកូអរដោនេ (GPS points) សម្រាប់ប្រភេទដីនីមួយៗ (ឧទាហរណ៍ ព្រៃស្រោង ចម្ការកៅស៊ូ ផ្ទៃទឹក) ដើម្បីត្រៀមសម្រាប់បង្វឹកម៉ូដែល។
  3. បង្កើតរូបភាពពហុរដូវកាល (Seasonal Compositing): ប្រើប្រាស់ GEE ដដែល ដើម្បីបំបែកនិងបង្កើតរូបភាពសង្ខេប (Median Composite) ចំនួនពីរ គឺសម្រាប់រដូវប្រាំង និងរដូវវស្សា បន្ទាប់មកដាក់បញ្ចូលវាជាន់គ្នា (Layer Stacking) ដើម្បីបង្កើតជាទិន្នន័យអថេររួម (IMG 4) សម្រាប់ដោះស្រាយភាពស្រដៀងគ្នានៃការផ្លាស់ប្តូរពណ៌ស្លឹកឈើ។
  4. ការបង្វឹកម៉ូដែល Machine Learning (Model Training): នាំចេញ (Export) ទិន្នន័យទៅកាន់កុំព្យូទ័រ រួចប្រើប្រាស់កម្មវិធី R (randomForest package)Python (scikit-learn) ដើម្បីបង្វឹកម៉ូដែល Random Forest (RF) ដោយសារវាចំណាយពេលតិចជាង និងងាយស្រួលកំណត់ប៉ារ៉ាម៉ែត្រជាង SVM។
  5. វាយតម្លៃភាពត្រឹមត្រូវ និងគូសផែនទី (Accuracy Assessment & Mapping): ប្រើប្រាស់សំណុំទិន្នន័យផ្ទៀងផ្ទាត់ (Validation dataset) ដែលបំបែកចេញពី Ground Truth មកធ្វើការគណនា ម៉ាទ្រីសភាពច្របូកច្របល់ (Confusion Matrix) រកមើលសូចនាករ Overall Accuracy (OA) និង Kappa មុននឹងសម្រេចនាំចេញជាផែនទី LULC ផ្លូវការដោយប្រើ QGISArcGIS

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Multitemporal Imagery គឺជារូបភាពផ្កាយរណបដែលថតនៅទីតាំងដដែល ប៉ុន្តែនៅពេលវេលាឬរដូវកាលខុសៗគ្នា (ដូចជារដូវប្រាំង និងរដូវវស្សា)។ ការយកទិន្នន័យទាំងនេះមកត្រួតស៊ីគ្នា ជួយឱ្យកុំព្យូទ័រអាចតាមដានការប្រែប្រួលនៃរុក្ខជាតិ (ដូចជាការជ្រុះស្លឹកនៅរដូវប្រាំង) ដើម្បីញែកប្រភេទព្រៃឈើឬដំណាំដែលពិបាកមើលបំបែកនៅក្នុងរដូវតែមួយ។ ដូចជាការថតរូបមនុស្សម្នាក់នៅពេលព្រឹក និងពេលយប់ ដើម្បីសិក្សាពីទម្លាប់នៃការផ្លាស់ប្តូរសម្លៀកបំពាក់របស់គាត់ប្រចាំថ្ងៃ។
Support Vector Machine (SVM) ជាក្បួនដោះស្រាយ (Algorithm) នៃម៉ាស៊ីនរៀន (Machine Learning) ដែលព្យាយាមគូសបន្ទាត់ ឬប្លង់ (Hyperplane) ដ៏ល្អបំផុតដើម្បីខណ្ឌចែកចំណុចទិន្នន័យ (Data points) ផ្សេងៗគ្នា ឱ្យនៅដាច់ពីគ្នាបានឆ្ងាយបំផុត។ វាយកមកប្រើដើម្បីបែងចែកភិចសែលប្រភេទដីនិងព្រៃឈើ ដោយផ្អែកលើទម្រង់ចំណាំងផ្លាតនៃពន្លឺ។ ដូចជាការយកបន្ទាត់ទៅគូសខណ្ឌនៅកណ្តាលរវាងក្រុមគ្រាប់ឃ្លីពណ៌ក្រហម និងពណ៌ខៀវ ដើម្បីបែងចែកពួកវាឱ្យដាច់ស្រឡះពីគ្នាយ៉ាងច្បាស់លាស់។
Random Forests (RF) ជាវិធីសាស្ត្រចំណាត់ថ្នាក់ដែលបង្កើតជា "មែកធាងការសម្រេចចិត្ត" (Decision Trees) ជាច្រើន ហើយឱ្យមែកធាងទាំងនោះបោះឆ្នោតរួមគ្នាដើម្បីសម្រេចថា តើភិចសែល (Pixel) មួយនៃរូបភាពផ្កាយរណប គួរតែចាត់ចូលជាប្រភេទដីអ្វី (ឧទាហរណ៍៖ ជាព្រៃស្រោង ឬជាចម្ការកៅស៊ូ)។ ដូចជាការសួរសំណួរទៅកាន់អ្នកជំនាញ១០០នាក់ ដើម្បីបោះឆ្នោតយករចម្លើយដែលភាគច្រើនឯកភាពគ្នា ជំនួសឱ្យការជឿលើចម្លើយរបស់មនុស្សតែម្នាក់។
Confusion matrix ជាតារាងស្ថិតិដែលប្រើសម្រាប់តម្រៀបនិងប្រៀបធៀបលទ្ធផលចំណាត់ថ្នាក់ដែលកុំព្យូទ័រទាយបាន ទៅនឹងទិន្នន័យពិតជាក់ស្តែងនៅលើដី (Ground truth)។ វាជួយបង្ហាញប្រាប់ថាតើម៉ូដែលទាយត្រូវប៉ុន្មានភាគរយ ហើយច្រឡំប្រភេទដីណាខ្លះចូលគ្នាជាញឹកញាប់។ ដូចជាតារាងកត់ពិន្ទុសិស្សប្រឡង ដែលប្រៀបធៀបចម្លើយសិស្សរើស ទៅនឹងកូនសោរចម្លើយរបស់គ្រូ ដើម្បីវិភាគថាសិស្សតែងតែឆ្លើយខុស (ច្រឡំ) នៅសំណួរប្រភេទណាខ្លះ។
Kappa coefficient ជារង្វាស់ស្ថិតិដែលវាស់ស្ទង់ភាពត្រឹមត្រូវនៃម៉ូដែលចំណាត់ថ្នាក់ ដោយបានកាត់កងដកចេញនូវភាពត្រឹមត្រូវទាំងឡាយណាដែលកើតឡើងដោយសារភាពចៃដន្យ (Random chance)។ លទ្ធផលរឹតតែកៀកលេខ ១ មានន័យថាម៉ូដែលនោះកាន់តែអាចទុកចិត្តបានខ្ពស់។ ដូចជារង្វាស់ដែលវាយតម្លៃថាតើសិស្សប្រឡងជាប់ដោយសារសមត្ថភាពចេះពិតប្រាកដ ឬជាប់ដោយសារតែការលួចទាយចម្លើយត្រូវដោយចៃដន្យ។
Bidirectional reflectance distribution function (BRDF) ជារូបមន្តគណិតវិទ្យាដ៏ស្មុគស្មាញដែលប្រើសម្រាប់កែតម្រូវតម្លៃចំណាំងផ្លាតពន្លឺព្រះអាទិត្យពីរូបភាពផ្កាយរណប ដោយសារតែពន្លឺអាចជះមកនិងផ្លាតទៅវិញខុសៗគ្នា អាស្រ័យលើមុំរបស់ព្រះអាទិត្យ និងទីតាំងមុំរបស់កាមេរ៉ាផ្កាយរណបនៅពេលថត។ ដូចជាការប្រើកម្មវិធីកែពណ៌រូបថតដែលថតបញ្ច្រាសពន្លឺព្រះអាទិត្យ ឱ្យមើលទៅឃើញច្បាស់និងមានពណ៌ធម្មតាដូចរូបដែលថតស្របពន្លឺវិញ។
Topographic correction គឺជាដំណើរការកែតម្រូវឥទ្ធិពលនៃស្រមោលភ្នំ និងសណ្ឋានដីរដិបរដុបលើរូបភាពផ្កាយរណប។ វាជួយសម្រួលតម្លៃពណ៌នៃភិចសែល ដើម្បីកុំឱ្យផ្នែកព្រៃឈើដែលស្ថិតក្នុងទីងងឹត (ជម្រាលភ្នំបាំងពន្លឺ) ត្រូវបានកុំព្យូទ័រចាត់ថ្នាក់ខុសថាជាប្រភេទដីផ្សេង ឬជាទឹក។ ដូចជាការប្រើភ្លើងពិលបញ្ចាំងបន្ថែមទៅលើកន្លែងដែលងងឹត (ស្រមោល) នៅក្នុងរូបថត ដើម្បីឱ្យគេអាចមើលឃើញវត្ថុនៅទីនោះបានច្បាស់ និងមានពណ៌ដូចទីកន្លែងដែលមានពន្លឺធម្មតា។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖