Original Title: Land Cover Mapping Using Remote Sensing Data
Source: doi.org/10.5923/j.ajgis.20200901.04
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការធ្វើផែនទីគម្របដីដោយប្រើប្រាស់ទិន្នន័យទូរយាន (Remote Sensing)

ចំណងជើងដើម៖ Land Cover Mapping Using Remote Sensing Data

អ្នកនិពន្ធ៖ Jwan Al-doski (Civil Department, Faculty of Engineering, Universiti Putra Malaysia), Shattri B. Mansor (Civil Department, Faculty of Engineering, Universiti Putra Malaysia), H'ng Paik San (Forest Production Department, Faculty of Forestry, Universiti Putra Malaysia), Zailani Khuzaimah (Civil Department, Faculty of Engineering, Universiti Putra Malaysia)

ឆ្នាំបោះពុម្ព៖ 2020 American Journal of Geographic Information System

វិស័យសិក្សា៖ Geographic Information Systems & Remote Sensing

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះរំលេចអំពីភាពស្មុគស្មាញ និងបញ្ហាប្រឈមក្នុងការធ្វើផែនទីគម្របដី (Land Cover Mapping) ពិសេសការជ្រើសរើសប្រភេទទិន្នន័យទូរយាន និងក្បួនដោះស្រាយចំណាត់ថ្នាក់រូបភាពដែលស័ក្តិសមដើម្បីសម្រេចបានភាពត្រឹមត្រូវខ្ពស់បំផុត។

វិធីសាស្ត្រ (The Methodology)៖ អត្ថបទនេះធ្វើការត្រួតពិនិត្យអក្សរសិល្ប៍ (Literature Review) យ៉ាងលម្អិតអំពីប្រភេទទិន្នន័យ បច្ចេកទេស និងកត្តាដែលមានឥទ្ធិពលលើប្រសិទ្ធភាពនៃការធ្វើចំណាត់ថ្នាក់រូបភាពពីចម្ងាយ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Parametric Classification Algorithms (e.g., Maximum Likelihood Classifier - MLC)
ក្បួនដោះស្រាយចំណាត់ថ្នាក់ប៉ារ៉ាម៉ែត្រ (ឧ. MLC)
មានភាពងាយស្រួលក្នុងការប្រើប្រាស់ និងមានជម្រើសច្រើននៅក្នុងកម្មវិធី GIS ទូទៅ។ ដំណើរការបានល្អនៅពេលដែលទិន្នន័យមានរបាយធម្មតា (Normal distribution)។ ទាមទារឱ្យទិន្នន័យគោរពតាមការសន្មត់នៃរបាយធម្មតា (Normal distribution assumption)។ ងាយរងឥទ្ធិពលពីកំហុសនៅពេលប្រើជាមួយទិន្នន័យចម្រុះប្រភព (Multi-source data)។ ភាពត្រឹមត្រូវជារួមអាចទាបជាងក្បួនដោះស្រាយមិនមែនប៉ារ៉ាម៉ែត្រពី ១០% ទៅ ២០% ប៉ុន្តែត្រូវបានកែលម្អពី ១% ទៅ ១០% នៅពេលមានការកែតម្រូវសណ្ឋានដី (Topographic correction)។
Non-parametric Classification Algorithms (e.g., Support Vector Machine - SVM, Random Forest, ANN)
ក្បួនដោះស្រាយចំណាត់ថ្នាក់មិនមែនប៉ារ៉ាម៉ែត្រ (ឧ. SVM, Random Forest, ANN)
មិនតម្រូវឱ្យទិន្នន័យមានរបាយធម្មតានោះទេ ហើយអាចដោះស្រាយទិន្នន័យពហុប្រភព (Multi-modal) និងទិន្នន័យដែលបាត់បង់បានយ៉ាងល្អ។ ផ្តល់ភាពត្រឹមត្រូវខ្ពស់ជាងមុនក្នុងការបែងចែកប្រភេទគម្របដី។ ត្រូវការពេលវេលាគណនាយូរជាង និងត្រូវការកម្លាំងកុំព្យូទ័រខ្លាំង។ ភាពត្រឹមត្រូវអាស្រ័យខ្លាំងទៅលើការកំណត់រចនាសម្ព័ន្ធ (User-defined parameters) ដូចជាប្រភេទ Kernel របស់ SVM ជាដើម។ ផ្តល់ភាពត្រឹមត្រូវខ្ពស់ជាងមុន (កើនពី ៨៨.៨៧% ទៅ ៩៦.៩៧% សម្រាប់ SVM ពេលបន្ថែមទិន្នន័យតំបន់ជិតខាង)។
Object-Based Image Analysis (OBIA)
ការវិភាគរូបភាពផ្អែកលើវត្ថុ (OBIA)
មានសមត្ថភាពខ្ពស់ក្នុងការកំណត់អត្តសញ្ញាណវត្ថុដែលមានទំហំតូចៗ និងមានរាងជាខ្សែ (Linear components)។ ផ្តល់លទ្ធផលល្អប្រសើរនៅពេលប្រើជាមួយរូបភាពកម្រិតច្បាស់ខ្ពស់ ដូចជា Sentinel-2។ ទាមទារឯកសាររូបភាពធំៗ ដែលធ្វើឱ្យការប្រព័ន្ធដំណើរការ (Processing time) ត្រូវចំណាយពេលយូរជាងការវិភាគផ្អែកលើភីកសែល (Pixel-based)។ សម្រេចបានភាពត្រឹមត្រូវប្រហែល ៨៧-៨៨% សម្រាប់ទិន្នន័យ Sentinel-2 និង Landsat 8 នៅក្នុងតំបន់ដីសើម (Wetland areas)។
Traditional Ground-Based Surveys
ការចុះអង្កេតប្រមូលទិន្នន័យផ្ទាល់នៅមូលដ្ឋាន (Ground-Based Data)
ផ្តល់នូវភាពត្រឹមត្រូវជាក់ស្តែងបំផុត (Ground truth) និងអាចប្រមូលទិន្នន័យលម្អិតដែលមិនអាចមើលឃើញពីលើអាកាសបាន។ ចាំបាច់សម្រាប់ធ្វើជាទិន្នន័យផ្ទៀងផ្ទាត់ (Reference data)។ ចំណាយថវិកា និងកម្លាំងពលកម្មច្រើន ព្រមទាំងចំណាយពេលយូរ។ ពិបាកអនុវត្តនៅក្នុងតំបន់ដែលពិបាកចូលទៅដល់ (ឧ. តំបន់ព្រៃក្រាស់ ឬភ្នំ)។ ត្រូវបានចាត់ទុកថាជាបច្ចេកទេសដ៏ល្អបំផុតសម្រាប់វាយតម្លៃភាពត្រឹមត្រូវ ប៉ុន្តែមិនស័ក្តិសមសម្រាប់ការធ្វើផែនទីក្នុងតំបន់ទូលំទូលាយនោះទេ។

ការចំណាយលើធនធាន (Resource Cost)៖ ការធ្វើផែនទីគម្របដីតម្រូវឱ្យមានការរួមបញ្ចូលគ្នានៃទិន្នន័យផ្កាយរណបឥតគិតថ្លៃ (ឬបង់ប្រាក់សម្រាប់កម្រិតច្បាស់ខ្ពស់) ជំនាញផ្នែករៀបចំទិន្នន័យបឋម និងកម្លាំងម៉ាស៊ីនកុំព្យូទ័រសម្រាប់ដំណើរការក្បួនដោះស្រាយដ៏ស្មុគស្មាញ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ឯកសារនេះគឺជាការត្រួតពិនិត្យអក្សរសិល្ប៍ (Literature Review) ដែលប្រមូលផ្តុំទិន្នន័យពីការសិក្សាជុំវិញពិភពលោក រួមមានតំបន់ត្រូពិចនៅប្រេស៊ីល ឥណ្ឌូនេស៊ី និងថៃ។ ការសិក្សាបានគូសបញ្ជាក់ថា នៅតំបន់ត្រូពិចដែលមានសំណើម វត្តមានពពកក្រាស់ជាឧបសគ្គដល់ការប្រមូលរូបភាពអុបទិក។ នេះមានសារៈសំខាន់ណាស់សម្រាប់ប្រទេសកម្ពុជា ដែលមានអាកាសធាតុស្រដៀងគ្នា និងទាមទារការប្រើប្រាស់បច្ចេកវិទ្យាបន្ថែមដូចជាប្រព័ន្ធ Radar ជាដើម។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកទេសបែងចែកចំណាត់ថ្នាក់មិនមែនប៉ារ៉ាម៉ែត្រ (Non-parametric algorithms) និងការប្រើប្រាស់ទិន្នន័យរួមបញ្ចូលគ្នា មានសក្តានុពលយ៉ាងធំធេងសម្រាប់ការតាមដានបរិស្ថាននៅកម្ពុជា។

ការអនុវត្តបច្ចេកទេសអភិវឌ្ឍន៍ថ្មីៗនេះ អាចជួយស្ថាប័នរដ្ឋ និងអង្គការនានានៅកម្ពុជា ទទួលបានផែនទីគម្របដីដែលទាន់សម័យ ត្រឹមត្រូវ និងសន្សំសំចៃខ្ពស់សម្រាប់រៀបចំផែនការអភិវឌ្ឍន៍ប្រកបដោយចីរភាព។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ជំហានទី១៖ ការស្វែងរក និងទាញយកទិន្នន័យផ្កាយរណប: អ្នកស្រាវជ្រាវគួរសិក្សាពីរបៀបទាញយកទិន្នន័យឥតគិតថ្លៃដូចជា Landsat 8 និង Sentinel-2 តាមរយៈ Google Earth Engine (GEE)Copernicus Open Access Hub
  2. ជំហានទី២៖ ការរៀបចំទិន្នន័យបឋម (Pre-processing): អនុវត្តការកែតម្រូវបរិយាកាស និងកែតម្រូវសណ្ឋានដី (Topographic & Atmospheric Correction) ជាពិសេសសម្រាប់តំបន់ភ្នំ នៅកម្ពុជា ដោយប្រើប្រាស់កម្មវិធី QGISSNAP ដើម្បីលុបបំបាត់ស្រមោលពពក និងកំហុសពន្លឺ។
  3. ជំហានទី៣៖ ការជ្រើសរើស និងដំណើរការក្បួនដោះស្រាយ: សរសេរកូដនៅក្នុង Python ដោយប្រើប្រាស់បណ្ណាល័យ scikit-learn ដើម្បីទាញយកអត្ថប្រយោជន៍ពីក្បួនដោះស្រាយ Support Vector Machine (SVM)Random Forest (RF) ជំនួសឱ្យការប្រើត្រឹម MLC ស្តង់ដារ។
  4. ជំហានទី៤៖ ការប្រមូលទិន្នន័យបណ្តុះបណ្តាល (Training Samples) និងការផ្ទៀងផ្ទាត់: កំណត់ទំហំសំណាកទិន្នន័យបណ្តុះបណ្តាល (យ៉ាងហោចណាស់ ៥០ ទៅ ១០០ ភីកសែលក្នុងមួយប្រភេទគម្របដី) និងធ្វើការវាយតម្លៃភាពត្រឹមត្រូវ (Accuracy Assessment) ដោយការគណនា Confusion Matrix និង Kappa Coefficient
  5. ជំហានទី៥៖ ការរួមបញ្ចូលទិន្នន័យរ៉ាដា (Radar/SAR) សម្រាប់រដូវវស្សា: នៅក្នុងលក្ខខណ្ឌអាកាសធាតុត្រូពិចដែលមានពពកច្រើននៃប្រទេសកម្ពុជា សិស្សគួរសិក្សាពីការបញ្ជូលទិន្នន័យ Sentinel-1 (SAR) បន្ថែមពីលើរូបភាពអុបទិក ដើម្បីជម្នះបញ្ហាពពកបាំង ដែលជួយឱ្យការបង្កើតផែនទីគម្របដីអាចប្រព្រឹត្តទៅបានពេញមួយឆ្នាំដោយរលូន។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Remote Sensing (RS) បច្ចេកវិទ្យាក្នុងការប្រមូលទិន្នន័យ និងព័ត៌មានអំពីផ្ទៃផែនដីពីចម្ងាយ (ជាទូទៅតាមរយៈឧបករណ៍បំពាក់លើផ្កាយរណប ឬយន្តហោះ) ដោយមិនមានការប៉ះផ្ទាល់ ប៉ុន្តែប្រើប្រាស់ការចាប់យកថាមពលចំណាំងផ្លាត ឬវិទ្យុសកម្មដែលភាយចេញពីផ្ទៃផែនដី។ ដូចជាការប្រើដ្រូនថតរូបពីលើអាកាស ដើម្បីមើលទិដ្ឋភាពរួមនៃភូមិមួយដោយមិនបាច់ដើរផ្ទាល់គ្រប់ច្រកល្ហក។
Support Vector Machine (SVM) ក្បួនដោះស្រាយចំណាត់ថ្នាក់ (Classification Algorithm) ប្រភេទមិនមែនប៉ារ៉ាម៉ែត្រក្នុងវិទ្យាសាស្ត្រកុំព្យូទ័រ ដែលមានសមត្ថភាពខ្ពស់ក្នុងការខណ្ឌចែកទិន្នន័យទៅជាក្រុមៗ ដោយស្វែងរកបន្ទាត់ព្រំដែន (Hyperplane) ដ៏ល្អបំផុត ទោះបីជាទិន្នន័យនោះមានភាពស្មុគស្មាញក៏ដោយ។ ដូចជាការគូសបន្ទាត់ព្រំដែនរវាងផ្លែប៉ោម និងផ្លែក្រូចនៅលើតុ ដោយព្យាយាមទុកគម្លាតឲ្យឆ្ងាយបំផុតពីផ្លែឈើទាំងពីរប្រភេទ ដើម្បីកុំឲ្យច្រឡំគ្នានៅពេលក្រោយ។
Maximum Likelihood Classifier (MLC) ក្បួនដោះស្រាយចំណាត់ថ្នាក់ប្រភេទប៉ារ៉ាម៉ែត្រ ដែលគណនាប្រូបាប៊ីលីតេ (Probability) នៃភីកសែលនីមួយៗនៅលើរូបភាព ថាតើវាគួរតែស្ថិតក្នុងប្រភេទគម្របដីណាមួយ ដោយផ្អែកលើការសន្មត់ថាទិន្នន័យមានរបាយធម្មតា (Normal distribution)។ ដូចជាការទាយមុខរបររបស់មនុស្សម្នាក់ដោយមើលលើឯកសណ្ឋាន ដោយសន្មត់ថាអ្នកពាក់អាវសភាគច្រើនជាគ្រូពេទ្យ។
Spatial Resolution ទំហំនៃផ្ទៃដីពិតប្រាកដដែលតំណាងដោយភីកសែល (Pixel) មួយនៅលើរូបភាពផ្កាយរណប។ កម្រិតច្បាស់ខ្ពស់ (High Spatial Resolution) មានន័យថាភីកសែលនីមួយៗតំណាងឲ្យផ្ទៃដីតូច (ឧ. ១ម៉ែត្រការ៉េ) ដែលធ្វើឲ្យរូបភាពអាចបង្ហាញព័ត៌មានបានកាន់តែលម្អិត។ ដូចជាទំហំនៃក្រឡាអុកតូចៗនៅលើផ្ទាំងគំនូរ បើក្រឡាកាន់តែតូច យើងអាចគូររូបភាពបានកាន់តែលម្អិត និងច្បាស់ល្អ។
Object-Based Image Analysis (OBIA) បច្ចេកទេសវិភាគរូបភាពពីចម្ងាយដោយមិនផ្តោតលើភីកសែលនីមួយៗដាច់ពីគ្នា តែធ្វើការប្រមូលផ្តុំភីកសែលដែលមានលក្ខណៈស្រដៀងគ្នា (ពណ៌ រូបរាង វាយនភាព) ទៅជាក្រុម ឬជា "វត្ថុ" (Objects) មុននឹងធ្វើចំណាត់ថ្នាក់។ ជំនួសឲ្យការផ្តោតមើលពណ៌នៃគ្រាប់ខ្សាច់នីមួយៗ វាប្រៀបដូចជាការមើលរូបរាងទាំងមូលនៃដុំថ្មមួយដុំ ដើម្បីដឹងថាវាជាអ្វី។
Non-parametric classification algorithms ប្រភេទក្បួនដោះស្រាយវាយតម្លៃចំណាត់ថ្នាក់ ដែលមិនទាមទារឲ្យទិន្នន័យគោរពតាមការសន្មត់នៃទម្រង់ស្ថិតិជាក់លាក់ណាមួយ (មិនសន្មត់ថាទិន្នន័យមានរបាយធម្មតា) ដែលធ្វើឲ្យវាអាចបត់បែន និងមានភាពត្រឹមត្រូវខ្ពស់ជាមួយទិន្នន័យចម្រុះប្រភព។ ដូចជាចុងភៅពូកែដែលអាចចម្អិនម្ហូបឆ្ងាញ់ៗបានដោយប្រើគ្រឿងផ្សំអ្វីក៏ដោយដែលមានស្រាប់ក្នុងទូទឹកកក ដោយមិនចាំបាច់មានសៀវភៅរូបមន្តធ្វើម្ហូប។
Topographic correction ដំណើរការផ្នែកទន់ក្នុងការកែតម្រូវទិន្នន័យរូបភាពផ្កាយរណប ដើម្បីលុបបំបាត់ឥទ្ធិពលនៃស្រមោល និងការប្រែប្រួលចំណាំងផ្លាត ដែលបណ្តាលមកពីភាពរដិបរដុបនៃសណ្ឋានដី (ដូចជាជ្រលងភ្នំ ឬជម្រាលភ្នំ)។ ដូចជាការប្រើកម្មវិធីកាត់តរូបភាព (Edit) ដើម្បីបំភ្លឺផ្ទៃមុខមនុស្សដែលថតរូបបញ្ច្រាសពន្លឺព្រះអាទិត្យឲ្យមើលឃើញច្បាស់មកវិញ។
Feature Extraction ដំណើរការនៃការបំប្លែង និងទាញយកលក្ខណៈពិសេសរបស់ទិន្នន័យរូបភាពពីទម្រង់ដើមទៅជាទម្រង់ថ្មី ដើម្បីទាញយកតែព័ត៌មានដែលចាំបាច់បំផុតក្នុងការវិភាគ និងកាត់បន្ថយទិន្នន័យដែលគ្មានប្រយោជន៍ (Noise)។ ដូចជាការកិនចម្រាញ់យកតែទឹកផ្លែឈើ និងវីតាមីនសុទ្ធចេញពីផ្លែឈើ ដោយច្រោះចោលនូវកាកសំណល់ ដើម្បីឲ្យងាយស្រួលបរិភោគ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖