Original Title: Deep Learning and Machine Learning Models for Landslide Susceptibility Mapping with Remote Sensing Data
Source: doi.org/10.3390/rs15194703
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ម៉ូដែល Deep Learning និង Machine Learning សម្រាប់ការគូសផែនទីភាពងាយរងគ្រោះដោយការរអិលបាក់ដី ដោយប្រើទិន្នន័យពីចម្ងាយ (Remote Sensing)

ចំណងជើងដើម៖ Deep Learning and Machine Learning Models for Landslide Susceptibility Mapping with Remote Sensing Data

អ្នកនិពន្ធ៖ Muhammad Afaq Hussain (School of Computer Science, China University of Geosciences), Zhanlong Chen (School of Computer Science, China University of Geosciences), Ying Zheng (Ningbo Alatu Digital Science and Technology Corporation Limited), Yulong Zhou (School of Geography and Information Engineering, China University of Geosciences), Hamza Daud (Badong National Observation and Research Station of Geohazards, China University of Geosciences)

ឆ្នាំបោះពុម្ព៖ 2023, Remote Sensing (MDPI)

វិស័យសិក្សា៖ Remote Sensing & Geohazards

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ផ្លូវហាយវេ Karakoram (KKH) ងាយរងគ្រោះយ៉ាងខ្លាំងដោយគ្រោះមហន្តរាយធម្មជាតិ ជាពិសេសការរអិលបាក់ដី ដោយសារស្ថានភាពភូមិសាស្ត្រស្មុគស្មាញ។ ការសិក្សានេះដោះស្រាយបញ្ហាតម្រូវការក្នុងការធ្វើបច្ចុប្បន្នភាពបញ្ជីរអិលបាក់ដី និងការគូសផែនទីភាពងាយរងគ្រោះដោយការរអិលបាក់ដី (Landslide Susceptibility Mapping) ដើម្បីកាត់បន្ថយហានិភ័យនៅតាមបណ្តោយផ្លូវយុទ្ធសាស្ត្រនេះ។

វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះរួមបញ្ចូលគ្នានូវបច្ចេកវិទ្យាវិភាគទិន្នន័យពីចម្ងាយ (Remote Sensing) និងប្រព័ន្ធព័ត៌មានភូមិសាស្ត្រ (GIS) ជាមួយនឹងក្បួនដោះស្រាយ Machine Learning (ML) និង Deep Learning (DL) កម្រិតខ្ពស់ ដើម្បីវិភាគកត្តាបណ្ដាលឱ្យមានការរអិលបាក់ដី និងបង្កើតម៉ូដែលព្យាករណ៍កម្រិតខ្ពស់។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Convolutional Neural Network (CNN 2D)
បណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត 2D
មានសមត្ថភាពខ្ពស់ក្នុងការទាញយកលក្ខណៈពិសេសពីទិន្នន័យពហុវិមាត្រ (Spatial recognition) និងការពារបញ្ហា Overfitting តាមរយៈ Dropout layer។ ទាមទារទិន្នន័យហ្វឹកហាត់ក្នុងទំហំធំ និងត្រូវចំណាយពេលបំលែងទិន្នន័យពីទម្រង់ 1D ទៅជា 2D Matrix។ ទទួលបានភាពត្រឹមត្រូវខ្ពស់ជាងគេបំផុត ដោយតម្លៃ AUC ស្មើនឹង ៨២.៥៦%។
Recurrent Neural Network (RNN)
បណ្ដាញសរសៃប្រសាទវិលជុំ
មានប្រសិទ្ធភាពខ្ពស់ក្នុងការវិភាគទិន្នន័យដែលមានលក្ខណៈជាលំដាប់លំដោយពេលវេលា (Sequential data) តាមរយៈ Recurrent connection។ ដំណើរការហ្វឹកហាត់មានភាពស្មុគស្មាញ និងយឺតយ៉ាវ ព្រមទាំងប្រឈមនឹងបញ្ហា Gradient។ ទទួលបានភាពត្រឹមត្រូវលំដាប់ទី២ ដោយតម្លៃ AUC ស្មើនឹង ៧៩.៤៣%។
Extreme Gradient Boosting (XGBoost)
ក្បួនដោះស្រាយ Machine Learning ប្រភេទ XGBoost
ដំណើរការលឿន អាចដោះស្រាយទិន្នន័យដែលបាត់បង់បានល្អ និងមានប្រព័ន្ធការពារការ Overfitting (Regularization)។ ផ្ដល់លទ្ធផលត្រឹមត្រូវទាបជាងម៉ូដែល Deep Learning បន្តិច សម្រាប់ករណីសិក្សាដែលមានទិន្នន័យភូមិសាស្ត្រស្មុគស្មាញ។ ទទួលបានភាពត្រឹមត្រូវលំដាប់ទី៣ ដោយតម្លៃ AUC ស្មើនឹង ៧៦.០៤%។
Random Forest (RF)
ក្បួនដោះស្រាយ Random Forest
មានភាពរឹងមាំទប់ទល់នឹងបញ្ហាទិន្នន័យមិនស្មើគ្នា និងទិន្នន័យដែលទាក់ទងគ្នាខ្លាំង (Multicollinear) ដោយមិនចាំបាច់កែប្រែទម្រង់ទិន្នន័យឡើយ។ ដំណើរការវិភាគស៊ីពេលយូរជាងគេ (Time-consuming process)។ ទទួលបានភាពត្រឹមត្រូវទាបជាងគេ ដោយតម្លៃ AUC ស្មើនឹង ៧៥.៣៧%។

ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះទាមទារធនធានកុំព្យូទ័រ និងទិន្នន័យច្រើន ដោយសារការប្រើប្រាស់រូបភាពផ្កាយរណប InSAR រួមជាមួយការហ្វឹកហាត់ម៉ូដែល Deep Learning។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងនៅតាមបណ្តោយផ្លូវ Karakoram Highway ក្បែរប្រទេសប៉ាគីស្ថាន ដែលជាតំបន់ភ្នំមានសណ្ឋានដីស្មុគស្មាញ និង៩០%នៃតំបន់បាក់ដីមិនមានរុក្ខជាតិដុះ (Barren land)។ សម្រាប់ប្រទេសកម្ពុជា តំបន់ប្រឈមការរអិលបាក់ដីដូចជាជួរភ្នំក្រវាញមានព្រៃឈើក្រាស់ ដែលអាចធ្វើឱ្យការប្រើប្រាស់បច្ចេកវិទ្យា C-band InSAR ជួបការលំបាកដោយសារបញ្ហា Decorrelation។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកទេសស្រាវជ្រាវនេះមានសក្តានុពលខ្ពស់ក្នុងការយកមកអនុវត្តសម្រាប់ការវាយតម្លៃហានិភ័យរអិលបាក់ដីនៅកម្ពុជា ជាពិសេសនៅតំបន់ខ្ពង់រាប និងតំបន់ភ្នំក្បែរផ្លូវជាតិ។

ដើម្បីអនុវត្តវិធីសាស្ត្រនេះនៅកម្ពុជាឲ្យមានប្រសិទ្ធភាព គេចាំបាច់ត្រូវកែសម្រួលម៉ូដែលដោយផ្តោតជាចម្បងលើទិន្នន័យកម្រិតទឹកភ្លៀង និងភាពក្រាស់នៃព្រៃឈើ ដែលជាកត្តាជំរុញដ៏សំខាន់នៅក្នុងបរិបទភូមិសាស្ត្រកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ប្រមូលទិន្នន័យផ្កាយរណប និងទិន្នន័យភូមិសាស្ត្រមូលដ្ឋាន: ចាប់ផ្តើមទាញយកទិន្នន័យកម្ពស់ ALOS-PALSAR DEM ព្រមទាំងទិន្នន័យផ្កាយរណបឥតគិតថ្លៃ Sentinel-1 (SAR) និង Sentinel-2 (Optical) ពី Alaska Satellite Facility (ASF)Copernicus Data Space សម្រាប់តំបន់គោលដៅ។
  2. វិភាគទិន្នន័យចលនាដីដោយបច្ចេកទេស InSAR: ប្រើប្រាស់កម្មវិធី SNAP (ESA)SARPROZ ដើម្បីដំណើរការទិន្នន័យ Sentinel-1 តាមវិធីសាស្ត្រ SBAS-InSAR និង PS-InSAR ក្នុងគោលបំណងកំណត់ល្បឿននៃការបំលាស់ទីនៃផ្ទៃដី (Deformation Velocity) និងកត់ត្រាទីតាំងមានហានិភ័យ។
  3. រៀបចំកត្តាបង្កការរអិលបាក់ដី (Conditioning Factors): ប្រើប្រាស់កម្មវិធី ArcGISQGIS ដើម្បីបង្កើតស្រទាប់ទិន្នន័យចំនួន ១៥ (ឧទាហរណ៍៖ ជម្រាលដី, ប្រភេទដី, ទឹកភ្លៀង, ចម្ងាយពីផ្លូវ) ដោយកំណត់ទំហំភីកសែលឲ្យដូចគ្នាទាំងអស់ (ឧទាហរណ៍៖ 12.5m x 12.5m) រួចធ្វើតេស្ត Multicollinearity (VIF/TOL)
  4. អភិវឌ្ឍ និងហ្វឹកហាត់ម៉ូដែល Deep Learning: សរសេរកូដក្នុងកម្មវិធី Python ដោយប្រើប្រាស់បណ្ណាល័យ TensorFlowPyTorch ដើម្បីបង្កើតម៉ូដែល CNN-2D ដោយត្រូវបំលែងទិន្នន័យ 1D ទៅជា 2D Matrix។ បន្ទាប់មក បែងចែកទិន្នន័យ 70% សម្រាប់ហ្វឹកហាត់ (Training) និង 30% សម្រាប់ធ្វើតេស្ត (Testing)។
  5. វាយតម្លៃម៉ូដែល និងបង្កើតផែនទីរអិលបាក់ដី: ផ្ទៀងផ្ទាត់ភាពត្រឹមត្រូវនៃម៉ូដែលដោយប្រើប្រាស់ខ្សែកោង ROC-AUC។ បន្ទាប់ពីជ្រើសរើសម៉ូដែលដែលល្អជាងគេ (ឧ. CNN-2D) ត្រូវបញ្ចេញលទ្ធផលទៅក្នុង GIS ដើម្បីគូសផែនទីចំណាត់ថ្នាក់ហានិភ័យ Landslide Susceptibility Mapping (LSM) ជា ៥ កម្រិត (ពីទាបបំផុត ទៅខ្ពស់បំផុត)។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Interferometric Synthetic Aperture Radar (InSAR) បច្ចេកវិទ្យាប្រើប្រាស់រលកសញ្ញាពីរ៉ាដារបស់ផ្កាយរណប ដើម្បីវាស់ស្ទង់ការផ្លាស់ប្តូរ ឬការខូចទ្រង់ទ្រាយនៃផ្ទៃដីក្នុងកម្រិតមីលីម៉ែត្រ ដោយប្រៀបធៀបរូបភាពដែលថតនៅពេលវេលាខុសគ្នាពីទីតាំងដដែល។ ដូចជាការថតរូបផ្ទះរបស់អ្នកពីរដងក្នុងពេលខុសគ្នា រួចយកវាមកត្រួតស៊ីគ្នាដើម្បីរកមើលស្នាមប្រេះតូចៗនៅលើជញ្ជាំងដែលភ្នែកទទេមើលមិនឃើញ។
Landslide Susceptibility Mapping (LSM) ដំណើរការនៃការបង្កើតផែនទីដែលបង្ហាញពីកម្រិតហានិភ័យ ឬតំបន់ដែលងាយនឹងរងគ្រោះដោយការរអិលបាក់ដីនៅថ្ងៃអនាគត ដោយផ្អែកលើការវិភាគកត្តាភូមិសាស្ត្ររួមបញ្ចូលគ្នា (ដូចជា ភាពចោតនៃជម្រាល ប្រភេទថ្ម និងបរិមាណទឹកភ្លៀង)។ ដូចជាការធ្វើផែនទីព្យាករណ៍អាកាសធាតុប្រចាំតំបន់ ប៉ុន្តែជំនួសឲ្យការព្យាករណ៍ភ្លៀង គឺយើងព្យាករណ៍ថាកន្លែងណាខ្លះមានឱកាសបាក់ដីខ្ពស់ជាងគេ។
Convolutional Neural Network (CNN 2D) ជាម៉ូដែលបញ្ញាសិប្បនិម្មិត (Deep Learning) មួយប្រភេទដែលពូកែខាងវិភាគទិន្នន័យជារូបភាព ឬម៉ាទ្រីស២វិមាត្រ ដោយវាមានសមត្ថភាពទាញយកលក្ខណៈពិសេសៗ (Features) ពីបណ្តុំទិន្នន័យភូមិសាស្ត្រ ដើម្បីធ្វើការទស្សន៍ទាយទីតាំងបាក់ដីយ៉ាងសុក្រឹត។ ដូចជាគ្រូពេទ្យឯកទេសថតកាំរស្មីអ៊ិច (X-ray) ដែលសម្លឹងមើលផ្ទាំងរូបភាពដើម្បីរកមើលចំណុចខុសប្រក្រតីនៃជំងឺ ដោយផ្តោតលើតំបន់នីមួយៗនៃរូបភាពនោះយ៉ាងល្អិតល្អន់។
Persistent Scatterer InSAR (PS-InSAR) ជាបច្ចេកទេសបំបែកមួយរបស់ InSAR ដែលផ្តោតលើការតាមដានតែចំណុចឆ្លុះបញ្ចាំងរលករ៉ាដាដែលនៅថេរល្អ (ដូចជា ផ្ទាំងថ្មធំៗ ឬអគារ) ដើម្បីវាស់ស្ទង់ល្បឿននៃការបំលាស់ទីផ្ទៃដីក្នុងរយៈពេលយូរ ទោះស្ថិតក្នុងតំបន់ដែលមានអាកាសធាតុប្រែប្រួលក៏ដោយ។ ដូចជាការលាបថ្នាំពណ៌ក្រហមចំណាំលើផ្ទាំងថ្មមួយ រួចតាមដានមើលតែផ្ទាំងថ្មនោះជារៀងរាល់ខែ ដើម្បីដឹងថាដីនៅទីនោះកំពុងរអិលចុះក្រោមឬអត់។
Multicollinearity បាតុភូតនៅក្នុងការវិភាគស្ថិតិដែលអថេរឯករាជ្យពីរ ឬច្រើន (ឧទាហរណ៍ កត្តាបង្កការបាក់ដីដូចជា រយៈកម្ពស់ និង សីតុណ្ហភាព) មានទំនាក់ទំនងគ្នាខ្លាំងពេក ដែលធ្វើឲ្យម៉ូដែលទស្សន៍ទាយមានការភាន់ច្រឡំ និងគណនាខុស។ ដូចជាការជួលមនុស្សពីរនាក់ដែលមានជំនាញនិងគំនិតដូចគ្នាបេះបិទឲ្យមកដោះស្រាយបញ្ហាតែមួយ ដែលធ្វើឲ្យខាតថវិកាហើយមិនទទួលបានគំនិតអ្វីថ្មីឡើយ។
Receiver Operating Characteristic (ROC) ជារង្វាស់ម៉ែត្រ (គិតជាក្រាហ្វិក) សម្រាប់វាស់ស្ទង់សមត្ថភាព និងភាពត្រឹមត្រូវរបស់ម៉ូដែល Machine Learning ក្នុងការបែងចែករវាងតំបន់ដែលមានហានិភ័យ និងគ្មានហានិភ័យបាក់ដី។ តម្លៃផ្ទៃក្រោមខ្សែកោង (AUC) កាន់តែខិតជិត 1 មានន័យថាម៉ូដែលកាន់តែមានភាពសុក្រឹតខ្ពស់។ ដូចជាសន្លឹកពិន្ទុប្រឡងបញ្ចប់ឆមាសរបស់សិស្សអញ្ចឹងដែរ បើសិស្សធ្វើលំហាត់ត្រូវច្រើន (ទស្សន៍ទាយត្រូវ) នោះពិន្ទុ AUC នឹងខ្ពស់ ហើយបញ្ជាក់ថាសិស្សនោះពិតជាពូកែមែន។
Line-of-sight (LOS) displacement រង្វាស់នៃការផ្លាស់ទីរបស់វត្ថុមួយនៅលើដី (ស្រុតចុះ ឬងើបឡើង) ដែលវាស់តាមខ្សែបន្ទាត់ត្រង់រវាងទីតាំងផ្កាយរណបនៅលើមេឃ និងចំណុចគោលដៅនៅលើផែនដី ជំនួសឲ្យការវាស់តាមទិសដៅខ្សែបន្ទាត់ផ្តេក ឬបញ្ឈរធម្មតា។ ដូចជាអ្នកឈរលើផ្ទះជាន់ទី៣ ហើយទាញខ្សែម៉ែត្រវាស់តម្រង់ទៅរកឡានដែលចតនៅដីខាងក្រោម ដើម្បីដឹងថាឡាននោះកំពុងរំកិលចេញឆ្ងាយ ឬរំកិលចូលមកជិតអ្នក។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖