បញ្ហា (The Problem)៖ ទីក្រុងហូជីមិញប្រឈមនឹងហានិភ័យខ្ពស់នៃការលិចទឹកដោយសារការប្រែប្រួលអាកាសធាតុ និងការកើនឡើងកម្ពស់ទឹកសមុទ្រ ដែលទាមទារឱ្យមានដំណោះស្រាយរហ័សទាន់ពេលវេលាដើម្បីវាយតម្លៃ និងគូសផែនទីហានិភ័យទឹកជំនន់។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានស្នើឡើងនូវក្របខ័ណ្ឌរួមបញ្ចូលគ្នារវាងទិន្នន័យប្រព័ន្ធព័ត៌មានភូមិសាស្ត្រ (GIS) ទិន្នន័យផ្កាយរណប និងបច្ចេកទេសរៀនដោយម៉ាស៊ីនដើម្បីវាយតម្លៃហានិភ័យទឹកជំនន់។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Random Forest (RF) ម៉ូដែលរៀនដោយម៉ាស៊ីន Random Forest |
ងាយស្រួល លឿន អាចដោះស្រាយទិន្នន័យធំៗបានល្អ និងមានភាពសុក្រឹតខ្ពស់បំផុតក្នុងការទស្សន៍ទាយចំណាត់ថ្នាក់ពហុកម្រិត។ | ទាមទារការកំណត់ប៉ារ៉ាម៉ែត្រកម្រិតខ្ពស់ (Hyperparameter tuning ដូចជា n_Estimator) ដើម្បីធានាបាននូវដំណើរការល្អបំផុត។ | ទទួលបានពិន្ទុ F1 ខ្ពស់បំផុតប្រហែល ០.៩៩ សម្រាប់គ្រប់កម្រិតហានិភ័យទឹកជំនន់។ |
| Neural Network (NN) បណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត |
មានសមត្ថភាពខ្ពស់ក្នុងការស្វែងរកទំនាក់ទំនងស្មុគស្មាញ និងពហុកម្រិតរវាងអថេរនៃទិន្នន័យ។ | ត្រូវការធនធានកុំព្យូទ័រខ្ពស់ និងពេលវេលាយូរក្នុងការបង្ហាត់ម៉ូដែល (Training time) បើធៀបនឹងម៉ូដែលសាមញ្ញដទៃទៀត។ | ទទួលបានពិន្ទុ F1 ល្អឥតខ្ចោះប្រហែល ០.៩៩ សម្រាប់រាល់កម្រិតហានិភ័យ (ខ្ពស់ មធ្យម និងទាប)។ |
| Support Vector Machine (SVM) ម៉ាស៊ីនវ៉ិចទ័រគាំទ្រ |
មានប្រសិទ្ធភាពក្នុងការបែងចែកទិន្នន័យដោយប្រើបន្ទាត់ព្រំដែន (Hyperplane) ក្នុងលំហទិន្នន័យពហុវិមាត្រ។ | ប្រសិទ្ធភាពអាចធ្លាក់ចុះនៅពេលប្រើជាមួយសំណុំទិន្នន័យធំខ្លាំង និងត្រូវការជ្រើសរើសមុខងារ Kernel ឱ្យបានត្រឹមត្រូវ។ | ទទួលបានពិន្ទុ F1 ចន្លោះពី ០.៩៧ ដល់ ០.៩៨ ។ |
| Naive Bayes (NB) ទ្រឹស្តីប្រូបាប៊ីលីតេ Naive Bayes |
ជាក្បួនដោះស្រាយសាមញ្ញ លឿន និងងាយស្រួលប្រើប្រាស់ជាមួយនឹងសំណុំទិន្នន័យធំៗ។ | ដំណើរការមិនល្អលើទិន្នន័យស្មុគស្មាញ ដោយសារការសន្មត់ថាអថេរទាំងអស់មិនមានទំនាក់ទំនងនឹងគ្នា ដែលនាំឱ្យបរាជ័យក្នុងការទាយកម្រិតហានិភ័យមធ្យម។ | ទទួលបានពិន្ទុ F1 ០.៩២ សម្រាប់ហានិភ័យខ្ពស់ ប៉ុន្តែបរាជ័យក្នុងការទស្សន៍ទាយហានិភ័យមធ្យម (F1 = ០.០០)។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះពឹងផ្អែកខ្លាំងលើការប្រើប្រាស់ប្រព័ន្ធពពក (Cloud Computing) និងទិន្នន័យផ្កាយរណបប្រភពបើកចំហ ប៉ុន្តែទាមទារទិន្នន័យវាស់ស្ទង់ផ្ទាល់ដី និងកម្មវិធីជំនាញពិសេស។
ការសិក្សានេះពឹងផ្អែកលើទិន្នន័យដែលប្រមូលបាននៅក្នុងតំបន់ទីក្រុងហូជីមិញ ដែលជាទីក្រុងមានការអភិវឌ្ឍន៍ខ្ពស់ ការស្រុតដីដោយសារបូមទឹកក្រោមដី និងលក្ខណៈភូមិសាស្ត្រជាប់សមុទ្រ។ ការយកម៉ូដែលនេះមកអនុវត្តផ្ទាល់នៅកម្ពុជាដោយមិនបានបង្ហាត់សារជាថ្មី (Retraining) ជាមួយទិន្នន័យក្នុងស្រុក នឹងធ្វើឱ្យលទ្ធផលមិនសុក្រឹត ព្រោះមូលហេតុនៃការលិចទឹកនៅកម្ពុជាអាចខុសគ្នា។
វិធីសាស្ត្ររួមបញ្ចូលបច្ចេកវិទ្យាអវកាស និងបញ្ញាសិប្បនិម្មិតនេះមានសក្តានុពលខ្ពស់ខ្លាំងណាស់សម្រាប់កម្ពុជាក្នុងការរៀបចំយុទ្ធសាស្ត្រឆ្លើយតបនឹងគ្រោះមហន្តរាយ។
ការប្រើប្រាស់ទិន្នន័យ Sentinel-1 រួមជាមួយ Machine Learning នឹងផ្តល់នូវប្រព័ន្ធប្រកាសអាសន្នទឹកជំនន់មុនពេលកំណត់ដ៏មានប្រសិទ្ធភាព និងចំណាយតិចសម្រាប់រដ្ឋាភិបាលកម្ពុជា។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Sentinel-1 | ជាប្រភេទផ្កាយរណបរ៉ាដា (SAR) ដែលអាចថតរូបភាពផ្ទៃដីបានទាំងយប់ទាំងថ្ងៃ និងអាចទម្លុះពពក ដោយបញ្ជូនរលកសញ្ញាវិទ្យុទៅប៉ះដីរួចត្រលប់មកវិញ ដើម្បីវាស់ស្ទង់តំបន់លិចទឹក ឬការស្រុតដី។ | ដូចជាសត្វប្រចៀវបញ្ចេញសំឡេងខ្ទាតប៉ះជញ្ជាំងដើម្បីដឹងទីតាំងវត្ថុ ទោះបីជាមើលមិនឃើញក៏ដោយ។ |
| Random Forest | ជាបច្ចេកទេសរៀនដោយម៉ាស៊ីន (Machine Learning) ដែលបង្កើត "ដើមឈើសម្រេចចិត្ត" ច្រើនរួមបញ្ចូលគ្នា ដើម្បីធ្វើការទស្សន៍ទាយចំណាត់ថ្នាក់ទិន្នន័យបានយ៉ាងសុក្រឹត (ឧ. ញែកតំបន់ហានិភ័យខ្ពស់ មធ្យម និងទាប)។ | ដូចជាការសួរសំណួរទៅកាន់មនុស្សមួយក្រុមធំ ហើយយកចម្លើយភាគច្រើនដើម្បីសម្រេចចិត្តចុងក្រោយ ជាជាងការជឿលើមនុស្សតែម្នាក់។ |
| Digital Elevation Model (DEM) | ជាគំរូទិន្នន័យកុំព្យូទ័រ 3D ដែលតំណាងឱ្យកម្ពស់នៃផ្ទៃដីធៀបនឹងនីវ៉ូទឹកសមុទ្រ (មិនរាប់បញ្ចូលអាគារ ឬដើមឈើ) ដែលគេប្រើដើម្បីវិភាគថាតើតំបន់ណាទាប និងងាយរងគ្រោះដោយទឹកជំនន់។ | ដូចជាការយកដីឥដ្ឋមកសូនជារូបរាងភ្នំ និងជ្រលង ដើម្បីមើលថាតើទឹកនឹងហូរទៅដក់នៅកន្លែងណាខ្លះ។ |
| InSAR (Interferometric Synthetic Aperture Radar) | ជាបច្ចេកទេសប្រៀបធៀបរូបភាពផ្កាយរណបរ៉ាដាពីពេលវេលាពីរខុសគ្នា ដើម្បីវាស់ស្ទង់បម្រែបម្រួលកម្ពស់ផ្ទៃដីក្នុងកម្រិតមិល្លីម៉ែត្រ ដូចជាការវាស់ស្ទង់អត្រាស្រុតចុះនៃដីទីក្រុងដោយសារការបូមទឹកក្រោមដី។ | ដូចជាការថតរូបទីតាំងតែមួយពីរបីដង ហើយយកមកដាក់ត្រួតស៊ីគ្នាដើម្បីពិនិត្យមើលថាតើមានផ្ទៃដីណាបានរំកិលចុះក្រោមឬទេ។ |
| Support Vector Machine (SVM) | ជាក្បួនដោះស្រាយផ្នែក Machine Learning ដែលស្វែងរកគូសបន្ទាត់ព្រំដែនដ៏ល្អបំផុត (Hyperplane) នៅក្នុងលំហទិន្នន័យពហុវិមាត្រ ដើម្បីបែងចែកប្រភេទចំណាត់ថ្នាក់ទិន្នន័យឱ្យដាច់ពីគ្នា។ | ដូចជាការគូសខ្សែបន្ទាត់មួយយ៉ាងប្រុងប្រយ័ត្ននៅលើទីលាន ដើម្បីបែងចែកក្រុមសិស្សពាក់អាវក្រហម និងអាវខៀវឱ្យនៅដាច់ពីគ្នាបានច្បាស់បំផុត។ |
| F1 Score | ជារង្វាស់នៃភាពសុក្រឹតរបស់ម៉ូដែល Machine Learning ដែលគណនារួមបញ្ចូលគ្នារវាង Precision (ភាពច្បាស់លាស់) និង Recall (សមត្ថភាពក្នុងការរកឃើញ) ដើម្បីវាយតម្លៃថាតើម៉ូដែលនោះទាយត្រូវកម្រិតណា។ | ដូចជាពិន្ទុវាយតម្លៃរួម ដែលមិនត្រឹមតែមើលលើចម្លើយត្រឹមត្រូវប៉ុណ្ណោះទេ តែថែមទាំងមើលថាតើសិស្សបានឆ្លើយគ្រប់សំណួរដែរឬទេ។ |
| Speckle noise removal | ដំណើរការផ្នែកទន់ (Software Process) ក្នុងការកាត់បន្ថយគ្រាប់អុចៗ ឬសំឡេងរំខាននៅក្នុងរូបភាពផ្កាយរណបរ៉ាដា ដើម្បីធ្វើឱ្យរូបភាពកាន់តែរលោង និងងាយស្រួលក្នុងការកំណត់ព្រំដែនផ្ទៃទឹក។ | ដូចជាការជូតកញ្ចក់វ៉ែនតាដែលប្រឡាក់ដោយគ្រាប់ធូលី ដើម្បីឱ្យយើងអាចមើលឃើញទិដ្ឋភាពខាងក្រៅបានច្បាស់។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖