បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហានៃការវាយតម្លៃ និងការគូសផែនទីហានិភ័យនៃការបាក់ដីនៅក្នុងតំបន់ភ្នំដែលមានអាកាសធាតុស្ងួតនៃភាគខាងត្បូងប្រទេសប៉េរូ ដោយសារភាពស្មុគស្មាញក្នុងការព្យាករណ៍ពីគ្រោះមហន្តរាយនេះនៅកម្រិតតំបន់។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់វិធីសាស្ត្រចម្រុះដោយរួមបញ្ចូលទិន្នន័យពីផ្កាយរណប និងការវាស់ស្ទង់ផ្ទាល់ ដើម្បីបង្កើតនិងវាយតម្លៃម៉ូដែលបញ្ញាសិប្បនិម្មិត (Machine Learning) សម្រាប់ស្វែងរកតំបន់ងាយរងគ្រោះ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Individual Models (KNN & ANN) ម៉ូដែលទោល K-Nearest Neighbors (KNN) និង Artificial Neural Network (ANN) |
មានសមត្ថភាពខ្ពស់បំផុតក្នុងការទស្សន៍ទាយ ដោយប្រើប្រាស់កត្តាជះឥទ្ធិពលត្រឹមតែ ៥ ប៉ុណ្ណោះ ដែលជួយកាត់បន្ថយភាពស្មុគស្មាញនៃម៉ូដែល។ | មិនបង្ហាញពីការកើនឡើងសមត្ថភាពទស្សន៍ទាយនោះទេ នៅពេលបន្ថែមចំនួនកត្តាជះឥទ្ធិពលច្រើនជាងនេះ។ | ទទួលបានរង្វាស់ AUC ប្រមាណ ០.៨៦ ទៅ ០.៨៧ និងភាពត្រឹមត្រូវរួម (Overall Accuracy) ៧៨% ទៅ ៧៩%។ |
| Individual Models (RF, RTF, & C5.0) ម៉ូដែលទោល Random Forest (RF), Rotation Forest (RTF) និង C5.0 |
មានភាពសុក្រឹតខ្ពស់បំផុត និងបង្ហាញពីការកើនឡើងសមត្ថភាពនៅពេលដំណើរការជាមួយសំណុំទិន្នន័យអថេរច្រើន (២៤ កត្តា)។ | ទាមទារទិន្នន័យច្រើន រយៈពេលគណនាយូរ និងបង្កហានិភ័យ Overfitting ដោយសារភាពស្មុគស្មាញនៃម៉ូដែល។ | ទទួលបានរង្វាស់ AUC រហូតដល់ ០.៩០ ទៅ ០.៩៣ និងភាពត្រឹមត្រូវរួម (Overall Accuracy) ៨២% ទៅ ៨៤%។ |
| Ensemble ML Models (KNN+RTF, KNN+ANN, ANN+RTF) ការផ្គុំបញ្ចូលម៉ូដែលចម្រុះ (KNN+RTF, KNN+ANN, ANN+RTF) |
ផ្តល់ស្ថិរភាព និងរក្សាលំនឹងសមត្ថភាពទស្សន៍ទាយខ្ពស់ ទោះបីប្រើត្រឹម ៥ កត្តាជះឥទ្ធិពល កាត់បន្ថយភាពលម្អៀងរវាងម៉ូដែលទោល។ | ត្រូវការពេលវេលា និងធនធានគណនាច្រើនជាងម៉ូដែលទោល ដោយសារត្រូវដំណើរការម៉ូដែលជាច្រើនបញ្ចូលគ្នាក្នុងពេលតែមួយ។ | ទទួលបានរង្វាស់ឱកាសកំណត់ការបាក់ដីត្រឹមត្រូវ (Sensitivity) ០.៧២ ទៅ ០.៧៣ និង AUC ០.៨៦ ដែលល្អប្រសើរបំផុតសម្រាប់ការអនុវត្តជាក់ស្តែង។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះពឹងផ្អែកលើទិន្នន័យផ្កាយរណបឥតគិតថ្លៃ និងការចុះវាស់ស្ទង់ទីតាំងផ្ទាល់ ដែលទាមទារឲ្យមានកុំព្យូទ័រមានសមត្ថភាពមធ្យមទៅខ្ពស់ដើម្បីរៀបចំនិងដំណើរការម៉ូដែលបញ្ញាសិប្បនិម្មិត។
ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងតំបន់ភ្នំដែលមានអាកាសធាតុស្ងួត (Arid mountainous terrain) នៃភាគខាងត្បូងប្រទេសប៉េរូ។ លក្ខខណ្ឌភូមិសាស្ត្រនេះខុសប្លែកពីប្រទេសកម្ពុជាដែលជាតំបន់ត្រូពិចមានសីតុណ្ហភាពក្តៅសើម និងមានភ្លៀងធ្លាក់ខ្លាំង។ គម្លាតនៃទិន្នន័យនេះមានសារៈសំខាន់ ពីព្រោះកត្តាជះឥទ្ធិពលមួយចំនួន (ដូចជាវិទ្យុសកម្មព្រះអាទិត្យ) អាចនឹងមិនសូវសំខាន់សម្រាប់កម្ពុជា ខណៈដែលរបាយទឹកភ្លៀង និងសំណើមដី អាចមានឥទ្ធិពលលើសលប់។
ទោះបីជាលក្ខខណ្ឌអាកាសធាតុមានភាពខុសគ្នាក៏ដោយ ក្របខណ្ឌនៃវិធីសាស្ត្រប្រើប្រាស់ Ensemble Machine Learning និងរូបភាពផ្កាយរណបនេះ គឺមានសារៈប្រយោជន៍ខ្លាំងណាស់សម្រាប់ការអនុវត្តនៅកម្ពុជា។
ជារួម ការរៀបចំប្រព័ន្ធម៉ូដែលឆ្លាតវៃ (Ensemble Models) សម្រាប់ផែនទីបាក់ដីនេះ នឹងផ្តល់លទ្ធភាពឲ្យរដ្ឋាភិបាលកម្ពុជាកាត់បន្ថយគ្រោះថ្នាក់ និងរៀបចំយុទ្ធសាស្ត្រកាត់បន្ថយហានិភ័យបានកាន់តែប្រសើរ ដោយប្រើប្រាស់ធនធានតិចលើការវាស់ស្ទង់ផ្ទាល់។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Ensemble Machine Learning | ជាវិធីសាស្ត្ររួមបញ្ចូលម៉ូដែលបញ្ញាសិប្បនិម្មិត (Machine Learning Models) ចាប់ពីពីរឬច្រើនចូលគ្នា ដើម្បីធ្វើការទស្សន៍ទាយរួមគ្នា ដែលជួយកាត់បន្ថយកំហុសឆ្គង និងបង្កើនភាពត្រឹមត្រូវជាងការប្រើម៉ូដែលតែមួយឯកឯង។ | ដូចជាការសួរមតិពីក្រុមគ្រូពេទ្យជំនាញជាច្រើននាក់ ដើម្បីធ្វើរោគវិនិច្ឆ័យជំងឺមួយឲ្យបានច្បាស់លាស់ ជាជាងជឿលើគ្រូពេទ្យតែម្នាក់។ |
| Ensemble Feature Selection (EFS) | ជាបច្ចេកទេសប្រើប្រាស់រូបមន្តស្ថិតិចម្រុះដើម្បីចម្រាញ់ និងជ្រើសរើសយកតែកត្តាជះឥទ្ធិពលណាដែលសំខាន់បំផុត (ឧទាហរណ៍៖ កម្រិតចំណោតភ្នំ) និងកាត់ចោលទិន្នន័យដែលមិនចាំបាច់ ដើម្បីឲ្យម៉ូដែលកុំព្យូទ័រដំណើរការលឿននិងមិនស្មុគស្មាញ។ | ដូចជាការរែងយកតែគ្រាប់អង្ករល្អបំផុត និងបោះចោលអង្កាម ឬកម្ទេចកំទី មុននឹងយកទៅដាំបាយដើម្បីទទួលបានបាយឆ្ងាញ់។ |
| Landslide Influencing Factors (LIFs) | ជាបណ្តុំនៃអថេរ ឬកត្តាធម្មជាតិផ្សេងៗ (ដូចជា ភាពចំណោតនៃដី សំណើម កម្ពស់ របាយទឹកភ្លៀង និងប្រភេទថ្ម) ដែលត្រូវបានប្រើជាទិន្នន័យបញ្ចូល (Input) សម្រាប់ឲ្យកុំព្យូទ័រវិភាគរកកន្លែងដែលអាចនឹងមានហានិភ័យបាក់ដី។ | ដូចជាគ្រឿងផ្សំ (អំបិល ស្ករ ប៊ីចេង) ដែលយើងត្រូវដឹងអត្រាសមាមាត្រដើម្បីទស្សន៍ទាយថាសម្លមួយមុខនឹងមានរសជាតិយ៉ាងណា។ |
| Multicollinearity | ជាបាតុភូតស្ថិតិដែលកើតឡើងនៅពេលអថេរឯករាជ្យពីរ ឬច្រើនមានទំនាក់ទំនងគ្នាខ្លាំងពេក (ផ្តល់ព័ត៌មានជាន់គ្នា) ដែលធ្វើឲ្យម៉ូដែលកុំព្យូទ័រមានការភាន់ច្រឡំក្នុងការវាយតម្លៃឥទ្ធិពលពិតប្រាកដរបស់អថេរនីមួយៗក្នុងការវិភាគហានិភ័យ។ | ដូចជាការពាក់នាឡិកាដៃពីរដែលមានម៉ោងដូចគ្នាបេះបិទ ដែលវាមិនបានផ្តល់ព័ត៌មានអ្វីថ្មីបន្ថែម ក្រៅពីធ្វើឲ្យធ្ងន់ដៃនោះទេ។ |
| Area Under Curve (AUC) | ជារង្វាស់ស្ថិតិសម្រាប់វាយតម្លៃសមត្ថភាពរបស់ម៉ូដែល ដោយវាស់ស្ទង់ថាវាកំពុងបែងចែកដាច់ស្រឡះរវាង "តំបន់មានបាក់ដី" និង "តំបន់មិនបាក់ដី" បានល្អកម្រិតណា ដោយពិន្ទុកាន់តែជិតលេខ ១ គឺកាន់តែល្អ និងលេខ ០.៥ គឺស្មើនឹងការទាយស្មានសំណាង។ | ដូចជាពិន្ទុប្រឡងបញ្ចប់ឆមាសរបស់សិស្ស ដែលពិន្ទុកាន់តែខ្ពស់ បញ្ជាក់ថាសិស្សនោះមានសមត្ថភាពសរសេរចម្លើយបានត្រឹមត្រូវកាន់តែច្រើន។ |
| Topographical Wetness Index (TWI) | ជាសន្ទស្សន៍វាស់ស្ទង់សក្តានុពលនៃការដក់ទឹក ឬភាពសើមនៃដីនៅក្នុងតំបន់ណាមួយ ដោយគណនាផ្អែកលើទម្រង់រាងនៃសណ្ឋានដី និងភាពចំណោត ដែលវាជាកត្តាសំខាន់បំផុតមួយធ្វើឲ្យដីចុះខ្សោយ និងរអិលបាក់ស្រុត។ | ដូចជាការពិនិត្យមើលរាងផតនៃបាតខ្ទះ ដើម្បីដឹងថាពេលចាក់ប្រេងចូល ប្រេងនឹងហូរទៅដក់ប្រមូលផ្តុំនៅត្រង់ចំណុចណាខ្លាំងជាងគេ។ |
| K-Nearest Neighbors (KNN) | ជាក្បួនដោះស្រាយ (Algorithm) ដែលទស្សន៍ទាយលក្ខណៈរបស់ទីតាំងថ្មីមួយ (ថាតើវានឹងបាក់ដីឬអត់) ដោយពឹងផ្អែកលើការប្រៀបធៀបភាពស្រដៀងគ្នាទៅនឹងលក្ខណៈនៃទីតាំងចាស់ៗដែលនៅក្បែរវាបំផុត។ | ដូចជាការទស្សន៍ទាយអត្តចរិត និងចំណង់ចំណូលចិត្តរបស់មនុស្សម្នាក់ ដោយសង្កេតមើលទៅលើអត្តចរិតរបស់មិត្តភក្តិជិតស្និទ្ធបំផុតរបស់គាត់។ |
| Overfitting | ជាបញ្ហាដែលកើតឡើងនៅពេលម៉ូដែលបញ្ញាសិប្បនិម្មិតទន្ទេញចាំទិន្នន័យសម្រាប់ហ្វឹកហាត់ (Training Data) ខ្លាំងពេក រហូតដល់បាត់បង់ភាពបត់បែន និងមិនអាចទស្សន៍ទាយទិន្នន័យថ្មីៗក្នុងស្ថានភាពជាក់ស្តែងបានត្រឹមត្រូវ។ | ដូចជាសិស្សដែលទន្ទេញចាំវិញ្ញាសាចាស់ៗឡើងស្ទាត់មាត់ ប៉ុន្តែប្រឡងធ្លាក់នៅពេលគ្រូចេញលំហាត់ថ្មីដែលមានទម្រង់ខុសពីមុនបន្តិច។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖