បញ្ហា (The Problem)៖ និក្ខេបបទនេះដោះស្រាយបញ្ហានៃការខ្វះខាតទិន្នន័យការប៉ះពាល់ (Exposure data) ដែលមានភាពច្បាស់លាស់ និងទាន់សម័យសម្រាប់ការវាយតម្លៃហានិភ័យគ្រោះថ្នាក់ធម្មជាតិ ដោយសារការកើនឡើងនៃនគរូបនីយកម្ម និងបម្រែបម្រួលអាកាសធាតុ។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះអភិវឌ្ឍវិធីសាស្ត្ររៀនស៊ីជម្រៅ (Deep Learning) និងម៉ាស៊ីនរៀន (Machine Learning) ថ្មីៗ ដើម្បីទាញយកព័ត៌មានលម្អិតពីទិន្នន័យរូបភាពផ្កាយរណប និងទិន្នន័យពីដី។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Virtual Support Vector Machines (VSVM) with Self-Learning ម៉ាស៊ីនវ៉ិចទ័រគាំទ្រនិម្មិត (VSVM) ដែលមានយុទ្ធសាស្ត្ររៀនដោយខ្លួនឯង |
ដំណើរការបានល្អបំផុត និងផ្តល់ភាពត្រឹមត្រូវខ្ពស់នៅពេលមានទិន្នន័យគំរូ (Labeled data) តិចតួច។ ជួយកាត់បន្ថយការចំណាយ និងពេលវេលាក្នុងការប្រមូលទិន្នន័យផ្ទាល់ពីទីតាំង។ | នៅពេលមានទិន្នន័យគំរូច្រើនគ្រប់គ្រាន់ វិធីសាស្ត្រនេះអាចនឹងមានប្រសិទ្ធភាពទាបជាងបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (CNNs) បន្តិច។ | បង្កើតបានលទ្ធផលមានលំនឹង (Plateau-like performance) និងមានភាពត្រឹមត្រូវខ្ពស់ជាង SVM ធម្មតា និង CNN ក្នុងស្ថានភាពខ្វះខាតទិន្នន័យគំរូ។ |
| Deep Multitask Learning (CNN) ការរៀនស៊ីជម្រៅពហុភារកិច្ចដោយប្រើ CNN ពីរូបភាពកម្រិតដងផ្លូវ |
អាចធ្វើចំណាត់ថ្នាក់និងទាញយកលក្ខណៈជាច្រើនរបស់អគារ (ដូចជា កម្ពស់ ប្រភេទដំបូល សម្ភារៈសាងសង់) ក្នុងពេលតែមួយ ដែលជួយសន្សំសំចៃពេលវេលាហ្វឹកហាត់ម៉ូដែល។ | ទាមទារកម្លាំងម៉ាស៊ីនកុំព្យូទ័រ (GPU) ខ្ពស់ និងភាពសម្បូរបែបនៃទិន្នន័យរូបភាពដងផ្លូវ (Street-level imagery)។ | សម្រេចបានភាពត្រឹមត្រូវទូទៅ (Overall Accuracy) រហូតដល់ 88.43% ក្នុងការវាយតម្លៃលក្ខណៈនៃអគារសម្រាប់ការសិក្សាហានិភ័យធម្មជាតិពហុមុខ។ |
| LSTM Networks for Time-Series Extrapolation បណ្តាញអង្គចងចាំរយៈពេលខ្លី-វែង (LSTM) សម្រាប់ព្យាករណ៍ទិន្នន័យ |
មានសមត្ថភាពខ្ពស់ក្នុងការវិភាគលំនាំទិន្នន័យតាមពេលវេលា (Time-series) ដើម្បីព្យាករណ៍ពីការពង្រីកទីក្រុង និងចំនួនប្រជាជនដែលនឹងរងហានិភ័យនាពេលអនាគត។ | ទាមទារទិន្នន័យប្រវត្តិសាស្ត្រដែលមានគុណភាពខ្ពស់ និងមានរយៈពេលវែងទើបអាចព្យាករណ៍បានច្បាស់លាស់។ | ម៉ូដែល Bidirectional LSTM ទទួលបានកម្រិតលំអៀងទាបបំផុតត្រឹមតែ 3.63 នាក់ប៉ុណ្ណោះក្នុងមួយក្រឡា 100x100 ម៉ែត្រ សម្រាប់ការប៉ាន់ស្មានប្រជាជននៅឆ្នាំ 2035។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តវិធីសាស្ត្រក្នុងការសិក្សានេះទាមទារធនធានកុំព្យូទ័រខ្លាំង និងទិន្នន័យចម្រុះជាច្រើន ពិសេសសម្រាប់ការហ្វឹកហាត់ម៉ូដែល Deep Learning លើទិន្នន័យរូបភាពផ្កាយរណប។
ការសិក្សានេះត្រូវបានធ្វើឡើងជាចម្បងនៅក្នុងប្រទេសអាល្លឺម៉ង់ ស៊ីលី កូឡុំប៊ី និងប៉េរូ ដែលទម្រង់នៃអគារ និងការរៀបចំទីក្រុងមានភាពខុសប្លែកពីប្រទេសកម្ពុជា។ អគារនៅកម្ពុជា (ដូចជាផ្ទះឈើ ផ្ទះល្វែង និងសំណង់មិនរៀបរយតាមមាត់ស្ទឹង) មានលក្ខណៈភូមិសាស្ត្រនិងស្ថាបត្យកម្មខុសប្លែក ដែលតម្រូវឱ្យមានការប្រមូលទិន្នន័យគំរូក្នុងស្រុកដើម្បីធ្វើការកែតម្រូវម៉ូដែល (Fine-tuning)។
ទោះបីជាបរិបទភូមិសាស្ត្រខុសគ្នាក៏ពិតមែន ប៉ុន្តែវិធីសាស្ត្រនិងបច្ចេកវិទ្យាដែលបានលើកឡើងក្នុងឯកសារនេះមានសក្តានុពលខ្ពស់ក្នុងការយកមកអនុវត្តនៅប្រទេសកម្ពុជា។
សរុបមក បច្ចេកទេស AI និងការប្រើប្រាស់ទិន្នន័យផ្កាយរណបបើកទូលាយទាំងនេះ ផ្តល់នូវឧបករណ៍ដ៏មានឥទ្ធិពលសម្រាប់រដ្ឋាភិបាលនិងអ្នកស្រាវជ្រាវកម្ពុជា ក្នុងការវាយតម្លៃហានិភ័យនិងរៀបចំផែនការទប់ទល់គ្រោះធម្មជាតិដោយចំណាយតិច។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Virtual Support Vector Machines (VSVM) | ជាក្បួនម៉ាស៊ីនរៀនដែលបង្កើតទិន្នន័យនិម្មិត (virtual samples) បន្ថែមពីលើទិន្នន័យពិតដែលមានស្រាប់ ដើម្បីជួយឲ្យម៉ូដែលរៀនបានកាន់តែច្បាស់ និងកាត់បន្ថយកំហុសទោះបីជាមានទិន្នន័យសម្រាប់ហ្វឹកហាត់តិចតួចក៏ដោយ។ | ដូចជាសិស្សម្នាក់ដែលយកលំហាត់ចាស់មកបំប្លែងជារាងថ្មីៗខ្លួនឯងដើម្បីហាត់ធ្វើ ដែលធ្វើឲ្យគេពូកែជាងមុនទោះគ្រូដាក់លំហាត់ឲ្យតិចក៏ដោយ។ |
| Convolutional Neural Networks (CNN) | ជាប្រភេទបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតដែលពូកែខាងវិភាគរូបភាព ដោយវាធ្វើការកាត់រូបភាពជាចំណែកតូចៗដើម្បីស្វែងរកលក្ខណៈពិសេស (ដូចជា គែម ទម្រង់ ឬពណ៌) សម្រាប់ធ្វើចំណាត់ថ្នាក់ឬទាញយកទិន្នន័យ។ | ដូចជាមនុស្សដែលប្រើកែវពង្រីកដើរសម្លឹងមើលរូបភាពមួយផ្ទាំងម្តងមួយក្រឡាៗ ដើម្បីកត់សម្គាល់ថាវត្ថុក្នុងរូបនោះជាអ្វី។ |
| Long Short-Term Memory (LSTM) | ជាម៉ូដែល AI មួយប្រភេទដែលមានសមត្ថភាពចងចាំព័ត៌មានពីអតីតកាលក្នុងរយៈពេលយូរ ដែលស័ក្តិសមបំផុតសម្រាប់ការវិភាគលំនាំទិន្នន័យជាស៊េរីពេលវេលា (Time-series) និងការព្យាករណ៍ព្រឹត្តិការណ៍នាពេលអនាគត។ | ដូចជាអ្នកកត់ត្រាប្រវត្តិសាស្ត្រម្នាក់ដែលអាចចងចាំហេតុការណ៍និងលំនាំកាលពីឆ្នាំមុនៗ ដើម្បីយកមកទាយប្រាប់ពីអ្វីដែលអាចនឹងកើតឡើងនៅឆ្នាំក្រោយ។ |
| Semantic Segmentation | ជាបច្ចេកទេសកុំព្យូទ័រក្នុងការបែងចែករូបភាព ដោយចាត់ថ្នាក់ភីកសែល (pixel) នីមួយៗទៅក្នុងក្រុមណាមួយជាក់លាក់ (ឧទាហរណ៍ អគារ ផ្លូវ ដើមឈើ) ដើម្បីឱ្យកុំព្យូទ័រយល់ពីអត្ថន័យនៃរូបភាពនោះទាំងមូល។ | ដូចជាការយកពណ៌ផ្សេងៗគ្នាទៅផាត់លើរូបភាពមួយផ្ទាំង ដោយផាត់ពណ៌ក្រហមលើអគារ ពណ៌ខៀវលើទឹក និងពណ៌បៃតងលើដើមឈើ ដើម្បីងាយស្រួលចំណាំនិងបែងចែក។ |
| Multitask Learning | ជាវិធីសាស្ត្រហ្វឹកហាត់ម៉ូដែល AI មួយឲ្យធ្វើការងារច្រើនមុខក្នុងពេលតែមួយ ដោយប្រើប្រាស់ចំណេះដឹងនិងលក្ខណៈរួមគ្នា ដើម្បីសន្សំសំចៃពេលវេលា និងបង្កើនភាពត្រឹមត្រូវជាងការហ្វឹកហាត់ម៉ូដែលដាច់ដោយឡែកពីគ្នា។ | ដូចជាការបង្រៀនសិស្សម្នាក់ឲ្យចេះទាំងគណិតវិទ្យា និងរូបវិទ្យាព្រមគ្នា ព្រោះមុខវិជ្ជាទាំងពីរនេះអាចជួយបំពេញចំណេះដឹងឲ្យគ្នាទៅវិញទៅមកបានយ៉ាងល្អ។ |
| Digital Surface Model (DSM) | ជាទិន្នន័យគំរូកម្ពស់បែប 3D នៃផ្ទៃផែនដី ដែលប្រមូលបានពីផ្កាយរណប ដោយវារួមបញ្ចូលទាំងកម្ពស់នៃសំណង់អគារ ដើមឈើ និងវត្ថុផ្សេងៗទៀតដែលស្ថិតនៅលើដី។ | ដូចជាការយកភួយមួយផ្ទាំងធំទៅគ្របពីលើទីក្រុងមួយ រួចវាស់រាង និងកម្ពស់នៃភួយនោះដែលពើងឡើងដោយសារអគារ ឬដើមឈើ។ |
| Domain Adaptation | ជាបច្ចេកទេសផ្ទេរចំណេះដឹងរបស់ម៉ូដែល AI ដែលបានហ្វឹកហាត់រួចនៅតំបន់ប្រភពមួយ ទៅអនុវត្តនៅតំបន់គោលដៅមួយទៀតដែលមានលក្ខណៈស្រដៀងគ្នា ដើម្បីកាត់បន្ថយការចំណាយក្នុងការប្រមូលទិន្នន័យថ្មី។ | ដូចជាការដែលយើងចេះបើកឡាននៅប្រទេសកម្ពុជា រួចយកជំនាញនេះទៅកែសម្រួលបន្តិចបន្តួចដើម្បីអាចបើកឡាននៅប្រទេសអង់គ្លេសបានដោយមិនបាច់រៀនពីដំបូងឡើយ។ |
| Exposure Modelling | ជាការបង្កើតម៉ូដែលដើម្បីវាយតម្លៃ និងគណនាពីចំនួនប្រជាជន សំណង់អគារ ឬហេដ្ឋារចនាសម្ព័ន្ធ ដែលស្ថិតក្នុងតំបន់ប្រឈមនឹងគ្រោះថ្នាក់ធម្មជាតិ (ដូចជាការរញ្ជួយដី ឬទឹកជំនន់) ដើម្បីត្រៀមលក្ខណៈទប់ទល់និងប៉ាន់ស្មានការខូចខាត។ | ដូចជាការរាប់ចំនួនមនុស្សនិងទ្រព្យសម្បត្តិដែលស្ថិតនៅលើផ្លូវទឹកហូរ ដើម្បីដឹងជាមុនថាបើមានទឹកជំនន់ តើមានអ្នកណាខ្លះនិងអ្វីខ្លះដែលអាចនឹងរងគ្រោះ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖