បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហានៃការតាមដានតំបន់ឆ្នេរដែលងាយរងគ្រោះដោយសារការប្រែប្រួលអាកាសធាតុ តាមរយៈការកាត់បន្ថយភាពប្រែប្រួលនៃរូបភាពផ្កាយរណបដែលថតនៅថ្ងៃខុសៗគ្នា ដើម្បីបង្កើតផែនទីគ្របដណ្តប់ដីឱ្យបានច្បាស់លាស់។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់គំរូបញ្ញាសិប្បនិម្មិតកម្រិតជ្រៅ (Deep Learning) ដែលរួមបញ្ចូលនូវការវិភាគទាំងលំហ (Spatial) និងពេលវេលា (Temporal) ទៅលើរូបភាពផ្កាយរណប។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Single Image FCN (Baseline) បណ្ដាញ FCN ប្រើរូបភាពតែមួយសន្លឹក (កម្រិតមូលដ្ឋាន) |
ងាយស្រួលក្នុងការអភិវឌ្ឍ និងប្រើប្រាស់ថាមពលកុំព្យូទ័រ (GPU Memory) តិចជាងម៉ូដែលស៊េរីពេលវេលា។ | មិនអាចស្វែងយល់ពីទំនាក់ទំនងតាមពេលវេលា និងរងការប៉ះពាល់ដោយការប្រែប្រួលពន្លឺ ឬស្រមោលប្រចាំថ្ងៃ។ | ភាពត្រឹមត្រូវ 91.1% សម្រាប់ផ្លូវ និង 80.1% សម្រាប់ព្រៃកោងកាង។ |
| FCN + ConvLSTM with 5-image sequence (Proposed) បណ្ដាញរួមបញ្ចូល FCN និង ConvLSTM ដោយប្រើស៊េរីរូបភាព ៥ សន្លឹក |
អាចទាញយកលក្ខណៈពិសេសទាំងលំហ និងពេលវេលា ដែលជួយកាត់បន្ថយភាពប្រែប្រួលដោយសារពេលវេលាថតរូបភាព។ | ទាមទារការពុះរូបភាពជាចំណែកៗ (Patches) ដើម្បីឱ្យទំហំតម្រូវការស៊ីសង្វាក់ជាមួយអង្គចងចាំ GPU ធ្វើឱ្យចំណាយពេលហ្វឹកហាត់យូរជាង។ | ភាពត្រឹមត្រូវកើនឡើងដល់ 93.4% សម្រាប់ផ្លូវ និង 86.3% សម្រាប់ព្រៃកោងកាង។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារធនធានកុំព្យូទ័រ និងទិន្នន័យច្រើនគួរសម ជាពិសេសអង្គចងចាំ GPU សម្រាប់ដំណើរការបណ្ដាញ Deep Learning លើរូបភាពដែលមានទំហំធំ។
ការសិក្សានេះប្រើប្រាស់ទិន្នន័យពីតំបន់ឆ្នេរនៃទ្វីបអាហ្រ្វិកខាងលិច (ទីក្រុង Saint-Louis និង Douala)។ ទោះបីជាតំបន់ទាំងនេះមានលក្ខណៈភូមិសាស្រ្តឆ្នេរស្រដៀងគ្នាក៏ដោយ ក៏លក្ខណៈព្រៃកោងកាង និងរចនាសម្ព័ន្ធផ្លូវនៅកម្ពុជាអាចមានភាពខុសគ្នាខ្លះៗ។ ការយកមកអនុវត្តនៅកម្ពុជា ទាមទារឱ្យមានការប្រមូលទិន្នន័យក្នុងស្រុកបន្ថែមដើម្បីកែតម្រូវម៉ូដែល (Fine-tuning) ឱ្យកាន់តែសុក្រឹត។
វិធីសាស្រ្តនេះមានសក្តានុពលខ្ពស់ខ្លាំងណាស់ក្នុងការយកមកអនុវត្តនៅប្រទេសកម្ពុជា ជាពិសេសសម្រាប់ការតាមដានការផ្លាស់ប្តូរគម្របដីដោយស្វ័យប្រវត្តិ។
សរុបមក ការរួមបញ្ចូលទិន្នន័យផ្កាយរណបឥតគិតថ្លៃជាមួយម៉ូដែលបញ្ញាសិប្បនិម្មិតកម្រិតជ្រៅនេះ គឺជាដំណោះស្រាយដែលមានប្រសិទ្ធភាពចំណាយខ្ពស់ សម្រាប់ស្ថាប័នរដ្ឋ និងអង្គការនានាក្នុងការតាមដានបរិស្ថាននៅកម្ពុជា។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| ConvLSTM | ជាប្រភេទបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតដែលរួមបញ្ចូលសមត្ថភាពរបស់បណ្ដាញ Convolution ក្នុងការទាញយកលក្ខណៈពិសេសពីរូបភាព និងសមត្ថភាពរបស់បណ្ដាញ LSTM ក្នុងការចងចាំព័ត៌មានតាមពេលវេលា ដើម្បីវិភាគការផ្លាស់ប្តូរនៃទីតាំងណាមួយពីមួយថ្ងៃទៅមួយថ្ងៃ។ | ដូចជាមនុស្សម្នាក់ដែលមិនត្រឹមតែអាចចំណាំមុខមិត្តភក្តិបានច្បាស់កាលពីជួបគ្នាម្សិលមិញ ប៉ុន្តែថែមទាំងចាំនិងតាមដានថាថ្ងៃនេះមិត្តភក្តិនោះផ្លាស់ប្តូរសម្លៀកបំពាក់អ្វីខ្លះ។ |
| Fully Convolutional Networks | ជាបណ្ដាញបញ្ញាសិប្បនិម្មិតកម្រិតជ្រៅ ដែលប្រើប្រាស់ស្រទាប់ Convolution សុទ្ធសាធ (គ្មានស្រទាប់ភ្ជាប់ពេញលេញ ឬ Fully Connected Layer) ដើម្បីបែងចែកចំណាត់ថ្នាក់របស់ភីកសែល (Pixel) នីមួយៗក្នុងរូបភាព ដែលជួយឱ្យយើងដឹងថាផ្នែកណាជារបស់អ្វី (ឧ. ផ្លូវ ឬ ព្រៃ)។ | ដូចជាវិចិត្រករដែលលាបពណ៌រូបភាពធំមួយដោយផ្តោតលើចំណុចតូចៗម្ដងមួយៗ ហើយអាចប្រាប់បានថាចំណុចនីមួយៗជារូបអ្វី (ឧទាហរណ៍៖ ស្លឹកឈើ ឬដី) ដោយមិនបាត់បង់ទម្រង់ដើមនៃរូបភាពទាំងមូល។ |
| Time-Series Images | ជាបណ្ដុំរូបភាពនៃទីតាំងតែមួយ ដែលត្រូវបានថតជាបន្តបន្ទាប់គ្នាតាមកាលបរិច្ឆេទខុសៗគ្នា ដើម្បីតាមដាន និងវិភាគការប្រែប្រួលនៃទីតាំងនោះតាមពេលវេលាជាក់ស្តែង។ | ដូចជាការថតរូបសែលហ្វី (Selfie) នៅកន្លែងដដែលជារៀងរាល់ថ្ងៃ ដើម្បីយកមកតម្រៀបគ្នាមើលថាតើសក់របស់អ្នកដុះវែងប៉ុណ្ណាក្នុងរយៈពេលមួយខែ។ |
| morphological dilation | ជាបច្ចេកទេសកែច្នៃរូបភាពដែលពង្រីកទំហំ ឬកម្រាស់នៃព្រំដែនវត្ថុនៅក្នុងរូបភាព (ដូចជាការពង្រីកបន្ទាត់ផ្លូវថ្នល់) ឱ្យធំជាងមុន ដើម្បីងាយស្រួលដល់ប្រព័ន្ធកុំព្យូទ័រក្នុងការរៀន និងសម្គាល់វត្ថុនោះបានច្បាស់។ | ដូចជាការយកប៊ិចហ្វឺតទៅគូសបញ្ជាក់ (Highlight) លើគំនូសបន្ទាត់ខ្មៅតូចមួយ ដើម្បីឱ្យគេអាចមើលឃើញបន្ទាត់នោះកាន់តែច្បាស់ និងងាយស្រួលចាប់អារម្មណ៍ពីចម្ងាយ។ |
| Probability Map | ជាលទ្ធផលរូបភាពដែលបញ្ចេញដោយប្រព័ន្ធបញ្ញាសិប្បនិម្មិត ដែលក្នុងនោះភីកសែល (Pixel) នីមួយៗផ្ទុកនូវតម្លៃភាគរយដែលបញ្ជាក់ពីលទ្ធភាពដែលទីតាំងនោះជាវត្ថុអ្វីមួយ (ឧទាហរណ៍៖ ភាគរយដែលទីតាំងនោះជាព្រៃកោងកាង)។ | ដូចជាផែនទីព្យាករណ៍អាកាសធាតុ ដែលតំបន់មានពណ៌ក្រហមចាស់បង្ហាញពីកន្លែងដែលមានភាគរយ ឬឱកាសភ្លៀងធ្លាក់ខ្ពស់បំផុត។ |
| Sentinel-2 | ជាគម្រោងផ្កាយរណបសង្កេតការណ៍ផែនដីរបស់ទីភ្នាក់ងារអវកាសអឺរ៉ុប (ESA) ដែលថតរូបភាពផ្ទៃផែនដីក្នុងកម្រិតភាពច្បាស់ ១០ម៉ែត្រ និងផ្តល់ទិន្នន័យដោយឥតគិតថ្លៃសម្រាប់ការតាមដានបរិស្ថាន និងកសិកម្ម។ | ដូចជាកាមេរ៉ាសុវត្ថិភាពដ៏ធំមួយនៅលើមេឃ ដែលថតរូបផ្ទះរបស់អ្នកជារៀងរាល់ ៥ ថ្ងៃម្តង ដើម្បីឱ្យអ្នកដឹងថាមានអ្វីប្រែប្រួលខ្លះនៅក្នុងសួនច្បាររបស់អ្នក។ |
| U-Net | ជារចនាសម្ព័ន្ធបណ្ដាញសរសៃប្រសាទកម្រិតជ្រៅមានរាងជាអក្សរ U ដែលមានសមត្ថភាពខ្ពស់ក្នុងការកាត់ផ្តាច់ និងបែងចែកវត្ថុក្នុងរូបភាព (Image Segmentation) ដោយចាប់យកទាំងរូបរាងទូទៅ និងទីតាំងលម្អិតរបស់វត្ថុក្នុងពេលតែមួយ។ | ដូចជារោងចក្រកែច្នៃ ដែលដំបូងបង្រួមវត្ថុធំមួយឱ្យតូចដើម្បីយល់ពីរចនាសម្ព័ន្ធស្នូលរបស់វា រួចពង្រីកវាត្រឡប់មកទំហំដើមវិញដោយបំពាក់ព័ត៌មានលម្អិត ដើម្បីបង្កើតជាផែនទីរូបភាពដ៏ច្បាស់លាស់។ |
| intersection over union | ជារង្វាស់សម្រាប់វាយតម្លៃភាពត្រឹមត្រូវនៃម៉ូដែល (IoU) ក្នុងការចាប់យករូបភាព ដោយគណនាធៀបគ្នារវាងផ្នែកដែលកុំព្យូទ័រទាយត្រូវ (ផ្ទៃត្រួតស៊ីគ្នា) ចែកជាមួយទំហំផ្ទៃសរុបនៃវត្ថុជាក់ស្តែង និងការទស្សន៍ទាយបញ្ចូលគ្នា។ | ដូចជាការយកកាក់ពីរមកដាក់ត្រួតលើគ្នា ហើយវាស់មើលថាតើផ្ទៃដែលត្រួតលើគ្នានោះមានទំហំប៉ុនណាធៀបនឹងផ្ទៃរួមនៃកាក់ទាំងពីរ ដើម្បីដឹងថាវាដាក់ចំគ្នាល្អកម្រិតណា។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖