បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហានៃការខ្វះខាតការប៉ាន់ស្មានប្រភេទគម្របដីព្រៃ និងរចនាសម្ព័ន្ធព្រៃឈើដែលមានភាពត្រឹមត្រូវនិងមានបច្ចុប្បន្នភាព ដើម្បីជួយណែនាំដល់គោលនយោបាយគ្រប់គ្រងព្រៃឈើ ដោយយកឈ្នះលើដែនកំណត់នៃទិន្នន័យរូបភាពដែលមានកម្រិតបង្ហាញទាប (Data saturation) និងទិន្នន័យ LiDAR ដែលមានតម្លៃថ្លៃ។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានបង្កើតនិងប្រើប្រាស់នូវស្ថាបត្យកម្មបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតវិលជុំពហុភារកិច្ច (Multi-Task Recurrent Convolutional Neural Network) ដែលមានឈ្មោះថា 'Chimera' ដើម្បីច្របាច់បញ្ចូលទិន្នន័យពីប្រភពផ្សេងៗគ្នាសម្រាប់ការទស្សន៍ទាយក្នុងពេលតែមួយ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Chimera Ensemble (CE) - Multi-Task RCNN ការប្រើប្រាស់បណ្តាញសរសៃប្រសាទវិលជុំពហុភារកិច្ចរួមបញ្ចូលគ្នា (Chimera Ensemble) |
មានសមត្ថភាពខ្ពស់ក្នុងការច្របាច់បញ្ចូលទិន្នន័យរូបភាពនិងពេលវេលា (Spatial-temporal) ព្រមទាំងមានកម្រិតលំហូរទិន្នន័យ (Saturation limit) ខ្ពស់សម្រាប់ការគណនាជីវម៉ាស។ វាអាចរៀននិងធ្វើចំណាត់ថ្នាក់ព្រៃឈើស្របពេលជាមួយគ្នានឹងការប៉ាន់ស្មានរចនាសម្ព័ន្ធ។ | ទាមទារទិន្នន័យហ្វឹកហាត់ច្រើន និងកម្លាំងម៉ាស៊ីនកុំព្យូទ័រ (Compute Power) ខ្ពស់សម្រាប់ការបង្ហាត់ម៉ូដែល។ | ទទួលបានភាពត្រឹមត្រូវខ្ពស់បំផុតដោយពិន្ទុ F1-score រួមស្មើនឹង 0.92 និង R2 សម្រាប់គណនាជីវម៉ាស (AGB) ស្មើនឹង 0.84 ជាមួយកម្រិត Saturation ដល់ទៅ 416.7 Mg/ha។ |
| Random Forest (RF) ក្បួនដោះស្រាយរៀនម៉ាស៊ីនបែបព្រៃចៃដន្យ (Random Forest) |
ងាយស្រួលប្រើប្រាស់ មិនសូវទាមទារកម្លាំងម៉ាស៊ីនកុំព្យូទ័រខ្ពស់ និងដំណើរការបានលឿនជាងម៉ូដែល Deep Learning ក្នុងការហ្វឹកហាត់។ | មិនមានសមត្ថភាពវិភាគលើទម្រង់រូបភាពនិងពេលវេលាតាមលំដាប់លំដោយ (Spatial/temporal sequences) បានល្អដូចម៉ូដែលវិលជុំ RCNN ទេ ហើយឆាប់ដល់ចំណុចឆ្អែតទិន្នន័យ (Data saturation) ។ | ទទួលបានលទ្ធផលមធ្យម ជាមួយពិន្ទុ R2 សម្រាប់គណនាជីវម៉ាស (AGB) ស្មើនឹង 0.76 និងកម្រិត Saturation ត្រឹម 386.3 Mg/ha ។ |
| Support Vector Machine (SVM) ក្បួនដោះស្រាយរៀនម៉ាស៊ីនដោយបែងចែកវ៉ិចទ័រ (Support Vector Machine) |
មានប្រសិទ្ធភាពសម្រាប់សំណុំទិន្នន័យតូចៗ និងមានសមត្ថភាពដោះស្រាយបញ្ហាចំណាត់ថ្នាក់បានល្អគួរសម។ | ពិបាកក្នុងការចាប់យកលក្ខណៈពិសេសរចនាសម្ព័ន្ធស្មុគស្មាញពីទិន្នន័យរូបភាព ហើយទទួលបានលទ្ធផលអន់ជាងគេសម្រាប់ការគណនាបរិមាណ (Regression) ក្នុងកម្រិតទិន្នន័យច្រើន។ | ទទួលបានលទ្ធផលទាបជាងគេ ដោយពិន្ទុ R2 សម្រាប់គណនាជីវម៉ាស (AGB) ស្មើនឹង 0.68 និងកម្រិត Saturation ទាបបំផុតត្រឹម 245.0 Mg/ha ។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ម៉ូដែលនេះទាមទារការប្រើប្រាស់កម្លាំងម៉ាស៊ីនកុំព្យូទ័រខ្ពស់ ជាពិសេសគឺអង្គគណនាក្រាហ្វិក (GPU) សម្រាប់ការហ្វឹកហាត់ទិន្នន័យរូបភាពគុណភាពខ្ពស់ និងទិន្នន័យពីផ្កាយរណបតាមពេលវេលា។
ការសិក្សានេះត្រូវបានអនុវត្តនៅក្នុងតំបន់នៃរដ្ឋ California និង Nevada សហរដ្ឋអាមេរិក ដែលសម្បូរទៅដោយព្រៃឈើប្រភេទអាកាសធាតុមធ្យម (Temperate forests) និងព្រៃពាក់កណ្តាលស្ងួត។ អ្នកស្រាវជ្រាវបានបញ្ជាក់យ៉ាងច្បាស់ថា ម៉ូដែលនេះមិនអាចយកទៅអនុវត្តផ្ទាល់លើតំបន់ព្រៃទឹកភ្លៀង (Rainforests) នៃតំបន់ត្រូពិចបានទេ លុះត្រាតែមានការហ្វឹកហាត់ម៉ូដែលឡើងវិញជាមួយទិន្នន័យក្នុងតំបន់។ នេះគឺជាបញ្ហាដ៏សំខាន់សម្រាប់ប្រទេសកម្ពុជា ព្រោះយើងត្រូវបង្កើតសំណុំទិន្នន័យក្នុងស្រុកខ្លួនឯងជាមុនសិន។
ទោះបីជាតម្រូវឲ្យមានការហ្វឹកហាត់ម៉ូដែលឡើងវិញជាមួយទិន្នន័យក្នុងស្រុកក៏ដោយ ស្ថាបត្យកម្ម Multi-Task RCNN (Chimera) នេះមានសក្តានុពល និងអត្ថប្រយោជន៍យ៉ាងធំធេងសម្រាប់ការគ្រប់គ្រងធនធានព្រៃឈើនៅប្រទេសកម្ពុជា។
ជារួម ការអនុម័តយកស្ថាបត្យកម្មរៀនពហុភារកិច្ចនេះ អាចជួយធ្វើទំនើបកម្មប្រព័ន្ធតាមដានព្រៃឈើរបស់កម្ពុជា ឲ្យកាន់តែមានភាពសុក្រឹត តម្លាភាព និងងាយស្រួលក្នុងការធ្វើបច្ចុប្បន្នភាពទិន្នន័យបរិស្ថានប្រចាំឆ្នាំ។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Multi-task learning (MTL) | វិធីសាស្ត្ររៀនម៉ាស៊ីនដែលអនុញ្ញាតឱ្យបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (Neural Network) តែមួយ អាចហ្វឹកហាត់និងដោះស្រាយបញ្ហាពីរឬច្រើនក្នុងពេលតែមួយ (ដូចជាការធ្វើចំណាត់ថ្នាក់ប្រភេទព្រៃ និងការទស្សន៍ទាយបរិមាណឈើស្របគ្នា) ដើម្បីជួយឱ្យម៉ូដែលយល់ពីទំនាក់ទំនងនៃកត្តាទាំងពីរ និងបង្កើនភាពត្រឹមត្រូវរួម។ | ដូចជាសិស្សម្នាក់ដែលរៀនមុខវិជ្ជាគណិតវិទ្យា និងរូបវិទ្យាក្នុងពេលតែមួយ ដែលចំណេះដឹងពីមុខវិជ្ជាមួយជួយឱ្យគេយល់មុខវិជ្ជាមួយទៀតបានកាន់តែច្បាស់។ |
| Recurrent Convolutional Neural Network (RCNN) | ជាទម្រង់ស្ថាបត្យកម្មកុំព្យូទ័រ (Deep Learning) ដែលច្របាច់បញ្ចូលគ្នានូវបណ្តាញ CNN សម្រាប់ទាញយកលក្ខណៈពិសេសពីរូបភាពតាមតំបន់ និងបណ្តាញលំដាប់ពេលវេលា (RNN/LSTM) សម្រាប់ចងចាំការប្រែប្រួលពីរដូវមួយទៅរដូវមួយ ដើម្បីវាយតម្លៃអត្តសញ្ញាណ និងរចនាសម្ព័ន្ធព្រៃឈើ។ | ដូចជាការពឹងផ្អែកលើភ្នែកដើម្បីមើលទម្រង់រូបរាង (CNN) និងប្រើខួរក្បាលដើម្បីចងចាំសកម្មភាពដែលផ្លាស់ប្តូរតាមពេលវេលា (RNN) រួចរួមបញ្ចូលគ្នាដើម្បីសម្គាល់នរណាម្នាក់យ៉ាងច្បាស់។ |
| Above ground biomass (AGB) | ទម្ងន់សរុប (គិតជាម៉ាសស្ងួត) នៃផ្នែករុក្ខជាតិមានជីវិតទាំងអស់ដែលនៅពីលើផ្ទៃដី (ដូចជាតួដើម មែក ស្លឹក) ក្នុងតំបន់ណាមួយ។ ទិន្នន័យនេះត្រូវបានគេប្រើដើម្បីវាយតម្លៃសុខភាពព្រៃឈើ និងគណនាទំហំការស្តុកទុកឧស្ម័នកាបូន។ | ដូចជាការថ្លឹងទម្ងន់ផ្នែកខាងលើរបស់ដើមឈើទាំងអស់នៅក្នុងចម្ការមួយ ដើម្បីដឹងថាចម្ការនោះមានសាច់ឈើនិងស្លឹកសរុបប៉ុន្មានតោនកាបូន។ |
| Data saturation | បាតុភូតដែលកើតឡើងនៅពេលសេនស័រកាមេរ៉ាផ្កាយរណប (ដូចជា Landsat) មិនអាចចាប់យកភាពខុសគ្នានៃការចំណាំងផ្លាតពន្លឺបន្ថែមទៀតបាន នៅពេលព្រៃឈើមានសភាពក្រាស់ពេក ឬជីវម៉ាសឡើងខ្ពស់ពេក (ឧទាហរណ៍ លើសពី 150 Mg/ha) ដែលធ្វើឱ្យការទស្សន៍ទាយបរិមាណឈើផ្តល់តំលៃទាបជាងការពិត។ | ដូចជាការថតរូបក្នុងបន្ទប់ដែលភ្លឺខ្លាំងពេក រហូតដល់ពន្លឺចាំងសក្បុសពេញកាមេរ៉ា ធ្វើឱ្យកាមេរ៉ាមិនអាចចាប់យកក្បូរក្បាច់រចនានៅលើជញ្ជាំងបានច្បាស់។ |
| Ensembling | បច្ចេកទេសបូកបញ្ចូលការទស្សន៍ទាយពីម៉ូដែលរៀនម៉ាស៊ីន (Machine learning models) ច្រើនខុសៗគ្នា ឬហ្វឹកហាត់លើចំណែកទិន្នន័យផ្សេងគ្នា ដើម្បីបង្កើតជាការទស្សន៍ទាយចុងក្រោយមួយដែលរឹងមាំ និងមានភាពត្រឹមត្រូវខ្ពស់ជាងការប្រើប្រាស់ម៉ូដែលតែមួយឯកឯង ដោយកាត់បន្ថយភាពលម្អៀង។ | ដូចជាការប្រឹក្សាយោបល់ជាមួយវេជ្ជបណ្ឌិតជំនាញ៥នាក់ផ្សេងគ្នា រួចយកមតិទាំងអស់មកថ្លឹងថ្លែង ដើម្បីសន្និដ្ឋានរោគវិនិច្ឆ័យចុងក្រោយមួយដែលច្បាស់លាស់បំផុត។ |
| k-fold cross-validation | វិធីសាស្ត្រវាយតម្លៃភាពត្រឹមត្រូវរបស់ម៉ូដែល ដោយបែងចែកសំណុំទិន្នន័យជាចំណែកស្មើៗគ្នា (k ចំណែក) រួចប្រើប្រាស់ចំណែកភាគច្រើនដើម្បីហ្វឹកហាត់ម៉ូដែល និងចំណែកសល់ដើម្បីសាកល្បង ដោយធ្វើការឆ្លាស់គ្នារហូតដល់គ្រប់ចំណែកទាំងអស់ត្រូវបានយកមកធ្វើជាទិន្នន័យសាកល្បង។ | ដូចជាការចែកសៀវភៅមេរៀនជា ៥ជំពូក ដោយរៀន ៤ជំពូក ហើយប្រឡងតេស្ត ១ជំពូក រួចប្តូរគ្នារហូតទាល់តែបានប្រឡងតេស្តគ្រប់ទាំង ៥ជំពូក ដើម្បីប្រាកដថាសិស្សពិតជាចេះមេរៀនទាំងអស់មែន។ |
| Quadratic mean diameter (QMD) | រង្វាស់ស្ថិតិដែលគេប្រើជាទូទៅក្នុងការស្រាវជ្រាវព្រៃឈើ ដើម្បីគណនាអង្កត់ផ្ចិតមធ្យមនៃដើមឈើទាំងអស់នៅក្នុងតំបន់មួយ ដោយផ្អែកលើផ្ទៃមុខកាត់ (Basal area) នៃដើមឈើទាំងនោះ ព្រោះវាផ្តល់តម្លៃមធ្យមដែលតំណាងឱ្យទំហំឈើបានត្រឹមត្រូវជាងការរកមធ្យមភាគធម្មតា។ | ដូចជាការទាយរកទំហំមធ្យមនៃនំភីហ្សាជាច្រើនបន្ទះ ដោយផ្អែកលើផ្ទៃក្រឡារបស់នំ ជំនួសឱ្យការគ្រាន់តែយកប្រវែងអង្កត់ផ្ចិតរបស់វាមកបូកបញ្ចូលគ្នាហើយចែកជាមធ្យម។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖