Original Title: Chimera: A Multi-Task Recurrent Convolutional Neural Network for Forest Classification and Structural Estimation
Source: doi.org/10.3390/rs11070768
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

Chimera៖ បណ្តាញសរសៃប្រសាទវិលជុំសិប្បនិម្មិតពហុភារកិច្ចសម្រាប់ការចាត់ថ្នាក់ព្រៃឈើ និងការប៉ាន់ស្មានរចនាសម្ព័ន្ធ

ចំណងជើងដើម៖ Chimera: A Multi-Task Recurrent Convolutional Neural Network for Forest Classification and Structural Estimation

អ្នកនិពន្ធ៖ Tony Chang (Conservation Science Partners, Inc.), Brandon P. Rasmussen (Conservation Science Partners, Inc.), Brett G. Dickson (Conservation Science Partners, Inc.; Northern Arizona University), Luke J. Zachmann (Conservation Science Partners, Inc.; Northern Arizona University)

ឆ្នាំបោះពុម្ព៖ 2019, Remote Sensing

វិស័យសិក្សា៖ Remote Sensing and Deep Learning

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហានៃការខ្វះខាតការប៉ាន់ស្មានប្រភេទគម្របដីព្រៃ និងរចនាសម្ព័ន្ធព្រៃឈើដែលមានភាពត្រឹមត្រូវនិងមានបច្ចុប្បន្នភាព ដើម្បីជួយណែនាំដល់គោលនយោបាយគ្រប់គ្រងព្រៃឈើ ដោយយកឈ្នះលើដែនកំណត់នៃទិន្នន័យរូបភាពដែលមានកម្រិតបង្ហាញទាប (Data saturation) និងទិន្នន័យ LiDAR ដែលមានតម្លៃថ្លៃ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានបង្កើតនិងប្រើប្រាស់នូវស្ថាបត្យកម្មបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតវិលជុំពហុភារកិច្ច (Multi-Task Recurrent Convolutional Neural Network) ដែលមានឈ្មោះថា 'Chimera' ដើម្បីច្របាច់បញ្ចូលទិន្នន័យពីប្រភពផ្សេងៗគ្នាសម្រាប់ការទស្សន៍ទាយក្នុងពេលតែមួយ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Chimera Ensemble (CE) - Multi-Task RCNN
ការប្រើប្រាស់បណ្តាញសរសៃប្រសាទវិលជុំពហុភារកិច្ចរួមបញ្ចូលគ្នា (Chimera Ensemble)
មានសមត្ថភាពខ្ពស់ក្នុងការច្របាច់បញ្ចូលទិន្នន័យរូបភាពនិងពេលវេលា (Spatial-temporal) ព្រមទាំងមានកម្រិតលំហូរទិន្នន័យ (Saturation limit) ខ្ពស់សម្រាប់ការគណនាជីវម៉ាស។ វាអាចរៀននិងធ្វើចំណាត់ថ្នាក់ព្រៃឈើស្របពេលជាមួយគ្នានឹងការប៉ាន់ស្មានរចនាសម្ព័ន្ធ។ ទាមទារទិន្នន័យហ្វឹកហាត់ច្រើន និងកម្លាំងម៉ាស៊ីនកុំព្យូទ័រ (Compute Power) ខ្ពស់សម្រាប់ការបង្ហាត់ម៉ូដែល។ ទទួលបានភាពត្រឹមត្រូវខ្ពស់បំផុតដោយពិន្ទុ F1-score រួមស្មើនឹង 0.92 និង R2 សម្រាប់គណនាជីវម៉ាស (AGB) ស្មើនឹង 0.84 ជាមួយកម្រិត Saturation ដល់ទៅ 416.7 Mg/ha។
Random Forest (RF)
ក្បួនដោះស្រាយរៀនម៉ាស៊ីនបែបព្រៃចៃដន្យ (Random Forest)
ងាយស្រួលប្រើប្រាស់ មិនសូវទាមទារកម្លាំងម៉ាស៊ីនកុំព្យូទ័រខ្ពស់ និងដំណើរការបានលឿនជាងម៉ូដែល Deep Learning ក្នុងការហ្វឹកហាត់។ មិនមានសមត្ថភាពវិភាគលើទម្រង់រូបភាពនិងពេលវេលាតាមលំដាប់លំដោយ (Spatial/temporal sequences) បានល្អដូចម៉ូដែលវិលជុំ RCNN ទេ ហើយឆាប់ដល់ចំណុចឆ្អែតទិន្នន័យ (Data saturation) ។ ទទួលបានលទ្ធផលមធ្យម ជាមួយពិន្ទុ R2 សម្រាប់គណនាជីវម៉ាស (AGB) ស្មើនឹង 0.76 និងកម្រិត Saturation ត្រឹម 386.3 Mg/ha ។
Support Vector Machine (SVM)
ក្បួនដោះស្រាយរៀនម៉ាស៊ីនដោយបែងចែកវ៉ិចទ័រ (Support Vector Machine)
មានប្រសិទ្ធភាពសម្រាប់សំណុំទិន្នន័យតូចៗ និងមានសមត្ថភាពដោះស្រាយបញ្ហាចំណាត់ថ្នាក់បានល្អគួរសម។ ពិបាកក្នុងការចាប់យកលក្ខណៈពិសេសរចនាសម្ព័ន្ធស្មុគស្មាញពីទិន្នន័យរូបភាព ហើយទទួលបានលទ្ធផលអន់ជាងគេសម្រាប់ការគណនាបរិមាណ (Regression) ក្នុងកម្រិតទិន្នន័យច្រើន។ ទទួលបានលទ្ធផលទាបជាងគេ ដោយពិន្ទុ R2 សម្រាប់គណនាជីវម៉ាស (AGB) ស្មើនឹង 0.68 និងកម្រិត Saturation ទាបបំផុតត្រឹម 245.0 Mg/ha ។

ការចំណាយលើធនធាន (Resource Cost)៖ ម៉ូដែលនេះទាមទារការប្រើប្រាស់កម្លាំងម៉ាស៊ីនកុំព្យូទ័រខ្ពស់ ជាពិសេសគឺអង្គគណនាក្រាហ្វិក (GPU) សម្រាប់ការហ្វឹកហាត់ទិន្នន័យរូបភាពគុណភាពខ្ពស់ និងទិន្នន័យពីផ្កាយរណបតាមពេលវេលា។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានអនុវត្តនៅក្នុងតំបន់នៃរដ្ឋ California និង Nevada សហរដ្ឋអាមេរិក ដែលសម្បូរទៅដោយព្រៃឈើប្រភេទអាកាសធាតុមធ្យម (Temperate forests) និងព្រៃពាក់កណ្តាលស្ងួត។ អ្នកស្រាវជ្រាវបានបញ្ជាក់យ៉ាងច្បាស់ថា ម៉ូដែលនេះមិនអាចយកទៅអនុវត្តផ្ទាល់លើតំបន់ព្រៃទឹកភ្លៀង (Rainforests) នៃតំបន់ត្រូពិចបានទេ លុះត្រាតែមានការហ្វឹកហាត់ម៉ូដែលឡើងវិញជាមួយទិន្នន័យក្នុងតំបន់។ នេះគឺជាបញ្ហាដ៏សំខាន់សម្រាប់ប្រទេសកម្ពុជា ព្រោះយើងត្រូវបង្កើតសំណុំទិន្នន័យក្នុងស្រុកខ្លួនឯងជាមុនសិន។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាតម្រូវឲ្យមានការហ្វឹកហាត់ម៉ូដែលឡើងវិញជាមួយទិន្នន័យក្នុងស្រុកក៏ដោយ ស្ថាបត្យកម្ម Multi-Task RCNN (Chimera) នេះមានសក្តានុពល និងអត្ថប្រយោជន៍យ៉ាងធំធេងសម្រាប់ការគ្រប់គ្រងធនធានព្រៃឈើនៅប្រទេសកម្ពុជា។

ជារួម ការអនុម័តយកស្ថាបត្យកម្មរៀនពហុភារកិច្ចនេះ អាចជួយធ្វើទំនើបកម្មប្រព័ន្ធតាមដានព្រៃឈើរបស់កម្ពុជា ឲ្យកាន់តែមានភាពសុក្រឹត តម្លាភាព និងងាយស្រួលក្នុងការធ្វើបច្ចុប្បន្នភាពទិន្នន័យបរិស្ថានប្រចាំឆ្នាំ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃទិន្នន័យពីចម្ងាយ (Remote Sensing Base): ចាប់ផ្តើមរៀនប្រើប្រាស់ប្រព័ន្ធ Google Earth Engine (GEE) សម្រាប់ការហៅយកទិន្នន័យផ្កាយរណបកម្រិតមធ្យមដូចជា Landsat 8/9Sentinel-2 ដែលមានផ្តល់ឲ្យដោយឥតគិតថ្លៃសម្រាប់វិភាគកម្រិតសន្ទស្សន៍បៃតង (NDVI)។
  2. អភិវឌ្ឍជំនាញ Deep Learning: សិក្សាពីការសរសេរកូដក្នុងភាសា Python ដោយប្រើប្រាស់បណ្ណាល័យ TensorFlow និង Keras។ ផ្តោតសំខាន់លើស្ថាបត្យកម្មវិភាគរូបភាព (CNN) និងការវិភាគពេលវេលា (LSTM) ដើម្បីត្រៀមខ្លួនសាងសង់ម៉ូដែល Recurrent CNN
  3. ប្រមូលនិងរៀបចំទិន្នន័យវាស់វែងព្រៃឈើនៅកម្ពុជា: សហការជាមួយក្រសួងបរិស្ថាន ឬអង្គការក្រៅរដ្ឋាភិបាល (ដូចជា WCS ឬ WWF) ដើម្បីទទួលបានទិន្នន័យវាស់វែងព្រៃឈើផ្ទាល់ (Plot data) ហើយផ្គូផ្គងទិន្នន័យទីតាំងទាំងនោះជាមួយនឹងរូបភាពផ្កាយរណប និងទិន្នន័យកម្ពស់ដី (DEM) ក្នុងស្រុក។
  4. សាងសង់និងសាកល្បងម៉ូដែល Multi-Task Learning: ចាប់ផ្តើមសរសេរកូដបង្កើតស្ថាបត្យកម្មតាមគំរូ Chimera ដែលមានសមត្ថភាពបញ្ចេញលទ្ធផលពីរក្នុងពេលតែមួយ គឺការធ្វើចំណាត់ថ្នាក់ព្រៃឈើ (Classification) និងការគណនាទំហំជីវម៉ាស/កាបូន (Regression)។
  5. វាយតម្លៃនិងធ្វើការកែតម្រូវចុងក្រោយ (Fine-tuning): អនុវត្តការបែងចែកទិន្នន័យហ្វឹកហាត់ និងទិន្នន័យសាកល្បងដោយប្រើ k-fold cross-validation រួចធ្វើការប្រៀបធៀបលទ្ធផលម៉ូដែលរបស់អ្នកជាមួយនឹងក្បួន Random Forest ដើម្បីកំណត់ថាវាមានប្រសិទ្ធភាពគ្រប់គ្រាន់ក្នុងការប្រើប្រាស់តាមដានព្រៃឈើពិតប្រាកដឬទេ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Multi-task learning (MTL) វិធីសាស្ត្ររៀនម៉ាស៊ីនដែលអនុញ្ញាតឱ្យបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (Neural Network) តែមួយ អាចហ្វឹកហាត់និងដោះស្រាយបញ្ហាពីរឬច្រើនក្នុងពេលតែមួយ (ដូចជាការធ្វើចំណាត់ថ្នាក់ប្រភេទព្រៃ និងការទស្សន៍ទាយបរិមាណឈើស្របគ្នា) ដើម្បីជួយឱ្យម៉ូដែលយល់ពីទំនាក់ទំនងនៃកត្តាទាំងពីរ និងបង្កើនភាពត្រឹមត្រូវរួម។ ដូចជាសិស្សម្នាក់ដែលរៀនមុខវិជ្ជាគណិតវិទ្យា និងរូបវិទ្យាក្នុងពេលតែមួយ ដែលចំណេះដឹងពីមុខវិជ្ជាមួយជួយឱ្យគេយល់មុខវិជ្ជាមួយទៀតបានកាន់តែច្បាស់។
Recurrent Convolutional Neural Network (RCNN) ជាទម្រង់ស្ថាបត្យកម្មកុំព្យូទ័រ (Deep Learning) ដែលច្របាច់បញ្ចូលគ្នានូវបណ្តាញ CNN សម្រាប់ទាញយកលក្ខណៈពិសេសពីរូបភាពតាមតំបន់ និងបណ្តាញលំដាប់ពេលវេលា (RNN/LSTM) សម្រាប់ចងចាំការប្រែប្រួលពីរដូវមួយទៅរដូវមួយ ដើម្បីវាយតម្លៃអត្តសញ្ញាណ និងរចនាសម្ព័ន្ធព្រៃឈើ។ ដូចជាការពឹងផ្អែកលើភ្នែកដើម្បីមើលទម្រង់រូបរាង (CNN) និងប្រើខួរក្បាលដើម្បីចងចាំសកម្មភាពដែលផ្លាស់ប្តូរតាមពេលវេលា (RNN) រួចរួមបញ្ចូលគ្នាដើម្បីសម្គាល់នរណាម្នាក់យ៉ាងច្បាស់។
Above ground biomass (AGB) ទម្ងន់សរុប (គិតជាម៉ាសស្ងួត) នៃផ្នែករុក្ខជាតិមានជីវិតទាំងអស់ដែលនៅពីលើផ្ទៃដី (ដូចជាតួដើម មែក ស្លឹក) ក្នុងតំបន់ណាមួយ។ ទិន្នន័យនេះត្រូវបានគេប្រើដើម្បីវាយតម្លៃសុខភាពព្រៃឈើ និងគណនាទំហំការស្តុកទុកឧស្ម័នកាបូន។ ដូចជាការថ្លឹងទម្ងន់ផ្នែកខាងលើរបស់ដើមឈើទាំងអស់នៅក្នុងចម្ការមួយ ដើម្បីដឹងថាចម្ការនោះមានសាច់ឈើនិងស្លឹកសរុបប៉ុន្មានតោនកាបូន។
Data saturation បាតុភូតដែលកើតឡើងនៅពេលសេនស័រកាមេរ៉ាផ្កាយរណប (ដូចជា Landsat) មិនអាចចាប់យកភាពខុសគ្នានៃការចំណាំងផ្លាតពន្លឺបន្ថែមទៀតបាន នៅពេលព្រៃឈើមានសភាពក្រាស់ពេក ឬជីវម៉ាសឡើងខ្ពស់ពេក (ឧទាហរណ៍ លើសពី 150 Mg/ha) ដែលធ្វើឱ្យការទស្សន៍ទាយបរិមាណឈើផ្តល់តំលៃទាបជាងការពិត។ ដូចជាការថតរូបក្នុងបន្ទប់ដែលភ្លឺខ្លាំងពេក រហូតដល់ពន្លឺចាំងសក្បុសពេញកាមេរ៉ា ធ្វើឱ្យកាមេរ៉ាមិនអាចចាប់យកក្បូរក្បាច់រចនានៅលើជញ្ជាំងបានច្បាស់។
Ensembling បច្ចេកទេសបូកបញ្ចូលការទស្សន៍ទាយពីម៉ូដែលរៀនម៉ាស៊ីន (Machine learning models) ច្រើនខុសៗគ្នា ឬហ្វឹកហាត់លើចំណែកទិន្នន័យផ្សេងគ្នា ដើម្បីបង្កើតជាការទស្សន៍ទាយចុងក្រោយមួយដែលរឹងមាំ និងមានភាពត្រឹមត្រូវខ្ពស់ជាងការប្រើប្រាស់ម៉ូដែលតែមួយឯកឯង ដោយកាត់បន្ថយភាពលម្អៀង។ ដូចជាការប្រឹក្សាយោបល់ជាមួយវេជ្ជបណ្ឌិតជំនាញ៥នាក់ផ្សេងគ្នា រួចយកមតិទាំងអស់មកថ្លឹងថ្លែង ដើម្បីសន្និដ្ឋានរោគវិនិច្ឆ័យចុងក្រោយមួយដែលច្បាស់លាស់បំផុត។
k-fold cross-validation វិធីសាស្ត្រវាយតម្លៃភាពត្រឹមត្រូវរបស់ម៉ូដែល ដោយបែងចែកសំណុំទិន្នន័យជាចំណែកស្មើៗគ្នា (k ចំណែក) រួចប្រើប្រាស់ចំណែកភាគច្រើនដើម្បីហ្វឹកហាត់ម៉ូដែល និងចំណែកសល់ដើម្បីសាកល្បង ដោយធ្វើការឆ្លាស់គ្នារហូតដល់គ្រប់ចំណែកទាំងអស់ត្រូវបានយកមកធ្វើជាទិន្នន័យសាកល្បង។ ដូចជាការចែកសៀវភៅមេរៀនជា ៥ជំពូក ដោយរៀន ៤ជំពូក ហើយប្រឡងតេស្ត ១ជំពូក រួចប្តូរគ្នារហូតទាល់តែបានប្រឡងតេស្តគ្រប់ទាំង ៥ជំពូក ដើម្បីប្រាកដថាសិស្សពិតជាចេះមេរៀនទាំងអស់មែន។
Quadratic mean diameter (QMD) រង្វាស់ស្ថិតិដែលគេប្រើជាទូទៅក្នុងការស្រាវជ្រាវព្រៃឈើ ដើម្បីគណនាអង្កត់ផ្ចិតមធ្យមនៃដើមឈើទាំងអស់នៅក្នុងតំបន់មួយ ដោយផ្អែកលើផ្ទៃមុខកាត់ (Basal area) នៃដើមឈើទាំងនោះ ព្រោះវាផ្តល់តម្លៃមធ្យមដែលតំណាងឱ្យទំហំឈើបានត្រឹមត្រូវជាងការរកមធ្យមភាគធម្មតា។ ដូចជាការទាយរកទំហំមធ្យមនៃនំភីហ្សាជាច្រើនបន្ទះ ដោយផ្អែកលើផ្ទៃក្រឡារបស់នំ ជំនួសឱ្យការគ្រាន់តែយកប្រវែងអង្កត់ផ្ចិតរបស់វាមកបូកបញ្ចូលគ្នាហើយចែកជាមធ្យម។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖