Original Title: The Use of Three-Dimensional Convolutional Neural Networks to Interpret LiDAR for Forest Inventory
Source: doi.org/10.3390/rs10040649
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការប្រើប្រាស់បណ្តាញសរសៃប្រសាទវិមាត្របី ដើម្បីបកស្រាយទិន្នន័យ LiDAR សម្រាប់ការជំរឿនព្រៃឈើ

ចំណងជើងដើម៖ The Use of Three-Dimensional Convolutional Neural Networks to Interpret LiDAR for Forest Inventory

អ្នកនិពន្ធ៖ Elias Ayrey, School of Forest Resources, University of Maine, Daniel J. Hayes, School of Forest Resources, University of Maine

ឆ្នាំបោះពុម្ព៖ 2018, Remote Sensing

វិស័យសិក្សា៖ Remote Sensing and Deep Learning

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយពីតម្រូវការនៃវិធីសាស្ត្រដែលមានភាពត្រឹមត្រូវខ្ពស់ក្នុងការប៉ាន់ស្មានលក្ខណៈព្រៃឈើ (ដូចជា ជីវម៉ាស ចំនួនដើមឈើ និងប្រភេទឈើ) លើផ្ទៃដីធំៗ ដោយប្រើប្រាស់ទិន្នន័យពីចម្ងាយ (Remote Sensing) ជាជាងការប្រើប្រាស់រង្វាស់កម្ពស់បែបប្រពៃណីដែលមិនអាចចាប់យកភាពស្មុគស្មាញតាមផ្តេកនៃព្រៃឈើបាន។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានកែសម្រួលរចនាសម្ព័ន្ធបណ្តាញសរសៃប្រសាទ 2D CNN ពេញនិយមចំនួនប្រាំ ទៅជាម៉ូដែល 3D ដើម្បីដំណើរការទិន្នន័យ LiDAR ហើយប្រៀបធៀបដំណើរការរបស់វាជាមួយម៉ូដែលស្ថិតិបែបប្រពៃណី។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Inception-V3 3D Convolutional Neural Network
បណ្តាញសរសៃប្រសាទវិមាត្របីប្រភេទ Inception-V3
មានកម្រិតលម្អៀង (Bias) ទាប និងកាត់បន្ថយកំហុសបានច្រើនជាងគេបំផុត។ អាចទាញយកលក្ខណៈពិសេសនៃរចនាសម្ព័ន្ធព្រៃឈើពីទិន្នន័យ LiDAR ដោយស្វ័យប្រវត្តិ។ ទាមទារទិន្នន័យបណ្តុះបណ្តាលដ៏ច្រើនសន្ធឹកសន្ធាប់ ត្រូវការថាមពលកុំព្យូទ័រខ្លាំង (GPU) ក្នុងការគណនា និងពិបាកពន្យល់ពីដំណើរការខាងក្នុងនៃម៉ូដែល (Black Box)។ កាត់បន្ថយកំហុសប៉ាន់ស្មានជីវម៉ាស (RMSE) បាន ១១% បើធៀបនឹងម៉ូដែល Random Forest និងទទួលបានកំហុសត្រឹមតែ ៤៨.១ Mg/ha ប៉ុណ្ណោះ។
Random Forest with Traditional Height Metrics (RF-THM)
ម៉ូដែលព្រៃចៃដន្យ (Random Forest) ប្រើប្រាស់រង្វាស់កម្ពស់ប្រពៃណី
ងាយស្រួលប្រើប្រាស់ ត្រូវការធនធានកុំព្យូទ័រតិចជាង និងងាយបកស្រាយអថេរជាងបណ្តាញសរសៃប្រសាទ។ ដំណើរការបានល្អជាងម៉ូដែលលីនេអ៊ែរធម្មតា។ ទាមទារការបង្កើតអថេរដោយដៃ (Feature Engineering) និងមិនអាចចាប់យករចនាសម្ព័ន្ធភាពស្មុគស្មាញតាមផ្តេកនៃមកុដឈើបានល្អនោះទេ។ មានកំហុសប៉ាន់ស្មានជីវម៉ាស (RMSE) ៥៤.១ Mg/ha ដែលខ្ពស់ជាងម៉ូដែល Inception-V3 ប៉ុន្តែទាបជាង LMM-THM។
Linear Mixed Models with Traditional Height Metrics (LMM-THM)
ម៉ូដែលចម្រុះលីនេអ៊ែរ ប្រើប្រាស់រង្វាស់កម្ពស់ប្រពៃណី
ជារូបមន្តស្ថិតិសាមញ្ញបំផុត ងាយស្រួលបកស្រាយទំនាក់ទំនងរវាងកម្ពស់ដើមឈើនិងជីវម៉ាស ព្រមទាំងមានកម្រិតលម្អៀង (Bias) សរុបតិចតួចសម្រាប់ការប៉ាន់ស្មានចំនួនដើមឈើ។ មានភាពត្រឹមត្រូវទាបបំផុត និងងាយរងឥទ្ធិពលអវិជ្ជមានពីកម្រិតអថេរដែលទាក់ទងគ្នាខ្លាំង (Multicollinearity)។ មានកំហុសខ្ពស់បំផុតដោយ RMSE ស្មើនឹង ៥៧.៦ Mg/ha សម្រាប់ការប៉ាន់ស្មានជីវម៉ាស។

ការចំណាយលើធនធាន (Resource Cost)៖ ការប្រើប្រាស់វិធីសាស្ត្របណ្តាញសរសៃប្រសាទវិមាត្របី (3D CNNs) ទាមទារការបណ្តាក់ទុនយ៉ាងធំទៅលើធនធានកុំព្យូទ័រ និងទិន្នន័យក្នុងបរិមាណដ៏ច្រើនសន្ធឹកសន្ធាប់។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រមូលទិន្នន័យនៅតំបន់ព្រៃឈើ Northern New England នៃសហរដ្ឋអាមេរិក ដែលសំបូរទៅដោយប្រភេទឈើស្លឹកម្ជុល (Needleleaf) និងដើមឈើក្នុងតំបន់ត្រជាក់។ សម្រាប់ប្រទេសកម្ពុជា ទិន្នន័យនេះមិនអាចយកមកប្រើផ្ទាល់បានទេ ដោយសារព្រៃឈើនៅកម្ពុជាជាប្រភេទព្រៃត្រូពិច (ដូចជាព្រៃស្រោង ព្រៃពាក់កណ្តាលស្រោង) ដែលមានដង់ស៊ីតេ រចនាសម្ព័ន្ធមកុដឈើ និងភាពចម្រុះនៃពូជឈើខុសគ្នាស្រឡះ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាមានបញ្ហាប្រឈមលើធនធានទិន្នន័យក្តី វិធីសាស្ត្រនេះមានសក្តានុពលខ្លាំងក្នុងការធ្វើបដិវត្តន៍ការវាស់វែងព្រៃឈើនៅកម្ពុជា ជាពិសេសសម្រាប់ការងារអភិរក្ស និងទីផ្សារកាបូន។

សរុបមក បច្ចេកវិទ្យា 3D CNNs អាចផ្តល់នូវទិន្នន័យជំរឿនព្រៃឈើកម្រិតថ្នាក់ជាតិដ៏ត្រឹមត្រូវមួយ ជួយជំរុញយុទ្ធសាស្ត្រសេដ្ឋកិច្ចបៃតង និងការអភិរក្សនៅកម្ពុជាយ៉ាងមានប្រសិទ្ធភាព ប្រសិនបើមានការវិនិយោគលើការហោះហើរថត LiDAR និងប្រមូលទិន្នន័យទីវាលបានគ្រប់គ្រាន់។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃទិន្នន័យ LiDAR និង Point Cloud: ស្វែងយល់ពីការរៀបចំ និងសម្អាតទិន្នន័យ 3D Point Cloud ដោយអនុវត្តការប្រើប្រាស់កម្មវិធីកូដបើកចំហរដូចជា CloudCompare ឬបណ្ណាល័យ PDAL និង rLiDAR នៅក្នុងភាសា R ដើម្បីទាញយកទម្រង់រង្វាស់កម្ពស់ (Height Metrics)។
  2. អនុវត្តការបំប្លែងទិន្នន័យទៅជាទម្រង់ Voxelization: សាកល្បងយកទិន្នន័យ LiDAR ពិតប្រាកដមកបំប្លែងទៅជាទម្រង់ប្រអប់បីវិមាត្រ (Voxelized 3D blocks) ដូចជាការកំណត់ទំហំ 25x25x33cm ដូចការសិក្សា ដើម្បីត្រៀមបញ្ចូលទៅក្នុងម៉ូដែល Deep Learning ដោយប្រើប្រាស់ភាសា Python រួមជាមួយបណ្ណាល័យ NumPy និង Open3D
  3. អភិវឌ្ឍជំនាញកសាងម៉ូដែល 3D CNNs: រៀនសរសេរកូដដើម្បីបង្កើតម៉ូដែលបណ្តាញសរសៃប្រសាទវិមាត្របី ដោយប្រើប្រាស់កញ្ចប់កម្មវិធី TensorFlowPyTorch ដោយចាប់ផ្តើមពីស្ថាបត្យកម្មតូចៗដូចជា LeNet ជាមុន មុននឹងឈានទៅសាកល្បងម៉ូដែលស្មុគស្មាញដូចជា Inception-V3ResNet
  4. បង្កើតទិន្នន័យបណ្តុះបណ្តាលសិប្បនិម្មិត (Data Augmentation): ដោយសារកម្ពុជាខ្វះខាតទិន្នន័យទីវាល និស្សិតគួរអនុវត្តបច្ចេកទេសពង្រីកទិន្នន័យ ដូចជាការបង្វិល (Rotation) ឬការបំបែក Voxel ដើម្បីបង្កើតកញ្ចប់ទិន្នន័យថ្មីៗបន្ថែមសម្រាប់បង្វឹកម៉ូដែលកុំឱ្យមានកំហុស Overfitting។
  5. សាកល្បងបច្ចេកទេសផ្ទេរចំណេះដឹង (Transfer Learning): សិក្សាពីការយកម៉ូដែល 3D CNN ដែលគេបានបង្វឹករួចហើយ (Pre-trained Models) មកកែសម្រួលបន្ថែម (Fine-tune) ជាមួយគំរូទិន្នន័យព្រៃឈើកម្ពុជា ដើម្បីសន្សំសំចៃពេលវេលានិងថាមពលកុំព្យូទ័រក្នុងការគណនា។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Three-Dimensional Convolutional Neural Networks (3D CNN) ជាប្រភេទម៉ូដែលបញ្ញាសិប្បនិម្មិតកម្រិតជ្រៅ (Deep Learning) ដែលប្រើប្រាស់បណ្តាញកុំព្យូទ័រដើម្បីស្កេនទិន្នន័យមានរាងជាទំហំបីវិមាត្រ (3D) តាមអ័ក្ស X, Y, Z ដើម្បីស្វែងរកនិងកំណត់សម្គាល់លក្ខណៈពិសេសៗ (ដូចជារាងដើមឈើ និងមែកឈើ) ដោយស្វ័យប្រវត្តិដោយមិនត្រូវការមនុស្សប្រាប់។ វាដូចជាភ្នែកវេទមន្តដែលអាចមើលធ្លុះឃើញរចនាសម្ព័ន្ធខាងក្នុងនិងខាងក្រៅនៃប្រអប់មួយគ្រប់ជ្រុងជ្រោយ ដើម្បីដឹងថាមានអ្វីខ្លះនៅខាងក្នុងប្រអប់នោះ។
Light Detection and Ranging (LiDAR) ជាបច្ចេកវិទ្យាបញ្ជាពីចម្ងាយ (Remote Sensing) ដែលបាញ់កាំរស្មីឡាស៊ែរពីយន្តហោះទៅកាន់ផ្ទៃដី ហើយវាស់ចំណាយពេលដែលពន្លឺនោះផ្លាតត្រឡប់មកវិញ ដើម្បីបង្កើតជាផែនទីចំណុចបីវិមាត្រ (3D Point Cloud) ដែលបង្ហាញពីរចនាសម្ព័ន្ធព្រៃឈើ ឬសណ្ឋានដីយ៉ាងលម្អិត។ វាស្រដៀងនឹងសត្វប្រចៀវដែលបញ្ចេញសំឡេងអេកូដើម្បីស្ទាបស្ទង់រកទីតាំងវត្ថុនៅខាងមុខក្នុងទីងងឹត ប៉ុន្តែបច្ចេកវិទ្យានេះប្រើប្រាស់ពន្លឺឡាស៊ែរជំនួសវិញ។
Voxels គឺជាចំណុចភីកសែល (Pixels) ក្នុងទម្រង់ជាប្រអប់បីវិមាត្រ (មានបណ្តោយ ទទឹង និងកម្ពស់) ដែលត្រូវបានគេប្រើសម្រាប់បែងចែកទិន្នន័យទីតាំង LiDAR ទៅជាបំណែកកន្លែងតូចៗ ដើម្បីងាយស្រួលបញ្ជូនទៅឱ្យប្រព័ន្ធកុំព្យូទ័រធ្វើការវិភាគគណនា។ វាដូចជាដុំឡេហ្គោ (Lego) តូចៗរាប់លានដុំ ដែលគេយកមកតម្រៀបផ្តុំគ្នាដើម្បីបង្កើតជារូបរាងដើមឈើមួយដើម។
Traditional Height Metrics (THMs) ជារង្វាស់ស្ថិតិគណនាដោយមនុស្ស (ដូចជាកម្ពស់មធ្យម ភាគរយកម្ពស់ ឬកម្ពស់អតិបរមារបស់ដើមឈើ) ដែលទាញចេញពីទិន្នន័យ LiDAR ដើម្បីយកទៅប្រើប្រាស់ក្នុងរូបមន្តគណនាទំហំ ឬបរិមាណព្រៃឈើតាមបែបប្រពៃណីពីមុនមក។ វាប្រៀបដូចជាការយកម៉ែត្រទៅវាស់កម្ពស់សិស្សម្នាក់ៗក្នុងថ្នាក់ រួចគណនារកកម្ពស់មធ្យម ដើម្បីធ្វើការសន្និដ្ឋានពីអាយុរបស់ពួកគេ។
Feature maps ជាលទ្ធផលរូបភាពដែលបញ្ចេញដោយស្រទាប់បណ្តាញសរសៃប្រសាទកុំព្យូទ័រ ដែលបង្ហាញរំលេចនូវលក្ខណៈពិសេសៗ (ដូចជាគែម ផ្ទៃ ឬមែកឈើ) ដែលម៉ូដែលកុំព្យូទ័រគិតថាមានសារៈសំខាន់បំផុតសម្រាប់ការទស្សន៍ទាយលទ្ធផល។ វាដូចជាការប្រើប្រាស់ប៊ិចហាយឡាយ (Highlighter) គូសបញ្ជាក់តែពាក្យគន្លឹះសំខាន់ៗនៅក្នុងសៀវភៅក្រាស់មួយ ដើម្បីងាយស្រួលអាននិងចងចាំ។
Inception layers ជាបណ្តុំនៃបណ្តាញវិភាគទិន្នន័យក្នុងម៉ូដែល CNN ដែលដំណើរការស្កេនទិន្នន័យក្នុងពេលតែមួយ ដោយប្រើប្រាស់ទំហំវីនដូ (Windows) ស្កេនខុសៗគ្នា ដើម្បីចាប់យកលក្ខណៈពិសេសរបស់វត្ថុទាំងតូចនិងធំ ក្នុងពេលតែមួយ។ វាប្រៀបដូចជាការប្រើប្រាស់កែវពង្រីកដែលមានកម្រិតពង្រីកខុសៗគ្នាច្រើនប្រភេទក្នុងពេលតែមួយ ដើម្បីអាចសង្កេតមើលស្រមោចផងនិងមើលសត្វដំរីផងនៅក្នុងផ្ទាំងគំនូរតែមួយ។
Aboveground Biomass ជាទម្ងន់សរុបនៃរុក្ខជាតិមានជីវិតទាំងអស់ដែលនៅលិចផុសពីលើដី (រួមមាន ដងដើម មែក ស្លឹក និងសំបក) ដែលត្រូវបានគេវាស់វែងដើម្បីគណនាបរិមាណកាបូនដែលព្រៃឈើនោះអាចស្រូបយក និងស្តុកទុកបាន។ ប្រសិនបើយើងដកដើមឈើមួយដើម កាត់ឫសវាចោល ហើយយកតែផ្នែកខាងលើដីទាំងអស់ទៅថ្លឹងលើជញ្ជីង នោះទម្ងន់ដែលទទួលបានគឺជាជីវម៉ាសលើដី។
Area Based (AB) approach ជាវិធីសាស្ត្រក្នុងការប៉ាន់ស្មានទិន្នន័យព្រៃឈើ ដោយការយកទិន្នន័យវាស់វែងផ្ទាល់ដៃក្នុងដីឡូតិ៍តូចមួយ (Plot) ទៅផ្គូផ្គងជាមួយទិន្នន័យថតពីចម្ងាយ (LiDAR) រួមបញ្ចូលគ្នាបង្កើតជាម៉ូដែល ដើម្បីទស្សន៍ទាយលក្ខណៈព្រៃឈើនៅលើផ្ទៃដីធំៗរាប់ពាន់ហិកតាផ្សេងទៀតដោយស្វ័យប្រវត្តិ។ វាដូចជាការភ្លក់ទឹកស៊ុបតែមួយស្លាបព្រា ដើម្បីអាចដឹងនិងវាយតម្លៃពីរសជាតិនៃទឹកស៊ុបទាំងមូលនៅក្នុងឆ្នាំងដ៏ធំមួយ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖