Original Title: INDIVIDUAL TREE EXTRACTION FROM UAV LIDAR POINT CLOUDS BASED ON SELF-ADAPTIVE MEAN SHIFT SEGMENTATION
Source: doi.org/10.5194/isprs-annals-V-1-2021-25-2021
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការទាញយកដើមឈើនីមួយៗពីពពកចំណុច UAV LiDAR ដោយផ្អែកលើការបែងចែក Mean Shift សម្របខ្លួនដោយស្វ័យប្រវត្តិ

ចំណងជើងដើម៖ INDIVIDUAL TREE EXTRACTION FROM UAV LIDAR POINT CLOUDS BASED ON SELF-ADAPTIVE MEAN SHIFT SEGMENTATION

អ្នកនិពន្ធ៖ Z. Hui (Faculty of Geomatics, East China University of Technology, Nanchang, China), N. Li, Y. Xia, P. Cheng, Y. He

ឆ្នាំបោះពុម្ព៖ 2021 ISPRS Annals of the Photogrammetry, Remote Sensing and Spatial Information Sciences

វិស័យសិក្សា៖ Remote Sensing and Forestry

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហាភាពត្រឹមត្រូវទាប និងតម្រូវការក្នុងការកំណត់ប៉ារ៉ាម៉ែត្រដោយដៃច្រើន នៅក្នុងវិធីសាស្ត្រទាញយកដើមឈើនីមួយៗពីទិន្នន័យពពកចំណុច (Point clouds) របស់ UAV LiDAR ក្នុងបរិស្ថានព្រៃឈើដែលមានភាពស្មុគស្មាញ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះស្នើឡើងនូវវិធីសាស្ត្របែងចែក Mean Shift ដោយស្វ័យប្រវត្តិ ដែលអាចគណនាទំហំ Bandwidth ដោយខ្លួនឯងរួមជាមួយបច្ចេកទេសបែងចែកតាមឋានានុក្រម។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Self-Adaptive Mean Shift Segmentation (Proposed)
ការបែងចែក Mean Shift ដោយសម្របខ្លួនឯង (វិធីសាស្ត្រស្នើឡើង)
មិនតម្រូវឱ្យកំណត់ប៉ារ៉ាម៉ែត្រ Bandwidth ដោយដៃទេ ព្រោះវាគណនាទំហំមកុដឈើដោយស្វ័យប្រវត្តិ។ ដំណើរការដោយស្វ័យប្រវត្តិកម្មខ្ពស់។ ការគណនាដំបូងដើម្បីកំណត់ទីតាំងគល់ឈើ (Trunk points) អាចមានភាពស្មុគស្មាញ និងទាមទារការពឹងផ្អែកលើចំណុចដែលនៅជិតដី។ ទទួលបានអត្រាភាពពេញលេញ (Completeness) និងភាពត្រឹមត្រូវមធ្យម (Mean accuracy) ខ្ពស់បំផុតដោយមិនចាំបាច់កែតម្រូវប៉ារ៉ាម៉ែត្រអ្វីឡើយ។
Traditional Mean Shift Segmentation (Ferraz et al., 2012)
ការបែងចែក Mean Shift បែបប្រពៃណី
ជាវិធីសាស្ត្រមូលដ្ឋានដែលងាយស្រួលយល់ និងអនុវត្ត ប្រសិនបើដឹងពីទំហំមកុដឈើប្រហាក់ប្រហែលជាមុន។ តម្រូវឱ្យសាកល្បងកំណត់ប៉ារ៉ាម៉ែត្រ Bandwidth (Trial and error) ដោយដៃច្រើនដង។ លទ្ធផលងាយប្រែប្រួលខ្លាំងអាស្រ័យលើតម្លៃដែលបានកំណត់។ លទ្ធផលនៃភាពត្រឹមត្រូវកើនឡើងហើយធ្លាក់ចុះវិញអាស្រ័យលើទំហំ Bandwidth ផ្ដេក (ពី 1.0m ដល់ 3.5m) ដោយទាមទារការស្វែងរកទំហំដ៏ប្រសើរបំផុតដោយដៃ។

ការចំណាយលើធនធាន (Resource Cost)៖ ទោះបីជាឯកសារមិនបានបញ្ជាក់លម្អិតពីថ្លៃដើមក៏ដោយ ប៉ុន្តែការអនុវត្តវិធីសាស្ត្រនេះតម្រូវឱ្យមានឧបករណ៍ ទិន្នន័យ និងចំណេះដឹងកម្រិតខ្ពស់ដូចខាងក្រោម៖

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់ទិន្នន័យ UAV LiDAR ពីតំបន់ព្រៃឈើដែលមានដើម Douglas Fir ជាចម្បង ដែលជាប្រភេទឈើនៅតំបន់ត្រជាក់មានទម្រង់មកុដស្រួចនិងច្បាស់លាស់។ សម្រាប់ប្រទេសកម្ពុជា ដែលមានព្រៃត្រូពិចក្រាស់ និងរុក្ខជាតិចម្រុះ ទម្រង់មកុដឈើមានភាពត្រួតស៊ីគ្នានិងស្មុគស្មាញជាង ដែលអាចតម្រូវឱ្យមានការកែតម្រូវក្បួនដោះស្រាយបន្ថែម ដើម្បីធានាបាននូវភាពត្រឹមត្រូវខ្ពស់នៅពេលអនុវត្តជាក់ស្តែង។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្ដានុពលខ្ពស់ខ្លាំងសម្រាប់ការគ្រប់គ្រង និងស្រាវជ្រាវធនធានព្រៃឈើ និងកសិកម្មនៅប្រទេសកម្ពុជា ដោយសារវាមិនតម្រូវឱ្យកំណត់ប៉ារ៉ាម៉ែត្រដោយដៃច្រើន។

សរុបមក បច្ចេកវិទ្យា UAV LiDAR និងក្បួនដោះស្រាយនេះ អាចជួយជំរុញការធ្វើទំនើបកម្មលើការគ្រប់គ្រងធនធានធម្មជាតិ និងកសិ-ឧស្សាហកម្មនៅកម្ពុជា ប្រសិនបើមានការគាំទ្រផ្នែកថវិកាលើឧបករណ៍ដ្រូន។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃទិន្នន័យ Point Cloud: ចាប់ផ្តើមស្វែងយល់ពីទម្រង់ទិន្នន័យ 3D Point Cloud និងរបៀបដំណើរការវាដោយប្រើប្រាស់បណ្ណាល័យ Open3DPDAL នៅក្នុង Python ដើម្បីចេះត្រងយកចំណុចដី (Ground filtering) ចេញពីទិន្នន័យ។
  2. អនុវត្តក្បួនដោះស្រាយ DBSCAN ជាមុន: សិក្សា និងសរសេរកូដសាកល្បងក្បួនដោះស្រាយ DBSCAN ដោយប្រើប្រាស់ Scikit-Learn លើទិន្នន័យគំរូតូចៗ ដើម្បីស្វែងយល់ពីរបៀបចាប់យកចំណុចគល់ឈើ (Trunk clustering) និងការដកចេញនូវចំណុចរំខាន (Outliers)។
  3. សាកល្បងបែងចែកដើមឈើជាមួយ Mean Shift: អនុវត្តក្បួនដោះស្រាយ Mean Shift Clustering សម្រាប់បែងចែកមកុដឈើ។ អ្នកគួរប្រើប្រាស់កម្មវិធី CloudCompare ជាមុនដើម្បីមើលទិន្នន័យជាក់ស្តែង មុននឹងសរសេរកូដកែសម្រួល Bandwidth ដោយស្វ័យប្រវត្តិ។
  4. ប្រមូល និងសាកល្បងជាមួយទិន្នន័យក្នុងស្រុក: ស្វែងរកទិន្នន័យ UAV LiDAR ដែលបើកទូលាយ (Open-source) ឬស្នើសុំសហការជាមួយស្ថាប័នក្នុងស្រុក ដើម្បីយកទិន្នន័យព្រៃឈើ ឬចម្ការនៅកម្ពុជាមកសាកល្បង និងវាស់ស្ទង់ភាពត្រឹមត្រូវនៃក្បួនដោះស្រាយ។
  5. បង្កើតប្រព័ន្ធស្វ័យប្រវត្តិកម្មពេញលេញ (Pipeline): ចងក្រងកូដទាំងអស់ (ការច្រោះដី, DBSCAN សម្រាប់គល់ឈើ, និងការគណនាទំហំមកុដឈើសម្រាប់ Mean Shift) ទៅជា Pipeline តែមួយ ដើម្បីបង្កើតជាប្រព័ន្ធទាញយកដើមឈើនីមួយៗដោយស្វ័យប្រវត្តិពីទិន្នន័យ LiDAR ឆៅ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
UAV LiDAR បច្ចេកវិទ្យាប្រើប្រាស់ដ្រូន (UAV) បំពាក់ឧបករណ៍បាញ់ពន្លឺឡាស៊ែរ (LiDAR) ទៅកាន់ផ្ទៃដី ដើម្បីវាស់ចម្ងាយដោយគណនារយៈពេលដែលពន្លឺនោះចំណាយពេលផ្លាតត្រឡប់មកវិញ ដែលអាចបង្កើតជាទិន្នន័យ 3D នៃរចនាសម្ព័ន្ធព្រៃឈើបានយ៉ាងច្បាស់លាស់។ ដូចជាសត្វប្រចៀវបញ្ចេញសំឡេងដើម្បីស្វែងរកទីតាំងចំណីក្នុងទីងងឹត ប៉ុន្តែនេះប្រើពន្លឺឡាស៊ែរពីលើអាកាសដើម្បីវាស់និងគូររូបភាពដីនិងដើមឈើ។
Point Clouds បណ្ដុំនៃចំណុចទិន្នន័យរាប់លាននៅក្នុងលំហ 3D (ដែលមានកូអរដោណេ x, y, z) ដែលប្រមូលបានពីឧបករណ៍ LiDAR ដើម្បីតំណាងឱ្យរូបរាងពិតប្រាកដនៃវត្ថុ ផ្ទៃដី ឬដើមឈើ។ ឯកសារនេះប្រើវាដើម្បីទាញយកទម្រង់ដើមឈើនីមួយៗ។ ដូចជាការយកគ្រាប់ខ្សាច់តូចៗរាប់លានគ្រាប់មកតម្រៀបបញ្ឈរទល់មុខគ្នា ឱ្យចេញជារូបរាងដើមឈើ ឬផ្ទះមួយនៅក្នុងកុំព្យូទ័រ។
Mean Shift Segmentation ក្បួនដោះស្រាយផ្នែក Machine Learning សម្រាប់បែងចែកទិន្នន័យជាក្រុម (Clustering) ដោយស្វែងរកតំបន់ដែលមានដង់ស៊ីតេទិន្នន័យខ្ពស់បំផុត (ឧទាហរណ៍ ចំណុចកណ្ដាលនៃមកុដឈើ) ហើយប្រមូលចំណុចនៅជុំវិញនោះចូលជាក្រុមតែមួយ ដើម្បីកាត់ផ្តាច់ដើមឈើមួយពីដើមឈើមួយទៀត។ ដូចជាការទម្លាក់មេដែកចូលក្នុងគំនរដែកគោល មេដែកនោះនឹងទាញទាក់ដែកគោលដែលនៅជិតៗវាបំផុតឱ្យផ្តុំគ្នាជាដុំៗដាច់ដោយឡែកពីគ្នា។
Bandwidth នៅក្នុងបរិបទនៃ Mean Shift ពាក្យនេះមិនមែនជាល្បឿនអ៊ីនធឺណិតទេ តែវាសំដៅលើទំហំកាំ (Radius) នៃរង្វង់ឬស្វ៊ែរដែលប្រើសម្រាប់រុករក និងប្រមូលផ្តុំចំណុចទិន្នន័យ។ បើវាតូចពេក ដើមឈើមួយអាចត្រូវបែកជាពីរ បើវាធំពេក ដើមឈើពីរអាចត្រូវច្របាច់បញ្ចូលគ្នាជាដើមឈើតែមួយ។ ដូចជាទំហំនៃសំណាញ់ចាប់ត្រី បើប្រើសំណាញ់តូច ចាប់បានតែត្រីនៅជិតៗខ្លួន បើប្រើសំណាញ់ធំ អាចចាប់បានត្រីក្នុងបរិវេណធំទូលាយជាង និងអាចជាប់ទាំងកំទេចកំទីផ្សេងៗមកជាមួយផងដែរ។
DBSCAN Clustering ក្បួនដោះស្រាយសម្រាប់ចាប់ក្រុមទិន្នន័យដោយផ្អែកលើភាពកកកុញ (Density-based) ដែលអាចរកឃើញរូបរាងក្រុមទិន្នន័យស្មុគស្មាញ និងទម្លាក់ចោលចំណុចរំខាន (Outliers) ដែលនៅដាច់តែឯង។ ក្នុងឯកសារនេះ វាត្រូវប្រើសម្រាប់ចង្កោមចំណុចឱ្យក្លាយជាគល់ឈើ។ ដូចជាការកំណត់សម្គាល់ក្រុមមនុស្សនៅក្នុងពិធីបុណ្យ តំបន់ណាមានមនុស្សឈរជុំគ្នាច្រើនចាត់ទុកជាក្រុមមួយ ចំណែកអ្នកដែលឈរនៅឆ្ងាយដាច់តែឯងត្រូវបានចាត់ទុកជាអ្នកដើរកាត់ (Outliers)។
Canopy Height Model (CHM) ម៉ូដែលឌីជីថលតំណាងឱ្យកម្ពស់សុទ្ធរបស់មកុដឈើ (Canopy) ដែលទទួលបានតាមរយៈការយកកម្ពស់ផ្ទៃខាងលើបង្អស់នៃព្រៃឈើដកកម្ពស់ផ្ទៃដីធម្មតាចេញ ដើម្បីដឹងថាតើដើមឈើនោះខ្ពស់ផុតពីដីប៉ុន្មានម៉ែត្រ។ ដូចជាការវាស់កម្ពស់មនុស្សដោយដកកម្រាស់ស្បែកជើងចេញ ដើម្បីដឹងថាតើមនុស្សនោះមានកម្ពស់ពិតប្រាកដប៉ុន្មានចាប់ពីបាតជើងដល់កំពូលក្បាល។
Morphological filtering ដំណើរការនៃក្បួនដោះស្រាយក្នុងការសម្អាតទិន្នន័យ Point Clouds តាមរយៈការវិភាគរូបរាង និងកម្ពស់ ដើម្បីបែងចែកឱ្យដាច់រវាងចំណុចដែលជាដី (Ground) និងចំណុចដែលជាវត្ថុនៅពីលើដី (Non-ground ដូចជាដើមឈើ) មុននឹងឈានទៅធ្វើការវិភាគបន្ត។ ដូចជាការប្រើកញ្ច្រែងដើម្បីច្រោះយកគ្រាប់ក្រួសធំៗចេញពីខ្សាច់ម៉ដ្ឋ ដើម្បីយកតែដីខ្សាច់សុទ្ធ (តំណាងឱ្យផ្ទៃដី) ទុកសម្រាប់ប្រើប្រាស់បន្ត។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖