Original Title: INDIVIDUAL TREE EXTRACTION FROM UAV LIDAR POINT CLOUDS BASED ON SELF-ADAPTIVE MEAN SHIFT SEGMENTATION
Source: doi.org/10.5194/isprs-annals-V-1-2021-25-2021
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការទាញយកដើមឈើនីមួយៗពីពពកចំណុច UAV LiDAR ដោយផ្អែកលើការបែងចែក Mean Shift សម្របខ្លួនដោយស្វ័យប្រវត្តិ

ចំណងជើងដើម៖ INDIVIDUAL TREE EXTRACTION FROM UAV LIDAR POINT CLOUDS BASED ON SELF-ADAPTIVE MEAN SHIFT SEGMENTATION

អ្នកនិពន្ធ៖ Z. Hui (Faculty of Geomatics, East China University of Technology, Nanchang, China), N. Li, Y. Xia, P. Cheng, Y. He

ឆ្នាំបោះពុម្ព៖ 2021 ISPRS Annals of the Photogrammetry, Remote Sensing and Spatial Information Sciences

វិស័យសិក្សា៖ Remote Sensing and Forestry

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហាភាពត្រឹមត្រូវទាប និងតម្រូវការក្នុងការកំណត់ប៉ារ៉ាម៉ែត្រដោយដៃច្រើន នៅក្នុងវិធីសាស្ត្រទាញយកដើមឈើនីមួយៗពីទិន្នន័យពពកចំណុច (Point clouds) របស់ UAV LiDAR ក្នុងបរិស្ថានព្រៃឈើដែលមានភាពស្មុគស្មាញ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះស្នើឡើងនូវវិធីសាស្ត្របែងចែក Mean Shift ដោយស្វ័យប្រវត្តិ ដែលអាចគណនាទំហំ Bandwidth ដោយខ្លួនឯងរួមជាមួយបច្ចេកទេសបែងចែកតាមឋានានុក្រម។

ការច្រោះចំណុចដីចេញដោយប្រើប្រាស់តម្រងរូបវិទ្យាដែលបានធ្វើឱ្យប្រសើរឡើង (Improved morphological filtering)
ការចង្កោមចំណុចគល់ឈើដោយប្រើក្បួនដោះស្រាយ DBSCAN (DBSCAN clustering for trunk points)
ការប៉ាន់ស្មានទំហំមកុដឈើដើម្បីកំណត់កម្រិត Bandwidth ផ្ដេកដោយស្វ័យប្រវត្តិ (Self-adaptive horizontal bandwidth estimation based on crown sizes)
ការបែងចែក Mean shift តាមឋានានុក្រមដើម្បីទាញយកដើមឈើនីមួយៗជាបន្តបន្ទាប់ (Hierarchy mean shift segmentation)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

វិធីសាស្ត្រដែលបានស្នើឡើងអាចទាញយកដើមឈើនីមួយៗបានយ៉ាងល្អប្រសើរ ដោយមិនតម្រូវឱ្យមានការកំណត់ប៉ារ៉ាម៉ែត្រ Bandwidth ដោយដៃនោះទេ។
បើប្រៀបធៀបជាមួយវិធីសាស្ត្រ Mean shift បែបប្រពៃណី វិធីសាស្ត្រថ្មីនេះទទួលបានអត្រាភាពពេញលេញ (Completeness) និងភាពត្រឹមត្រូវមធ្យម (Mean accuracy) ខ្ពស់ជាង។
ការគណនាទំហំ Bandwidth ដោយស្វ័យប្រវត្តិជួយលុបបំបាត់ភាពលំបាកក្នុងការកែសម្រួលប៉ារ៉ាម៉ែត្រ ដែលធ្វើឱ្យវិធីសាស្ត្រនេះងាយស្រួលក្នុងការអនុវត្តសូម្បីតែសម្រាប់អ្នកដែលមិនសូវមានបទពិសោធន៍ក៏ដោយ។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Self-Adaptive Mean Shift Segmentation (Proposed) ការបែងចែក Mean Shift ដោយសម្របខ្លួនឯង (វិធីសាស្ត្រស្នើឡើង)	មិនតម្រូវឱ្យកំណត់ប៉ារ៉ាម៉ែត្រ Bandwidth ដោយដៃទេ ព្រោះវាគណនាទំហំមកុដឈើដោយស្វ័យប្រវត្តិ។ ដំណើរការដោយស្វ័យប្រវត្តិកម្មខ្ពស់។	ការគណនាដំបូងដើម្បីកំណត់ទីតាំងគល់ឈើ (Trunk points) អាចមានភាពស្មុគស្មាញ និងទាមទារការពឹងផ្អែកលើចំណុចដែលនៅជិតដី។	ទទួលបានអត្រាភាពពេញលេញ (Completeness) និងភាពត្រឹមត្រូវមធ្យម (Mean accuracy) ខ្ពស់បំផុតដោយមិនចាំបាច់កែតម្រូវប៉ារ៉ាម៉ែត្រអ្វីឡើយ។
Traditional Mean Shift Segmentation (Ferraz et al., 2012) ការបែងចែក Mean Shift បែបប្រពៃណី	ជាវិធីសាស្ត្រមូលដ្ឋានដែលងាយស្រួលយល់ និងអនុវត្ត ប្រសិនបើដឹងពីទំហំមកុដឈើប្រហាក់ប្រហែលជាមុន។	តម្រូវឱ្យសាកល្បងកំណត់ប៉ារ៉ាម៉ែត្រ Bandwidth (Trial and error) ដោយដៃច្រើនដង។ លទ្ធផលងាយប្រែប្រួលខ្លាំងអាស្រ័យលើតម្លៃដែលបានកំណត់។	លទ្ធផលនៃភាពត្រឹមត្រូវកើនឡើងហើយធ្លាក់ចុះវិញអាស្រ័យលើទំហំ Bandwidth ផ្ដេក (ពី 1.0m ដល់ 3.5m) ដោយទាមទារការស្វែងរកទំហំដ៏ប្រសើរបំផុតដោយដៃ។

ការចំណាយលើធនធាន (Resource Cost)៖ ទោះបីជាឯកសារមិនបានបញ្ជាក់លម្អិតពីថ្លៃដើមក៏ដោយ ប៉ុន្តែការអនុវត្តវិធីសាស្ត្រនេះតម្រូវឱ្យមានឧបករណ៍ ទិន្នន័យ និងចំណេះដឹងកម្រិតខ្ពស់ដូចខាងក្រោម៖

Hardware: ដ្រូន (UAV) បំពាក់ដោយម៉ាស៊ីនស្កេនឡាស៊ែរ (ឧទាហរណ៍ Riegl Ricopter ជាមួយ VUX-1UAV) និងកុំព្យូទ័រដែលមានសមត្ថភាពដំណើរការទិន្នន័យ 3D ធំៗ។
Dataset: ទិន្នន័យពពកចំណុច (3D Point Clouds) ពី UAV LiDAR ដែលមានដង់ស៊ីតេខ្ពស់ និងអាចឆ្លុះដល់ផ្ទៃដីដើម្បីចាប់យកគល់ឈើ។
Software: កម្មវិធីសម្រាប់មើល និងកែសម្រួលទិន្នន័យ 3D ដូចជា CloudCompare និងបរិស្ថានសរសេរកូដសម្រាប់ដំណើរការក្បួនដោះស្រាយ Clustering។
Expertise: ចំណេះដឹងជំនាញផ្នែកកែច្នៃទិន្នន័យ Point Cloud ផ្នែកក្បួនដោះស្រាយ Machine Learning (DBSCAN, Mean Shift) និងផ្នែករុក្ខាប្រមាញ់។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់ទិន្នន័យ UAV LiDAR ពីតំបន់ព្រៃឈើដែលមានដើម Douglas Fir ជាចម្បង ដែលជាប្រភេទឈើនៅតំបន់ត្រជាក់មានទម្រង់មកុដស្រួចនិងច្បាស់លាស់។ សម្រាប់ប្រទេសកម្ពុជា ដែលមានព្រៃត្រូពិចក្រាស់ និងរុក្ខជាតិចម្រុះ ទម្រង់មកុដឈើមានភាពត្រួតស៊ីគ្នានិងស្មុគស្មាញជាង ដែលអាចតម្រូវឱ្យមានការកែតម្រូវក្បួនដោះស្រាយបន្ថែម ដើម្បីធានាបាននូវភាពត្រឹមត្រូវខ្ពស់នៅពេលអនុវត្តជាក់ស្តែង។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្ដានុពលខ្ពស់ខ្លាំងសម្រាប់ការគ្រប់គ្រង និងស្រាវជ្រាវធនធានព្រៃឈើ និងកសិកម្មនៅប្រទេសកម្ពុជា ដោយសារវាមិនតម្រូវឱ្យកំណត់ប៉ារ៉ាម៉ែត្រដោយដៃច្រើន។

កសិកម្មខ្នាតធំ (ចម្ការកៅស៊ូ និងស្វាយចន្ទី): អាចប្រើប្រាស់សម្រាប់រាប់ចំនួនដើម និងវាយតម្លៃការលូតលាស់នៃមកុដឈើនៅក្នុងចម្ការកៅស៊ូ (ខេត្តកំពង់ចាម ត្បូងឃ្មុំ) ឬចម្ការស្វាយចន្ទី ដើម្បីប៉ាន់ស្មានទិន្នផលបានយ៉ាងរហ័ស។
ការត្រួតពិនិត្យតំបន់ការពារធម្មជាតិ (Prey Lang, Cardamom Mountains): ជួយដល់ក្រសួងបរិស្ថាន និងអង្គការនានាក្នុងការធ្វើសារពើភ័ណ្ឌព្រៃឈើ (Forest Inventory) និងតាមដានរចនាសម្ព័ន្ធព្រៃឈើនៅតំបន់ព្រៃឡង់ ឬជួរភ្នំក្រវាញ ដោយមិនបាច់ចុះវាស់ផ្ទាល់ដែលចំណាយពេលយូរ និងប្រឈមហានិភ័យ។
គម្រោងឥណទានកាបូន (REDD+): អាចគាំទ្រដល់គម្រោងឥណទានកាបូននៅកម្ពុជា ដោយផ្តល់នូវទិន្នន័យ 3D នៃរចនាសម្ព័ន្ធដើមឈើនីមួយៗ ដែលមានភាពត្រឹមត្រូវខ្ពស់សម្រាប់យកទៅគណនាបរិមាណជីវម៉ាស និងកាបូនស្តុកទុក។

សរុបមក បច្ចេកវិទ្យា UAV LiDAR និងក្បួនដោះស្រាយនេះ អាចជួយជំរុញការធ្វើទំនើបកម្មលើការគ្រប់គ្រងធនធានធម្មជាតិ និងកសិ-ឧស្សាហកម្មនៅកម្ពុជា ប្រសិនបើមានការគាំទ្រផ្នែកថវិកាលើឧបករណ៍ដ្រូន។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះនៃទិន្នន័យ Point Cloud: ចាប់ផ្តើមស្វែងយល់ពីទម្រង់ទិន្នន័យ 3D Point Cloud និងរបៀបដំណើរការវាដោយប្រើប្រាស់បណ្ណាល័យ Open3D ឬ PDAL នៅក្នុង Python ដើម្បីចេះត្រងយកចំណុចដី (Ground filtering) ចេញពីទិន្នន័យ។
អនុវត្តក្បួនដោះស្រាយ DBSCAN ជាមុន: សិក្សា និងសរសេរកូដសាកល្បងក្បួនដោះស្រាយ DBSCAN ដោយប្រើប្រាស់ Scikit-Learn លើទិន្នន័យគំរូតូចៗ ដើម្បីស្វែងយល់ពីរបៀបចាប់យកចំណុចគល់ឈើ (Trunk clustering) និងការដកចេញនូវចំណុចរំខាន (Outliers)។
សាកល្បងបែងចែកដើមឈើជាមួយ Mean Shift: អនុវត្តក្បួនដោះស្រាយ Mean Shift Clustering សម្រាប់បែងចែកមកុដឈើ។ អ្នកគួរប្រើប្រាស់កម្មវិធី CloudCompare ជាមុនដើម្បីមើលទិន្នន័យជាក់ស្តែង មុននឹងសរសេរកូដកែសម្រួល Bandwidth ដោយស្វ័យប្រវត្តិ។
ប្រមូល និងសាកល្បងជាមួយទិន្នន័យក្នុងស្រុក: ស្វែងរកទិន្នន័យ UAV LiDAR ដែលបើកទូលាយ (Open-source) ឬស្នើសុំសហការជាមួយស្ថាប័នក្នុងស្រុក ដើម្បីយកទិន្នន័យព្រៃឈើ ឬចម្ការនៅកម្ពុជាមកសាកល្បង និងវាស់ស្ទង់ភាពត្រឹមត្រូវនៃក្បួនដោះស្រាយ។
បង្កើតប្រព័ន្ធស្វ័យប្រវត្តិកម្មពេញលេញ (Pipeline): ចងក្រងកូដទាំងអស់ (ការច្រោះដី, DBSCAN សម្រាប់គល់ឈើ, និងការគណនាទំហំមកុដឈើសម្រាប់ Mean Shift) ទៅជា Pipeline តែមួយ ដើម្បីបង្កើតជាប្រព័ន្ធទាញយកដើមឈើនីមួយៗដោយស្វ័យប្រវត្តិពីទិន្នន័យ LiDAR ឆៅ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
UAV LiDAR	បច្ចេកវិទ្យាប្រើប្រាស់ដ្រូន (UAV) បំពាក់ឧបករណ៍បាញ់ពន្លឺឡាស៊ែរ (LiDAR) ទៅកាន់ផ្ទៃដី ដើម្បីវាស់ចម្ងាយដោយគណនារយៈពេលដែលពន្លឺនោះចំណាយពេលផ្លាតត្រឡប់មកវិញ ដែលអាចបង្កើតជាទិន្នន័យ 3D នៃរចនាសម្ព័ន្ធព្រៃឈើបានយ៉ាងច្បាស់លាស់។	ដូចជាសត្វប្រចៀវបញ្ចេញសំឡេងដើម្បីស្វែងរកទីតាំងចំណីក្នុងទីងងឹត ប៉ុន្តែនេះប្រើពន្លឺឡាស៊ែរពីលើអាកាសដើម្បីវាស់និងគូររូបភាពដីនិងដើមឈើ។
Point Clouds	បណ្ដុំនៃចំណុចទិន្នន័យរាប់លាននៅក្នុងលំហ 3D (ដែលមានកូអរដោណេ x, y, z) ដែលប្រមូលបានពីឧបករណ៍ LiDAR ដើម្បីតំណាងឱ្យរូបរាងពិតប្រាកដនៃវត្ថុ ផ្ទៃដី ឬដើមឈើ។ ឯកសារនេះប្រើវាដើម្បីទាញយកទម្រង់ដើមឈើនីមួយៗ។	ដូចជាការយកគ្រាប់ខ្សាច់តូចៗរាប់លានគ្រាប់មកតម្រៀបបញ្ឈរទល់មុខគ្នា ឱ្យចេញជារូបរាងដើមឈើ ឬផ្ទះមួយនៅក្នុងកុំព្យូទ័រ។
Mean Shift Segmentation	ក្បួនដោះស្រាយផ្នែក Machine Learning សម្រាប់បែងចែកទិន្នន័យជាក្រុម (Clustering) ដោយស្វែងរកតំបន់ដែលមានដង់ស៊ីតេទិន្នន័យខ្ពស់បំផុត (ឧទាហរណ៍ ចំណុចកណ្ដាលនៃមកុដឈើ) ហើយប្រមូលចំណុចនៅជុំវិញនោះចូលជាក្រុមតែមួយ ដើម្បីកាត់ផ្តាច់ដើមឈើមួយពីដើមឈើមួយទៀត។	ដូចជាការទម្លាក់មេដែកចូលក្នុងគំនរដែកគោល មេដែកនោះនឹងទាញទាក់ដែកគោលដែលនៅជិតៗវាបំផុតឱ្យផ្តុំគ្នាជាដុំៗដាច់ដោយឡែកពីគ្នា។
Bandwidth	នៅក្នុងបរិបទនៃ Mean Shift ពាក្យនេះមិនមែនជាល្បឿនអ៊ីនធឺណិតទេ តែវាសំដៅលើទំហំកាំ (Radius) នៃរង្វង់ឬស្វ៊ែរដែលប្រើសម្រាប់រុករក និងប្រមូលផ្តុំចំណុចទិន្នន័យ។ បើវាតូចពេក ដើមឈើមួយអាចត្រូវបែកជាពីរ បើវាធំពេក ដើមឈើពីរអាចត្រូវច្របាច់បញ្ចូលគ្នាជាដើមឈើតែមួយ។	ដូចជាទំហំនៃសំណាញ់ចាប់ត្រី បើប្រើសំណាញ់តូច ចាប់បានតែត្រីនៅជិតៗខ្លួន បើប្រើសំណាញ់ធំ អាចចាប់បានត្រីក្នុងបរិវេណធំទូលាយជាង និងអាចជាប់ទាំងកំទេចកំទីផ្សេងៗមកជាមួយផងដែរ។
DBSCAN Clustering	ក្បួនដោះស្រាយសម្រាប់ចាប់ក្រុមទិន្នន័យដោយផ្អែកលើភាពកកកុញ (Density-based) ដែលអាចរកឃើញរូបរាងក្រុមទិន្នន័យស្មុគស្មាញ និងទម្លាក់ចោលចំណុចរំខាន (Outliers) ដែលនៅដាច់តែឯង។ ក្នុងឯកសារនេះ វាត្រូវប្រើសម្រាប់ចង្កោមចំណុចឱ្យក្លាយជាគល់ឈើ។	ដូចជាការកំណត់សម្គាល់ក្រុមមនុស្សនៅក្នុងពិធីបុណ្យ តំបន់ណាមានមនុស្សឈរជុំគ្នាច្រើនចាត់ទុកជាក្រុមមួយ ចំណែកអ្នកដែលឈរនៅឆ្ងាយដាច់តែឯងត្រូវបានចាត់ទុកជាអ្នកដើរកាត់ (Outliers)។
Canopy Height Model (CHM)	ម៉ូដែលឌីជីថលតំណាងឱ្យកម្ពស់សុទ្ធរបស់មកុដឈើ (Canopy) ដែលទទួលបានតាមរយៈការយកកម្ពស់ផ្ទៃខាងលើបង្អស់នៃព្រៃឈើដកកម្ពស់ផ្ទៃដីធម្មតាចេញ ដើម្បីដឹងថាតើដើមឈើនោះខ្ពស់ផុតពីដីប៉ុន្មានម៉ែត្រ។	ដូចជាការវាស់កម្ពស់មនុស្សដោយដកកម្រាស់ស្បែកជើងចេញ ដើម្បីដឹងថាតើមនុស្សនោះមានកម្ពស់ពិតប្រាកដប៉ុន្មានចាប់ពីបាតជើងដល់កំពូលក្បាល។
Morphological filtering	ដំណើរការនៃក្បួនដោះស្រាយក្នុងការសម្អាតទិន្នន័យ Point Clouds តាមរយៈការវិភាគរូបរាង និងកម្ពស់ ដើម្បីបែងចែកឱ្យដាច់រវាងចំណុចដែលជាដី (Ground) និងចំណុចដែលជាវត្ថុនៅពីលើដី (Non-ground ដូចជាដើមឈើ) មុននឹងឈានទៅធ្វើការវិភាគបន្ត។	ដូចជាការប្រើកញ្ច្រែងដើម្បីច្រោះយកគ្រាប់ក្រួសធំៗចេញពីខ្សាច់ម៉ដ្ឋ ដើម្បីយកតែដីខ្សាច់សុទ្ធ (តំណាងឱ្យផ្ទៃដី) ទុកសម្រាប់ប្រើប្រាស់បន្ត។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖