Original Title: Automatic Tree Height Measurement Based on Three-Dimensional Reconstruction Using Smartphone
Source: doi.org/10.3390/s23167248
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការវាស់កម្ពស់ដើមឈើដោយស្វ័យប្រវត្តិដោយផ្អែកលើការស្ថាបនាឡើងវិញជាទម្រង់ត្រីមាត្រ(3D)ដោយប្រើប្រាស់ស្មាតហ្វូន

ចំណងជើងដើម៖ Automatic Tree Height Measurement Based on Three-Dimensional Reconstruction Using Smartphone

អ្នកនិពន្ធ៖ Yulin Shen (School of Computer, Electronics and Information, Guangxi University), Ruwei Huang (School of Computer, Electronics and Information, Guangxi University), Bei Hua (School of Computer, Electronics and Information, Guangxi University), Yuanguan Pan (School of Computer, Electronics and Information, Guangxi University), Yong Mei (School of Computer, Electronics and Information, Guangxi University), Minghao Dong (School of Computer, Electronics and Information, Guangxi University)

ឆ្នាំបោះពុម្ព៖ 2023 (Sensors)

វិស័យសិក្សា៖ Forestry and Computer Vision

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហាទាក់ទងនឹងការវាស់កម្ពស់ដើមឈើក្នុងការស្រាវជ្រាវធនធានព្រៃឈើ ដែលវិធីសាស្ត្រប្រពៃណីនិងឧបករណ៍ស្ទង់ទំនើបៗមានតម្លៃថ្លៃ ត្រូវការកម្លាំងពលកម្មច្រើន ចំណាយពេលយូរ និងមានភាពស្មុគស្មាញ។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានស្នើឡើងនូវវិធីសាស្ត្រវាស់កម្ពស់ដើមឈើថ្មីដោយផ្អែកលើការស្ថាបនាទម្រង់ត្រីមាត្រ (3D Reconstruction) តាមរយៈកម្មវិធីស្មាតហ្វូន (Android App) ប្រកបដោយភាពងាយស្រួលនិងស្វ័យប្រវត្តិ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Proposed: 3D Reconstruction using Smartphone (ARCore + MidasNet + Depth-Attention-UNet)
ការវាស់កម្ពស់ដោយស្ថាបនាទម្រង់ត្រីមាត្រ (3D Reconstruction) តាមរយៈស្មាតហ្វូន
មានភាពងាយស្រួល ចំណាយតិច លឿនរហ័ស និងមិនតម្រូវឱ្យមានឧបករណ៍វាស់ខ្នាត (Calibration Objects) ស្មុគស្មាញឡើយ។ ភាពត្រឹមត្រូវអាចធ្លាក់ចុះនៅពេលថតពីចម្ងាយឆ្ងាយ ឬមានស្លឹកឈើបាំងច្រើន ដែលធ្វើឱ្យការចាប់ចំណុចពពក (Point Cloud) មិនសូវច្បាស់។ ទទួលបានកម្រិតកំហុសធៀបជាមធ្យមត្រឹមតែ ៣,២០% ប៉ុណ្ណោះ ក្នុងចម្ងាយថតពី ២ ទៅ ១៧ ម៉ែត្រ។
Baseline: Ultrasonic Rangefinder (Vertex IV)
ការវាស់ដោយប្រើប្រាស់ឧបករណ៍វាស់ចម្ងាយដោយរលកសំឡេង (Ultrasonic Rangefinder)
មានភាពត្រឹមត្រូវខ្ពស់បំផុត និងត្រូវបានទទួលស្គាល់ជាស្តង់ដារសម្រាប់ការចុះអង្កេតព្រៃឈើជាសកល។ ឧបករណ៍មានតម្លៃថ្លៃ ពិបាកយកតាមខ្លួនក្នុងព្រៃជ្រៅ និងត្រូវការពេលវេលារៀបចំដំឡើង (Transponder) ដោយកម្លាំងមនុស្ស។ ត្រូវបានប្រើប្រាស់ជាទិន្នន័យគោល (Ground Truth) សម្រាប់ប្រៀបធៀបដើម្បីវាយតម្លៃភាពត្រឹមត្រូវនៃវិធីសាស្ត្រថ្មី។
Standard Image Segmentation (Attention-UNet without depth)
ការបំបែករូបភាពដើមឈើដោយប្រើបណ្តាញ Attention-UNet ទូទៅ (គ្មានប្រើទិន្នន័យជម្រៅ)
អាចបំបែកទម្រង់ដើមឈើចេញពីផ្ទៃខាងក្រោយបានល្អក្នុងស្ថានភាពដែលរូបភាពមានពណ៌ដាច់ស្រឡះពីគ្នា។ ជួបការលំបាកក្នុងការបំបែកដើមឈើពីរដែលដុះត្រួតស៊ីគ្នា ឬមានពណ៌ស្រដៀងនឹងផ្ទៃខាងក្រោយ ធ្វើឱ្យមានកំហុសក្នុងការកាត់ផ្តាច់រូបភាព។ ទទួលបានកម្រិតចំណុចកាត់ប្រសព្វ (IoU) ត្រឹមតែ ៩១,២០% ធៀបនឹង ៩៥,៣១% របស់ម៉ូដែលស្នើឡើងថ្មីដែលមានបន្ថែមទិន្នន័យជម្រៅ។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តប្រព័ន្ធនេះទាមទារនូវឧបករណ៍ស្មាតហ្វូនធម្មតាដែលគាំទ្រមុខងារ AR សម្រាប់ការទាញយកទិន្នន័យ និងប្រព័ន្ធម៉ាស៊ីនមេ (Server) ដែលមានសមត្ថភាពខ្ពស់ក្នុងការដំណើរការ AI និង Point Cloud ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងបរិវេណសាកលវិទ្យាល័យ Guangxi ប្រទេសចិន ដែលដើមឈើភាគច្រើនមានការរៀបចំដាំមានរបៀបរៀបរយ និងមានផ្ទៃខាងក្រោយមិនសូវស្មុគស្មាញ។ ចំណុចនេះមានសារៈសំខាន់សម្រាប់ប្រទេសកម្ពុជា ដោយសារព្រៃឈើធម្មជាតិនៅកម្ពុជាមានសភាពក្រាស់ និងស្មុគស្មាញខ្លាំង ដែលអាចទាមទារឱ្យមានការបង្ហាត់ម៉ូដែលឡើងវិញ (Fine-tuning) ជាមួយទិន្នន័យក្នុងស្រុក ដើម្បីធានាបាននូវភាពត្រឹមត្រូវនៅពេលប្រើប្រាស់ជាក់ស្តែង។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់និងមានប្រយោជន៍ខ្លាំងសម្រាប់ការគ្រប់គ្រងធនធានព្រៃឈើ ការសិក្សាជីវចម្រុះ និងវិស័យកសិកម្មនៅកម្ពុជា ដោយសារវាជួយសន្សំសំចៃការចំណាយបានយ៉ាងច្រើន។

ជារួម បច្ចេកវិទ្យានេះអាចធ្វើបដិវត្តន៍របៀបដែលកម្ពុជាធ្វើការអង្កេតព្រៃឈើ ដោយបំប្លែងវាទៅជាសកម្មភាពដែលមានតម្លៃទាប លឿនរហ័ស និងអនុញ្ញាតឱ្យសហគមន៍មូលដ្ឋានអាចចូលរួមបានយ៉ាងងាយស្រួល។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃការទាញយកទិន្នន័យជម្រៅពីស្មាតហ្វូន (Depth Estimation Basics): និស្សិតត្រូវចាប់ផ្តើមសិក្សាពីការអភិវឌ្ឍកម្មវិធី Android និងប្រើប្រាស់ ARCore ដើម្បីយល់ពីរបៀបកំណត់ទីតាំងកាមេរ៉ា និងទាញយកទិន្នន័យជម្រៅ (Depth Map) ចេញពីរូបភាពប្រចាំថ្ងៃ។
  2. អភិវឌ្ឍម៉ូដែលបញ្ញាសិប្បនិម្មិតសម្រាប់ការបំបែករូបភាព (AI Image Segmentation): ប្រើប្រាស់ PyTorch ដើម្បីសាងសង់និងបង្ហាត់បណ្តាញកសាងរូបភាពត្រីមាត្រ ដោយប្រើប្រាស់ Attention-UNet រួមបញ្ចូលជាមួយបណ្តាញប៉ាន់ស្មានជម្រៅដូចជា MidasNet ដើម្បីកាត់ផ្តាច់ដើមឈើចេញពីផ្ទៃខាងក្រោយ។
  3. កសាងប្រព័ន្ធដំណើរការទិន្នន័យចំណុចពពក (3D Point Cloud Processing Backend): សរសេរកូដផ្នែក Backend ដោយប្រើប្រាស់ Flask ដើម្បីទទួលទិន្នន័យពីទូរស័ព្ទ បន្ទាប់មកប្រើប្រាស់ Open3D និង OpenCV ក្នុងការបង្កើតចំណុចពពកត្រីមាត្រ (3D Point Cloud) ការត្រងយកចំណុចរំខានចេញ (Radius Filtering) និងគណនាកម្ពស់តាមរយៈប្រអប់ Bounding Box។
  4. ការប្រមូលទិន្នន័យដើមឈើក្នុងស្រុក និងការកែលម្អម៉ូដែល (Local Data Collection & Fine-tuning): ចុះប្រមូលទិន្នន័យរូបភាពដើមឈើជាក់ស្តែងនៅក្នុងតំបន់ឧទ្យានជាតិ ឬសហគមន៍ព្រៃឈើនៅកម្ពុជា (ឧទាហរណ៍៖ ឧទ្យានជាតិគិរីរម្យ) យកមកធ្វើ Annotation ដើម្បី Fine-tune ម៉ូដែលឱ្យវាមានសមត្ថភាពស្គាល់ដើមឈើក្នុងបរិស្ថានត្រូពិចរបស់កម្ពុជាបានល្អប្រសើរ។
  5. ការធ្វើសមាហរណកម្មប្រព័ន្ធ និងការធ្វើតេស្តជាក់ស្តែង (System Integration & Field Testing): ភ្ជាប់កម្មវិធីទូរស័ព្ទផ្នែក Frontend ទៅកាន់ AI Backend តាមរយៈ OkHttp3 ហើយចុះធ្វើការសាកល្បងវាស់កម្ពស់ដើមឈើផ្ទាល់ ដោយប្រៀបធៀបលទ្ធផលជាមួយវិធីសាស្ត្រប្រពៃណី ដើម្បីវាយតម្លៃភាពត្រឹមត្រូវមុននឹងដាក់ឱ្យប្រើប្រាស់ជាផ្លូវការ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Depth from Motion (DfM) បច្ចេកវិទ្យាដែលប្រើប្រាស់កាមេរ៉ាតែមួយដើម្បីថតរូបភាពបន្តបន្ទាប់គ្នាពេលកាមេរ៉ាផ្លាស់ទី ហើយគណនាចម្ងាយពីកាមេរ៉ាទៅកាន់វត្ថុដោយផ្អែកលើការផ្លាស់ប្តូរទីតាំងនៃវត្ថុក្នុងបណ្តុំរូបភាពទាំងនោះ។ ដូចជាពេលយើងអង្គុយលើឡានកំពុងបើកបរ ហើយសង្កេតឃើញដើមឈើនៅជិតរត់លឿនជាងភ្នំនៅឆ្ងាយ ដែលបាតុភូតនេះជួយឱ្យប្រព័ន្ធដឹងថាវត្ថុណាជិត វត្ថុណាឆ្ងាយ។
Absolute Depth Map ផែនទីរូបភាពដែលចំណុចភីកសែល (Pixel) នីមួយៗមិនមែនផ្ទុកទិន្នន័យពណ៌ទេ ប៉ុន្តែផ្ទុកនូវទិន្នន័យចម្ងាយពិតប្រាកដ (គិតជាមីលីម៉ែត្រ ឬម៉ែត្រ) ពីកាមេរ៉ាទៅកាន់ផ្ទៃនៃវត្ថុដែលវាបានចាប់យក។ ដូចជាការយកបន្ទាត់ទៅវាស់ចម្ងាយពីភ្នែកយើងទៅកាន់គ្រប់ចំណុចទាំងអស់នៅលើវត្ថុមួយ រួចកត់ត្រាចម្ងាយទាំងនោះទុកជាផ្ទាំងគំនូរ។
Attention-UNet ម៉ូដែលបណ្ដាញបញ្ញាសិប្បនិម្មិត (AI) ដែលប្រើប្រាស់យន្តការផ្តោតអារម្មណ៍ (Attention Mechanism) ដើម្បីរំលេចលក្ខណៈពិសេសរបស់វត្ថុគោលដៅ និងកាត់ផ្តាច់រូបភាពវត្ថុនោះចេញពីផ្ទៃខាងក្រោយដែលស្មុគស្មាញ។ ដូចជានិស្សិតម្នាក់ដែលពាក់វ៉ែនតាវេទមន្តអាចច្រោះមើលឃើញតែពណ៌បៃតងនៃដើមឈើ ដោយមិនខ្វល់ ឬមិនចាប់អារម្មណ៍ពីអគារ ឬមេឃដែលនៅពីក្រោយវានោះទេ។
3D Point Cloud បណ្តុំនៃចំណុចតូចៗរាប់លាននៅក្នុងលំហត្រីមាត្រ (3D) ដែលចំណុចនីមួយៗមានផ្ទុកនូវព័ត៌មានទីតាំងអ័ក្ស (x, y, z) និងពណ៌ ដើម្បីសង់ផ្គុំចេញជារូបរាងសរុបនៃវត្ថុណាមួយ។ ដូចជាការយកគ្រាប់ខ្សាច់មានពណ៌រាប់លានគ្រាប់មកបិទផ្គុំគ្នាឱ្យអណ្តែតចេញជារូបរាងដើមឈើនៅក្នុងលំហអាកាសអ៊ីចឹងដែរ។
Image Segmentation បច្ចេកទេសក្នុងវិទ្យាសាស្ត្រកុំព្យូទ័រចក្ខុ (Computer Vision) ដែលបែងចែករូបភាពមួយទៅជាផ្នែកៗដោយផ្តល់ស្លាក (Label) ទៅកាន់ភីកសែលនីមួយៗ ដើម្បីញែកវត្ថុដែលយើងចង់បានចេញពីផ្ទៃខាងក្រោយ។ ដូចជាការប្រើកន្ត្រៃកាត់ផ្តាច់រូបភាពដើមឈើចេញពីទស្សនាវដ្តី ដោយយកតែតួដើមឈើសុទ្ធ និងបោះចោលរូបភាពមេឃ ឬដី។
Radius Filtering ដំណើរការនៃការសម្អាតទិន្នន័យចំណុចពពក (Point Cloud) ដោយលុបចោលនូវចំណុចណាដែលនៅឯកកោ ឬគ្មានចំណុចផ្សេងទៀតនៅក្បែរវាក្នុងកម្រិតកាំ (Radius) ដែលបានកំណត់ ដើម្បីកាត់បន្ថយភាពរំខាននៃរូបភាព (Noise)។ ដូចជាការរែងយកកម្ទេចកំទីដែលរសាត់នៅដាច់ឆ្ងាយពីគេចេញ ដើម្បីទទួលបានតែដុំវត្ថុគោលដៅណាដែលនៅផ្តុំគ្នាជាដុំធំ។
Axis-aligned bounding box ការសង់ប្រអប់ចតុកោណកែងមួយគ្របតួដើមឈើទាំងមូលនៅក្នុងទម្រង់ 3D ដោយឱ្យស្របទៅនឹងអ័ក្សប្រព័ន្ធកូអរដោនេ ដើម្បីទាញយកទំហំ ឬកម្ពស់អតិបរមារបស់វត្ថុនោះតាមរយៈប្រវែងអ័ក្ស Y នៃប្រអប់នោះ។ ដូចជាការយកកេសក្រដាសរាងចតុកោណកែងទៅគ្របពីលើដើមឈើឱ្យជិតសព្វ ហើយបន្ទាប់មកយើងវាស់កម្ពស់កេសនោះជំនួសឱ្យការវាស់ដើមឈើផ្ទាល់។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖