Original Title: Automatic extraction of economically important forest tree species using deep learning and image processing techniques
Source: doi.org/10.18520/cs/v128/i9/899-907
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការទាញយកដោយស្វ័យប្រវត្តិនូវប្រភេទដើមឈើព្រៃឈើដែលមានសារៈសំខាន់ខាងសេដ្ឋកិច្ចដោយប្រើប្រាស់បច្ចេកវិទ្យាសិក្សាស៊ីជម្រៅ និងការដំណើរការរូបភាព

ចំណងជើងដើម៖ Automatic extraction of economically important forest tree species using deep learning and image processing techniques

អ្នកនិពន្ធ៖ Anju Bajpai, A. O. Varghese, T. P. Girish Kumar, G. Sreenivasan

ឆ្នាំបោះពុម្ព៖ CURRENT SCIENCE, 2025

វិស័យសិក្សា៖ Remote Sensing and Machine Learning

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការស្រាវជ្រាវនេះដោះស្រាយបញ្ហាប្រឈមក្នុងការកំណត់អត្តសញ្ញាណ និងចាត់ថ្នាក់ប្រភេទដើមឈើព្រៃឈើចម្រុះនៅតំបន់ត្រូពិចដែលមានតម្លៃសេដ្ឋកិច្ចខ្ពស់ ដើម្បីគាំទ្រដល់ជីវភាពសហគមន៍ជនបទ និងការគ្រប់គ្រងធនធានធម្មជាតិ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានរួមបញ្ចូលគ្នានូវការវិភាគរូបភាពផ្អែកលើវត្ថុ (OBIA) ជាមួយនឹងបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតសម្រាប់ការបែងចែកអត្ថន័យ (Semantic Segmentation) លើរូបភាពផ្កាយរណបកម្រិតច្បាស់ខ្ពស់។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Object-Based Image Analysis (OBIA) with GASC
ការវិភាគរូបភាពផ្អែកលើវត្ថុ (OBIA) រួមជាមួយនឹងការវិភាគក្រាហ្វិកចំណាំងផ្លាតវិសាលគម (GASC)
អាចបង្កើតរបាំងទិន្នន័យ (Masks) ដោយពាក់កណ្តាលស្វ័យប្រវត្តិលឿនជាងការធ្វើដោយដៃ និងប្រើប្រាស់លក្ខណៈពិសេសប្លែកៗដូចជា រាង ទំហំ និងពណ៌នៃមកុដដើមឈើ។ ទាមទារការកែសម្រួលដោយមនុស្ស (Interactive editing) ដើម្បីលុបបំបាត់កំហុស និងនៅមានការលាយឡំគ្នានៃប្រភេទដើមឈើមួយចំនួន។ បង្កើតបានជាទិន្នន័យបណ្តុះបណ្តាល (Training dataset) ដែលមានគុណភាពខ្ពស់សម្រាប់បន្តទៅកាន់ម៉ូដែលសិក្សាស៊ីជម្រៅ។
DeepLabV3+ (Semantic Segmentation)
ម៉ូដែលសិក្សាស៊ីជម្រៅ DeepLabV3+ សម្រាប់ការបែងចែកអត្ថន័យ
ជាប្រព័ន្ធស្វ័យប្រវត្តិពេញលេញ មានប្រសិទ្ធភាពខ្ពស់ក្នុងការទាញយកមកុដដើមឈើ និងអាចចាប់យកព័ត៌មានលម្អិតនៃរូបភាពបានយ៉ាងល្អ។ ត្រូវការទិន្នន័យបណ្តុះបណ្តាល (Ground-truth data) ច្រើន និងប្រើប្រាស់ថាមពលកុំព្យូទ័រខ្ពស់សម្រាប់ការបណ្តុះបណ្តាល។ ទទួលបានសន្ទស្សន៍ IoU 0.806 កម្រិត Kappa 0.813 ជាមួយនឹងកំហុសអវត្តមាន (Omission error) ត្រឹមតែ 3% និងកំហុសកម្រៃជើងសារ (Commission error) 8% ។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តវិធីសាស្ត្រនេះទាមទារនូវធនធានបច្ចេកវិទ្យា ទិន្នន័យកម្រិតច្បាស់ខ្ពស់ដែលមានតម្លៃថ្លៃ និងឧបករណ៍សម្រាប់ចុះប្រមូលទិន្នន័យផ្ទាល់នៅទីវាល។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងតំបន់ព្រៃល្បោះចម្រុះនៃខេត្ត Nagpur ប្រទេសឥណ្ឌា ដោយផ្តោតលើប្រភេទដើមឈើត្រូពិចចំនួន ៤ ប្រភេទប៉ុណ្ណោះ។ ទោះបីជាកម្ពុជាមានប្រភេទដើមឈើដូចគ្នា (ឧទាហរណ៍៖ ដើមម៉ៃសាក់ និងឫស្សី) ក៏ដោយ ក៏លក្ខណៈនៃមកុដដើមឈើអាចប្រែប្រួលទៅតាមអាកាសធាតុ និងប្រភេទដី។ ការយកមកអនុវត្តផ្ទាល់នៅកម្ពុជាអាចនឹងមានភាពលម្អៀង (Bias) ប្រសិនបើមិនមានការប្រមូលទិន្នន័យមូលដ្ឋានក្នុងស្រុកមកបង្វឹកម៉ូដែលឡើងវិញទេ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់ណាស់ក្នុងការយកមកអនុវត្តនៅប្រទេសកម្ពុជា ជាពិសេសសម្រាប់ការគ្រប់គ្រងធនធានព្រៃឈើ និងការគាំទ្រដល់ជីវភាពសហគមន៍ជនបទ។

ការរួមបញ្ចូលគ្នានូវទិន្នន័យផ្កាយរណបកម្រិតច្បាស់ខ្ពស់ និងបច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិត (AI) នឹងផ្តល់នូវដំណោះស្រាយប្រកបដោយភាពច្នៃប្រឌិត និងភាពត្រឹមត្រូវខ្ពស់សម្រាប់ការត្រួតពិនិត្យធនធានព្រៃឈើនៅក្នុងប្រទេសកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ការប្រមូលទិន្នន័យមូលដ្ឋាន និងទិន្នន័យរូបភាពផ្កាយរណប (Data Collection): ស្នើសុំឬទិញទិន្នន័យផ្កាយរណបកម្រិតច្បាស់ខ្ពស់ (ដូចជា Pléiades Neo ឬប្រើរូបភាពដ្រូន UAV) និងចុះប្រមូលទិន្នន័យ Ground-truth នៅតាមតំបន់ព្រៃគោលដៅក្នុងប្រទេសកម្ពុជា ដោយប្រើប្រាស់ឧបករណ៍ DGPS ដើម្បីកត់ត្រាទីតាំងដើមឈើសំខាន់ៗ។
  2. ការរៀបចំទិន្នន័យបណ្តុះបណ្តាល (Data Preparation & Mask Creation): ប្រើប្រាស់កម្មវិធី QGIS ដើម្បីកំណត់ទីតាំងដើមឈើលើរូបភាពផ្កាយរណប និងអនុវត្តបច្ចេកទេស OBIA ដើម្បីបង្កើត Mask Layers ជាទម្រង់ពាក់កណ្តាលស្វ័យប្រវត្តិ ព្រមទាំងកាត់រូបភាពជាផ្ទាំងតូចៗ (ឧទាហរណ៍៖ 512x512 pixels) សំរាប់បង្វឹកម៉ូដែល។
  3. ការអភិវឌ្ឍ និងបង្វឹកម៉ូដែល AI (Model Development & Training): រៀបចំបរិស្ថានកូដជាមួយ Python និងប្រើប្រាស់ស្ថាបត្យកម្ម DeepLabV3+ (ផ្អែកលើ ResNet101) ដំណើរការលើ TensorFlowPyTorch។ ប្រើប្រាស់ម៉ាស៊ីនដែលមាន GPU ខ្លាំងដើម្បីបង្វឹកម៉ូដែល ព្រមទាំងអនុវត្ត Data Augmentation ដើម្បីជៀសវាងបញ្ហា Overfitting
  4. ការវាយតម្លៃ និងកែលម្អម៉ូដែល (Model Evaluation & Fine-tuning): ធ្វើការសាកល្បងម៉ូដែលលើទិន្នន័យថ្មី (Validation dataset) និងវាស់ស្ទង់ភាពត្រឹមត្រូវតាមរយៈសន្ទស្សន៍ Intersection over Union (IoU) និង Kappa Coefficient។ កែសម្រួលប៉ារ៉ាម៉ែត្រម៉ូដែល ប្រសិនបើកំហុសអវត្តមាន (Omission error) នៅមានកម្រិតខ្ពស់។
  5. ការដាក់ឱ្យប្រើប្រាស់ជាក់ស្តែង (Deployment & Integration): រៀបចំប្រព័ន្ធពពក (Cloud-based Platform) ដែលអនុញ្ញាតឱ្យមន្ត្រីរដ្ឋបាលព្រៃឈើ ឬអ្នកស្រាវជ្រាវអាចបញ្ចូលរូបភាពផ្កាយរណបថ្មីៗ និងទទួលបានផែនទីចែកចាយប្រភេទដើមឈើដែលមានតម្លៃសេដ្ឋកិច្ចដោយស្វ័យប្រវត្តិ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Semantic segmentation ដំណើរការបែងចែករូបភាពទៅជាផ្នែកតូចៗ (pixels) ដោយកំណត់អត្តសញ្ញាណថាភីកសែលនីមួយៗជារបស់វត្ថុអ្វី (ឧទាហរណ៍៖ ដើមឈើ ផ្លូវ ឬដីទទេ) ជាជាងគ្រាន់តែគូសប្រអប់ព័ទ្ធជុំវិញវត្ថុ។ ដូចជាការផាត់ពណ៌លើរូបភាពសខ្មៅ ដោយប្រើពណ៌ខុសៗគ្នាសម្រាប់វត្ថុខុសៗគ្នា (ពណ៌បៃតងសម្រាប់ដើមឈើ ពណ៌ត្នោតសម្រាប់ដី) ដើម្បីឱ្យកុំព្យូទ័រយល់ពីអ្វីដែលមានក្នុងរូបភាពយ៉ាងលម្អិត។
Object-based image analysis (OBIA) បច្ចេកទេសវិភាគរូបភាពដោយផ្តុំភីកសែល (pixels) ដែលមានលក្ខណៈស្រដៀងគ្នា (ពណ៌ រូបរាង ទំហំ) ទៅជា "វត្ថុ" តែមួយ រួចទើបធ្វើចំណាត់ថ្នាក់វត្ថុនោះ ជំនួសឱ្យការវិភាគលើភីកសែលនីមួយៗដាច់ដោយឡែកពីគ្នា។ ដូចជាការលេងរូបផ្គុំ (Jigsaw puzzle) ដែលយើងមិនមើលត្រឹមតែចំណុចពណ៌តូចៗទេ តែយើងផ្តុំបំណែកដែលមានពណ៌និងរាងស្រដៀងគ្នាចូលគ្នា ដើម្បីដឹងថាវាជារូបអ្វីឱ្យប្រាកដ។
Intersection over Union (IoU) រង្វាស់សម្រាប់វាស់ស្ទង់ភាពត្រឹមត្រូវនៃម៉ូដែលបញ្ញាសិប្បនិម្មិតក្នុងការកាត់ព្រំដែនវត្ថុ ដោយគណនាផលធៀបរវាងផ្ទៃដែលម៉ូដែលទាយត្រូវត្រួតស៊ីគ្នាជាមួយផ្ទៃពិតប្រាកដ (Intersection) ធៀបនឹងផ្ទៃសរុបទាំងពីរបញ្ចូលគ្នា (Union)។ ដូចជាការប្រៀបធៀបគំនូរដែលអ្នកគូសត្រាប់តាមរូបដើម ប្រសិនបើគំនូររបស់អ្នកត្រួតស៊ីគ្នាបេះបិទជាមួយរូបដើម នោះពិន្ទុ IoU នឹងខ្ពស់បំផុត (១០០%)។
Graphic analysis of spectral reflectance curve (GASC) ការវិភាគក្រាហ្វិកនៃខ្សែកោងចំណាំងផ្លាតពន្លឺ ដើម្បីស្វែងរកលក្ខណៈសម្គាល់ពិសេសរបស់ប្រភេទដើមឈើនីមួយៗ ផ្អែកលើរបៀបដែលស្លឹករបស់វាស្រូប និងចំណាំងផ្លាតរលកពន្លឺផ្សេងៗគ្នា (ដូចជាពន្លឺក្រហម ឬពន្លឺក្រៅតំបន់មើលឃើញ)។ ដូចជាការប្រើម៉ាស៊ីនស្កេនក្រសែភ្នែក ឬស្នាមម្រាមដៃ ដើម្បីបែងចែកមនុស្សម្នាក់ពីម្នាក់ទៀត ដោយដើមឈើនីមួយៗមាន "ស្នាមម្រាមដៃពន្លឺ" រៀងៗខ្លួន។
Pléiades Neo ប្រព័ន្ធផ្កាយរណបសង្កេតផែនដីរបស់អឺរ៉ុប ដែលមានសមត្ថភាពផ្តិតយករូបភាពក្នុងកម្រិតច្បាស់ខ្ពស់ខ្លាំង (ទំហំដល់ទៅ ៣០ សង់ទីម៉ែត្រក្នុងមួយភីកសែល) ដែលអនុញ្ញាតឱ្យគេអាចមើលឃើញមកុដដើមឈើនីមួយៗបានយ៉ាងច្បាស់ពីលំហ។ ដូចជាកែវយឹតដ៏មានអានុភាពខ្លាំងបំពាក់លើលំហអាកាស ដែលអាចថតរូបផ្ទៃដីបានច្បាស់រហូតដល់អាចមើលឃើញដំបូលផ្ទះ ឬដើមឈើមួយដើមៗបាន។
Non-timber forest products (NTFPs) អនុផលព្រៃឈើ ឬផលិតផលទាំងឡាយណាដែលប្រមូលបានពីព្រៃក្រៅពីឈើមានតម្លៃសម្រាប់យកទៅសាងសង់ ដូចជា ផ្លែឈើ គ្រាប់ ជ័រ វល្លិ៍ ឫស្សី និងរុក្ខជាតិឱសថ ដែលមានសារៈសំខាន់ខ្លាំងសម្រាប់សេដ្ឋកិច្ចនិងជីវភាពសហគមន៍មូលដ្ឋាន។ គឺជារបស់របរទាំងអស់ដែលព្រៃឈើផ្តល់ឱ្យក្រៅពីឈើធំៗ ដូចជាផ្សិត ទឹកឃ្មុំ ឬទំពាំង ដែលអ្នកស្រុកអាចរកបានដើម្បីហូប ឬលក់ដោយមិនបាច់កាប់រំលំដើមឈើ។
Data augmentation បច្ចេកទេសបំប្លែងទិន្នន័យដើម (ដូចជាការបង្វិល បង្រួម ពង្រីក ឬប្តូរពន្លឺរូបភាព) ដើម្បីបង្កើតទិន្នន័យថ្មីៗបន្ថែមសម្រាប់យកទៅបង្វឹកម៉ូដែល AI ជួយការពារកុំឱ្យម៉ូដែលទន្ទេញចាំតែរូបភាពចាស់ៗ (Overfitting)។ ដូចជាការបង្រៀនក្មេងឱ្យស្គាល់សត្វឆ្មា ដោយបង្ហាញរូបឆ្មាពីមុខ ពីចំហៀង ពេលដេក និងពេលរត់ ដើម្បីឱ្យក្មេងអាចចំណាំសត្វឆ្មាបានទោះវានៅក្នុងស្ថានភាពបែបណាក៏ដោយ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖