Original Title: Estimating Tea Plant Physiological Parameters Using Unmanned Aerial Vehicle Imagery and Machine Learning Algorithms
Source: doi.org/10.3390/s25071966
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្រសរីរវិទ្យានៃរុក្ខជាតិតែ ដោយប្រើរូបភាពយន្តហោះគ្មានមនុស្សបើក (UAV) និងក្បួនដោះស្រាយម៉ាស៊ីនរៀន (Machine Learning Algorithms)

ចំណងជើងដើម៖ Estimating Tea Plant Physiological Parameters Using Unmanned Aerial Vehicle Imagery and Machine Learning Algorithms

អ្នកនិពន្ធ៖ Zhong-Han Zhuang (National Chung Hsing University), Hui-Ping Tsai (National Chung Hsing University), Chung-I Chen (National Pingtung University of Science and Technology)

ឆ្នាំបោះពុម្ព៖ 2025 Sensors

វិស័យសិក្សា៖ Precision Agriculture

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការប្រែប្រួលអាកាសធាតុគំរាមកំហែងដល់ការលូតលាស់ ទិន្នផល និងគុណភាពរបស់រុក្ខជាតិតែ ដែលទាមទារឱ្យមានប្រព័ន្ធតាមដានពេលវេលាជាក់ស្តែង (Real-time monitoring system) ប្រកបដោយភាពត្រឹមត្រូវ ដើម្បីបង្កើនប្រសិទ្ធភាពនៃការគ្រប់គ្រងចម្ការ និងធានាស្ថិរភាពផលិតកម្ម។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានរួមបញ្ចូលទិន្នន័យវាស់ស្ទង់សរីរវិទ្យាផ្ទាល់នៅចម្ការ ជាមួយនឹងរូបភាពពីយន្តហោះគ្មានមនុស្សបើក (UAV) ព្រមទាំងប្រើប្រាស់ក្បួនដោះស្រាយម៉ាស៊ីនរៀន (Machine Learning) ដើម្បីវាយតម្លៃ និងបង្កើតគំរូទស្សន៍ទាយ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
XGBoost with Multispectral Indices (MIs)
ក្បួនដោះស្រាយ XGBoost ប្រើជាមួយសន្ទស្សន៍ពហុវិសាលគម
មានភាពត្រឹមត្រូវខ្ពស់បំផុត និងចាប់យកទំនាក់ទំនងមិនលីនេអ៊ែររវាងសន្ទស្សន៍រូបភាពនិងប៉ារ៉ាម៉ែត្រសរីរវិទ្យាបានយ៉ាងល្អ ដោយទាមទារអថេរឯករាជ្យតិចជាងម៉ូដែលផ្សេងៗ។ ត្រូវការកម្លាំងកុំព្យូទ័រខ្ពស់ និងការរៀបចំទិន្នន័យ (Hyperparameter tuning) ច្រើនដើម្បីចៀសវាងការចងចាំទិន្នន័យជ្រុល (Overfitting)។ ទទួលបានភាពត្រឹមត្រូវខ្ពស់បំផុត (LAI: R² = 0.716, PRI: R² = 0.643, ΦPSII: R² = 0.920) ជាមួយនឹងទិន្នន័យពហុវិសាលគម។
LightGBM with Multispectral Indices (MIs)
ក្បួនដោះស្រាយ LightGBM ប្រើជាមួយសន្ទស្សន៍ពហុវិសាលគម
មានល្បឿនលឿនក្នុងការហ្វឹកហាត់ម៉ូដែល និងមានប្រសិទ្ធភាពខ្ពស់ក្នុងការគ្រប់គ្រងទិន្នន័យធំៗ ផ្តល់លទ្ធផលប្រកៀកប្រកិតនឹង XGBoost។ ត្រូវការអថេរឯករាជ្យច្រើនជាង XGBoost បន្តិចដើម្បីសម្រេចបានភាពត្រឹមត្រូវកម្រិតដូចគ្នា។ ផ្តល់ភាពត្រឹមត្រូវទាបជាង XGBoost បន្តិច (ចន្លោះពី 0.006 ទៅ 0.375) ប៉ុន្តែប្រើពេលគណនាលឿនជាង។
Random Forest Regression (RFR) with Color Indices (CIs)
តំរែតំរង់ព្រៃចៃដន្យ (RFR) ប្រើជាមួយសន្ទស្សន៍ពណ៌
មានស្ថិរភាពក្នុងការទស្សន៍ទាយ និងកាត់បន្ថយបញ្ហាទិន្នន័យមានភាពលម្អៀង (Overfitting) តាមរយៈការប្រើដើមឈើសម្រេចចិត្តច្រើន។ ទាមទារអង្គចងចាំច្រើន ហើយនៅពេលប្រើជាមួយទិន្នន័យរូបភាពធម្មតា (RGB) ភាពត្រឹមត្រូវនៅមានកម្រិតទាបនៅឡើយ។ ទទួលបានលទ្ធផលល្អបំផុតក្នុងការទស្សន៍ទាយសន្ទស្សន៍ PRI ពេលប្រើទិន្នន័យរូបភាពធម្មតា ដោយទទួលបាន R² = 0.284 ។
Polynomial Regression (PR)
តំរែតំរង់ពហុធា
អាចចាប់យកទំនាក់ទំនងកោង (Curved relationships) មួយចំនួន ដែលម៉ូដែលលីនេអ៊ែរធម្មតាមិនអាចធ្វើបាន។ មិនមានស្ថិរភាព ងាយរងឥទ្ធិពលពីពហុកូលីនេអ៊ែរ (Multicollinearity) និងមានការប្រែប្រួលភាពត្រឹមត្រូវខ្លាំងពេក។ ផ្តល់ភាពត្រឹមត្រូវទាបបំផុត និងមិនសូវមានសមត្ថភាពក្នុងការពន្យល់ពីទំនាក់ទំនងស្មុគស្មាញនៃសរីរវិទ្យារុក្ខជាតិនោះទេ។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារការវិនិយោគច្រើនលើឧបករណ៍ប្រមូលទិន្នន័យរូបភាពពីចម្ងាយ (Remote Sensing) ឧបករណ៍វាស់ស្ទង់ជីវសាស្ត្រកម្រិតខ្ពស់ និងអ្នកជំនាញខាងទិន្នន័យម៉ាស៊ីនរៀន។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានអនុវត្តនៅក្នុងចម្ការតែចំនួន ២១កន្លែង ក្នុងខេត្ត Nantou ភាគកណ្តាលកោះតៃវ៉ាន់ ដោយផ្តោតលើរយៈកម្ពស់៣កម្រិត និងវិធីសាស្ត្រដាំដុះ២ប្រភេទ។ ដោយសារកម្ពុជាមានប្រភេទរុក្ខជាតិ អាកាសធាតុ (ត្រូពិច) និងលក្ខណៈដីខុសពីតៃវ៉ាន់ ម៉ូដែល (Models) ដែលបានបណ្តុះបណ្តាលទាំងនេះចាំបាច់ត្រូវតែយកមកកែសម្រួលពិន្ទុឡើងវិញ (Local Calibration) ដោយប្រើទិន្នន័យក្នុងស្រុក មុននឹងយកមកអនុវត្តពិតប្រាកដ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រតាមដានដំណាំដោយប្រើ UAV និង Machine Learning នេះ មានសក្តានុពលខ្ពស់ក្នុងការជំរុញការអភិវឌ្ឍកសិកម្មឆ្លាតវៃ (Precision Agriculture) នៅកម្ពុជា ជាពិសេសសម្រាប់ដំណាំឧស្សាហកម្មខ្នាតធំ។

ការបំពាក់បច្ចេកវិទ្យានេះនៅកម្ពុជានឹងជួយផ្លាស់ប្តូរការតាមដានដំណាំពីទម្រង់ប្រពៃណីដែលចំណាយពេលយូរ ទៅជាការវិភាគទិន្នន័យបែបឌីជីថល ដែលជួយទប់ទល់នឹងបម្រែបម្រួលអាកាសធាតុបានលឿនជាងមុន និងបង្កើនប្រសិទ្ធភាពសេដ្ឋកិច្ចរបស់កសិករ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. រៀបចំឧបករណ៍វិភាគនិងប្រមូលទិន្នន័យ (Equipment Procurement): វិនិយោគលើការទិញយន្តហោះគ្មានមនុស្សបើក (UAV) ដែលមានសមត្ថភាពថតរូបភាព Multispectral (ឧទាហរណ៍៖ DJI Mavic 3 Multispectral) ព្រមទាំងឧបករណ៍វាស់ផ្ទៃស្លឹករុក្ខជាតិ LAI-2200C សម្រាប់យកទិន្នន័យមូលដ្ឋាន។
  2. ការប្រមូលរូបភាព និងកែច្នៃទិន្នន័យបឋម (Image Acquisition & Processing): បណ្តុះបណ្តាលបុគ្គលិកឱ្យចេះហោះហើរប្រមូលទិន្នន័យនៅតាមចម្ការ និងប្រើប្រាស់កម្មវិធីដូចជា Agisoft MetashapePix4D ដើម្បីផ្គុំរូបភាពទៅជាផែនទី Orthomosaic រួចទាញយកសន្ទស្សន៍បៃតង (Vegetation Indices)។
  3. អនុវត្តក្បួនដោះស្រាយម៉ាស៊ីនរៀន (Implement Machine Learning): ប្រើប្រាស់ភាសាកម្មវិធី Python រួមជាមួយបណ្ណាល័យ Scikit-learn និង XGBoost ដើម្បីហ្វឹកហាត់ម៉ូដែល ដោយប្រៀបធៀបទិន្នន័យពីរូបភាព UAV ជាមួយនឹងទិន្នន័យដែលវាស់បានផ្ទាល់ពីចម្ការ។
  4. វាយតម្លៃ និងកែសម្រួលសម្រាប់បរិបទកម្ពុជា (Local Calibration): យកម៉ូដែលទៅធ្វើតេស្តសាកល្បងជាមួយដំណាំក្នុងស្រុក (ឧទាហរណ៍៖ ស្រូវ ស្វាយចន្ទី ឬកៅស៊ូ)។ អនុវត្តបច្ចេកទេសជ្រើសរើសលក្ខណៈពិសេស Feature Selection (PCA, MRMR) ដើម្បីកាត់បន្ថយចំនួនអថេរដែលមិនចាំបាច់ និងរក្សាភាពត្រឹមត្រូវនៃការព្យាករណ៍។
  5. បង្កើតប្រព័ន្ធគ្រប់គ្រងតាមដាន (Develop Monitoring Dashboard): រៀបចំបង្កើត Web Dashboard មួយដើម្បីបង្ហាញលទ្ធផលដែលវិភាគចេញពី AI អនុញ្ញាតឱ្យអ្នកគ្រប់គ្រងចម្ការអាចមើលឃើញពីចំណុចខ្វះជាតិទឹក ឬជី និងអាចធ្វើសេចក្តីសម្រេចចិត្តបានទាន់ពេលវេលា។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Leaf Area Index (LAI) ជារង្វាស់ដែលបង្ហាញពីផ្ទៃក្រឡាសរុបនៃស្លឹករុក្ខជាតិធៀបនឹងផ្ទៃដីមួយឯកតាដែលរុក្ខជាតិនោះដុះ។ វាត្រូវបានប្រើដើម្បីវាយតម្លៃពីភាពក្រាស់នៃស្លឹក សមត្ថភាពក្នុងការធ្វើរស្មីសំយោគ និងសក្តានុពលនៃទិន្នផលរបស់ដំណាំ។ ដូចជាការវាស់ទំហំនៃឆ័ត្រ ថាតើវាអាចបាំងម្លប់លើដីបានកម្រិតណាដែរ បើឆ័ត្រធំឬស្លឹកក្រាស់ (LAI ខ្ពស់) វាបាំងពន្លឺមិនឱ្យធ្លាក់ដល់ដីបានច្រើន។
Photochemical Reflectance Index (PRI) ជាសន្ទស្សន៍ដែលគណនាពីចំណាំងផ្លាតនៃពន្លឺ (ពិសេសពន្លឺពណ៌បៃតងនិងលឿង) ចេញពីស្លឹករុក្ខជាតិ ដើម្បីវាស់ស្ទង់ប្រសិទ្ធភាពនៃការប្រើប្រាស់ពន្លឺក្នុងការធ្វើរស្មីសំយោគ និងបង្ហាញពីកម្រិតភាពតានតឹង (Stress) របស់រុក្ខជាតិ។ ដូចជាការវាស់ចង្វាក់បេះដូងរបស់មនុស្សពេលកំពុងរត់ ដើម្បីដឹងថាគាត់ហត់កម្រិតណា រុក្ខជាតិប្រើ PRI ដើម្បីបង្ហាញថាវាខ្វះទឹកឬក្តៅខ្លាំងកម្រិតណា។
Quantum Yield of Photosystem II (ΦPSII) ជាប៉ារ៉ាម៉ែត្រជីវគីមីដែលវាស់ស្ទង់ពីអត្រាថាមពលពន្លឺព្រះអាទិត្យ ដែលរុក្ខជាតិស្រូបយកហើយអាចបំប្លែងទៅជាថាមពលគីមីបានជោគជ័យនៅក្នុងដំណើរការរស្មីសំយោគ។ វាបង្ហាញពីសុខភាពពិតប្រាកដនៃកោសិកាស្លឹក។ ដូចជាការវាស់ប្រសិទ្ធភាពផ្ទាំងសូឡា ថាតើវាអាចទាញយកពន្លឺព្រះអាទិត្យមកបំប្លែងជាអគ្គិសនីជាក់ស្តែងបានប៉ុន្មានភាគរយ។
Multispectral Imagery ជារូបភាពដែលថតដោយសេនស័រ (Sensor) ពិសេស ដែលអាចចាប់យកវិសាលគមពន្លឺច្រើនទម្រង់ រួមទាំងពន្លឺដែលភ្នែកមនុស្សមើលមិនឃើញ (ដូចជាពន្លឺក្រហមចុងកាត់ - Red Edge និងពន្លឺអ៊ីនហ្វ្រារ៉េដជិត - NIR) ដើម្បីមើលធ្លុះដល់រចនាសម្ព័ន្ធខាងក្នុងនៃស្លឹក។ ដូចជាការថតកាំរស្មីអ៊ិច (X-ray) នៅមន្ទីរពេទ្យ ដើម្បីមើលឃើញឆ្អឹងនិងសរីរាង្គខាងក្នុងដែលភ្នែកទទេមើលមិនឃើញ។
eXtreme Gradient Boosting (XGBoost) ជាក្បួនដោះស្រាយម៉ាស៊ីនរៀន (Machine Learning) ដ៏មានឥទ្ធិពលមួយ ដែលបង្កើតម៉ូដែលព្យាករណ៍តូចៗជាច្រើនដោយស្វ័យប្រវត្តិ ហើយជួយកែតម្រូវកំហុសរបស់ម៉ូដែលមុនៗជាបន្តបន្ទាប់ ដើម្បីផ្តល់នូវការទស្សន៍ទាយមួយដែលមានភាពត្រឹមត្រូវខ្ពស់បំផុត។ ដូចជាការធ្វើការងារជាក្រុម ដែលសមាជិកម្នាក់ៗជួយកែតម្រូវចំណុចខ្វះខាតរបស់អ្នកមុនជាបន្តបន្ទាប់ រហូតទទួលបានលទ្ធផលការងារមួយដែលល្អឥតខ្ចោះ។
Simple Linear Iterative Clustering (SLIC) ជាវិធីសាស្ត្រក្នុងការបែងចែករូបភាព (Image Segmentation) ទៅជាបំណែកតូចៗ (Superpixels) ដោយផ្អែកលើភាពស្រដៀងគ្នានៃពណ៌ និងទីតាំង ដើម្បីងាយស្រួលក្នុងការញែកប្រភេទវត្ថុក្នុងរូបភាព (ឧទាហរណ៍៖ ញែករូបដើមតែចេញពីដី ឬស្មៅ)។ ដូចជាការកាត់ដុំរូបភាពតុក្កតាផ្គុំ (Jigsaw puzzle) ជាក្រុមៗទៅតាមពណ៌ ដើម្បីឱ្យយើងងាយស្រួលរៀបវាចូលគ្នាជាងមុន។
Minimum Redundancy Maximum Relevance (MRMR) ជាបច្ចេកទេសក្នុងម៉ាស៊ីនរៀនសម្រាប់ជ្រើសរើសទិន្នន័យ (Feature Selection) ដោយរើសយកតែអថេរណាដែលមានឥទ្ធិពលខ្លាំងបំផុតទៅលើលទ្ធផលដែលចង់បាន ព្រមទាំងលុបចោលអថេរណាដែលមានព័ត៌មានជាន់គ្នាឬស្រដៀងគ្នាពេក។ ដូចជាការរៀបចំវ៉ាលីធ្វើដំណើរ ដោយរើសយកតែរបស់ណាដែលចាំបាច់បំផុត (Maximum Relevance) ហើយដកចេញនូវរបស់ដែលមុខងារជាន់គ្នាដូចជាអាវយឺតច្រើនពេក (Minimum Redundancy)។
Multicollinearity ជាបញ្ហានៅក្នុងស្ថិតិ នៅពេលដែលអថេរឯករាជ្យពីរឬច្រើននៅក្នុងម៉ូដែលព្យាករណ៍ មានទំនាក់ទំនងគ្នាខ្លាំងពេក (ផ្តល់ព័ត៌មានជាន់គ្នា) ធ្វើឱ្យម៉ូដែលពិបាកវាយតម្លៃថាអថេរមួយណាមានឥទ្ធិពលពិតប្រាកដទៅលើលទ្ធផលចុងក្រោយ។ ដូចជាការភ្លក់សម្លដែលមានដាក់ទាំងស្ករនិងទឹកឃ្មុំក្នុងបរិមាណច្រើន ធ្វើឱ្យយើងពិបាកដឹងច្បាស់ថាភាពផ្អែមនោះមកពីគ្រឿងមួយណាពិតប្រាកដ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖