បញ្ហា (The Problem)៖ ការប្រែប្រួលអាកាសធាតុគំរាមកំហែងដល់ការលូតលាស់ ទិន្នផល និងគុណភាពរបស់រុក្ខជាតិតែ ដែលទាមទារឱ្យមានប្រព័ន្ធតាមដានពេលវេលាជាក់ស្តែង (Real-time monitoring system) ប្រកបដោយភាពត្រឹមត្រូវ ដើម្បីបង្កើនប្រសិទ្ធភាពនៃការគ្រប់គ្រងចម្ការ និងធានាស្ថិរភាពផលិតកម្ម។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានរួមបញ្ចូលទិន្នន័យវាស់ស្ទង់សរីរវិទ្យាផ្ទាល់នៅចម្ការ ជាមួយនឹងរូបភាពពីយន្តហោះគ្មានមនុស្សបើក (UAV) ព្រមទាំងប្រើប្រាស់ក្បួនដោះស្រាយម៉ាស៊ីនរៀន (Machine Learning) ដើម្បីវាយតម្លៃ និងបង្កើតគំរូទស្សន៍ទាយ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| XGBoost with Multispectral Indices (MIs) ក្បួនដោះស្រាយ XGBoost ប្រើជាមួយសន្ទស្សន៍ពហុវិសាលគម |
មានភាពត្រឹមត្រូវខ្ពស់បំផុត និងចាប់យកទំនាក់ទំនងមិនលីនេអ៊ែររវាងសន្ទស្សន៍រូបភាពនិងប៉ារ៉ាម៉ែត្រសរីរវិទ្យាបានយ៉ាងល្អ ដោយទាមទារអថេរឯករាជ្យតិចជាងម៉ូដែលផ្សេងៗ។ | ត្រូវការកម្លាំងកុំព្យូទ័រខ្ពស់ និងការរៀបចំទិន្នន័យ (Hyperparameter tuning) ច្រើនដើម្បីចៀសវាងការចងចាំទិន្នន័យជ្រុល (Overfitting)។ | ទទួលបានភាពត្រឹមត្រូវខ្ពស់បំផុត (LAI: R² = 0.716, PRI: R² = 0.643, ΦPSII: R² = 0.920) ជាមួយនឹងទិន្នន័យពហុវិសាលគម។ |
| LightGBM with Multispectral Indices (MIs) ក្បួនដោះស្រាយ LightGBM ប្រើជាមួយសន្ទស្សន៍ពហុវិសាលគម |
មានល្បឿនលឿនក្នុងការហ្វឹកហាត់ម៉ូដែល និងមានប្រសិទ្ធភាពខ្ពស់ក្នុងការគ្រប់គ្រងទិន្នន័យធំៗ ផ្តល់លទ្ធផលប្រកៀកប្រកិតនឹង XGBoost។ | ត្រូវការអថេរឯករាជ្យច្រើនជាង XGBoost បន្តិចដើម្បីសម្រេចបានភាពត្រឹមត្រូវកម្រិតដូចគ្នា។ | ផ្តល់ភាពត្រឹមត្រូវទាបជាង XGBoost បន្តិច (ចន្លោះពី 0.006 ទៅ 0.375) ប៉ុន្តែប្រើពេលគណនាលឿនជាង។ |
| Random Forest Regression (RFR) with Color Indices (CIs) តំរែតំរង់ព្រៃចៃដន្យ (RFR) ប្រើជាមួយសន្ទស្សន៍ពណ៌ |
មានស្ថិរភាពក្នុងការទស្សន៍ទាយ និងកាត់បន្ថយបញ្ហាទិន្នន័យមានភាពលម្អៀង (Overfitting) តាមរយៈការប្រើដើមឈើសម្រេចចិត្តច្រើន។ | ទាមទារអង្គចងចាំច្រើន ហើយនៅពេលប្រើជាមួយទិន្នន័យរូបភាពធម្មតា (RGB) ភាពត្រឹមត្រូវនៅមានកម្រិតទាបនៅឡើយ។ | ទទួលបានលទ្ធផលល្អបំផុតក្នុងការទស្សន៍ទាយសន្ទស្សន៍ PRI ពេលប្រើទិន្នន័យរូបភាពធម្មតា ដោយទទួលបាន R² = 0.284 ។ |
| Polynomial Regression (PR) តំរែតំរង់ពហុធា |
អាចចាប់យកទំនាក់ទំនងកោង (Curved relationships) មួយចំនួន ដែលម៉ូដែលលីនេអ៊ែរធម្មតាមិនអាចធ្វើបាន។ | មិនមានស្ថិរភាព ងាយរងឥទ្ធិពលពីពហុកូលីនេអ៊ែរ (Multicollinearity) និងមានការប្រែប្រួលភាពត្រឹមត្រូវខ្លាំងពេក។ | ផ្តល់ភាពត្រឹមត្រូវទាបបំផុត និងមិនសូវមានសមត្ថភាពក្នុងការពន្យល់ពីទំនាក់ទំនងស្មុគស្មាញនៃសរីរវិទ្យារុក្ខជាតិនោះទេ។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារការវិនិយោគច្រើនលើឧបករណ៍ប្រមូលទិន្នន័យរូបភាពពីចម្ងាយ (Remote Sensing) ឧបករណ៍វាស់ស្ទង់ជីវសាស្ត្រកម្រិតខ្ពស់ និងអ្នកជំនាញខាងទិន្នន័យម៉ាស៊ីនរៀន។
ការសិក្សានេះត្រូវបានអនុវត្តនៅក្នុងចម្ការតែចំនួន ២១កន្លែង ក្នុងខេត្ត Nantou ភាគកណ្តាលកោះតៃវ៉ាន់ ដោយផ្តោតលើរយៈកម្ពស់៣កម្រិត និងវិធីសាស្ត្រដាំដុះ២ប្រភេទ។ ដោយសារកម្ពុជាមានប្រភេទរុក្ខជាតិ អាកាសធាតុ (ត្រូពិច) និងលក្ខណៈដីខុសពីតៃវ៉ាន់ ម៉ូដែល (Models) ដែលបានបណ្តុះបណ្តាលទាំងនេះចាំបាច់ត្រូវតែយកមកកែសម្រួលពិន្ទុឡើងវិញ (Local Calibration) ដោយប្រើទិន្នន័យក្នុងស្រុក មុននឹងយកមកអនុវត្តពិតប្រាកដ។
វិធីសាស្ត្រតាមដានដំណាំដោយប្រើ UAV និង Machine Learning នេះ មានសក្តានុពលខ្ពស់ក្នុងការជំរុញការអភិវឌ្ឍកសិកម្មឆ្លាតវៃ (Precision Agriculture) នៅកម្ពុជា ជាពិសេសសម្រាប់ដំណាំឧស្សាហកម្មខ្នាតធំ។
ការបំពាក់បច្ចេកវិទ្យានេះនៅកម្ពុជានឹងជួយផ្លាស់ប្តូរការតាមដានដំណាំពីទម្រង់ប្រពៃណីដែលចំណាយពេលយូរ ទៅជាការវិភាគទិន្នន័យបែបឌីជីថល ដែលជួយទប់ទល់នឹងបម្រែបម្រួលអាកាសធាតុបានលឿនជាងមុន និងបង្កើនប្រសិទ្ធភាពសេដ្ឋកិច្ចរបស់កសិករ។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Leaf Area Index (LAI) | ជារង្វាស់ដែលបង្ហាញពីផ្ទៃក្រឡាសរុបនៃស្លឹករុក្ខជាតិធៀបនឹងផ្ទៃដីមួយឯកតាដែលរុក្ខជាតិនោះដុះ។ វាត្រូវបានប្រើដើម្បីវាយតម្លៃពីភាពក្រាស់នៃស្លឹក សមត្ថភាពក្នុងការធ្វើរស្មីសំយោគ និងសក្តានុពលនៃទិន្នផលរបស់ដំណាំ។ | ដូចជាការវាស់ទំហំនៃឆ័ត្រ ថាតើវាអាចបាំងម្លប់លើដីបានកម្រិតណាដែរ បើឆ័ត្រធំឬស្លឹកក្រាស់ (LAI ខ្ពស់) វាបាំងពន្លឺមិនឱ្យធ្លាក់ដល់ដីបានច្រើន។ |
| Photochemical Reflectance Index (PRI) | ជាសន្ទស្សន៍ដែលគណនាពីចំណាំងផ្លាតនៃពន្លឺ (ពិសេសពន្លឺពណ៌បៃតងនិងលឿង) ចេញពីស្លឹករុក្ខជាតិ ដើម្បីវាស់ស្ទង់ប្រសិទ្ធភាពនៃការប្រើប្រាស់ពន្លឺក្នុងការធ្វើរស្មីសំយោគ និងបង្ហាញពីកម្រិតភាពតានតឹង (Stress) របស់រុក្ខជាតិ។ | ដូចជាការវាស់ចង្វាក់បេះដូងរបស់មនុស្សពេលកំពុងរត់ ដើម្បីដឹងថាគាត់ហត់កម្រិតណា រុក្ខជាតិប្រើ PRI ដើម្បីបង្ហាញថាវាខ្វះទឹកឬក្តៅខ្លាំងកម្រិតណា។ |
| Quantum Yield of Photosystem II (ΦPSII) | ជាប៉ារ៉ាម៉ែត្រជីវគីមីដែលវាស់ស្ទង់ពីអត្រាថាមពលពន្លឺព្រះអាទិត្យ ដែលរុក្ខជាតិស្រូបយកហើយអាចបំប្លែងទៅជាថាមពលគីមីបានជោគជ័យនៅក្នុងដំណើរការរស្មីសំយោគ។ វាបង្ហាញពីសុខភាពពិតប្រាកដនៃកោសិកាស្លឹក។ | ដូចជាការវាស់ប្រសិទ្ធភាពផ្ទាំងសូឡា ថាតើវាអាចទាញយកពន្លឺព្រះអាទិត្យមកបំប្លែងជាអគ្គិសនីជាក់ស្តែងបានប៉ុន្មានភាគរយ។ |
| Multispectral Imagery | ជារូបភាពដែលថតដោយសេនស័រ (Sensor) ពិសេស ដែលអាចចាប់យកវិសាលគមពន្លឺច្រើនទម្រង់ រួមទាំងពន្លឺដែលភ្នែកមនុស្សមើលមិនឃើញ (ដូចជាពន្លឺក្រហមចុងកាត់ - Red Edge និងពន្លឺអ៊ីនហ្វ្រារ៉េដជិត - NIR) ដើម្បីមើលធ្លុះដល់រចនាសម្ព័ន្ធខាងក្នុងនៃស្លឹក។ | ដូចជាការថតកាំរស្មីអ៊ិច (X-ray) នៅមន្ទីរពេទ្យ ដើម្បីមើលឃើញឆ្អឹងនិងសរីរាង្គខាងក្នុងដែលភ្នែកទទេមើលមិនឃើញ។ |
| eXtreme Gradient Boosting (XGBoost) | ជាក្បួនដោះស្រាយម៉ាស៊ីនរៀន (Machine Learning) ដ៏មានឥទ្ធិពលមួយ ដែលបង្កើតម៉ូដែលព្យាករណ៍តូចៗជាច្រើនដោយស្វ័យប្រវត្តិ ហើយជួយកែតម្រូវកំហុសរបស់ម៉ូដែលមុនៗជាបន្តបន្ទាប់ ដើម្បីផ្តល់នូវការទស្សន៍ទាយមួយដែលមានភាពត្រឹមត្រូវខ្ពស់បំផុត។ | ដូចជាការធ្វើការងារជាក្រុម ដែលសមាជិកម្នាក់ៗជួយកែតម្រូវចំណុចខ្វះខាតរបស់អ្នកមុនជាបន្តបន្ទាប់ រហូតទទួលបានលទ្ធផលការងារមួយដែលល្អឥតខ្ចោះ។ |
| Simple Linear Iterative Clustering (SLIC) | ជាវិធីសាស្ត្រក្នុងការបែងចែករូបភាព (Image Segmentation) ទៅជាបំណែកតូចៗ (Superpixels) ដោយផ្អែកលើភាពស្រដៀងគ្នានៃពណ៌ និងទីតាំង ដើម្បីងាយស្រួលក្នុងការញែកប្រភេទវត្ថុក្នុងរូបភាព (ឧទាហរណ៍៖ ញែករូបដើមតែចេញពីដី ឬស្មៅ)។ | ដូចជាការកាត់ដុំរូបភាពតុក្កតាផ្គុំ (Jigsaw puzzle) ជាក្រុមៗទៅតាមពណ៌ ដើម្បីឱ្យយើងងាយស្រួលរៀបវាចូលគ្នាជាងមុន។ |
| Minimum Redundancy Maximum Relevance (MRMR) | ជាបច្ចេកទេសក្នុងម៉ាស៊ីនរៀនសម្រាប់ជ្រើសរើសទិន្នន័យ (Feature Selection) ដោយរើសយកតែអថេរណាដែលមានឥទ្ធិពលខ្លាំងបំផុតទៅលើលទ្ធផលដែលចង់បាន ព្រមទាំងលុបចោលអថេរណាដែលមានព័ត៌មានជាន់គ្នាឬស្រដៀងគ្នាពេក។ | ដូចជាការរៀបចំវ៉ាលីធ្វើដំណើរ ដោយរើសយកតែរបស់ណាដែលចាំបាច់បំផុត (Maximum Relevance) ហើយដកចេញនូវរបស់ដែលមុខងារជាន់គ្នាដូចជាអាវយឺតច្រើនពេក (Minimum Redundancy)។ |
| Multicollinearity | ជាបញ្ហានៅក្នុងស្ថិតិ នៅពេលដែលអថេរឯករាជ្យពីរឬច្រើននៅក្នុងម៉ូដែលព្យាករណ៍ មានទំនាក់ទំនងគ្នាខ្លាំងពេក (ផ្តល់ព័ត៌មានជាន់គ្នា) ធ្វើឱ្យម៉ូដែលពិបាកវាយតម្លៃថាអថេរមួយណាមានឥទ្ធិពលពិតប្រាកដទៅលើលទ្ធផលចុងក្រោយ។ | ដូចជាការភ្លក់សម្លដែលមានដាក់ទាំងស្ករនិងទឹកឃ្មុំក្នុងបរិមាណច្រើន ធ្វើឱ្យយើងពិបាកដឹងច្បាស់ថាភាពផ្អែមនោះមកពីគ្រឿងមួយណាពិតប្រាកដ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖