Original Title: Dissolved Oxygen Estimation in Freshwater Aquaculture Ponds from UAV Multispectral Imagery via Coupled Transfer Learning Strategies
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការប៉ាន់ប្រមាណអុកស៊ីហ្សែនរលាយក្នុងស្រះវារីវប្បកម្មទឹកសាបពីរូបភាពពហុវិសាលគម UAV តាមរយៈយុទ្ធសាស្ត្ររួមបញ្ចូលគ្នានៃការរៀនបន្ត (Transfer Learning)

ចំណងជើងដើម៖ Dissolved Oxygen Estimation in Freshwater Aquaculture Ponds from UAV Multispectral Imagery via Coupled Transfer Learning Strategies

អ្នកនិពន្ធ៖ Wenxu Lv (North China Institute of Aerospace Engineering), Peng Cheng, Guohong Li, Ruiyin Tang, Yancang Wang, Xuqing Li

ឆ្នាំបោះពុម្ព៖ 2025 The 46th Asian Conference on Remote Sensing (ACRS)

វិស័យសិក្សា៖ Remote Sensing and Machine Learning

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ម៉ូដែលប៉ាន់ប្រមាណគុណភាពទឹកពីចម្ងាយតែងតែជួបប្រទះបញ្ហាធ្លាក់ចុះភាពត្រឹមត្រូវនៅពេលអនុវត្តក្នុងពេលវេលាខុសគ្នា ដោយសារការប្រែប្រួលបរិស្ថាន។ ការសិក្សានេះដោះស្រាយបញ្ហានេះដោយប្រើបច្ចេកវិទ្យា Transfer Learning ដើម្បីបង្កើនសមត្ថភាពទូទៅតាមពេលវេលា (Temporal Generalization) សម្រាប់ការតាមដានអុកស៊ីហ្សែនរលាយ (DO) ក្នុងស្រះវារីវប្បកម្មទឹកសាប។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់ទិន្នន័យរូបភាពពហុវិសាលគមពីដ្រូន (UAV) និងទិន្នន័យវាស់វែងផ្ទាល់ពីឆ្នាំ ២០២៣ និង ២០២៤ ដោយរួមបញ្ចូលម៉ូដែល Machine Learning ជាមូលដ្ឋានជាមួយនឹងយុទ្ធសាស្ត្រ Transfer Learning ផ្សេងៗដើម្បីបង្កើនភាពសុក្រឹតតាមពេលវេលា។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Baseline Machine Learning (RF, XGBoost, LightGBM)
ម៉ូដែលរៀនម៉ាស៊ីនមូលដ្ឋាន (RF, XGBoost, LightGBM)
ងាយស្រួលក្នុងការបង្កើតម៉ូដែលសម្រាប់សំណុំទិន្នន័យក្នុងពេលតែមួយ និងមានសមត្ថភាពចាប់យកទំនាក់ទំនងមិនលីនេអ៊ែររវាងទិន្នន័យ។ ខ្សោយក្នុងការរក្សាភាពត្រឹមត្រូវនៅពេលអនុវត្តលើទិន្នន័យក្នុងឆ្នាំ ឬរដូវកាលផ្សេងគ្នា ដោយសារតែការប្រែប្រួលបរិស្ថាន។ មានកម្រិត R² ទាបជាងគេ និងកំហុស (RMSE, MAE) ខ្ពស់បំផុតនៅពេលតេស្តលើសំណុំទិន្នន័យឆ្លងឆ្នាំ (២០២៤)។
Instance Reweighting (IR) Transfer Learning
ការរៀនបន្តដោយផ្តល់ទម្ងន់លើសំណាក (IR)
ជួយកាត់បន្ថយភាពខុសគ្នានៃការចែកចាយទិន្នន័យ ដោយផ្តល់ទម្ងន់ដល់សំណាកទិន្នន័យចាស់ៗដែលស្រដៀងនឹងទិន្នន័យថ្មី។ ប្រសិទ្ធភាពនៅមានកម្រិត និងមិនទាន់បានតម្រឹមលក្ខណៈពិសេស (Feature alignment) ដោយផ្ទាល់រវាងទិន្នន័យចាស់និងថ្មីនោះទេ។ បង្កើនមេគុណ R² ជាមធ្យម ១២% និងកាត់បន្ថយ RMSE ៤% និង MAE ៤.៥% បើធៀបនឹងម៉ូដែលមូលដ្ឋាន។
Maximum Mean Discrepancy (MMD) Transfer Learning
ការរៀនបន្តដោយប្រើគម្លាតមធ្យមអតិបរមា (MMD)
មានប្រសិទ្ធភាពខ្ពស់ក្នុងការកាត់បន្ថយការផ្លាស់ប្តូរទិន្នន័យតាមពេលវេលា ដោយតម្រឹមលក្ខណៈពិសេសរវាងទិន្នន័យនៃប្រភពដើមនិងប្រភពគោលដៅ។ ត្រូវការការគណនាស្មុគស្មាញជាងបច្ចេកទេស IR ដោយសារវាត្រូវទាញយកចម្ងាយ MMD នៅក្នុងលំហ RKHS។ ទទួលបាន R² ប្រសើរជាង IR ដោយបង្កើន R² ជាមធ្យម ៣២% និងកាត់បន្ថយ RMSE ១១% និង MAE ១៥% បើធៀបនឹងម៉ូដែលមូលដ្ឋាន។
Hybrid IR-MMD Transfer Learning (Proposed)
យុទ្ធសាស្ត្ររៀនបន្តចម្រុះ (Hybrid IR-MMD)
រួមបញ្ចូលចំណុចខ្លាំងទាំងការថ្លឹងទម្ងន់សំណាក (Local) និងការតម្រឹមលក្ខណៈពិសេស (Global) ធ្វើឱ្យមានភាពសុក្រឹតខ្ពស់បំផុតសម្រាប់ការប្រែប្រួលតាមពេលវេលា។ ទាមទារកម្លាំងម៉ាស៊ីនគណនាខ្ពស់ និងការកំណត់ប៉ារ៉ាម៉ែត្ររួមបញ្ចូលគ្នាដែលស្មុគស្មាញជាងគេ។ ទទួលបានលទ្ធផលល្អបំផុត ដោយបង្កើន R² ៣៨% និងបន្ថយ RMSE ១៨% និង MAE ២១% (ម៉ូដែល RF សម្រេចបាន R² = ០.៥៨ និង RMSE = ៣.០១ mg/L)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តបច្ចេកវិទ្យានេះទាមទារការវិនិយោគលើបរិក្ខារផ្នែករឹងកម្រិតខ្ពស់សម្រាប់ការហោះហើរប្រមូលទិន្នន័យ និងកម្លាំងម៉ាស៊ីនកុំព្យូទ័រសម្រាប់ដំណើរការម៉ូដែលបញ្ញាសិប្បនិម្មិត។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងនៅតំបន់ចិញ្ចឹមក្តាមនីងជាំង (Gaochun District) ប្រទេសចិន ដែលមានអាកាសធាតុស៊ុបត្រូពិចមូសុង និងផ្តោតលើពូជសត្វទឹកជាក់លាក់។ សម្រាប់កម្ពុជាដែលមានអាកាសធាតុត្រូពិចក្តៅហើយសើម (រដូវប្រាំងនិងវស្សាច្បាស់លាស់) ព្រមទាំងមានប្រភេទវារីវប្បកម្មខុសគ្នា (ដូចជាការចិញ្ចឹមត្រីប្រា ត្រីពោធិ៍ និងត្រីទីឡាព្យា) លក្ខណៈនៃការប្រែប្រួលអុកស៊ីហ្សែនអាចមានទម្រង់ខុសគ្នា ដែលតម្រូវឱ្យមានការប្រមូលទិន្នន័យ និងហ្វឹកហាត់ម៉ូដែលឡើងវិញនៅក្នុងស្រុក។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាមានភាពខុសគ្នានៃបរិស្ថានភូមិសាស្ត្រក៏ដោយ បច្ចេកវិទ្យា និងវិធីសាស្ត្ររៀនបន្ត (Transfer Learning) នេះមានសក្តានុពលខ្លាំងក្នុងការអភិវឌ្ឍវិស័យវារីវប្បកម្មឆ្លាតវៃនៅកម្ពុជា។

ការរួមបញ្ចូលគ្នារវាងបច្ចេកវិទ្យាដ្រូនពហុវិសាលគម និង Transfer Learning នឹងជួយកាត់បន្ថយហានិភ័យនៃជំងឺឬការងាប់របស់មច្ឆាជាតិ និងជួយលើកកម្ពស់ទិន្នផលវារីវប្បកម្មប្រកបដោយនិរន្តរភាពនៅកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ជំហានទី១៖ ការបំពាក់បរិក្ខារ និងការប្រមូលទិន្នន័យមូលដ្ឋានចម្រុះរដូវ: សាកលវិទ្យាល័យ ឬស្ថាប័នស្រាវជ្រាវគួរវិនិយោគលើដ្រូនកសិកម្មដូចជា DJI P4 Multispectral និងឧបករណ៍វាស់ DO ទឹកស្តង់ដារ។ ចាប់ផ្តើមប្រមូលទិន្នន័យទាំងរូបភាព និងសំណាកទឹក ឆ្លងកាត់ពីររដូវកាលផ្សេងគ្នា (រដូវប្រាំង និងរដូវវស្សា) នៅតាមស្រះគំរូក្នុងខេត្តកណ្តាល ឬតាកែវ។
  2. ជំហានទី២៖ ការរៀបចំទិន្នន័យរូបភាព និងទាញយកសន្ទស្សន៍ទឹក: ប្រើប្រាស់កម្មវិធី Pix4D សម្រាប់ផ្គុំរូបភាព និង ENVI ដើម្បីកែតម្រូវចំណាំងផ្លាត។ អនុវត្តរូបមន្ត NDWI (Normalized Difference Water Index) ដោយប្រើកម្រិត Threshold [0.05, 0.1] ដើម្បីកាត់ផ្តាច់រូបភាពផ្ទៃទឹកចេញពីរុក្ខជាតិទឹក និងច្រាំងស្រះ។
  3. ជំហានទី៣៖ វិភាគ និងជ្រើសរើសលក្ខណៈពិសេស (Feature Selection): គណនាសន្ទស្សន៍ពហុវិសាលគម (២៦ ប្រភេទ) រួចប្រើប្រាស់កូដ Python រួមជាមួយវិភាគ Pearson Correlation និងបណ្ណាល័យ SHAP ដើម្បីរើសយកបន្សំលក្ខណៈពិសេសណាដែលជះឥទ្ធិពលខ្លាំងបំផុតដល់កម្រិត DO។ ហ្វឹកហាត់ម៉ូដែលមូលដ្ឋានដោយប្រើ Random Forest (RF)XGBoost
  4. ជំហានទី៤៖ សមាហរណកម្មបច្ចេកទេស Transfer Learning (IR & MMD): សរសេរក្បួនដោះស្រាយបញ្រ្ចូលយុទ្ធសាស្ត្រ Instance Reweighting (IR) និង Maximum Mean Discrepancy (MMD) ដើម្បីកែតម្រូវភាពខុសគ្នានៃទិន្នន័យរវាងរដូវប្រាំង និងរដូវវស្សា។ វិធីនេះធានាថាម៉ូដែលនៅតែរក្សាភាពត្រឹមត្រូវខ្ពស់ទោះបីជាបរិស្ថានអាកាសធាតុប្រែប្រួលក៏ដោយ។
  5. ជំហានទី៥៖ បង្កើតប្រព័ន្ធផែនទីវិភាគ និងព្រមាន (Dashboard Visualization): យកលទ្ធផលដែលគណនាបានមកបង្កើតជាផែនទីបង្ហាញពីកម្រិតអុកស៊ីហ្សែនរលាយតាមភីកសែល (Pixel-wise DO Mapping)។ អភិវឌ្ឍទៅជា Web Dashboard ដើម្បីឱ្យម្ចាស់កសិដ្ឋានអាចមើលឃើញតំបន់ទឹកដែលខ្វះអុកស៊ីហ្សែន (Low-DO Zones) និងចាត់វិធានការសង្គ្រោះបន្ទាន់ភ្លាមៗ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Transfer Learning ជាបច្ចេកទេសនៃបញ្ញាសិប្បនិម្មិត (AI) ដែលយកចំណេះដឹងពីម៉ូដែលដែលបានហ្វឹកហាត់រួចលើទិន្នន័យបរិបទចាស់ (ឧទាហរណ៍៖ ទិន្នន័យឆ្នាំ២០២៣) មកកែសម្រួលដើម្បីប្រើប្រាស់លើទិន្នន័យបរិបទថ្មី (ឆ្នាំ២០២៤) ដើម្បីរក្សាភាពត្រឹមត្រូវទោះបីជាស្ថានភាពបរិស្ថានប្រែប្រួលក៏ដោយ។ ដូចជាអ្នកចេះជិះកង់ស្រាប់ ពេលប្តូរទៅរៀនជិះម៉ូតូ គឺងាយស្រួល និងរៀនឆាប់ចេះជាងអ្នកដែលមិនធ្លាប់ជិះអ្វីសោះ។
Temporal Generalization គឺជាសមត្ថភាពរបស់ម៉ូដែលកុំព្យូទ័រក្នុងការរក្សាភាពសុក្រឹតនៃការទស្សន៍ទាយរបស់វា នៅពេលយកទៅអនុវត្តលើទិន្នន័យដែលប្រមូលបាននៅពេលវេលាខុសគ្នា (ឧទាហរណ៍៖ រដូវកាល ឬឆ្នាំបន្ទាប់) ដែលមានការប្រែប្រួលលក្ខខណ្ឌអាកាសធាតុ។ ដូចជាសិស្សដែលយល់មេរៀនពិតប្រាកដ អាចធ្វើវិញ្ញាសាប្រឡងបានល្អគ្រប់ពេល ទោះបីជាវិញ្ញាសាចេញនៅឆ្នាំណាក៏ដោយ មិនមែនគ្រាន់តែទន្ទេញចាំមាត់សម្រាប់តែប្រឡងថ្ងៃនេះនោះទេ។
Multispectral Imagery ជារូបភាពថតដោយកាមេរ៉ាពិសេស ដែលអាចចាប់យករលកពន្លឺច្រើនប្រភេទដាច់ៗពីគ្នា រួមទាំងពន្លឺដែលភ្នែកមនុស្សមើលមិនឃើញ (ដូចជាពន្លឺក្រហមអាំងហ្វ្រា ឬ Near-Infrared) ដើម្បីយកមកវិភាគរកសារធាតុ ឬលក្ខណៈកំបាំងផ្សេងៗនៅក្នុងទឹក ឬរុក្ខជាតិ។ ដូចជាការពាក់វ៉ែនតាវេទមន្តដែលអាចឱ្យយើងមើលធ្លុះឃើញកម្រិតអុកស៊ីហ្សែននៅក្នុងទឹក ដែលភ្នែកទទេមិនអាចមើលឃើញ។
Instance Reweighting (IR) ជាវិធីសាស្ត្រក្នុងការបង្រៀនម៉ូដែល ដោយផ្តល់ពិន្ទុ (ទម្ងន់) ខ្ពស់ដល់ទិន្នន័យចាស់ណាដែលមានលក្ខណៈស្រដៀងនឹងទិន្នន័យថ្មី និងបន្ថយពិន្ទុទិន្នន័យណាដែលខុសគ្នាខ្លាំង ដើម្បីឱ្យម៉ូដែលផ្តោតលើព័ត៌មានដែលមានប្រយោជន៍បំផុត។ ដូចជាគ្រូបង្រៀនប្រាប់សិស្សឱ្យចំណាយពេលអានមេរៀនណាដែលទំនងជានឹងចេញប្រឡង ច្រើនជាងអានមេរៀនដែលហួសសម័យ។
Maximum Mean Discrepancy (MMD) ជារូបមន្តគណិតវិទ្យាប្រើសម្រាប់វាស់វែងគម្លាត និងកែតម្រូវភាពខុសគ្នានៃការចែកចាយទិន្នន័យរវាងបណ្តុំទិន្នន័យពីរ (ឧទាហរណ៍៖ ទិន្នន័យឆ្នាំចាស់ និងឆ្នាំថ្មី) ដើម្បីទាញលក្ខណៈទិន្នន័យទាំងពីរនោះឱ្យមកស៊ីចង្វាក់គ្នាបំផុត មុននឹងបញ្ជូនឲ្យម៉ូដែលវិភាគ។ ដូចជាការតម្រឹមជញ្ជីងពីរដែលលំអៀងឱ្យមកនៅកម្រិតសូន្យស្មើគ្នា ដើម្បីធានាថាការថ្លឹងរបស់នៅកន្លែងទាំងពីរទទួលបានលទ្ធផលត្រឹមត្រូវដូចគ្នា។
Normalized Difference Water Index (NDWI) ជាសន្ទស្សន៍ដែលគណនាចេញពីរលកពន្លឺពណ៌បៃតង និងពន្លឺអាំងហ្វ្រាក្រហមជិត (Near-Infrared) ដើម្បីកាត់ផ្តាច់តំបន់ជាផ្ទៃទឹក ចេញពីរុក្ខជាតិ ដី ឬច្រាំងស្រះ ដើម្បីងាយស្រួលក្នុងការវិភាគតែលើផ្ទៃទឹកសុទ្ធ។ ដូចជាការប្រើតម្រង (Filter) កាត់តរូបភាពក្នុងទូរស័ព្ទដៃ ដែលលុបផ្ទៃខាងក្រោយចោល និងរក្សាទុកតែរូបកែវទឹកប៉ុណ្ណោះ។
SHAP (SHapley Additive exPlanations) ជាបច្ចេកទេសគណិតវិទ្យាសម្រាប់ពន្យល់ពីការសម្រេចចិត្តរបស់ម៉ូដែល AI ដោយវាស់វែងយ៉ាងសុក្រឹតថាតើអថេរនីមួយៗ (ឧទាហរណ៍៖ ពន្លឺពណ៌ក្រហម ពន្លឺពណ៌ខៀវ) បានចូលរួមចំណែកប៉ុន្មានភាគរយ ក្នុងការជំរុញឱ្យម៉ូដែលទាយលទ្ធផលចុងក្រោយនោះ។ ដូចជាការវិភាគរកមើលថាតើកីឡាករម្នាក់ៗក្នុងក្រុមបាល់ទាត់ មានស្នាដៃជួយក្រុមឱ្យឈ្នះប៉ុន្មានភាគរយ មិនមែនគ្រាន់តែមើលលទ្ធផលឈ្នះរួមគ្នានោះទេ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖