Original Title: Optimizing prediction of key water quality parameters in tilapia river based cage culture system using simple parameters based on different deep learning models
Source: doi.org/10.34044/j.anres.2025.59.4.12
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការធ្វើឲ្យប្រសើរឡើងនូវការទស្សន៍ទាយប៉ារ៉ាម៉ែត្រគុណភាពទឹកសំខាន់ៗនៅក្នុងប្រព័ន្ធចិញ្ចឹមត្រីទីឡាព្យាក្នុងបែរតាមដងទន្លេ ដោយប្រើប៉ារ៉ាម៉ែត្រងាយៗផ្អែកលើម៉ូដែល Deep Learning ផ្សេងៗគ្នា

ចំណងជើងដើម៖ Optimizing prediction of key water quality parameters in tilapia river based cage culture system using simple parameters based on different deep learning models

អ្នកនិពន្ធ៖ Roongparit Jongjaraunsuk (Department of Aquaculture, Faculty of Fisheries, Kasetsart University, Bangkok 10900, Thailand), Wara Taparhudee (Department of Aquaculture, Faculty of Fisheries, Kasetsart University, Bangkok 10900, Thailand)

ឆ្នាំបោះពុម្ព៖ 2025 Agriculture and Natural Resources

វិស័យសិក្សា៖ Aquaculture Engineering

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការតាមដានគុណភាពទឹកក្នុងប្រព័ន្ធចិញ្ចឹមត្រីទីឡាព្យាក្រហមក្នុងបែរតាមដងទន្លេ ទាមទារការវាស់វែងប៉ារ៉ាម៉ែត្រមួយចំនួនដែលចំណាយពេល ថវិកា និងកម្លាំងពលកម្មច្រើន។ ការសិក្សានេះមានគោលបំណងបង្កើតម៉ូដែលទស្សន៍ទាយដែលប្រើប៉ារ៉ាម៉ែត្រងាយស្រួលវាស់វែង ដើម្បីប៉ាន់ស្មានគុណភាពទឹកដែលពិបាកវាស់វែងទាំងនោះ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានប្រើប្រាស់ប្រព័ន្ធបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (Deep Learning) ចំនួនបីប្រភេទ ដើម្បីធ្វើការប្រៀបធៀប និងស្វែងរកម៉ូដែលដែលល្អបំផុតសម្រាប់ការទស្សន៍ទាយ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
CNN (Convolutional Neural Network)
បណ្តាញសរសៃប្រសាទសិប្បនិម្មិត CNN
មានដំណើរការលឿនក្នុងការទស្សន៍ទាយប៉ារ៉ាម៉ែត្រមួយចំនួន (ដូចជា ALK និង NO2-N) និងពូកែក្នុងការទាញយកលក្ខណៈពិសេសពីទិន្នន័យ។ ទាមទារចំនួនជុំនៃការបង្វឹក (Epochs) ច្រើនរហូតដល់ ៣៥០០ ដើម្បីទទួលបានភាពសុក្រឹតខ្ពស់សម្រាប់ប៉ារ៉ាម៉ែត្រដូចជា DO ដែលធ្វើឱ្យម៉ូដែលមិនសូវមានស្ថិរភាព។ ដំណើរការលឿនបំផុតសម្រាប់ទស្សន៍ទាយ ALK (៩៥ វិនាទី) និង NO2-N (១២០ វិនាទី) នៅត្រឹម ២០០០ Epochs ប៉ុន្តែមានកម្រិតលម្អៀងខ្ពស់ជាងម៉ូដែលកូនកាត់។
LSTM (Long Short-Term Memory)
បណ្តាញសរសៃប្រសាទសិប្បនិម្មិតចងចាំរយៈពេលវែង-ខ្លី LSTM
មានសមត្ថភាពខ្ពស់ក្នុងការចងចាំ និងចាប់យកទំនាក់ទំនងទិន្នន័យដែលប្រែប្រួលតាមពេលវេលា (Time-series data) ក្នុងរយៈពេលយូរ។ ប្រើប្រាស់ពេលវេលាដំណើរការយូរជាងគេបំផុត និងត្រូវការចំនួន Epochs ច្រើន (៣៥០០ ទៅ ៤០០០) ដើម្បីដំណើរការបានល្អ។ ត្រូវការពេលវេលារហូតដល់ ៣២២ វិនាទី (៤០០០ Epochs) សម្រាប់ទស្សន៍ទាយ NO2-N និង ២៧៥ វិនាទី (៣៥០០ Epochs) សម្រាប់ ALK។
Hybrid CNN-LSTM
ម៉ូដែលកូនកាត់ CNN-LSTM
ផ្តល់នូវតុល្យភាពល្អបំផុតរវាងភាពត្រឹមត្រូវខ្ពស់ និងល្បឿនដំណើរការលឿន ដោយទាមទារចំនួន Epochs តិចជាងម៉ូដែលទោល។ វាមានសមត្ថភាពចាប់យកទាំងទំនាក់ទំនងលំហ និងពេលវេលា។ មានស្ថាបត្យកម្មស្មុគស្មាញជាងម៉ូដែលទោល ដែលទាមទារចំណេះដឹងស៊ីជម្រៅក្នុងការរៀបចំកូដ និងកំណត់ប៉ារ៉ាម៉ែត្រ (Hyperparameters)។ ជាម៉ូដែលល្អដាច់គេ ដោយទាមទារត្រឹមតែ ១០០០ Epochs ប៉ុណ្ណោះសម្រាប់ទស្សន៍ទាយ DO (ប្រើពេល ៨៦ វិនាទី) និង TAN (៥៦ វិនាទី) ជាមួយនឹងកម្រិតលម្អៀង (RMSE) ទាបបំផុត។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះប្រើប្រាស់កម្មវិធីកុំព្យូទ័រ និងសេវាកម្ម Cloud ឥតគិតថ្លៃសម្រាប់ការវិភាគទិន្នន័យ រួមជាមួយនឹងឧបករណ៍វាស់ស្ទង់គុណភាពទឹកជាក់ស្តែងនៅកន្លែងចិញ្ចឹម។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ទិន្នន័យត្រូវបានប្រមូលផ្តុំទាំងស្រុងពីកសិដ្ឋានចិញ្ចឹមត្រីទីឡាព្យាក្រហម (Oreochromis niloticus) ក្នុងបែរតាមដងទន្លេមែក្លង ខេត្តកញ្ជនៈបុរី ប្រទេសថៃ។ វាមិនបានគ្របដណ្តប់លើអាកាសធាតុប្រែប្រួលខ្លាំង ឬប្រភេទត្រីផ្សេងទៀតនោះទេ។ សម្រាប់ប្រទេសកម្ពុជា ទោះបីជាមានលក្ខណៈស្រដៀងគ្នាក៏ដោយ ក៏បរិស្ថានទឹកទន្លេសាប ឬទន្លេមេគង្គមានកម្រិតដក់ល្បាប់ និងសីតុណ្ហភាពខុសគ្នា ដែលទាមទារឱ្យមានការប្រមូលទិន្នន័យក្នុងស្រុកបន្ថែមដើម្បីបង្វឹកម៉ូដែលឡើងវិញឱ្យកាន់តែសុក្រឹត។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់ និងមានប្រយោជន៍ខ្លាំងសម្រាប់វិស័យវារីវប្បកម្មនៅកម្ពុជា ក្នុងការកាត់បន្ថយថ្លៃដើមលើឧបករណ៍វាស់ស្ទង់គុណភាពទឹកថ្លៃៗ។

ការអនុវត្តវិធីសាស្ត្រតាមដានគុណភាពទឹកផ្អែកលើបច្ចេកវិទ្យា AI នេះ នឹងជួយសន្សំសំចៃពេលវេលា ថវិកា និងកាត់បន្ថយអត្រាងាប់របស់ត្រី ជំរុញឱ្យការចិញ្ចឹមត្រីនៅកម្ពុជាកាន់តែមាននិរន្តរភាព។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ប្រមូលទិន្នន័យ និងរៀបចំទិន្នន័យជាមូលដ្ឋាន: ចាប់ផ្តើមប្រមូលទិន្នន័យសីតុណ្ហភាព កម្រិត pH និងភាពថ្លានៃទឹក គួបផ្សំជាមួយលទ្ធផលពិសោធន៍ទឹក (DO, TAN) ពីកសិដ្ឋានក្នុងស្រុក។ បន្ទាប់មក ប្រើប្រាស់ Python និង pandas ដើម្បីសម្អាតទិន្នន័យ និង scikit-learn (Min-Max Scaler) ដើម្បីធ្វើមាត្រដ្ឋានទិន្នន័យ (Data Normalization)។
  2. អភិវឌ្ឍម៉ូដែលកូនកាត់ (Hybrid Model Development): ប្រើប្រាស់ TensorFlowKeras ដើម្បីសរសេរកូដបង្កើតស្ថាបត្យកម្មម៉ូដែល ដោយដាក់ស្រទាប់ 1D-CNN នៅខាងដើមសម្រាប់ទាញយកលក្ខណៈពិសេសទិន្នន័យលំហ និងតាមពីក្រោយដោយស្រទាប់ LSTM សម្រាប់កត់ត្រាការប្រែប្រួលតាមពេលវេលា។
  3. បង្វឹក និងវាយតម្លៃម៉ូដែល (Model Training & Evaluation): ប្រើប្រាស់ Google Colab ដើម្បីដំណើរការបង្វឹកម៉ូដែលដោយកំណត់ Epochs ចាប់ពី ១០០០ ទៅ ២០០០ រួចវាយតម្លៃភាពសុក្រឹតដោយប្រើប្រាស់រូបមន្ត RMSE, MAE និង R² ដើម្បីធានាថាម៉ូដែលមិនមានការទន្ទេញចាំ (Overfitting)។
  4. បំប្លែងម៉ូដែលសម្រាប់ការប្រើប្រាស់ជាក់ស្តែង: បំប្លែងម៉ូដែលដែលបានបង្វឹករួចទៅជាទម្រង់ TensorFlow Lite ដែលមានទំហំតូច និងស៊ីភ្លើងតិច ដើម្បីអាចដាក់ដំណើរការលើឧបករណ៍ IoT តូចៗ។
  5. តភ្ជាប់ជាមួយប្រព័ន្ធតេឡេក្រាម ឬកម្មវិធីទូរស័ព្ទ (Deployment & Notification): ដាក់ដំណើរការម៉ូដែលនៅលើ Raspberry Pi ឬឧបករណ៍បញ្ជាខ្នាតតូចផ្សេងៗនៅកសិដ្ឋាន ដោយកំណត់ឱ្យវាអានទិន្នន័យពីសេនស័រ (Sensor) ងាយៗ រួចបញ្ជូនលទ្ធផលទស្សន៍ទាយគុណភាពទឹក (ដូចជាកម្រិតអុកស៊ីហ្សែន) ជាសារព្រមានចូលទៅកាន់ Telegram Bot របស់កសិករផ្ទាល់តែម្តង។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Convolutional neural network (CNN) (បណ្តាញសរសៃប្រសាទសិប្បនិម្មិត CNN) គឺជាប្រភេទម៉ូដែលបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត ដែលពូកែខាងស្កេននិងទាញយកលក្ខណៈពិសេសសំខាន់ៗចេញពីទិន្នន័យ (Spatial features) ដោយខ្លួនឯង ដោយមិនចាំបាច់មានការចង្អុលបង្ហាញពីមនុស្ស។ ដូចជាអ្នករាវរកគ្រាប់មីនដែលប្រើឧបករណ៍ស្កេនលើផ្ទៃដី ដើម្បីរកមើលកន្លែងដែលមានលក្ខណៈគួរឱ្យសង្ស័យមុននឹងធ្វើការសន្និដ្ឋាន។
Long short-term memory (LSTM) (បណ្តាញសរសៃប្រសាទសិប្បនិម្មិតចងចាំរយៈពេលវែង-ខ្លី) គឺជាប្រភេទម៉ូដែល Deep Learning ដែលមានសមត្ថភាពចងចាំពត៌មានចាស់ៗក្នុងរយៈពេលយូរ និងប្រើប្រាស់ប្រព័ន្ធទ្វារ (Gates) ដើម្បីសម្រេចថាពត៌មានណាគួរទុក ឬគួរលុបចោល ដើម្បីទស្សន៍ទាយទិន្នន័យដែលប្រែប្រួលតាមពេលវេលា។ ដូចជាសិស្សពូកែដែលចេះកត់ត្រាមេរៀនទុក ហើយដឹងថាចំណុចណាប្រឡងចេញ (ត្រូវចងចាំទុក) និងចំណុចណាមិនសំខាន់ (អាចបំភ្លេចបាន) ដើម្បីប្រឡងជាប់។
Hybrid CNN-LSTM (ម៉ូដែលកូនកាត់ CNN-LSTM) គឺជាការផ្គុំបញ្ចូលគ្នារវាងម៉ូដែល CNN ដែលពូកែស្រាវជ្រាវរកចំណុចពិសេសនៃទិន្នន័យនៅមួយកន្លែង និងម៉ូដែល LSTM ដែលពូកែចងចាំការប្រែប្រួលតាមពេលវេលា ដើម្បីផ្តល់លទ្ធផលទស្សន៍ទាយលឿននិងត្រឹមត្រូវបំផុត។ ដូចជាការសហការគ្នារវាងអ្នកស៊ើបអង្កេតដែលពូកែរកភស្តុតាងនៅកន្លែងកើតហេតុ (CNN) និងអ្នកវិភាគដែលពូកែភ្ជាប់សាច់រឿងតាមពេលវេលា (LSTM) ដើម្បីបំបែកសំណុំរឿងក្តីមួយ។
Epoch (ជុំនៃការបង្វឹកម៉ូដែល) គឺជាដំណើរការនៃការយកទិន្នន័យគំរូទាំងអស់ទៅបង្រៀនម៉ូដែលបញ្ញាសិប្បនិម្មិតឱ្យរៀនស្គាល់ទម្រង់ទិន្នន័យម្តងហើយម្តងទៀតក្នុងមួយជុំពេញ រហូតដល់វាចេះទស្សន៍ទាយបានត្រឹមត្រូវ។ ដូចជាការអានសៀវភៅមេរៀនចប់មួយក្បាល។ បើអានច្រើនចប់ (Epochs ច្រើន) យើងនឹងកាន់តែចាំយល់ ប៉ុន្តែបើអានច្រើនដងពេកអាចនឹងក្លាយជាការទន្ទេញចាំសេកដោយមិនយល់អត្ថន័យទូលំទូលាយ។
Root mean square error (RMSE) (កម្រិតលម្អៀងរវាងការទស្សន៍ទាយនិងជាក់ស្តែង) គឺជារូបមន្តគណិតវិទ្យាសម្រាប់វាស់ស្ទង់ថាតើលទ្ធផលដែលម៉ូដែលទស្សន៍ទាយបាន មានភាពខុសគ្នា (លម្អៀង) ពីទិន្នន័យជាក់ស្តែងកម្រិតណា។ បើលេខនេះកាន់តែតូច មានន័យថាម៉ូដែលកាន់តែមានភាពសុក្រឹតខ្ពស់។ ដូចជាការបាញ់ធ្នូចូលផ្ទាំងស៊ីប បើព្រួញកាន់តែខិតជិតចំណុចកណ្តាលនៃផ្ទាំងស៊ីប នោះពិន្ទុខុសឆ្គង (RMSE) គឺកាន់តែតិច។
Dissolved oxygen (DO) (អុកស៊ីហ្សែនរលាយក្នុងទឹក) គឺជាបរិមាណឧស្ម័នអុកស៊ីហ្សែនដែលមានរលាយសាយភាយនៅក្នុងទឹក ដែលជាខ្យល់ដកដង្ហើមដ៏មានសារៈសំខាន់បំផុតសម្រាប់ការរស់រានមានជីវិតនិងការលូតលាស់របស់ត្រី និងវារីសត្វផ្សេងៗ។ ដូចជាបរិមាណខ្យល់បរិសុទ្ធនៅក្នុងបន្ទប់បិទជិតមួយ ដែលចាំបាច់សម្រាប់ឱ្យមនុស្សអាចដកដង្ហើមបានស្រួល និងមានសុខភាពល្អ។
Total ammonia nitrogen (TAN) (អាម៉ូញាក់សរុប) គឺជាកម្រិតសារធាតុពុលនៅក្នុងទឹក ដែលកើតចេញពីការរលួយនៃកាកសំណល់សរីរាង្គ ចំណីត្រីសល់ និងលាមកត្រី ដែលវាអាចធ្វើឱ្យត្រីពុលងាប់បានប្រសិនបើមានកម្រិតខ្ពស់ពេក។ ដូចជាផ្សែងពុលដែលភាយចេញពីរថយន្តក្នុងទីក្រុង ដែលធ្វើឱ្យប៉ះពាល់ដល់សុខភាពអ្នកដកដង្ហើមប្រសិនបើវាកកកុញច្រើន។
Alkalinity (ALK) (កម្រិតអាល់កាឡាំង) គឺជាសមត្ថភាពរបស់ទឹកក្នុងការទប់ទល់នឹងការផ្លាស់ប្តូរកម្រិតជាតិអាស៊ីត (pH) ដែលជួយរក្សាបរិស្ថានទឹកឱ្យនៅមានលំនឹងជានិច្ច ទោះបីជាមានភ្លៀងធ្លាក់ខ្លាំង ឬមានការហូរចូលនូវសារធាតុបំពុលក៏ដោយ។ ដូចជាប្រព័ន្ធការពាររាងកាយ (Immune system) របស់មនុស្ស ដែលជួយទប់ទល់មេរោគមិនឱ្យជ្រៀតចូល និងការពារកុំឱ្យយើងងាយធ្លាក់ខ្លួនឈឺ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖