Original Title: Deep convolutional neural networks with transfer learning for estimation of Nile Tilapia mass
Source: doi.org/10.34044/j.anres.2022.56.4.07
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

បណ្ដាញសរសៃប្រសាទកុងវ៉ុលជ្រៅ (Deep Convolutional Neural Networks) ជាមួយនឹងការរៀនផ្ទេរចំណេះដឹង (Transfer Learning) សម្រាប់ការប៉ាន់ប្រមាណម៉ាសត្រីទីឡាព្យា

ចំណងជើងដើម៖ Deep convolutional neural networks with transfer learning for estimation of Nile Tilapia mass

អ្នកនិពន្ធ៖ Poonpat Poonnoy (Maejo University, Thailand), Nissara Kitcharoen (Maejo University, Thailand)

ឆ្នាំបោះពុម្ព៖ 2022, Agriculture and Natural Resources

វិស័យសិក្សា៖ Aquaculture and Computer Vision

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការថ្លឹងម៉ាសត្រីរស់ដោយផ្ទាល់ដោយប្រើជញ្ជីងឌីជីថលត្រូវចំណាយពេលយូរ ប្រើកម្លាំងពលកម្មច្រើន និងអាចធ្វើឱ្យត្រីមានភាពតានតឹង (Stress) ដែលប៉ះពាល់យ៉ាងខ្លាំងដល់សុខភាពត្រីសម្រាប់ការបង្កាត់ពូជ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានបង្កើតនិងកែច្នៃបណ្ដាញសរសៃប្រសាទកុងវ៉ុលជ្រៅ (Deep Convolutional Neural Networks) ចំនួន ៨ ប្រភេទ ដោយប្រើប្រាស់បច្ចេកទេសរៀនផ្ទេរចំណេះដឹង (Transfer Learning) ដើម្បីប៉ាន់ស្មានម៉ាសត្រីពីក្នុងរូបភាព។

ការប្រមូលទិន្នន័យរូបភាពត្រី (Image dataset collection): ថតរូបភាពត្រីទីឡាព្យាចំនួន ៣.៨៣២ ក្បាល ផ្គូផ្គងជាមួយទិន្នន័យម៉ាសជាក់ស្តែងដើម្បីបែងចែកជាក្រុមសម្រាប់បង្វឹកនិងធ្វើតេស្ត។
ការកែច្នៃម៉ូដែល (Model modification): កែច្នៃម៉ូដែល AI ល្បីៗដូចជា VGG-19, AlexNet និង ResNet សម្រាប់ការវិភាគតំរែតំរង់ (Regression analysis) ដើម្បីទស្សន៍ទាយម៉ាសត្រី។
ការវាយតម្លៃដំណើរការម៉ូដែល (Model performance evaluation): វាស់វែងភាពសុក្រឹតតាមរយៈកំហុសមធ្យមការ៉េឫស (RMSE) កំហុសមធ្យមដាច់ខាត (MAE) និងមេគុណកំនត់ (R²)។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ម៉ូដែល VGG-19 ដែលបានកែច្នៃផ្តល់លទ្ធផលល្អដាច់គេ ដោយមានកំហុសមធ្យមការ៉េឫស (RMSE) ទាបបំផុតត្រឹម ៣.៥៩ ក្រាម និងមេគុណកំនត់ (R²) ល្អឥតខ្ចោះរហូតដល់ ០.៩៩។
ពេលវេលាដំណើរការទស្សន៍ទាយសម្រាប់រូបភាពមួយសន្លឹកគឺលឿនបំផុត ត្រឹមតែ ០.០៥៣ វិនាទីនៅលើ GPU និង ០.១៧៧ វិនាទីនៅលើ CPU ដែលស័ក្តិសមសម្រាប់ការវាស់វែងក្នុងពេលជាក់ស្តែង (Real-time)។
ការជះពន្លឺចាំងពីស្រទាប់ទឹកនៅលើផ្ទៃខាងក្រោយមានឥទ្ធិពលអវិជ្ជមានដល់ការប៉ាន់ស្មានម៉ាស ដែលទាមទារឱ្យមានការកែលម្អប្រព័ន្ធកាមេរ៉ាបន្ថែមនៅពេលអនាគត។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Modified VGG-19 (Deep Learning) ម៉ូដែល VGG-19 ដែលបានកែច្នៃ (បណ្ដាញសរសៃប្រសាទកុងវ៉ុលជ្រៅ)	ផ្តល់ភាពសុក្រឹតខ្ពស់បំផុត និងមានសមត្ថភាពចាប់យកលក្ខណៈលម្អិតនៃរូបរាងត្រីបានយ៉ាងល្អ ដោយចំណាយពេលទស្សន៍ទាយលឿនបំផុត។	ទាមទារការបង្វឹកដោយប្រើកុំព្យូទ័រដែលមានកម្លាំង GPU ខ្លាំង និងងាយរងឥទ្ធិពលអវិជ្ជមានពីពន្លឺចាំងលើទឹក។	កំហុសមធ្យមការ៉េឫស (RMSE) ទាបបំផុតត្រឹម ៣.៥៩ ក្រាម និងល្បឿនដំណើរការ ០.០៥៣ វិនាទី/រូបភាព (លើ GPU)។
Modified GoogLeNet (Deep Learning) ម៉ូដែល GoogLeNet ដែលបានកែច្នៃ	មានទំហំម៉ូដែលតូចខ្លាំង និងមានល្បឿនដំណើរការលឿនជាងគេនៅលើកុំព្យូទ័រធម្មតា (CPU)។	មានភាពសុក្រឹតទាបជាងម៉ូដែល VGG-19 បន្តិច ដោយសារការកែប្រែទម្រង់រូបភាពស្មុគស្មាញពេក។	RMSE ស្មើនឹង ៣.៩២ ក្រាម, ទំហំម៉ូដែលត្រឹមតែ ២២.២ MB។
Traditional Power Curve Model (using area) គំរូខ្សែកោងថាមពលប្រពៃណី (ប្រើប្រាស់ផ្ទៃក្រឡា)	សាមញ្ញ ងាយស្រួលគណនាដោយមិនចាំបាច់ប្រើប្រាស់បច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិតកម្រិតខ្ពស់។	មានកំហុសខ្ពស់ជាង និងទាមទារឱ្យមានការប្រើប្រាស់កម្មវិធីកាត់ផ្ទៃកន្ទុយនិងព្រុយចេញពីរូបរាងដងខ្លួនត្រីជាមុនសិន។	RMSE ខ្ពស់រហូតដល់ ១៨.៦០ ក្រាម សម្រាប់ការប្រើផ្ទៃរូបរាងទូទៅ ឬ ៧៧.៥២ ក្រាម បើប្រើតែផ្ទៃដងខ្លួនសុទ្ធ។
Modified InceptionResNetV2 ម៉ូដែល InceptionResNetV2 ដែលបានកែច្នៃ	មានសក្តានុពលសម្រាប់កិច្ចការវិភាគរូបភាពដែលមានភាពស្មុគស្មាញ និងមានស្រទាប់វិភាគច្រើន។	មិនស័ក្តិសមសម្រាប់ការងារតំរែតំរង់ (Regression) សាមញ្ញទេ ដោយវាបង្កើតឱ្យមានកំហុសខ្ពស់ (Overfitting)។	មានកំហុសធំបំផុត ដោយតម្លៃ RMSE ស្មើនឹង ១៤.៣៦ ក្រាម និងកំហុសជាភាគរយ (MAPE) រហូតដល់ ៣៩.០១%។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តការសិក្សានេះទាមទារនូវឧបករណ៍កុំព្យូទ័រដែលមានកម្លាំងម៉ាស៊ីនខ្លាំងសម្រាប់ការបង្វឹកម៉ូដែល និងប្រព័ន្ធថតរូបភាពដែលមានការគ្រប់គ្រងបរិស្ថានពន្លឺបានល្អ។

Hardware: កុំព្យូទ័រ Workstation ដែលមាន CPU Intel XEON Silver 4108, RAM 32 GB និងកាតក្រាហ្វិក NVIDIA Quadro RTX5000 GPU ព្រមទាំងប្រព័ន្ធកាមេរ៉ា CMOS ជញ្ជីងឌីជីថល (Sartorius) និងម៉ាស៊ីនស្កេន RFID។
Software: កម្មវិធី LABVIEW សម្រាប់បញ្ជាប្រព័ន្ធថតរូប និងទាញយកទិន្នន័យ ព្រមទាំងបរិស្ថានកម្មវិធី MATLAB សម្រាប់កសាង និងបង្វឹកបណ្ដាញសរសៃប្រសាទកុងវ៉ុល។
Dataset: ទិន្នន័យរូបភាពត្រីទីឡាព្យាចំនួន ៣.៨៣២ សន្លឹក ដែលត្រូវបានថត និងភ្ជាប់ជាមួយទិន្នន័យម៉ាសពិតប្រាកដ និងលេខសម្គាល់ត្រី។
Expertise: ចំណេះដឹងឯកទេសផ្នែកកុំព្យូទ័រចក្ខុ (Computer Vision), បច្ចេកទេសរៀនផ្ទេរចំណេះដឹង (Transfer Learning) និងជំនាញសរសេរកូដសម្រាប់បញ្ញាសិប្បនិម្មិត។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងប្រទេសថៃ ដោយប្រើប្រាស់រូបភាពត្រីទីឡាព្យា (Oreochromis niloticus) ចំនួន ៣.៨៣២ ក្បាល ក្នុងលក្ខខណ្ឌថតរូបដែលមានប្រអប់ទប់ពន្លឺយ៉ាងត្រឹមត្រូវ។ ការណ៍នេះជារឿងសំខាន់ដែលត្រូវពិចារណាសម្រាប់កម្ពុជា ព្រោះលក្ខខណ្ឌជាក់ស្តែងនៅតាមកសិដ្ឋានវារីវប្បកម្មនៅកម្ពុជាអាចមានភាពខុសគ្នាទាំងពន្លឺ ប្រភេទពូជត្រី និងបរិយាកាសទឹក ដែលទាមទារឱ្យមានការប្រមូលទិន្នន័យក្នុងស្រុកបន្ថែមដើម្បីបង្វឹកម៉ូដែលឱ្យស្របតាមស្ថានភាពជាក់ស្តែង។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកវិទ្យានេះមានសក្តានុពលខ្ពស់ខ្លាំងសម្រាប់ការអភិវឌ្ឍវិស័យវារីវប្បកម្មទំនើបនៅកម្ពុជា ជាពិសេសសម្រាប់ការបង្កាត់ពូជ និងគ្រប់គ្រងកសិដ្ឋាន។

វិទ្យាស្ថានស្រាវជ្រាវ និងអភិវឌ្ឍន៍ជលផលទឹកសាបកម្ពុជា: អាចអនុវត្តបច្ចេកទេសនេះដើម្បីថ្លឹងម៉ាសត្រីមេពូជដោយមិនបាច់ចាប់កាន់ផ្ទាល់ ដែលជួយកាត់បន្ថយភាពតានតឹង (Stress) និងអត្រាស្លាប់របស់ត្រីក្នុងអំឡុងពេលជ្រើសរើសពូជ។
កសិដ្ឋានវារីវប្បកម្មពាណិជ្ជកម្ម (ខេត្តកណ្តាល, សៀមរាប, កំពង់ធំ): កសិដ្ឋានចិញ្ចឹមត្រីខ្នាតធំអាចប្រើប្រព័ន្ធកាមេរ៉ានេះដើម្បីត្រួតពិនិត្យការលូតលាស់ប្រចាំថ្ងៃ និងគណនាបរិមាណចំណីបានយ៉ាងរហ័សនិងសុក្រឹត ដោយកាត់បន្ថយការប្រើប្រាស់កម្លាំងពលកម្មច្រើន។
ការអប់រំនៅសាកលវិទ្យាល័យភូមិន្ទកសិកម្ម (RUA) ឬវិទ្យាស្ថានបច្ចេកវិទ្យាកម្ពុជា (ITC): និស្សិតជំនាញកសិកម្ម និងវិស្វកម្មកុំព្យូទ័រអាចយកវិធីសាស្ត្រនេះទៅកែច្នៃស្រាវជ្រាវបន្ថែម ប្រើជាមួយពូជត្រីសេដ្ឋកិច្ចក្នុងស្រុកផ្សេងទៀត ដូចជា ត្រីប្រា ត្រីពោ ឬត្រីឆ្តោជាដើម។

ជារួម ការប្រើប្រាស់បច្ចេកទេសរៀនផ្ទេរចំណេះដឹង (Transfer Learning) ជួយកាត់បន្ថយពេលវេលានិងធនធានក្នុងការបង្កើតម៉ូដែល AI ថ្មី ដែលធ្វើឱ្យបច្ចេកវិទ្យានេះងាយស្រួលនឹងត្រូវបានសម្របយកមកប្រើប្រាស់ជាក់ស្តែងក្នុងវិស័យកសិកម្មកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

១. សិក្សាមូលដ្ឋានគ្រឹះកុំព្យូទ័រចក្ខុ និងរៀនផ្ទេរចំណេះដឹង: ចាប់ផ្តើមរៀនភាសាកូដ Python និងប្រើប្រាស់បណ្ណាល័យ Deep Learning ទូទៅដូចជា TensorFlow ឬ PyTorch ដើម្បីយល់ពីរបៀបដំណើរការបណ្ដាញសរសៃប្រសាទកុងវ៉ុល (CNNs)។
២. រៀបចំប្រព័ន្ធកាមេរ៉ា និងប្រមូលទិន្នន័យរៀបចំ: បង្កើតប្រអប់ថតរូប (Lightbox) ដែលមានកាមេរ៉ានិងភ្លើងបំភ្លឺថេរ រួចថតរូបត្រីផ្គូផ្គងជាមួយទម្ងន់ជាក់ស្តែងដែលថ្លឹងដោយជញ្ជីងឌីជីថល រួចរក្សាទុកទិន្នន័យក្នុងទម្រង់ជា CSV។
៣. កែច្នៃម៉ូដែល AI សម្រាប់ការវិភាគតំរែតំរង់ (Regression): ទាញយកម៉ូដែលកុំព្យូទ័រដែលបានបង្វឹករួចដូចជា VGG-19 រួចផ្លាស់ប្តូរស្រទាប់ចុងក្រោយ (Fully Connected Layers) ពីមុខងារធ្វើចំណាត់ថ្នាក់រូបភាព (Classification) ទៅជាការទស្សន៍ទាយលេខ (Regression) សម្រាប់ទម្ងន់ត្រីវិញ។
៤. បង្វឹកម៉ូដែល និងវាយតម្លៃលទ្ធផលសុក្រឹតភាព: ប្រើប្រាស់ GPU ឬ Google Colab ដើម្បីបង្វឹកម៉ូដែលជាមួយទិន្នន័យរូបភាពត្រីដែលបានប្រមូល រួចវាយតម្លៃភាពសុក្រឹតនៃម៉ូដែលដោយប្រើរង្វាស់ស្តង់ដារដូចជា RMSE និង R²។
៥. ដាក់ពង្រាយប្រព័ន្ធឱ្យដំណើរការជាក់ស្តែង (Model Deployment): សរសេរកម្មវិធីកុំព្យូទ័រដោយប្រើប្រាស់បណ្ណាល័យ OpenCV ដើម្បីភ្ជាប់ជាមួយកាមេរ៉ាផ្ទាល់ និងអនុញ្ញាតឱ្យប្រព័ន្ធអាចទស្សន៍ទាយម៉ាសត្រីរស់ក្នុងពេលជាក់ស្តែង (Real-time) ដោយស្វ័យប្រវត្តិ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Transfer learning (ការរៀនផ្ទេរចំណេះដឹង)	ជាបច្ចេកទេសក្នុងបញ្ញាសិប្បនិម្មិត (AI) ដែលគេយកម៉ូដែលដែលបានបង្វឹកនិងរៀនរួចរាល់ពីទិន្នន័យដ៏ធំមួយ (ឧទាហរណ៍ រូបភាពទូទៅ) មកកែច្នៃនិងបង្វឹកបន្តបន្តិចបន្តួច ដើម្បីដោះស្រាយបញ្ហាថ្មីមួយទៀត (ឧទាហរណ៍ ការប៉ាន់ស្មានទម្ងន់ត្រី) ដែលជួយសន្សំសំចៃពេលវេលានិងទិន្នន័យក្នុងការបង្វឹក។	ដូចជាមនុស្សដែលចេះជិះកង់រួចហើយ យកជំនាញទប់លំនឹងនោះទៅរៀនជិះម៉ូតូ ដោយមិនបាច់ចាប់ផ្តើមរៀនពីសូន្យ។
Convolutional Neural Networks (បណ្ដាញសរសៃប្រសាទកុងវ៉ុល)	ជាប្រភេទម៉ូដែលបញ្ញាសិប្បនិម្មិតដ៏មានប្រសិទ្ធភាពបំផុតសម្រាប់ការវិភាគរូបភាព ដោយវាប្រើប្រាស់ស្រទាប់តម្រង (Filters) ជាច្រើនជាន់ដើម្បីទាញយកលក្ខណៈពិសេសៗពីរូបភាព ដូចជា គែម ទ្រង់ទ្រាយ និងលំនាំផ្សេងៗដោយស្វ័យប្រវត្តិ ដោយមិនចាំបាច់មានមនុស្សបញ្ជាប្រាប់។	ដូចជាភ្នែកនិងខួរក្បាលមនុស្សដែលសម្លឹងមើលវត្ថុមួយ ដោយផ្តើមពីការចាប់អារម្មណ៍លើវណ្ឌវង្កខាងក្រៅ រហូតដល់អាចចំណាំបានលម្អិតថាវាជារបស់អ្វីមួយច្បាស់លាស់។
VGG-19 (ម៉ូដែល VGG-19)	ជាប្រភេទបណ្ដាញសរសៃប្រសាទកុងវ៉ុល (CNN) ដ៏ល្បីមួយនិងមានជម្រៅជ្រៅរហូតដល់ ១៩ ស្រទាប់ (Layers) ដែលមានសមត្ថភាពខ្ពស់ក្នុងការវិភាគលក្ខណៈលម្អិតៗនៃរូបភាព ប៉ុន្តែវាទាមទារកម្លាំងម៉ាស៊ីនកុំព្យូទ័រខ្លាំងដើម្បីដំណើរការ។	ដូចជាកែវពង្រីកដែលមានឡង់ទី ១៩ ជាន់ត្រួតស៊ីគ្នា ដែលជួយឱ្យយើងមើលឃើញភាពលម្អិតនៃវត្ថុមួយកាន់តែច្បាស់។
Regression output layer (ស្រទាប់លទ្ធផលតំរែតំរង់)	ជាស្រទាប់ចុងក្រោយបង្អស់នៃបណ្ដាញសរសៃប្រសាទកុងវ៉ុល ដែលត្រូវបានកែច្នៃពីការប្រើសម្រាប់ធ្វើចំណាត់ថ្នាក់រូបភាព (ឧទាហរណ៍ ប្រាប់ថាជារូបត្រី ឬឆ្កែ) មកជាការទស្សន៍ទាយចេញជាតម្លៃលេខពិតប្រាកដ (ឧទាហរណ៍ ប្រាប់ថាត្រីមានទម្ងន់ ៣០០ ក្រាម)។	ដូចជាអ្នកជំនាញម្នាក់ដែលមិនត្រឹមតែអាចប្រាប់ថានេះជា "ផ្លែឪឡឹក" ទេ តែថែមទាំងអាចស្មានដឹងថាវាមានទម្ងន់ "៣ គីឡូក្រាម" ទៀតផង។
Root Mean Square Error (កំហុសមធ្យមការ៉េឫស)	ជារង្វាស់គណិតវិទ្យាសម្រាប់វាយតម្លៃភាពសុក្រឹតនៃម៉ូដែលទស្សន៍ទាយ ដោយវាវាស់វែងពីគម្លាតរវាងតម្លៃដែលម៉ូដែលទស្សន៍ទាយបាន និងតម្លៃពិតប្រាកដជាក់ស្តែង តម្លៃ RMSE កាន់តែតូច បញ្ជាក់ថាម៉ូដែលកាន់តែមានភាពសុក្រឹតនិងត្រឹមត្រូវខ្ពស់។	ដូចជាការបាញ់ព្រួញទៅកាន់ផ្ទាំងស៊ីប បើគ្រាប់ព្រួញភាគច្រើនដោតចំក្បែរៗចំណុចកណ្តាល នោះកំហុស (RMSE) គឺមានទំហំតូច។
Passive integrated transponder (បន្ទះឈីបបញ្ជូនសញ្ញាអកម្ម)	ហៅកាត់ថា PIT ជាបន្ទះឈីបអេឡិចត្រូនិចទំហំតូចដែលត្រូវបានចាក់បញ្ចូលទៅក្នុងខ្លួនត្រីនីមួយៗ ដើម្បីផ្ទុកលេខកូដសម្គាល់អត្តសញ្ញាណ (ID) ធ្វើឱ្យគេអាចតាមដានប្រវត្តិទម្ងន់ ការលូតលាស់ និងពូជអម្បូររបស់ត្រីមួយក្បាលៗបានយ៉ាងច្បាស់លាស់។	ដូចជាអត្តសញ្ញាណប័ណ្ណទំហំប៉ុនគ្រាប់អង្ករដែលផ្សាំក្នុងខ្លួនត្រី សម្រាប់ឱ្យម៉ាស៊ីនស្កេនដឹងថាត្រីនេះឈ្មោះអ្វីនិងមកពីពូជណា។
Fully connected layer (ស្រទាប់តភ្ជាប់ពេញលេញ)	ជាស្រទាប់នៅក្នុងបណ្ដាញសរសៃប្រសាទ ដែលតភ្ជាប់គ្រប់ណឺរ៉ូន (Neurons) ពីស្រទាប់មុនទៅកាន់ណឺរ៉ូននៃស្រទាប់បន្ទាប់ ដើម្បីប្រមូលផ្តុំរាល់ព័ត៌មានលក្ខណៈពិសេសៗដែលបានវិភាគរួចរាល់ យកមកធ្វើការសម្រេចចិត្តឬទស្សន៍ទាយលទ្ធផលចុងក្រោយ។	ដូចជាក្រុមប្រឹក្សាភិបាលដែលប្រមូលរបាយការណ៍សង្ខេបពីគ្រប់ផ្នែកទាំងអស់នៃក្រុមហ៊ុន ដើម្បីយកមកធ្វើការសម្រេចចិត្តរួមមួយចុងក្រោយ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖