Original Title: Deep convolutional neural networks with transfer learning for estimation of Nile Tilapia mass
Source: doi.org/10.34044/j.anres.2022.56.4.07
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

បណ្ដាញសរសៃប្រសាទកុងវ៉ុលជ្រៅ (Deep Convolutional Neural Networks) ជាមួយនឹងការរៀនផ្ទេរចំណេះដឹង (Transfer Learning) សម្រាប់ការប៉ាន់ប្រមាណម៉ាសត្រីទីឡាព្យា

ចំណងជើងដើម៖ Deep convolutional neural networks with transfer learning for estimation of Nile Tilapia mass

អ្នកនិពន្ធ៖ Poonpat Poonnoy (Maejo University, Thailand), Nissara Kitcharoen (Maejo University, Thailand)

ឆ្នាំបោះពុម្ព៖ 2022, Agriculture and Natural Resources

វិស័យសិក្សា៖ Aquaculture and Computer Vision

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការថ្លឹងម៉ាសត្រីរស់ដោយផ្ទាល់ដោយប្រើជញ្ជីងឌីជីថលត្រូវចំណាយពេលយូរ ប្រើកម្លាំងពលកម្មច្រើន និងអាចធ្វើឱ្យត្រីមានភាពតានតឹង (Stress) ដែលប៉ះពាល់យ៉ាងខ្លាំងដល់សុខភាពត្រីសម្រាប់ការបង្កាត់ពូជ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានបង្កើតនិងកែច្នៃបណ្ដាញសរសៃប្រសាទកុងវ៉ុលជ្រៅ (Deep Convolutional Neural Networks) ចំនួន ៨ ប្រភេទ ដោយប្រើប្រាស់បច្ចេកទេសរៀនផ្ទេរចំណេះដឹង (Transfer Learning) ដើម្បីប៉ាន់ស្មានម៉ាសត្រីពីក្នុងរូបភាព។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Modified VGG-19 (Deep Learning)
ម៉ូដែល VGG-19 ដែលបានកែច្នៃ (បណ្ដាញសរសៃប្រសាទកុងវ៉ុលជ្រៅ)
ផ្តល់ភាពសុក្រឹតខ្ពស់បំផុត និងមានសមត្ថភាពចាប់យកលក្ខណៈលម្អិតនៃរូបរាងត្រីបានយ៉ាងល្អ ដោយចំណាយពេលទស្សន៍ទាយលឿនបំផុត។ ទាមទារការបង្វឹកដោយប្រើកុំព្យូទ័រដែលមានកម្លាំង GPU ខ្លាំង និងងាយរងឥទ្ធិពលអវិជ្ជមានពីពន្លឺចាំងលើទឹក។ កំហុសមធ្យមការ៉េឫស (RMSE) ទាបបំផុតត្រឹម ៣.៥៩ ក្រាម និងល្បឿនដំណើរការ ០.០៥៣ វិនាទី/រូបភាព (លើ GPU)។
Modified GoogLeNet (Deep Learning)
ម៉ូដែល GoogLeNet ដែលបានកែច្នៃ
មានទំហំម៉ូដែលតូចខ្លាំង និងមានល្បឿនដំណើរការលឿនជាងគេនៅលើកុំព្យូទ័រធម្មតា (CPU)។ មានភាពសុក្រឹតទាបជាងម៉ូដែល VGG-19 បន្តិច ដោយសារការកែប្រែទម្រង់រូបភាពស្មុគស្មាញពេក។ RMSE ស្មើនឹង ៣.៩២ ក្រាម, ទំហំម៉ូដែលត្រឹមតែ ២២.២ MB។
Traditional Power Curve Model (using area)
គំរូខ្សែកោងថាមពលប្រពៃណី (ប្រើប្រាស់ផ្ទៃក្រឡា)
សាមញ្ញ ងាយស្រួលគណនាដោយមិនចាំបាច់ប្រើប្រាស់បច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិតកម្រិតខ្ពស់។ មានកំហុសខ្ពស់ជាង និងទាមទារឱ្យមានការប្រើប្រាស់កម្មវិធីកាត់ផ្ទៃកន្ទុយនិងព្រុយចេញពីរូបរាងដងខ្លួនត្រីជាមុនសិន។ RMSE ខ្ពស់រហូតដល់ ១៨.៦០ ក្រាម សម្រាប់ការប្រើផ្ទៃរូបរាងទូទៅ ឬ ៧៧.៥២ ក្រាម បើប្រើតែផ្ទៃដងខ្លួនសុទ្ធ។
Modified InceptionResNetV2
ម៉ូដែល InceptionResNetV2 ដែលបានកែច្នៃ
មានសក្តានុពលសម្រាប់កិច្ចការវិភាគរូបភាពដែលមានភាពស្មុគស្មាញ និងមានស្រទាប់វិភាគច្រើន។ មិនស័ក្តិសមសម្រាប់ការងារតំរែតំរង់ (Regression) សាមញ្ញទេ ដោយវាបង្កើតឱ្យមានកំហុសខ្ពស់ (Overfitting)។ មានកំហុសធំបំផុត ដោយតម្លៃ RMSE ស្មើនឹង ១៤.៣៦ ក្រាម និងកំហុសជាភាគរយ (MAPE) រហូតដល់ ៣៩.០១%។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តការសិក្សានេះទាមទារនូវឧបករណ៍កុំព្យូទ័រដែលមានកម្លាំងម៉ាស៊ីនខ្លាំងសម្រាប់ការបង្វឹកម៉ូដែល និងប្រព័ន្ធថតរូបភាពដែលមានការគ្រប់គ្រងបរិស្ថានពន្លឺបានល្អ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងប្រទេសថៃ ដោយប្រើប្រាស់រូបភាពត្រីទីឡាព្យា (Oreochromis niloticus) ចំនួន ៣.៨៣២ ក្បាល ក្នុងលក្ខខណ្ឌថតរូបដែលមានប្រអប់ទប់ពន្លឺយ៉ាងត្រឹមត្រូវ។ ការណ៍នេះជារឿងសំខាន់ដែលត្រូវពិចារណាសម្រាប់កម្ពុជា ព្រោះលក្ខខណ្ឌជាក់ស្តែងនៅតាមកសិដ្ឋានវារីវប្បកម្មនៅកម្ពុជាអាចមានភាពខុសគ្នាទាំងពន្លឺ ប្រភេទពូជត្រី និងបរិយាកាសទឹក ដែលទាមទារឱ្យមានការប្រមូលទិន្នន័យក្នុងស្រុកបន្ថែមដើម្បីបង្វឹកម៉ូដែលឱ្យស្របតាមស្ថានភាពជាក់ស្តែង។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកវិទ្យានេះមានសក្តានុពលខ្ពស់ខ្លាំងសម្រាប់ការអភិវឌ្ឍវិស័យវារីវប្បកម្មទំនើបនៅកម្ពុជា ជាពិសេសសម្រាប់ការបង្កាត់ពូជ និងគ្រប់គ្រងកសិដ្ឋាន។

ជារួម ការប្រើប្រាស់បច្ចេកទេសរៀនផ្ទេរចំណេះដឹង (Transfer Learning) ជួយកាត់បន្ថយពេលវេលានិងធនធានក្នុងការបង្កើតម៉ូដែល AI ថ្មី ដែលធ្វើឱ្យបច្ចេកវិទ្យានេះងាយស្រួលនឹងត្រូវបានសម្របយកមកប្រើប្រាស់ជាក់ស្តែងក្នុងវិស័យកសិកម្មកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ១. សិក្សាមូលដ្ឋានគ្រឹះកុំព្យូទ័រចក្ខុ និងរៀនផ្ទេរចំណេះដឹង: ចាប់ផ្តើមរៀនភាសាកូដ Python និងប្រើប្រាស់បណ្ណាល័យ Deep Learning ទូទៅដូចជា TensorFlowPyTorch ដើម្បីយល់ពីរបៀបដំណើរការបណ្ដាញសរសៃប្រសាទកុងវ៉ុល (CNNs)។
  2. ២. រៀបចំប្រព័ន្ធកាមេរ៉ា និងប្រមូលទិន្នន័យរៀបចំ: បង្កើតប្រអប់ថតរូប (Lightbox) ដែលមានកាមេរ៉ានិងភ្លើងបំភ្លឺថេរ រួចថតរូបត្រីផ្គូផ្គងជាមួយទម្ងន់ជាក់ស្តែងដែលថ្លឹងដោយជញ្ជីងឌីជីថល រួចរក្សាទុកទិន្នន័យក្នុងទម្រង់ជា CSV
  3. ៣. កែច្នៃម៉ូដែល AI សម្រាប់ការវិភាគតំរែតំរង់ (Regression): ទាញយកម៉ូដែលកុំព្យូទ័រដែលបានបង្វឹករួចដូចជា VGG-19 រួចផ្លាស់ប្តូរស្រទាប់ចុងក្រោយ (Fully Connected Layers) ពីមុខងារធ្វើចំណាត់ថ្នាក់រូបភាព (Classification) ទៅជាការទស្សន៍ទាយលេខ (Regression) សម្រាប់ទម្ងន់ត្រីវិញ។
  4. ៤. បង្វឹកម៉ូដែល និងវាយតម្លៃលទ្ធផលសុក្រឹតភាព: ប្រើប្រាស់ GPU ឬ Google Colab ដើម្បីបង្វឹកម៉ូដែលជាមួយទិន្នន័យរូបភាពត្រីដែលបានប្រមូល រួចវាយតម្លៃភាពសុក្រឹតនៃម៉ូដែលដោយប្រើរង្វាស់ស្តង់ដារដូចជា RMSE និង
  5. ៥. ដាក់ពង្រាយប្រព័ន្ធឱ្យដំណើរការជាក់ស្តែង (Model Deployment): សរសេរកម្មវិធីកុំព្យូទ័រដោយប្រើប្រាស់បណ្ណាល័យ OpenCV ដើម្បីភ្ជាប់ជាមួយកាមេរ៉ាផ្ទាល់ និងអនុញ្ញាតឱ្យប្រព័ន្ធអាចទស្សន៍ទាយម៉ាសត្រីរស់ក្នុងពេលជាក់ស្តែង (Real-time) ដោយស្វ័យប្រវត្តិ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Transfer learning (ការរៀនផ្ទេរចំណេះដឹង) ជាបច្ចេកទេសក្នុងបញ្ញាសិប្បនិម្មិត (AI) ដែលគេយកម៉ូដែលដែលបានបង្វឹកនិងរៀនរួចរាល់ពីទិន្នន័យដ៏ធំមួយ (ឧទាហរណ៍ រូបភាពទូទៅ) មកកែច្នៃនិងបង្វឹកបន្តបន្តិចបន្តួច ដើម្បីដោះស្រាយបញ្ហាថ្មីមួយទៀត (ឧទាហរណ៍ ការប៉ាន់ស្មានទម្ងន់ត្រី) ដែលជួយសន្សំសំចៃពេលវេលានិងទិន្នន័យក្នុងការបង្វឹក។ ដូចជាមនុស្សដែលចេះជិះកង់រួចហើយ យកជំនាញទប់លំនឹងនោះទៅរៀនជិះម៉ូតូ ដោយមិនបាច់ចាប់ផ្តើមរៀនពីសូន្យ។
Convolutional Neural Networks (បណ្ដាញសរសៃប្រសាទកុងវ៉ុល) ជាប្រភេទម៉ូដែលបញ្ញាសិប្បនិម្មិតដ៏មានប្រសិទ្ធភាពបំផុតសម្រាប់ការវិភាគរូបភាព ដោយវាប្រើប្រាស់ស្រទាប់តម្រង (Filters) ជាច្រើនជាន់ដើម្បីទាញយកលក្ខណៈពិសេសៗពីរូបភាព ដូចជា គែម ទ្រង់ទ្រាយ និងលំនាំផ្សេងៗដោយស្វ័យប្រវត្តិ ដោយមិនចាំបាច់មានមនុស្សបញ្ជាប្រាប់។ ដូចជាភ្នែកនិងខួរក្បាលមនុស្សដែលសម្លឹងមើលវត្ថុមួយ ដោយផ្តើមពីការចាប់អារម្មណ៍លើវណ្ឌវង្កខាងក្រៅ រហូតដល់អាចចំណាំបានលម្អិតថាវាជារបស់អ្វីមួយច្បាស់លាស់។
VGG-19 (ម៉ូដែល VGG-19) ជាប្រភេទបណ្ដាញសរសៃប្រសាទកុងវ៉ុល (CNN) ដ៏ល្បីមួយនិងមានជម្រៅជ្រៅរហូតដល់ ១៩ ស្រទាប់ (Layers) ដែលមានសមត្ថភាពខ្ពស់ក្នុងការវិភាគលក្ខណៈលម្អិតៗនៃរូបភាព ប៉ុន្តែវាទាមទារកម្លាំងម៉ាស៊ីនកុំព្យូទ័រខ្លាំងដើម្បីដំណើរការ។ ដូចជាកែវពង្រីកដែលមានឡង់ទី ១៩ ជាន់ត្រួតស៊ីគ្នា ដែលជួយឱ្យយើងមើលឃើញភាពលម្អិតនៃវត្ថុមួយកាន់តែច្បាស់។
Regression output layer (ស្រទាប់លទ្ធផលតំរែតំរង់) ជាស្រទាប់ចុងក្រោយបង្អស់នៃបណ្ដាញសរសៃប្រសាទកុងវ៉ុល ដែលត្រូវបានកែច្នៃពីការប្រើសម្រាប់ធ្វើចំណាត់ថ្នាក់រូបភាព (ឧទាហរណ៍ ប្រាប់ថាជារូបត្រី ឬឆ្កែ) មកជាការទស្សន៍ទាយចេញជាតម្លៃលេខពិតប្រាកដ (ឧទាហរណ៍ ប្រាប់ថាត្រីមានទម្ងន់ ៣០០ ក្រាម)។ ដូចជាអ្នកជំនាញម្នាក់ដែលមិនត្រឹមតែអាចប្រាប់ថានេះជា "ផ្លែឪឡឹក" ទេ តែថែមទាំងអាចស្មានដឹងថាវាមានទម្ងន់ "៣ គីឡូក្រាម" ទៀតផង។
Root Mean Square Error (កំហុសមធ្យមការ៉េឫស) ជារង្វាស់គណិតវិទ្យាសម្រាប់វាយតម្លៃភាពសុក្រឹតនៃម៉ូដែលទស្សន៍ទាយ ដោយវាវាស់វែងពីគម្លាតរវាងតម្លៃដែលម៉ូដែលទស្សន៍ទាយបាន និងតម្លៃពិតប្រាកដជាក់ស្តែង តម្លៃ RMSE កាន់តែតូច បញ្ជាក់ថាម៉ូដែលកាន់តែមានភាពសុក្រឹតនិងត្រឹមត្រូវខ្ពស់។ ដូចជាការបាញ់ព្រួញទៅកាន់ផ្ទាំងស៊ីប បើគ្រាប់ព្រួញភាគច្រើនដោតចំក្បែរៗចំណុចកណ្តាល នោះកំហុស (RMSE) គឺមានទំហំតូច។
Passive integrated transponder (បន្ទះឈីបបញ្ជូនសញ្ញាអកម្ម) ហៅកាត់ថា PIT ជាបន្ទះឈីបអេឡិចត្រូនិចទំហំតូចដែលត្រូវបានចាក់បញ្ចូលទៅក្នុងខ្លួនត្រីនីមួយៗ ដើម្បីផ្ទុកលេខកូដសម្គាល់អត្តសញ្ញាណ (ID) ធ្វើឱ្យគេអាចតាមដានប្រវត្តិទម្ងន់ ការលូតលាស់ និងពូជអម្បូររបស់ត្រីមួយក្បាលៗបានយ៉ាងច្បាស់លាស់។ ដូចជាអត្តសញ្ញាណប័ណ្ណទំហំប៉ុនគ្រាប់អង្ករដែលផ្សាំក្នុងខ្លួនត្រី សម្រាប់ឱ្យម៉ាស៊ីនស្កេនដឹងថាត្រីនេះឈ្មោះអ្វីនិងមកពីពូជណា។
Fully connected layer (ស្រទាប់តភ្ជាប់ពេញលេញ) ជាស្រទាប់នៅក្នុងបណ្ដាញសរសៃប្រសាទ ដែលតភ្ជាប់គ្រប់ណឺរ៉ូន (Neurons) ពីស្រទាប់មុនទៅកាន់ណឺរ៉ូននៃស្រទាប់បន្ទាប់ ដើម្បីប្រមូលផ្តុំរាល់ព័ត៌មានលក្ខណៈពិសេសៗដែលបានវិភាគរួចរាល់ យកមកធ្វើការសម្រេចចិត្តឬទស្សន៍ទាយលទ្ធផលចុងក្រោយ។ ដូចជាក្រុមប្រឹក្សាភិបាលដែលប្រមូលរបាយការណ៍សង្ខេបពីគ្រប់ផ្នែកទាំងអស់នៃក្រុមហ៊ុន ដើម្បីយកមកធ្វើការសម្រេចចិត្តរួមមួយចុងក្រោយ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖