Original Title: Image recognition method using Local Binary Pattern and the Random forest classifier to count post larvae shrimp
Source: doi.org/10.1016/j.anres.2018.10.007
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

វិធីសាស្ត្រសម្គាល់រូបភាពដោយប្រើប្រាស់ Local Binary Pattern និងចំណាត់ថ្នាក់ Random forest ដើម្បីរាប់កូនបង្គា (post larvae)

ចំណងជើងដើម៖ Image recognition method using Local Binary Pattern and the Random forest classifier to count post larvae shrimp

អ្នកនិពន្ធ៖ Jirabhorn Kaewchote (Rajamangala University of Technology Srivijaya), Sittichoke Janyong (Rajamangala University of Technology Srivijaya), Wasit Limprasert (Thammasat University)

ឆ្នាំបោះពុម្ព៖ 2018, Agriculture and Natural Resources

វិស័យសិក្សា៖ Computer Vision / Aquaculture

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការរាប់ចំនួនកូនបង្គា (post larvae) ដោយដៃគឺជាការងារលំបាក ចំណាយពេលយូរ និងងាយមានកំហុស ដែលធ្វើឱ្យប៉ះពាល់ដល់ការគ្រប់គ្រងដង់ស៊ីតេបង្គាក្នុងកសិដ្ឋាន។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានវាយតម្លៃ និងប្រៀបធៀបវិធីសាស្ត្រទាញយកលក្ខណៈរូបភាពចំនួនពីរប្រភេទរួមជាមួយនឹងចំណាត់ថ្នាក់មែកធាងដើម្បីស្វ័យប្រវត្តិកម្មការរាប់ចំនួនកូនបង្គា។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Local Binary Pattern (LBP) + Random Forest
ការទាញយកលក្ខណៈរូបភាពដោយ Local Binary Pattern (LBP) រួមជាមួយចំណាត់ថ្នាក់ Random Forest
មានភាពត្រឹមត្រូវខ្ពស់រហូតដល់ ៩៨.៥០% និងមានស្ថិរភាពជាងមុននៅពេលកំណត់កាំ (half-window size) ចាប់ពី ៣ ភីកសែលឡើងទៅ។ ទាមទារពេលវេលាច្រើនជាងមុនក្នុងការទាញយកលក្ខណៈរូបភាពនៅពេលបង្កើនទំហំកាំ ហើយនៅតែមានកំហុសខ្លះនៅពេលកូនបង្គាត្រួតស៊ីគ្នា។ សម្រេចបានភាពត្រឹមត្រូវ ៩៨.៥០% ដោយមានកម្រិតកំហុស RMSE ១៤.៤៣ ក្នុងមួយរូបភាព។
RGB Feature Extraction + Random Forest
ការទាញយកលក្ខណៈរូបភាពតាមប្រព័ន្ធពណ៌ RGB រួមជាមួយចំណាត់ថ្នាក់ Random Forest
មានភាពសាមញ្ញជាងក្នុងការទាញយកទិន្នន័យពណ៌ពីចន្លោះពណ៌ (Color space) របស់រូបភាពដោយផ្ទាល់។ មានភាពសុក្រឹតនិងស្ថិរភាពទាបជាង LBP ព្រមទាំងងាយកំណត់គោលដៅខុសនៅតំបន់ដែលគ្មានកូនបង្គា ឬមានការត្រួតស៊ីគ្នាខ្លាំង។ លទ្ធផលទាបជាងបច្ចេកទេស LBP យ៉ាងច្បាស់ និងមិនសូវមានស្ថិរភាពក្នុងការរាប់។
Manual Counting
ការរាប់ចំនួនកូនបង្គាដោយដៃ (វិធីសាស្ត្រប្រពៃណី)
ជាវិធីសាស្ត្រមូលដ្ឋានដែលមិនត្រូវការឧបករណ៍បច្ចេកវិទ្យាស្មុគស្មាញ និងងាយយល់សម្រាប់កសិករ។ ចំណាយពេលយូរខ្លាំង ប្រើប្រាស់កម្លាំងពលកម្មច្រើន និងងាយមានកំហុសដោយសារភ្នែកមនុស្ស (Human error) ពេលបរិមាណបង្គាច្រើន។ ប្រើប្រាស់ជាទិន្នន័យគោល (Ground truth) ដើម្បីផ្ទៀងផ្ទាត់កម្រិតភាពត្រឹមត្រូវរបស់កុំព្យូទ័រ។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារឧបករណ៍ថតរូបដែលមានគុណភាព និងកុំព្យូទ័រដែលមានសមត្ថភាពមធ្យមសម្រាប់ដំណើរការកូដ ការបង្វឹកម៉ូដែល និងការទាញយកលក្ខណៈរូបភាព។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងមន្ទីរពិសោធន៍នៃសាកលវិទ្យាល័យ Rajamangala ខេត្តត្រាង ប្រទេសថៃ ដោយប្រើប្រាស់ទិន្នន័យកូនបង្គាក្នុងបរិស្ថានដែលបានកំណត់ពន្លឺនិងផ្ទៃខាងក្រោយច្បាស់លាស់។ ទិន្នន័យនេះមានភាពពាក់ព័ន្ធខ្ពស់សម្រាប់ប្រទេសកម្ពុជាដោយសារលក្ខខណ្ឌអាកាសធាតុ និងប្រភេទកូនបង្គាមានភាពស្រដៀងគ្នា ប៉ុន្តែម៉ូដែលនេះប្រហែលជាត្រូវការពង្រីកទិន្នន័យបង្វឹកបន្ថែម ប្រសិនបើចង់យកទៅប្រើក្នុងបរិស្ថានកសិដ្ឋានដែលមានពន្លឺធម្មជាតិ និងគុណភាពទឹកខុសគ្នា។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកវិទ្យាសម្គាល់រូបភាពនេះមានសក្តានុពល និងភាពជាក់ស្តែងខ្ពស់ក្នុងការយកមកអនុវត្តដើម្បីជួយដល់វិស័យវារីវប្បកម្មនៅកម្ពុជា។

ជារួម ការធ្វើសមាហរណកម្មបច្ចេកវិទ្យាកុំព្យូទ័រមើលឃើញ (Computer Vision) ចូលទៅក្នុងវិស័យវារីវប្បកម្មកម្ពុជានឹងចូលរួមចំណែកយ៉ាងសំខាន់ក្នុងការសន្សំសំចៃពេលវេលា បង្កើនទំនុកចិត្តលើទិន្នន័យ និងជំរុញការគ្រប់គ្រងកសិដ្ឋានបែបវិទ្យាសាស្ត្រទំនើប។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. រៀបចំបរិស្ថានថតរូបភាពនិងប្រមូលទិន្នន័យ (Data Collection): រៀបចំកន្លែងថតរូបភាពកូនបង្គាដែលដាក់ក្នុងចានមានផ្ទៃខាងក្រោយពណ៌សាង (ឧ. ប្រើចានស ឬកញ្ចក់ថ្លា) ក្រោមពន្លឺគ្រប់គ្រាន់ ដោយប្រើកាមេរ៉ាថតពីលើក្នុងចម្ងាយថេរមួយដើម្បីបង្កើត Dataset ផ្ទាល់ខ្លួនជាបរិបទស្រុកខ្មែរ។
  2. អនុវត្តការកែច្នៃរូបភាពជាមូលដ្ឋានដោយប្រើ OpenCV: ប្រើប្រាស់ភាសា Python ជាមួយបណ្ណាល័យ OpenCV (cv2) ដើម្បីអានរូបភាព កាត់ផ្ទៃដែលមិនត្រូវការចោល និងទាញយកទិន្នន័យពណ៌ (RGB/Grayscale) សម្រាប់ត្រៀមបញ្ចូលទៅក្នុងម៉ូដែល។
  3. ទាញយកលក្ខណៈរូបភាពដោយប្រើ Local Binary Pattern (LBP): សរសេរកូដដើម្បីទាញយកលក្ខណៈពិសេសរបស់រូបភាពកូនបង្គាតាមរយៈបច្ចេកទេស LBP ដោយកំណត់កាំ (hwz) ចាប់ពី ៣ ភីកសែលឡើងទៅ ដើម្បីទទួលបានទិន្នន័យដែលមានស្ថិរភាព និងភាពត្រឹមត្រូវខ្ពស់ជាងបច្ចេកទេសពណ៌ទូទៅ។
  4. បង្វឹកម៉ូដែលជាមួយ Scikit-learn: ប្រើប្រាស់ Random ForestExtra-trees classifier ពីបណ្ណាល័យ Scikit-learn ដោយបែងចែកទិន្នន័យជាពីរ (៨០% សម្រាប់បង្វឹក និង ២០% សម្រាប់តេស្ត) ដើម្បីបង្កើតម៉ូដែលដែលអាចរាប់ចំនួនកូនបង្គាបានដោយស្វ័យប្រវត្តិ។
  5. កាត់បន្ថយកំហុសនិងអភិវឌ្ឍជាកម្មវិធី (Deployment): ដោះស្រាយបញ្ហាកូនបង្គាត្រួតស៊ីគ្នា (Overlapping) ដោយប្រើបច្ចេកទេស Gaussian filter និង Blob detection រួចវេចខ្ចប់កូដនេះទៅជាកម្មវិធីទូរស័ព្ទដោយប្រើ framework ដូចជា React Native និង Flask API

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Local Binary Pattern (LBP) (លំនាំទ្វេភាគមូលដ្ឋាន) វាជាបច្ចេកទេសក្នុងកុំព្យូទ័រមើលឃើញ (Computer Vision) ដែលពិនិត្យមើលភីកសែលនីមួយៗក្នុងរូបភាព ដោយប្រៀបធៀបកម្រិតពន្លឺរបស់វាទៅនឹងភីកសែលជុំវិញ ដើម្បីបង្កើតជាកូដលេខសម្គាល់ក្បាច់រចនា (Texture) របស់វត្ថុ ធ្វើឱ្យកុំព្យូទ័រអាចចំណាំរូបរាងកូនបង្គាបានយ៉ាងច្បាស់។ ដូចជាការពិនិត្យមើលក្បឿងនីមួយៗលើកម្រាលឥដ្ឋ ដោយប្រៀបធៀបពណ៌របស់វាទៅនឹងក្បឿងដែលនៅជុំវិញ ដើម្បីទាញយកជាលេខកូដសម្គាល់ក្បាច់រចនានៃឥដ្ឋនោះ។
Random Forest classifier (ចំណាត់ថ្នាក់ Random Forest) វាជាក្បួនដោះស្រាយការរៀនម៉ាស៊ីន (Machine Learning) ដែលបង្កើតជា "ដើមឈើសម្រេចចិត្ត" (Decision Trees) ជាច្រើនដើម ហើយវាប្រមូលចម្លើយពីដើមឈើទាំងនោះមកបូកបញ្ចូលគ្នាដើម្បីធ្វើការទស្សន៍ទាយឬចាត់ថ្នាក់ទិន្នន័យឱ្យបានកាន់តែសុក្រឹត និងកាត់បន្ថយកំហុស។ ដូចជាការសួរមតិពីក្រុមអ្នកជំនាញជាច្រើននាក់លើបញ្ហាមួយ រួចយកចម្លើយដែលភាគច្រើនឯកភាពគ្នាជាការសម្រេចចិត្តចុងក្រោយ ជាជាងការជឿលើមនុស្សតែម្នាក់។
Feature extraction (ការទាញយកលក្ខណៈរូបភាព) វាជាដំណើរការនៃការបំប្លែងទិន្នន័យរូបភាពដើមដ៏ស្មុគស្មាញ ឱ្យទៅជាទិន្នន័យលេខឬព័ត៌មានសំខាន់ៗ (ដូចជាពណ៌ ឬក្បាច់) ដែលតំណាងឱ្យរូបភាពនោះ ដើម្បីឱ្យម៉ូដែលកុំព្យូទ័រអាចងាយស្រួលអាន វិភាគ និងរៀនសូត្រពីវា។ ដូចជាការអានសៀវភៅក្រាស់មួយក្បាល ហើយសង្ខេបយកតែចំណុចសំខាន់ៗដើម្បីឱ្យអ្នកដទៃងាយយល់និងចាប់បានលឿន ដោយមិនបាច់អានសៀវភៅទាំងមូលឡើងវិញ។
K-fold cross validation (ការផ្ទៀងផ្ទាត់ខ្វែង K-fold) វាជាវិធីសាស្ត្រស្ថិតិសម្រាប់វាស់ស្ទង់សមត្ថភាពរបស់ម៉ូដែល AI ដោយបែងចែកទិន្នន័យជា K ផ្នែក (ឧទាហរណ៍ ៥ ផ្នែក) រួចប្រើប្រាស់ ៤ ផ្នែកសម្រាប់បង្វឹកម៉ូដែល និង ១ ផ្នែកទៀតសម្រាប់តេស្ត ដោយធ្វើបែបនេះឆ្លាស់គ្នារហូតគ្រប់ផ្នែកទាំងអស់។ ដូចជាការចែកសិស្សជា ៥ ក្រុម ហើយឱ្យ ៤ ក្រុមរៀនពីមេរៀន រួចយក ១ ក្រុមទៀតមកប្រឡងតេស្តសមត្ថភាព ដោយធ្វើឆ្លាស់គ្នារហូតគ្រប់ក្រុមទាំងអស់ដើម្បីធានាថាលទ្ធផលប្រឡងពិតជាត្រឹមត្រូវ មិនមែនដោយសារសំណាង។
Root mean square error - RMSE (កំហុសមធ្យមការ៉េឬស) វាជារង្វាស់គណិតវិទ្យាដែលប្រើសម្រាប់គណនាពីទំហំកំហុសជាមធ្យមរវាងតម្លៃដែលម៉ូដែលទស្សន៍ទាយបាន និងតម្លៃពិតប្រាកដ។ តម្លៃ RMSE កាន់តែតូច មានន័យថាម៉ូដែលទស្សន៍ទាយបានកាន់តែត្រឹមត្រូវ។ ដូចជាការវាស់ស្ទង់មើលថា តើគ្រាប់ធ្នូដែលយើងបាញ់ទៅនោះ ឃ្លាតពីចំណុចកណ្តាលស៊ីបប៉ុន្មានសង់ទីម៉ែត្រជាមធ្យមរាល់ពេលបាញ់ម្តងៗ។
Blob detection (ការស្វែងរកចំណុចដុំៗ) វាជាបច្ចេកទេសកែច្នៃរូបភាពដែលស្វែងរកនិងគូសវង់ចំណាំតំបន់នានានៅក្នុងរូបភាព ដែលមានលក្ខណៈខុសប្លែកពីផ្ទៃខាងក្រោយ (ដូចជាភាពភ្លឺ ឬពណ៌) ដែលក្នុងទីនេះគេប្រើដើម្បីចាប់យកទម្រង់ដងខ្លួនកូនបង្គាដែលត្រួតស៊ីគ្នាដើម្បីងាយស្រួលរាប់។ ដូចជាការសម្លឹងមើលតំណក់ទឹកថ្នាំដែលស្រក់លើក្រដាសស ហើយរាប់ថាតើមានតំណក់ប៉ុន្មានដុំ ទោះបីជាពេលខ្លះវាហូរចូលគ្នាបន្តិចបន្តួចក៏ដោយ។
Gaussian filter (តម្រង Gaussian) វាជាតម្រងគណិតវិទ្យាដែលគេប្រើសម្រាប់កាត់បន្ថយគ្រាប់ល្អិតៗ (Noise) នៅក្នុងរូបភាព ដោយធ្វើឱ្យរូបភាពមានលក្ខណៈព្រិលបន្តិច (Blur) ដើម្បីជួយឱ្យប្រព័ន្ធកុំព្យូទ័រផ្តោតសំខាន់តែលើទម្រង់ធំៗរបស់វត្ថុ ងាយស្រួលក្នុងការចាប់យកទម្រង់បង្គា។ ដូចជាការប្រើកញ្ចក់វ៉ែនតាដែលធ្វើឱ្យព្រិលបន្តិច ដើម្បីកុំឱ្យភ្នែកយើងចាប់អារម្មណ៍នឹងធូលីល្អិតៗនៅលើរូបភាព ហើយងាយស្រួលមើលឃើញទម្រង់វត្ថុធំៗច្បាស់ជាងមុន។
Post larvae shrimp (កូនបង្គា) វាជាដំណាក់កាលលូតលាស់ដំបូងបំផុតរបស់បង្គាបន្ទាប់ពីញាស់ ដែលមានរូបរាងដូចទៅនឹងបង្គាធំធម្មតាគ្រាន់តែមានទំហំតូចខ្លាំង ហើយវាជាដំណាក់កាលដែលកសិករទិញយកមកទម្លាក់ចូលចិញ្ចឹមក្នុងស្រះ។ ដូចជាទារកទើបនឹងកើតដែលត្រូវគេនាំយកពីមន្ទីរពេទ្យ (កន្លែងបង្កាត់ពូជ) យកទៅថែរក្សានិងចិញ្ចឹមនៅផ្ទះ (ស្រះចិញ្ចឹម)។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖