បញ្ហា (The Problem)៖ ការរាប់ចំនួនកូនបង្គា (post larvae) ដោយដៃគឺជាការងារលំបាក ចំណាយពេលយូរ និងងាយមានកំហុស ដែលធ្វើឱ្យប៉ះពាល់ដល់ការគ្រប់គ្រងដង់ស៊ីតេបង្គាក្នុងកសិដ្ឋាន។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានវាយតម្លៃ និងប្រៀបធៀបវិធីសាស្ត្រទាញយកលក្ខណៈរូបភាពចំនួនពីរប្រភេទរួមជាមួយនឹងចំណាត់ថ្នាក់មែកធាងដើម្បីស្វ័យប្រវត្តិកម្មការរាប់ចំនួនកូនបង្គា។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Local Binary Pattern (LBP) + Random Forest ការទាញយកលក្ខណៈរូបភាពដោយ Local Binary Pattern (LBP) រួមជាមួយចំណាត់ថ្នាក់ Random Forest |
មានភាពត្រឹមត្រូវខ្ពស់រហូតដល់ ៩៨.៥០% និងមានស្ថិរភាពជាងមុននៅពេលកំណត់កាំ (half-window size) ចាប់ពី ៣ ភីកសែលឡើងទៅ។ | ទាមទារពេលវេលាច្រើនជាងមុនក្នុងការទាញយកលក្ខណៈរូបភាពនៅពេលបង្កើនទំហំកាំ ហើយនៅតែមានកំហុសខ្លះនៅពេលកូនបង្គាត្រួតស៊ីគ្នា។ | សម្រេចបានភាពត្រឹមត្រូវ ៩៨.៥០% ដោយមានកម្រិតកំហុស RMSE ១៤.៤៣ ក្នុងមួយរូបភាព។ |
| RGB Feature Extraction + Random Forest ការទាញយកលក្ខណៈរូបភាពតាមប្រព័ន្ធពណ៌ RGB រួមជាមួយចំណាត់ថ្នាក់ Random Forest |
មានភាពសាមញ្ញជាងក្នុងការទាញយកទិន្នន័យពណ៌ពីចន្លោះពណ៌ (Color space) របស់រូបភាពដោយផ្ទាល់។ | មានភាពសុក្រឹតនិងស្ថិរភាពទាបជាង LBP ព្រមទាំងងាយកំណត់គោលដៅខុសនៅតំបន់ដែលគ្មានកូនបង្គា ឬមានការត្រួតស៊ីគ្នាខ្លាំង។ | លទ្ធផលទាបជាងបច្ចេកទេស LBP យ៉ាងច្បាស់ និងមិនសូវមានស្ថិរភាពក្នុងការរាប់។ |
| Manual Counting ការរាប់ចំនួនកូនបង្គាដោយដៃ (វិធីសាស្ត្រប្រពៃណី) |
ជាវិធីសាស្ត្រមូលដ្ឋានដែលមិនត្រូវការឧបករណ៍បច្ចេកវិទ្យាស្មុគស្មាញ និងងាយយល់សម្រាប់កសិករ។ | ចំណាយពេលយូរខ្លាំង ប្រើប្រាស់កម្លាំងពលកម្មច្រើន និងងាយមានកំហុសដោយសារភ្នែកមនុស្ស (Human error) ពេលបរិមាណបង្គាច្រើន។ | ប្រើប្រាស់ជាទិន្នន័យគោល (Ground truth) ដើម្បីផ្ទៀងផ្ទាត់កម្រិតភាពត្រឹមត្រូវរបស់កុំព្យូទ័រ។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារឧបករណ៍ថតរូបដែលមានគុណភាព និងកុំព្យូទ័រដែលមានសមត្ថភាពមធ្យមសម្រាប់ដំណើរការកូដ ការបង្វឹកម៉ូដែល និងការទាញយកលក្ខណៈរូបភាព។
ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងមន្ទីរពិសោធន៍នៃសាកលវិទ្យាល័យ Rajamangala ខេត្តត្រាង ប្រទេសថៃ ដោយប្រើប្រាស់ទិន្នន័យកូនបង្គាក្នុងបរិស្ថានដែលបានកំណត់ពន្លឺនិងផ្ទៃខាងក្រោយច្បាស់លាស់។ ទិន្នន័យនេះមានភាពពាក់ព័ន្ធខ្ពស់សម្រាប់ប្រទេសកម្ពុជាដោយសារលក្ខខណ្ឌអាកាសធាតុ និងប្រភេទកូនបង្គាមានភាពស្រដៀងគ្នា ប៉ុន្តែម៉ូដែលនេះប្រហែលជាត្រូវការពង្រីកទិន្នន័យបង្វឹកបន្ថែម ប្រសិនបើចង់យកទៅប្រើក្នុងបរិស្ថានកសិដ្ឋានដែលមានពន្លឺធម្មជាតិ និងគុណភាពទឹកខុសគ្នា។
បច្ចេកវិទ្យាសម្គាល់រូបភាពនេះមានសក្តានុពល និងភាពជាក់ស្តែងខ្ពស់ក្នុងការយកមកអនុវត្តដើម្បីជួយដល់វិស័យវារីវប្បកម្មនៅកម្ពុជា។
ជារួម ការធ្វើសមាហរណកម្មបច្ចេកវិទ្យាកុំព្យូទ័រមើលឃើញ (Computer Vision) ចូលទៅក្នុងវិស័យវារីវប្បកម្មកម្ពុជានឹងចូលរួមចំណែកយ៉ាងសំខាន់ក្នុងការសន្សំសំចៃពេលវេលា បង្កើនទំនុកចិត្តលើទិន្នន័យ និងជំរុញការគ្រប់គ្រងកសិដ្ឋានបែបវិទ្យាសាស្ត្រទំនើប។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Local Binary Pattern (LBP) (លំនាំទ្វេភាគមូលដ្ឋាន) | វាជាបច្ចេកទេសក្នុងកុំព្យូទ័រមើលឃើញ (Computer Vision) ដែលពិនិត្យមើលភីកសែលនីមួយៗក្នុងរូបភាព ដោយប្រៀបធៀបកម្រិតពន្លឺរបស់វាទៅនឹងភីកសែលជុំវិញ ដើម្បីបង្កើតជាកូដលេខសម្គាល់ក្បាច់រចនា (Texture) របស់វត្ថុ ធ្វើឱ្យកុំព្យូទ័រអាចចំណាំរូបរាងកូនបង្គាបានយ៉ាងច្បាស់។ | ដូចជាការពិនិត្យមើលក្បឿងនីមួយៗលើកម្រាលឥដ្ឋ ដោយប្រៀបធៀបពណ៌របស់វាទៅនឹងក្បឿងដែលនៅជុំវិញ ដើម្បីទាញយកជាលេខកូដសម្គាល់ក្បាច់រចនានៃឥដ្ឋនោះ។ |
| Random Forest classifier (ចំណាត់ថ្នាក់ Random Forest) | វាជាក្បួនដោះស្រាយការរៀនម៉ាស៊ីន (Machine Learning) ដែលបង្កើតជា "ដើមឈើសម្រេចចិត្ត" (Decision Trees) ជាច្រើនដើម ហើយវាប្រមូលចម្លើយពីដើមឈើទាំងនោះមកបូកបញ្ចូលគ្នាដើម្បីធ្វើការទស្សន៍ទាយឬចាត់ថ្នាក់ទិន្នន័យឱ្យបានកាន់តែសុក្រឹត និងកាត់បន្ថយកំហុស។ | ដូចជាការសួរមតិពីក្រុមអ្នកជំនាញជាច្រើននាក់លើបញ្ហាមួយ រួចយកចម្លើយដែលភាគច្រើនឯកភាពគ្នាជាការសម្រេចចិត្តចុងក្រោយ ជាជាងការជឿលើមនុស្សតែម្នាក់។ |
| Feature extraction (ការទាញយកលក្ខណៈរូបភាព) | វាជាដំណើរការនៃការបំប្លែងទិន្នន័យរូបភាពដើមដ៏ស្មុគស្មាញ ឱ្យទៅជាទិន្នន័យលេខឬព័ត៌មានសំខាន់ៗ (ដូចជាពណ៌ ឬក្បាច់) ដែលតំណាងឱ្យរូបភាពនោះ ដើម្បីឱ្យម៉ូដែលកុំព្យូទ័រអាចងាយស្រួលអាន វិភាគ និងរៀនសូត្រពីវា។ | ដូចជាការអានសៀវភៅក្រាស់មួយក្បាល ហើយសង្ខេបយកតែចំណុចសំខាន់ៗដើម្បីឱ្យអ្នកដទៃងាយយល់និងចាប់បានលឿន ដោយមិនបាច់អានសៀវភៅទាំងមូលឡើងវិញ។ |
| K-fold cross validation (ការផ្ទៀងផ្ទាត់ខ្វែង K-fold) | វាជាវិធីសាស្ត្រស្ថិតិសម្រាប់វាស់ស្ទង់សមត្ថភាពរបស់ម៉ូដែល AI ដោយបែងចែកទិន្នន័យជា K ផ្នែក (ឧទាហរណ៍ ៥ ផ្នែក) រួចប្រើប្រាស់ ៤ ផ្នែកសម្រាប់បង្វឹកម៉ូដែល និង ១ ផ្នែកទៀតសម្រាប់តេស្ត ដោយធ្វើបែបនេះឆ្លាស់គ្នារហូតគ្រប់ផ្នែកទាំងអស់។ | ដូចជាការចែកសិស្សជា ៥ ក្រុម ហើយឱ្យ ៤ ក្រុមរៀនពីមេរៀន រួចយក ១ ក្រុមទៀតមកប្រឡងតេស្តសមត្ថភាព ដោយធ្វើឆ្លាស់គ្នារហូតគ្រប់ក្រុមទាំងអស់ដើម្បីធានាថាលទ្ធផលប្រឡងពិតជាត្រឹមត្រូវ មិនមែនដោយសារសំណាង។ |
| Root mean square error - RMSE (កំហុសមធ្យមការ៉េឬស) | វាជារង្វាស់គណិតវិទ្យាដែលប្រើសម្រាប់គណនាពីទំហំកំហុសជាមធ្យមរវាងតម្លៃដែលម៉ូដែលទស្សន៍ទាយបាន និងតម្លៃពិតប្រាកដ។ តម្លៃ RMSE កាន់តែតូច មានន័យថាម៉ូដែលទស្សន៍ទាយបានកាន់តែត្រឹមត្រូវ។ | ដូចជាការវាស់ស្ទង់មើលថា តើគ្រាប់ធ្នូដែលយើងបាញ់ទៅនោះ ឃ្លាតពីចំណុចកណ្តាលស៊ីបប៉ុន្មានសង់ទីម៉ែត្រជាមធ្យមរាល់ពេលបាញ់ម្តងៗ។ |
| Blob detection (ការស្វែងរកចំណុចដុំៗ) | វាជាបច្ចេកទេសកែច្នៃរូបភាពដែលស្វែងរកនិងគូសវង់ចំណាំតំបន់នានានៅក្នុងរូបភាព ដែលមានលក្ខណៈខុសប្លែកពីផ្ទៃខាងក្រោយ (ដូចជាភាពភ្លឺ ឬពណ៌) ដែលក្នុងទីនេះគេប្រើដើម្បីចាប់យកទម្រង់ដងខ្លួនកូនបង្គាដែលត្រួតស៊ីគ្នាដើម្បីងាយស្រួលរាប់។ | ដូចជាការសម្លឹងមើលតំណក់ទឹកថ្នាំដែលស្រក់លើក្រដាសស ហើយរាប់ថាតើមានតំណក់ប៉ុន្មានដុំ ទោះបីជាពេលខ្លះវាហូរចូលគ្នាបន្តិចបន្តួចក៏ដោយ។ |
| Gaussian filter (តម្រង Gaussian) | វាជាតម្រងគណិតវិទ្យាដែលគេប្រើសម្រាប់កាត់បន្ថយគ្រាប់ល្អិតៗ (Noise) នៅក្នុងរូបភាព ដោយធ្វើឱ្យរូបភាពមានលក្ខណៈព្រិលបន្តិច (Blur) ដើម្បីជួយឱ្យប្រព័ន្ធកុំព្យូទ័រផ្តោតសំខាន់តែលើទម្រង់ធំៗរបស់វត្ថុ ងាយស្រួលក្នុងការចាប់យកទម្រង់បង្គា។ | ដូចជាការប្រើកញ្ចក់វ៉ែនតាដែលធ្វើឱ្យព្រិលបន្តិច ដើម្បីកុំឱ្យភ្នែកយើងចាប់អារម្មណ៍នឹងធូលីល្អិតៗនៅលើរូបភាព ហើយងាយស្រួលមើលឃើញទម្រង់វត្ថុធំៗច្បាស់ជាងមុន។ |
| Post larvae shrimp (កូនបង្គា) | វាជាដំណាក់កាលលូតលាស់ដំបូងបំផុតរបស់បង្គាបន្ទាប់ពីញាស់ ដែលមានរូបរាងដូចទៅនឹងបង្គាធំធម្មតាគ្រាន់តែមានទំហំតូចខ្លាំង ហើយវាជាដំណាក់កាលដែលកសិករទិញយកមកទម្លាក់ចូលចិញ្ចឹមក្នុងស្រះ។ | ដូចជាទារកទើបនឹងកើតដែលត្រូវគេនាំយកពីមន្ទីរពេទ្យ (កន្លែងបង្កាត់ពូជ) យកទៅថែរក្សានិងចិញ្ចឹមនៅផ្ទះ (ស្រះចិញ្ចឹម)។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖