Original Title: Advanced Preprocessing Technique for Tomato Imagery in Gravimetric Analysis Applied to Robotic Harvesting
Source: doi.org/10.3390/app14020511
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

បច្ចេកទេសរៀបចំទិន្នន័យរូបភាពប៉េងប៉ោះកម្រិតខ្ពស់ក្នុងការវិភាគទំនាញសម្រាប់ការប្រមូលផលដោយមនុស្សយន្ត

ចំណងជើងដើម៖ Advanced Preprocessing Technique for Tomato Imagery in Gravimetric Analysis Applied to Robotic Harvesting

អ្នកនិពន្ធ៖ Nail Beisekenov (Graduate School of Science and Technology, Niigata University), Hideo Hasegawa (Institute of Science and Technology, Niigata University)

ឆ្នាំបោះពុម្ព៖ 2024, Applied Sciences

វិស័យសិក្សា៖ Precision Agriculture / Computer Vision

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហាភាពមិនមានប្រសិទ្ធភាព និងការចំណាយខ្ពស់នៃការប្រមូលផលប៉េងប៉ោះដោយកម្លាំងពលកម្មមនុស្ស តាមរយៈការកែលម្អភាពត្រឹមត្រូវនៃប្រព័ន្ធប្រមូលផលដោយមនុស្សយន្ត (Robotic harvesting) ដោយប្រើប្រាស់បច្ចេកទេសកែច្នៃរូបភាពកម្រិតខ្ពស់ ដើម្បីកំណត់ទីតាំងចំណុចកណ្តាលនៃទំនាញ (Center of gravity)។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានបង្កើតគំរូកូនកាត់មួយដែលរួមបញ្ចូលបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត (CNNs) និង Part Affinity Fields (PAFs) ដោយធ្វើតេស្តលើបណ្តុំទិន្នន័យរូបភាពចម្រុះ។

ការបង្កើនទិន្នន័យ និងការផ្ទេរការរៀន (Data Augmentation and Transfer Learning)
ម៉ាទ្រីសទ្វេវិមាត្រ (Dual 2D matrices) សម្រាប់ការចាត់ថ្នាក់ និង Part Affinity Fields (PAFs)
ការកំណត់កម្រិតពន្លឺរូបភាព (Thresholding) និងបច្ចេកទេស Dithering
ការកំណត់ទីតាំងចំណុចសំខាន់ៗ (Key point localization) ដូចជា ចំណុចកណ្តាលទំនាញ (Center of gravity) ស្រទាប់ផ្កា (Calyx) និងតំបន់ផ្តាច់ទង (Abscission zone)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

គំរូនេះទទួលបានភាពត្រឹមត្រូវក្នុងការសម្គាល់រហូតដល់ ៩៦,៤% នៅពេលធ្វើតេស្តលើបណ្តុំទិន្នន័យរូបភាពប៉េងប៉ោះចម្រុះចំនួន ២២៦០ រូបភាព។
ចំណុចកណ្តាលនៃទំនាញ (Center of gravity) និងស្រទាប់ផ្កា (Calyx) មានកំហុសទីតាំងភីកសែលទាបបំផុត (៥,៣ និង ២,៦ ភីកសែល តាមអ័ក្សដេក) ដែលបង្ហាញពីសារៈសំខាន់ផ្នែកធរណីមាត្រដើម្បីជួយឱ្យមនុស្សយន្តប្រមូលផលបានត្រឹមត្រូវ។
វិធីសាស្ត្រដែលបានស្នើឡើងនេះជួយធ្វើឱ្យប្រសើរឡើងយ៉ាងខ្លាំងនូវការប៉ាន់ស្មានទីតាំង និងមានភាពបត់បែនខ្ពស់ទៅនឹងលក្ខខណ្ឌកសិកម្មជាក់ស្តែង ដែលអាចជួយកាត់បន្ថយកម្លាំងពលកម្មបានយ៉ាងមានប្រសិទ្ធភាពនៅពេលអនាគត។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Hybrid CNN-PAF Model (Proposed) គំរូកូនកាត់បណ្តាញសរសៃប្រសាទ (CNN) និង Part Affinity Fields (PAFs)	ផ្តល់ភាពត្រឹមត្រូវខ្ពស់ (៩៦,៤%) ក្នុងការកំណត់ទីតាំងចំណុចកណ្តាលទំនាញ និងមានភាពបត់បែនខ្ពស់ទៅនឹងលក្ខខណ្ឌបរិស្ថានកសិកម្មពិតប្រាកដ។	ជួបការលំបាកខ្លះៗជាមួយរូបភាពប៉េងប៉ោះដែលមានទំហំតូច ឬនៅផ្តុំគ្នាជាន់គ្នា និងទាមទារកម្លាំងម៉ាស៊ីនកុំព្យូទ័រខ្ពស់ក្នុងការដំណើរការ។	ទទួលបានកំហុសទីតាំងទាបបំផុតត្រឹមតែ ២,៦ ភីកសែលសម្រាប់ស្រទាប់ផ្កា (Calyx) និង ៥,៣ ភីកសែលសម្រាប់ចំណុចកណ្តាលទំនាញ។
Image Thresholding (Intensity 110 & 120) បច្ចេកទេសកាត់វែកញែករូបភាព (Thresholding) កម្រិតពន្លឺ ១១០ និង ១២០	មានប្រសិទ្ធភាពខ្ពស់ក្នុងការកាត់វែកញែករូបរាងវណ្ឌវង្ក (Contours) នៃវត្ថុគោលដៅក្នុងលក្ខខណ្ឌដែលមានពន្លឺ និងកម្រិតពណ៌ (Contrast) ច្បាស់លាស់។	អាចបាត់បង់ព័ត៌មានលម្អិតដ៏សំខាន់ប្រសិនបើរូបភាពមានពន្លឺមិនល្អ ឬមានកម្រិតពណ៌ប្រហាក់ប្រហែលគ្នារវាងផ្លែនិងស្លឹក។	ជួយបំបែកតួផ្លែប៉េងប៉ោះពីផ្ទៃខាងក្រោយ (Background) បានយ៉ាងលឿនសម្រាប់បញ្ចូលទៅក្នុងសំណុំទិន្នន័យបង្វឹក AI។
Image Dithering Technique បច្ចេកទេសរៀបចំរូបភាព Dithering	រក្សាទុកព័ត៌មានលម្អិត និងវាយនភាព (Textures) បានយ៉ាងល្អ ទោះបីជានៅក្នុងតំបន់រូបភាពដែលមានកម្រិតពណ៌ខ្សោយ (Low contrast) ក៏ដោយ។	អាចបង្កើតជាចំណុចតូចៗ (Noise) នៅលើរូបភាព ដែលតម្រូវឱ្យមានការព្យាបាលបន្ថែមមុននឹងបញ្ជូនទៅកាន់គំរូ CNN។	អាចជួយកំណត់ទីតាំងតំបន់ស្មុគស្មាញនៃប៉េងប៉ោះ ដែលវិធីសាស្ត្រធម្មតាមើលរំលង។

ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះទាមទារកម្លាំងម៉ាស៊ីនកុំព្យូទ័រដែលមានសមត្ថភាពខ្ពស់ (GPU) និងសំណុំទិន្នន័យរូបភាពច្រើនសន្ធឹកសន្ធាប់ដើម្បីបង្វឹកគំរូ AI ឱ្យមានភាពត្រឹមត្រូវ។

Hardware: កុំព្យូទ័រផ្ទាល់ខ្លួនកម្រិតខ្ពស់ (Intel i7, 3.60 GHz, 32 GB DDR4) បំពាក់ដោយក្រាហ្វិកកាត NVIDIA GeForce RTX 2080 សម្រាប់ដំណើរការ Deep Learning។
Software: ប្រព័ន្ធប្រតិបត្តិការ Windows 11 ជាមួយភាសាប្រូក្រាម Python និងប្រើប្រាស់បណ្ណាល័យ OpenCV និង scikit-image។
Dataset: សំណុំទិន្នន័យរូបភាពប៉េងប៉ោះចំនួន ២២៦០ សន្លឹក (ថតផ្ទាល់ក្នុងផ្ទះកញ្ចក់នៅជប៉ុនចំនួន ៧០០ សន្លឹក និងទាញយកពីប្រភពបើកចំហរដូចជា Kaggle និង GitHub ចំនួន ១៥៦០ សន្លឹក) រួមជាមួយការដាក់ស្លាកដោយអ្នកជំនាញកសិកម្ម។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

សំណុំទិន្នន័យត្រូវបានប្រមូលផ្តុំពីផ្ទះកញ្ចក់ក្នុងខេត្ត Niigata ប្រទេសជប៉ុន និងប្រភពអនឡាញអន្តរជាតិ ដែលភាគច្រើនឆ្លុះបញ្ចាំងពីពូជប៉េងប៉ោះ និងបរិស្ថានកសិកម្មនៅតំបន់អាកាសធាតុត្រជាក់។ សម្រាប់ប្រទេសកម្ពុជា ការអនុវត្តគំរូនេះផ្ទាល់អាចប្រឈមនឹងបញ្ហាអគតិ (Bias) ដោយសារភាពខុសគ្នានៃកម្រិតពន្លឺព្រះអាទិត្យ ពូជប៉េងប៉ោះក្នុងស្រុក និងការដាំដុះក្នុងទីវាល (Open-field) ឬផ្ទះសំណាញ់ធម្មតា។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាការប្រើប្រាស់មនុស្សយន្តប្រមូលផល (Robotic Harvesting) មិនទាន់ទូលំទូលាយនៅកម្ពុជាក៏ពិតមែន ប៉ុន្តែបច្ចេកវិទ្យាវិភាគរូបភាព (Computer Vision) នេះមានសក្តានុពលខ្ពស់សម្រាប់ការធ្វើទំនើបកម្មវិស័យកសិកម្មក្នុងស្រុក។

កសិដ្ឋានដាំដុះក្នុងផ្ទះសំណាញ់ទំនើប (ខេត្តមណ្ឌលគិរី កំពង់ចាម និងតំបន់ជុំវិញ): អ្នកអភិវឌ្ឍន៍អាចយកក្បួនដោះស្រាយ (Algorithm) នេះទៅកែច្នៃដើម្បីតាមដានកម្រិតទុំនៃផ្លែឈើ ឬប៉ាន់ស្មានទិន្នផលមុនរដូវប្រមូលផល ដោយគ្រាន់តែប្រើប្រាស់កាមេរ៉ាស្មាតហ្វូន ឬប្រព័ន្ធកាមេរ៉ាសុវត្ថិភាពក្នុងកសិដ្ឋាន។
ការស្រាវជ្រាវ និងបណ្តុះបណ្តាលនៅសាកលវិទ្យាល័យ (RUA, ITC, NIPTICT): និស្សិតជំនាញកសិកម្ម និងវិស្វកម្មបច្ចេកវិទ្យាអាចរួមគ្នាអភិវឌ្ឍប្រព័ន្ធ AI តូចៗសម្រាប់កំណត់រោគសញ្ញាជំងឺលើស្លឹកប៉េងប៉ោះ ឬទីតាំងលូតលាស់នៃដំណាំផ្សេងៗ ដោយប្រើបច្ចេកទេស Image Preprocessing ស្រដៀងគ្នានេះ។

សរុបមក បច្ចេកទេសរៀបចំរូបភាពកម្រិតខ្ពស់នេះជាគ្រឹះដ៏ល្អមួយសម្រាប់ធុរកិច្ចថ្មីបច្ចេកវិទ្យាកសិកម្ម (AgriTech Startups) នៅកម្ពុជា ក្នុងការបង្កើតប្រព័ន្ធតាមដានដំណាំឆ្លាតវៃដែលអាចជួយកាត់បន្ថយពេលវេលា និងការប្រើប្រាស់កម្លាំងពលកម្មបានយ៉ាងមានប្រសិទ្ធភាព។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

ស្វែងយល់ពីមូលដ្ឋានគ្រឹះនៃ Computer Vision: ចាប់ផ្តើមសិក្សាពីការកែច្នៃរូបភាព (Image Processing) ដោយប្រើបណ្ណាល័យ OpenCV និង scikit-image ក្នុងភាសាប្រូក្រាម Python ដោយផ្តោតលើការអនុវត្តផ្ទាល់លើបច្ចេកទេស Thresholding, Edge Detection និង Dithering។
ប្រមូល និងរៀបចំសំណុំទិន្នន័យក្នុងស្រុកពិតប្រាកដ: ចុះប្រមូលទិន្នន័យរូបភាពដំណាំប៉េងប៉ោះពីកសិដ្ឋានជាក់ស្តែងនៅកម្ពុជា (ឧទាហរណ៍ កសិដ្ឋានផ្ទះសំណាញ់នៅមណ្ឌលគិរី) រួចធ្វើការចំណាំតំបន់សំខាន់ៗ (Labeling) ដូចជាទង និងស្រទាប់ផ្កា ដោយប្រើប្រាស់ឧបករណ៍ LabelImg ឬ CVAT។
អភិវឌ្ឍគំរូ AI សម្គាល់រូបភាព: អនុវត្តការសរសេរកូដដើម្បីបង្កើតបណ្តាញ Convolutional Neural Networks (CNNs) តាមរយៈក្របខណ្ឌ PyTorch ឬ TensorFlow ដើម្បីទាញយកលក្ខណៈពិសេស (Feature extraction) ពីសំណុំទិន្នន័យដែលបានរៀបចំរួច។
សាកល្បងបច្ចេកទេស Part Affinity Fields (PAFs): រៀនបញ្ចូលក្បួនដោះស្រាយ PAFs ទៅក្នុងគំរូរបស់អ្នក ដើម្បីកំណត់ពីទំនាក់ទំនងនៃចម្ងាយនិងមុំរវាងចំណុចសំខាន់ៗនៃផ្លែប៉េងប៉ោះ ដែលជាកត្តាសំខាន់បំផុតក្នុងការវិភាគរកចំណុចកណ្តាលនៃទំនាញ (Center of gravity)។
ធ្វើតេស្តបន្សាំជាមួយ Hardware ខ្នាតតូច (Edge Computing): នាំយកគំរូដែលបានបង្វឹករួច ទៅដាក់ដំណើរការនិងសាកល្បងលើឧបករណ៍ខ្នាតតូចមានតម្លៃសមរម្យដូចជា Raspberry Pi ឬ NVIDIA Jetson Nano ដើម្បីតេស្តភាពជាក់ស្តែងក្នុងការប្រើប្រាស់ក្នុងកសិដ្ឋាន។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Convolutional Neural Networks (CNNs)	ជាប្រភេទបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត (AI) ដែលត្រូវបានរចនាឡើងយ៉ាងពិសេសសម្រាប់វិភាគទិន្នន័យរូបភាព។ វាមានសមត្ថភាពក្នុងការទាញយកលក្ខណៈពិសេសរបស់រូបភាព (ដូចជា ពណ៌ គែម និងរូបរាង) ដើម្បីធ្វើការចំណាំ និងចាត់ថ្នាក់វត្ថុដោយស្វ័យប្រវត្តិ។	ដូចជាភ្នែក និងខួរក្បាលរបស់មនុស្ស ដែលពេលឃើញផ្លែប៉េងប៉ោះភ្លាម អាចដឹងថាវាជារាងមូល និងមានពណ៌ក្រហម ដោយមិនបាច់គិតវិភាគយូរ។
Part Affinity Fields (PAFs)	ជាបច្ចេកទេសតំណាងវ៉ិចទ័រទ្វេវិមាត្រ (2D vectors) ដែលជួយកុំព្យូទ័រឱ្យយល់ពីទំនាក់ទំនង ទិសដៅ និងទីតាំងរវាងចំណុចសំខាន់ៗផ្សេងៗនៃវត្ថុមួយ (ឧទាហរណ៍៖ ទំនាក់ទំនងរវាងទង និងតួផ្លែប៉េងប៉ោះ) ដើម្បីជៀសវាងការចាប់គូខុសនៅពេលមានផ្លែប៉េងប៉ោះច្រើននៅផ្តុំគ្នា។	ដូចជាការគូសបន្ទាត់ភ្ជាប់ពីចំនុចមួយទៅចំនុចមួយនៅលើផែនទី ដើម្បីបង្ហាញពីផ្លូវតភ្ជាប់ពីរាជធានីទៅខេត្ត ដែលប្រាប់យើងទាំងចម្ងាយ និងទិសដៅ។
Gravimetric Analysis	នៅក្នុងបរិបទនៃការសិក្សានេះ វាគឺជាការវិភាគទម្ងន់និងរូបរាង ដើម្បីរកចំណុចកណ្តាលនៃទំនាញ (Center of gravity) របស់ផ្លែប៉េងប៉ោះ ដែលជួយឱ្យដៃមនុស្សយន្តដឹងពីចំណុចដែលត្រូវចាប់កាន់ប្រកបដោយលំនឹង និងមិនធ្វើឱ្យខូចខាតផ្លែ។	ដូចជាពេលយើងចង់លើកតុមួយដែលធ្ងន់ យើងត្រូវរកមើលចំណុចកណ្តាលរបស់វាសិន ដើម្បីលើកទៅកុំឱ្យផ្អៀងធ្លាក់ ឬចំណាយកម្លាំងអត់ប្រយោជន៍។
Dithering	ជាបច្ចេកទេសរៀបចំរូបភាពកម្រិតខ្ពស់ដោយប្រើកំហុសនៃបរិមាណ (Quantization errors) ដើម្បីបំប្លែងរូបភាពទៅជាសខ្មៅ (Monochromatic) ប៉ុន្តែនៅតែអាចរក្សាទុកនូវព័ត៌មានលម្អិត និងវាយនភាព (Texture) បានយ៉ាងល្អ ទោះជានៅតំបន់រូបភាពដែលមានកម្រិតពណ៌ខ្សោយក៏ដោយ។	ដូចជាការគូរគំនូរដោយប្រើចំណុចខ្មៅតូចៗផ្តុំគ្នា ដែលកន្លែងចំណុចញឹកតំណាងឱ្យកន្លែងងងឹត ហើយកន្លែងចំណុចរង្វើលតំណាងឱ្យកន្លែងភ្លឺ ដោយមិនបាច់ប្រើពណ៌ប្រផេះឡើយ។
Thresholding	វិធីសាស្ត្រកាត់វែកញែករូបភាពដោយផ្អែកលើកម្រិតពន្លឺ (Intensity) របស់ភីកសែល (Pixels)។ ភីកសែលណាដែលមានកម្រិតពន្លឺលើសលេខដែលបានកំណត់ នឹងត្រូវចាត់ទុកជាតួវត្ថុ (ឧ. ផ្លែប៉េងប៉ោះ) ឯភីកសែលដែលទាបជាង នឹងត្រូវកាត់ចេញជាផ្ទៃខាងក្រោយ (Background)។	ដូចជាការរែងខ្សាច់អញ្ចឹង គ្រាប់ខ្សាច់ណាដែលធំជាងរន្ធរែង នឹងត្រូវជាប់នៅលើតម្រង ឯគ្រាប់តូចៗនឹងធ្លាក់ចុះក្រោមចេញអស់។
Abscission zone	ជាតំបន់ជីវសាស្ត្រនៅលើទងផ្លែឈើ (ដូចជាប៉េងប៉ោះ) ដែលជាចំណុចខ្សោយពីធម្មជាតិ និងជាកន្លែងដែលផ្លែឈើនឹងរបេះផ្តាច់ចេញពីដើមនៅពេលវាទុំពេញលេញ។ នេះជាចំណុចគោលដៅសំខាន់បំផុតសម្រាប់ឱ្យមនុស្សយន្តធ្វើការកាត់ប្រមូលផល។	ដូចជារន្ធកាត់ត្រៀមទុកនៅលើក្រដាសប្រាក់ ឬសំបុត្រកុន ដែលធ្វើឱ្យយើងងាយស្រួលហែកផ្តាច់យកមកប្រើប្រាស់ដោយមិនរហែកខូចទ្រង់ទ្រាយក្រដាសទាំងមូល។
Confidence maps	ជាផែនទីកម្តៅ (Heat maps) ដែលគណនាដោយប្រូបាប៊ីលីតេ ដើម្បីបង្ហាញពីកម្រិតនៃទំនុកចិត្តរបស់ប្រព័ន្ធ AI ក្នុងការទស្សន៍ទាយទីតាំងជាក់លាក់ណាមួយ (ដូចជាចំណុចកណ្តាលនៃផ្លែប៉េងប៉ោះ) នៅលើទិន្នន័យរូបភាព។	ដូចជារ៉ាដាចាប់ទីតាំងរន្ទះ កន្លែងដែលមានពណ៌ក្រហមចាស់នៅលើអេក្រង់ គឺបញ្ជាក់ថាប្រព័ន្ធមានភាពជឿជាក់ខ្ពស់បំផុតថានឹងមានរន្ទះបាញ់នៅទីនោះ។
Transfer learning	ជាបច្ចេកទេស Machine Learning ដែលយកចំណេះដឹង (គំរូ AI) ដែលត្រូវបានបង្វឹករួចជាស្រេចពីបញ្ហាមួយ ទៅអនុវត្ត និងកែច្នៃបន្តដើម្បីដោះស្រាយបញ្ហាថ្មីមួយទៀតដែលមានលក្ខណៈស្រដៀងគ្នា ដើម្បីជួយសន្សំពេលវេលាបង្វឹក និងបង្កើនភាពត្រឹមត្រូវ។	ដូចជាអ្នកដែលចេះជិះកង់ស្ទាត់ជំនាញរួចហើយ ពេលងាកមករៀនជិះម៉ូតូ គាត់អាចរៀនឆាប់ចេះជាងអ្នកដែលមិនធ្លាប់ជិះកង់សោះ ព្រោះគាត់ចេះពីរបៀបរក្សាលំនឹងរួចទៅហើយ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖