Original Title: Advanced Preprocessing Technique for Tomato Imagery in Gravimetric Analysis Applied to Robotic Harvesting
Source: doi.org/10.3390/app14020511
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

បច្ចេកទេសរៀបចំទិន្នន័យរូបភាពប៉េងប៉ោះកម្រិតខ្ពស់ក្នុងការវិភាគទំនាញសម្រាប់ការប្រមូលផលដោយមនុស្សយន្ត

ចំណងជើងដើម៖ Advanced Preprocessing Technique for Tomato Imagery in Gravimetric Analysis Applied to Robotic Harvesting

អ្នកនិពន្ធ៖ Nail Beisekenov (Graduate School of Science and Technology, Niigata University), Hideo Hasegawa (Institute of Science and Technology, Niigata University)

ឆ្នាំបោះពុម្ព៖ 2024, Applied Sciences

វិស័យសិក្សា៖ Precision Agriculture / Computer Vision

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហាភាពមិនមានប្រសិទ្ធភាព និងការចំណាយខ្ពស់នៃការប្រមូលផលប៉េងប៉ោះដោយកម្លាំងពលកម្មមនុស្ស តាមរយៈការកែលម្អភាពត្រឹមត្រូវនៃប្រព័ន្ធប្រមូលផលដោយមនុស្សយន្ត (Robotic harvesting) ដោយប្រើប្រាស់បច្ចេកទេសកែច្នៃរូបភាពកម្រិតខ្ពស់ ដើម្បីកំណត់ទីតាំងចំណុចកណ្តាលនៃទំនាញ (Center of gravity)។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានបង្កើតគំរូកូនកាត់មួយដែលរួមបញ្ចូលបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត (CNNs) និង Part Affinity Fields (PAFs) ដោយធ្វើតេស្តលើបណ្តុំទិន្នន័យរូបភាពចម្រុះ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Hybrid CNN-PAF Model (Proposed)
គំរូកូនកាត់បណ្តាញសរសៃប្រសាទ (CNN) និង Part Affinity Fields (PAFs)
ផ្តល់ភាពត្រឹមត្រូវខ្ពស់ (៩៦,៤%) ក្នុងការកំណត់ទីតាំងចំណុចកណ្តាលទំនាញ និងមានភាពបត់បែនខ្ពស់ទៅនឹងលក្ខខណ្ឌបរិស្ថានកសិកម្មពិតប្រាកដ។ ជួបការលំបាកខ្លះៗជាមួយរូបភាពប៉េងប៉ោះដែលមានទំហំតូច ឬនៅផ្តុំគ្នាជាន់គ្នា និងទាមទារកម្លាំងម៉ាស៊ីនកុំព្យូទ័រខ្ពស់ក្នុងការដំណើរការ។ ទទួលបានកំហុសទីតាំងទាបបំផុតត្រឹមតែ ២,៦ ភីកសែលសម្រាប់ស្រទាប់ផ្កា (Calyx) និង ៥,៣ ភីកសែលសម្រាប់ចំណុចកណ្តាលទំនាញ។
Image Thresholding (Intensity 110 & 120)
បច្ចេកទេសកាត់វែកញែករូបភាព (Thresholding) កម្រិតពន្លឺ ១១០ និង ១២០
មានប្រសិទ្ធភាពខ្ពស់ក្នុងការកាត់វែកញែករូបរាងវណ្ឌវង្ក (Contours) នៃវត្ថុគោលដៅក្នុងលក្ខខណ្ឌដែលមានពន្លឺ និងកម្រិតពណ៌ (Contrast) ច្បាស់លាស់។ អាចបាត់បង់ព័ត៌មានលម្អិតដ៏សំខាន់ប្រសិនបើរូបភាពមានពន្លឺមិនល្អ ឬមានកម្រិតពណ៌ប្រហាក់ប្រហែលគ្នារវាងផ្លែនិងស្លឹក។ ជួយបំបែកតួផ្លែប៉េងប៉ោះពីផ្ទៃខាងក្រោយ (Background) បានយ៉ាងលឿនសម្រាប់បញ្ចូលទៅក្នុងសំណុំទិន្នន័យបង្វឹក AI។
Image Dithering Technique
បច្ចេកទេសរៀបចំរូបភាព Dithering
រក្សាទុកព័ត៌មានលម្អិត និងវាយនភាព (Textures) បានយ៉ាងល្អ ទោះបីជានៅក្នុងតំបន់រូបភាពដែលមានកម្រិតពណ៌ខ្សោយ (Low contrast) ក៏ដោយ។ អាចបង្កើតជាចំណុចតូចៗ (Noise) នៅលើរូបភាព ដែលតម្រូវឱ្យមានការព្យាបាលបន្ថែមមុននឹងបញ្ជូនទៅកាន់គំរូ CNN។ អាចជួយកំណត់ទីតាំងតំបន់ស្មុគស្មាញនៃប៉េងប៉ោះ ដែលវិធីសាស្ត្រធម្មតាមើលរំលង។

ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះទាមទារកម្លាំងម៉ាស៊ីនកុំព្យូទ័រដែលមានសមត្ថភាពខ្ពស់ (GPU) និងសំណុំទិន្នន័យរូបភាពច្រើនសន្ធឹកសន្ធាប់ដើម្បីបង្វឹកគំរូ AI ឱ្យមានភាពត្រឹមត្រូវ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

សំណុំទិន្នន័យត្រូវបានប្រមូលផ្តុំពីផ្ទះកញ្ចក់ក្នុងខេត្ត Niigata ប្រទេសជប៉ុន និងប្រភពអនឡាញអន្តរជាតិ ដែលភាគច្រើនឆ្លុះបញ្ចាំងពីពូជប៉េងប៉ោះ និងបរិស្ថានកសិកម្មនៅតំបន់អាកាសធាតុត្រជាក់។ សម្រាប់ប្រទេសកម្ពុជា ការអនុវត្តគំរូនេះផ្ទាល់អាចប្រឈមនឹងបញ្ហាអគតិ (Bias) ដោយសារភាពខុសគ្នានៃកម្រិតពន្លឺព្រះអាទិត្យ ពូជប៉េងប៉ោះក្នុងស្រុក និងការដាំដុះក្នុងទីវាល (Open-field) ឬផ្ទះសំណាញ់ធម្មតា។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាការប្រើប្រាស់មនុស្សយន្តប្រមូលផល (Robotic Harvesting) មិនទាន់ទូលំទូលាយនៅកម្ពុជាក៏ពិតមែន ប៉ុន្តែបច្ចេកវិទ្យាវិភាគរូបភាព (Computer Vision) នេះមានសក្តានុពលខ្ពស់សម្រាប់ការធ្វើទំនើបកម្មវិស័យកសិកម្មក្នុងស្រុក។

សរុបមក បច្ចេកទេសរៀបចំរូបភាពកម្រិតខ្ពស់នេះជាគ្រឹះដ៏ល្អមួយសម្រាប់ធុរកិច្ចថ្មីបច្ចេកវិទ្យាកសិកម្ម (AgriTech Startups) នៅកម្ពុជា ក្នុងការបង្កើតប្រព័ន្ធតាមដានដំណាំឆ្លាតវៃដែលអាចជួយកាត់បន្ថយពេលវេលា និងការប្រើប្រាស់កម្លាំងពលកម្មបានយ៉ាងមានប្រសិទ្ធភាព។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ស្វែងយល់ពីមូលដ្ឋានគ្រឹះនៃ Computer Vision: ចាប់ផ្តើមសិក្សាពីការកែច្នៃរូបភាព (Image Processing) ដោយប្រើបណ្ណាល័យ OpenCV និង scikit-image ក្នុងភាសាប្រូក្រាម Python ដោយផ្តោតលើការអនុវត្តផ្ទាល់លើបច្ចេកទេស Thresholding, Edge Detection និង Dithering
  2. ប្រមូល និងរៀបចំសំណុំទិន្នន័យក្នុងស្រុកពិតប្រាកដ: ចុះប្រមូលទិន្នន័យរូបភាពដំណាំប៉េងប៉ោះពីកសិដ្ឋានជាក់ស្តែងនៅកម្ពុជា (ឧទាហរណ៍ កសិដ្ឋានផ្ទះសំណាញ់នៅមណ្ឌលគិរី) រួចធ្វើការចំណាំតំបន់សំខាន់ៗ (Labeling) ដូចជាទង និងស្រទាប់ផ្កា ដោយប្រើប្រាស់ឧបករណ៍ LabelImgCVAT
  3. អភិវឌ្ឍគំរូ AI សម្គាល់រូបភាព: អនុវត្តការសរសេរកូដដើម្បីបង្កើតបណ្តាញ Convolutional Neural Networks (CNNs) តាមរយៈក្របខណ្ឌ PyTorchTensorFlow ដើម្បីទាញយកលក្ខណៈពិសេស (Feature extraction) ពីសំណុំទិន្នន័យដែលបានរៀបចំរួច។
  4. សាកល្បងបច្ចេកទេស Part Affinity Fields (PAFs): រៀនបញ្ចូលក្បួនដោះស្រាយ PAFs ទៅក្នុងគំរូរបស់អ្នក ដើម្បីកំណត់ពីទំនាក់ទំនងនៃចម្ងាយនិងមុំរវាងចំណុចសំខាន់ៗនៃផ្លែប៉េងប៉ោះ ដែលជាកត្តាសំខាន់បំផុតក្នុងការវិភាគរកចំណុចកណ្តាលនៃទំនាញ (Center of gravity)។
  5. ធ្វើតេស្តបន្សាំជាមួយ Hardware ខ្នាតតូច (Edge Computing): នាំយកគំរូដែលបានបង្វឹករួច ទៅដាក់ដំណើរការនិងសាកល្បងលើឧបករណ៍ខ្នាតតូចមានតម្លៃសមរម្យដូចជា Raspberry PiNVIDIA Jetson Nano ដើម្បីតេស្តភាពជាក់ស្តែងក្នុងការប្រើប្រាស់ក្នុងកសិដ្ឋាន។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Convolutional Neural Networks (CNNs) ជាប្រភេទបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត (AI) ដែលត្រូវបានរចនាឡើងយ៉ាងពិសេសសម្រាប់វិភាគទិន្នន័យរូបភាព។ វាមានសមត្ថភាពក្នុងការទាញយកលក្ខណៈពិសេសរបស់រូបភាព (ដូចជា ពណ៌ គែម និងរូបរាង) ដើម្បីធ្វើការចំណាំ និងចាត់ថ្នាក់វត្ថុដោយស្វ័យប្រវត្តិ។ ដូចជាភ្នែក និងខួរក្បាលរបស់មនុស្ស ដែលពេលឃើញផ្លែប៉េងប៉ោះភ្លាម អាចដឹងថាវាជារាងមូល និងមានពណ៌ក្រហម ដោយមិនបាច់គិតវិភាគយូរ។
Part Affinity Fields (PAFs) ជាបច្ចេកទេសតំណាងវ៉ិចទ័រទ្វេវិមាត្រ (2D vectors) ដែលជួយកុំព្យូទ័រឱ្យយល់ពីទំនាក់ទំនង ទិសដៅ និងទីតាំងរវាងចំណុចសំខាន់ៗផ្សេងៗនៃវត្ថុមួយ (ឧទាហរណ៍៖ ទំនាក់ទំនងរវាងទង និងតួផ្លែប៉េងប៉ោះ) ដើម្បីជៀសវាងការចាប់គូខុសនៅពេលមានផ្លែប៉េងប៉ោះច្រើននៅផ្តុំគ្នា។ ដូចជាការគូសបន្ទាត់ភ្ជាប់ពីចំនុចមួយទៅចំនុចមួយនៅលើផែនទី ដើម្បីបង្ហាញពីផ្លូវតភ្ជាប់ពីរាជធានីទៅខេត្ត ដែលប្រាប់យើងទាំងចម្ងាយ និងទិសដៅ។
Gravimetric Analysis នៅក្នុងបរិបទនៃការសិក្សានេះ វាគឺជាការវិភាគទម្ងន់និងរូបរាង ដើម្បីរកចំណុចកណ្តាលនៃទំនាញ (Center of gravity) របស់ផ្លែប៉េងប៉ោះ ដែលជួយឱ្យដៃមនុស្សយន្តដឹងពីចំណុចដែលត្រូវចាប់កាន់ប្រកបដោយលំនឹង និងមិនធ្វើឱ្យខូចខាតផ្លែ។ ដូចជាពេលយើងចង់លើកតុមួយដែលធ្ងន់ យើងត្រូវរកមើលចំណុចកណ្តាលរបស់វាសិន ដើម្បីលើកទៅកុំឱ្យផ្អៀងធ្លាក់ ឬចំណាយកម្លាំងអត់ប្រយោជន៍។
Dithering ជាបច្ចេកទេសរៀបចំរូបភាពកម្រិតខ្ពស់ដោយប្រើកំហុសនៃបរិមាណ (Quantization errors) ដើម្បីបំប្លែងរូបភាពទៅជាសខ្មៅ (Monochromatic) ប៉ុន្តែនៅតែអាចរក្សាទុកនូវព័ត៌មានលម្អិត និងវាយនភាព (Texture) បានយ៉ាងល្អ ទោះជានៅតំបន់រូបភាពដែលមានកម្រិតពណ៌ខ្សោយក៏ដោយ។ ដូចជាការគូរគំនូរដោយប្រើចំណុចខ្មៅតូចៗផ្តុំគ្នា ដែលកន្លែងចំណុចញឹកតំណាងឱ្យកន្លែងងងឹត ហើយកន្លែងចំណុចរង្វើលតំណាងឱ្យកន្លែងភ្លឺ ដោយមិនបាច់ប្រើពណ៌ប្រផេះឡើយ។
Thresholding វិធីសាស្ត្រកាត់វែកញែករូបភាពដោយផ្អែកលើកម្រិតពន្លឺ (Intensity) របស់ភីកសែល (Pixels)។ ភីកសែលណាដែលមានកម្រិតពន្លឺលើសលេខដែលបានកំណត់ នឹងត្រូវចាត់ទុកជាតួវត្ថុ (ឧ. ផ្លែប៉េងប៉ោះ) ឯភីកសែលដែលទាបជាង នឹងត្រូវកាត់ចេញជាផ្ទៃខាងក្រោយ (Background)។ ដូចជាការរែងខ្សាច់អញ្ចឹង គ្រាប់ខ្សាច់ណាដែលធំជាងរន្ធរែង នឹងត្រូវជាប់នៅលើតម្រង ឯគ្រាប់តូចៗនឹងធ្លាក់ចុះក្រោមចេញអស់។
Abscission zone ជាតំបន់ជីវសាស្ត្រនៅលើទងផ្លែឈើ (ដូចជាប៉េងប៉ោះ) ដែលជាចំណុចខ្សោយពីធម្មជាតិ និងជាកន្លែងដែលផ្លែឈើនឹងរបេះផ្តាច់ចេញពីដើមនៅពេលវាទុំពេញលេញ។ នេះជាចំណុចគោលដៅសំខាន់បំផុតសម្រាប់ឱ្យមនុស្សយន្តធ្វើការកាត់ប្រមូលផល។ ដូចជារន្ធកាត់ត្រៀមទុកនៅលើក្រដាសប្រាក់ ឬសំបុត្រកុន ដែលធ្វើឱ្យយើងងាយស្រួលហែកផ្តាច់យកមកប្រើប្រាស់ដោយមិនរហែកខូចទ្រង់ទ្រាយក្រដាសទាំងមូល។
Confidence maps ជាផែនទីកម្តៅ (Heat maps) ដែលគណនាដោយប្រូបាប៊ីលីតេ ដើម្បីបង្ហាញពីកម្រិតនៃទំនុកចិត្តរបស់ប្រព័ន្ធ AI ក្នុងការទស្សន៍ទាយទីតាំងជាក់លាក់ណាមួយ (ដូចជាចំណុចកណ្តាលនៃផ្លែប៉េងប៉ោះ) នៅលើទិន្នន័យរូបភាព។ ដូចជារ៉ាដាចាប់ទីតាំងរន្ទះ កន្លែងដែលមានពណ៌ក្រហមចាស់នៅលើអេក្រង់ គឺបញ្ជាក់ថាប្រព័ន្ធមានភាពជឿជាក់ខ្ពស់បំផុតថានឹងមានរន្ទះបាញ់នៅទីនោះ។
Transfer learning ជាបច្ចេកទេស Machine Learning ដែលយកចំណេះដឹង (គំរូ AI) ដែលត្រូវបានបង្វឹករួចជាស្រេចពីបញ្ហាមួយ ទៅអនុវត្ត និងកែច្នៃបន្តដើម្បីដោះស្រាយបញ្ហាថ្មីមួយទៀតដែលមានលក្ខណៈស្រដៀងគ្នា ដើម្បីជួយសន្សំពេលវេលាបង្វឹក និងបង្កើនភាពត្រឹមត្រូវ។ ដូចជាអ្នកដែលចេះជិះកង់ស្ទាត់ជំនាញរួចហើយ ពេលងាកមករៀនជិះម៉ូតូ គាត់អាចរៀនឆាប់ចេះជាងអ្នកដែលមិនធ្លាប់ជិះកង់សោះ ព្រោះគាត់ចេះពីរបៀបរក្សាលំនឹងរួចទៅហើយ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖