Original Title: A Novel CNN Model for Fruit Leaf Disease Detection: A Lightweight Solution for Grapes, Figs, and Oranges
Source: doi.org/10.54216/FPA.190220
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ម៉ូដែល CNN ថ្មីសម្រាប់ការរកឃើញជំងឺលើស្លឹកឈើហូបផ្លែ៖ ដំណោះស្រាយស្រាលសម្រាប់ទំពាំងបាយជូរ ល្វា និងក្រូច

ចំណងជើងដើម៖ A Novel CNN Model for Fruit Leaf Disease Detection: A Lightweight Solution for Grapes, Figs, and Oranges

អ្នកនិពន្ធ៖ Dalya Anwar (Department of Computer Science, Salahaddin University, Erbil, Iraq)

ឆ្នាំបោះពុម្ព៖ 2025, Fusion: Practice and Applications (FPA)

វិស័យសិក្សា៖ Computer Vision

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ជំងឺរុក្ខជាតិបង្កការគំរាមកំហែងដល់សន្តិសុខស្បៀង ខណៈពេលដែលម៉ូដែលបញ្ញាសិប្បនិម្មិត (AI) បច្ចុប្បន្នភាគច្រើនមានទំហំធំ ទាមទារថាមពលកុំព្យូទ័រខ្ពស់ និងពិបាកយកទៅប្រើប្រាស់ក្នុងឧបករណ៍ដែលមានធនធានកម្រិតទាប។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានអភិវឌ្ឍម៉ូដែលបណ្ដាញសរសៃប្រសាទខុនវ៉ូលូសិន (CNN) ថ្មីមួយដែលស៊ីធនធានតិច ដោយប្រើប្រាស់ទិន្នន័យរូបភាពស្លឹករុក្ខជាតិពីចម្ការផ្ទាល់នៅក្នុងប្រទេសអ៊ីរ៉ាក់។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Proposed CNN Model (Lightweight)
ម៉ូដែល CNN ស្រាលដែលបានស្នើឡើង
មានភាពត្រឹមត្រូវខ្ពស់បំផុត និងប្រើប្រាស់ទំហំគណនាតិចតួចបំផុត ដែលស័ក្តិសមឥតខ្ចោះសម្រាប់ឧបករណ៍ដែលមានធនធានខ្សោយ។ មានសមត្ថភាពចាប់យកលក្ខណៈពិសេសបានល្អតាមរយៈប្លុក Squeeze-Excitation និង Global Context។ ដោយសារតែមានប៉ារ៉ាម៉ែត្រតិចតួច ម៉ូដែលនេះអាចប្រឈមនឹងការពិបាកក្នុងការវិភាគលើប្រភេទជំងឺដែលស្មុគស្មាញខ្លាំង ឬទិន្នន័យដែលមានភាពចម្រុះលើសពីកម្រិតដែលបានហ្វឹកហាត់។ ភាពត្រឹមត្រូវ ៩៩%, FLOPs ៣៣៥ លាន, ប៉ារ៉ាម៉ែត្រ ១៧២,៣១៤
EfficientNet_b0
ម៉ូដែល EfficientNet_b0
មានតុល្យភាពល្អរវាងភាពត្រឹមត្រូវ និងទំហំគណនា ដែលស៊ីធនធានតិចជាងម៉ូដែលធំៗដូចជា VGG16 និង ResNet។ ទោះជាមានទំហំតូចជាងម៉ូដែលជំនាន់មុន ក៏នៅតែទាមទារប៉ារ៉ាម៉ែត្រច្រើនជាងម៉ូដែលស្នើឡើងរហូតដល់ជាង ៣០ដង។ ភាពត្រឹមត្រូវ ៩២%, FLOPs ៧៤៦ លាន, ប៉ារ៉ាម៉ែត្រ ៥.២ លាន
ResNet50
ម៉ូដែល ResNet50
អាចរៀនពីលក្ខណៈពិសេសនៃរូបភាពដ៏ស្មុគស្មាញបានល្អ និងមានភាពត្រឹមត្រូវខ្ពស់ដោយសារស្ថាបត្យកម្មដ៏ជ្រៅរបស់វា។ ទាមទារថាមពលគណនា និងមេម៉ូរីខ្ពស់ខ្លាំង ដែលមិនស័ក្តិសមទាល់តែសោះសម្រាប់ឧបករណ៍ចល័ត ឬ Edge devices តូចៗ។ ភាពត្រឹមត្រូវ ៩៣%, FLOPs ៧.៦ ពាន់លាន, ប៉ារ៉ាម៉ែត្រ ២៥.៥ លាន
VGG16
ម៉ូដែល VGG16
មានរចនាសម្ព័ន្ធសាមញ្ញ និងងាយស្រួលយល់ ដែលអាចចាប់យកទម្រង់រាងនៃស្លឹកឈើបានល្អ។ ស៊ីមេម៉ូរី និងថាមពលគណនាច្រើនមហាសាល (FLOPs ជាង ២៧ ពាន់លាន) ព្រមទាំងងាយរងបញ្ហា Overfitting ។ ភាពត្រឹមត្រូវ ៩២%, FLOPs ២៧.២ ពាន់លាន, ប៉ារ៉ាម៉ែត្រ ១៣៨ លាន

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះផ្ដោតសំខាន់លើការរចនាម៉ូដែលដែលប្រើប្រាស់ធនធានកុំព្យូទ័រ (RAM, GPU, CPU) ក្នុងកម្រិតអប្បបរមាបំផុត ដើម្បីឱ្យអាចដំណើរការបានលើឧបករណ៍ចុងស្រវាយ (Edge devices)។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ទិន្នន័យដែលប្រើក្នុងការសិក្សានេះ ត្រូវបានប្រមូលផ្តាច់មុខពីចម្ការនៅក្នុងប្រទេសអ៊ីរ៉ាក់ (Iraqi orchards) លើផ្លែក្រូច ល្វា និងទំពាំងបាយជូរ។ ការណ៍នេះអាចបណ្តាលឱ្យមានភាពលម្អៀង (Data Bias) ព្រោះអាកាសធាតុ ពន្លឺ និងពូជដំណាំនៅទីនោះអាចខុសគ្នាពីប្រទេសផ្សេងៗ។ សម្រាប់ប្រទេសកម្ពុជា ម៉ូដែលនេះចាំបាច់ត្រូវមានការហ្វឹកហាត់បន្ថែមជាមួយទិន្នន័យក្នុងស្រុក ដើម្បីអាចស្គាល់រោគសញ្ញាជំងឺរុក្ខជាតិដែលកើតមានក្នុងតំបន់ត្រូពិចបានត្រឹមត្រូវ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាប្រភពទិន្នន័យស្ថិតនៅតំបន់ផ្សេងក៏ដោយ ក៏ស្ថាបត្យកម្ម CNN ដ៏ស្រាលនេះមានសក្តានុពល និងអត្ថប្រយោជន៍ខ្ពស់បំផុតសម្រាប់ការយកមកកែច្នៃអនុវត្តក្នុងវិស័យកសិកម្មនៅកម្ពុជា។

ជារួម ការសិក្សានេះបានផ្តល់នូវដំណោះស្រាយបច្ចេកវិទ្យាដ៏សមស្របមួយសម្រាប់ប្រទេសកំពុងអភិវឌ្ឍន៍ដូចជាកម្ពុជា ក្នុងការនាំយកបច្ចេកវិទ្យា AI ដែលមានតម្លៃថោក និងប្រសិទ្ធភាពខ្ពស់ ទៅដល់ដៃកសិករនៅទីវាលដោយផ្ទាល់។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាស្វែងយល់ពីប្លុកស្ថាបត្យកម្មស្រាល (Lightweight Architecture): និស្សិតគួរចាប់ផ្តើមសិក្សាពីទ្រឹស្ដី និងការអនុវត្តជាក់ស្តែងនៃបច្ចេកទេស Depthwise Separable Convolutions និង Squeeze-Excitation (SE) networks ដោយសាកល្បងសរសេរកូដនៅក្នុង PyTorchTensorFlow
  2. ប្រមូល និងរៀបចំទិន្នន័យក្នុងស្រុក (Local Dataset Creation): ចុះទៅចម្ការកសិកម្មក្នុងប្រទេសកម្ពុជា ដើម្បីថតប្រមូលរូបភាពស្លឹកឈើដែលមានជំងឺ និងគ្មានជំងឺ (ឧទាហរណ៍ ក្រូចពោធិ៍សាត់ ឬស្វាយ)។ បន្ទាប់មកត្រូវប្រើបច្ចេកទេស Data Augmentation ដូចជាការបង្វិល (Rotation) ឬកែពន្លឺ តាមរយៈបណ្ណាល័យ OpenCV ដើម្បីពង្រីកទំហំទិន្នន័យ។
  3. កសាងម៉ូដែល និងប្រៀបធៀបដំណើរការ (Model Training & Benchmarking): រៀបចំកូដបង្កើតម៉ូដែលតាមការរចនាក្នុងឯកសារនេះ រួចធ្វើការហ្វឹកហាត់ដោយប្រើប្រាស់បច្ចេកទេស OneCycleLR។ ក្រោយមកត្រូវប្រៀបធៀបលទ្ធផល (Accuracy, FLOPs, Memory) ជាមួយនឹងម៉ូដែលទំនើបៗផ្សេងទៀតដូចជា MobileNetV3EfficientNet_b0
  4. បំប្លែងម៉ូដែលសម្រាប់ឧបករណ៍ចល័ត (Mobile Optimization): ប្រើប្រាស់ TensorFlow LiteONNX ដើម្បីកាត់បន្ថយទំហំម៉ូដែល (Quantization) បន្ថែមទៀត រួចបញ្ចូលវាទៅក្នុងកម្មវិធី Android/iOS ដែលអាចឱ្យអ្នកប្រើប្រាស់ថតរូប និងវិភាគរោគសញ្ញាផ្ទាល់ៗ (Real-time inference)។
  5. សាកល្បងផ្ទាល់នៅទីវាល (Field Testing & Iteration): យកកម្មវិធីដែលបានបង្កើតទៅសាកល្បងប្រើប្រាស់ផ្ទាល់នៅចម្ការ (ស្ថិតក្រោមស្ថានភាពពន្លឺព្រះអាទិត្យខុសៗគ្នា) ដើម្បីកត់ត្រាពីចំណុចខ្សោយរបស់ម៉ូដែល និងប្រមូលទិន្នន័យថ្មីៗមកធ្វើបច្ចុប្បន្នភាពម៉ូដែលឱ្យកាន់តែសុក្រឹតនៅជំនាន់ក្រោយ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Convolutional Neural Network (CNN) បណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតដែលត្រូវបានរចនាឡើងយ៉ាងពិសេសសម្រាប់វិភាគ និងទាញយកលក្ខណៈសម្បត្តិពីរូបភាព ដោយឆ្លងកាត់ស្រទាប់ចម្រោះ (Filters) ជាច្រើនតំណាក់កាលដើម្បីស្គាល់ទម្រង់ ឬវត្ថុផ្សេងៗ។ ដូចជាភ្នែក និងខួរក្បាលរបស់មនុស្សដែលសម្លឹងមើលរូបភាពមួយ រួចវិភាគពីពណ៌ រូបរាង និងលំនាំ ដើម្បីដឹងថារូបនោះជារូបអ្វីពិតប្រាកដ។
FLOPs រង្វាស់នៃចំនួនប្រតិបត្តិការគណនាទសភាគ (Floating-Point Operations) ដែលម៉ូដែល AI ត្រូវធ្វើការ។ វាតំណាងឱ្យកម្រិតនៃទំហំការងារ និងថាមពលកុំព្យូទ័រដែលម៉ូដែលត្រូវការដើម្បីដំណើរការការទស្សន៍ទាយមួយ។ ដូចជាចំនួនជំហាននៃការគណនាលេខបូកដកគុណចែក ដែលសិស្សម្នាក់ត្រូវសរសេរដើម្បីរកចម្លើយលំហាត់គណិតវិទ្យាមួយអញ្ចឹង (កាន់តែច្រើន គឺកាន់តែហត់ និងស៊ីពេល)។
Squeeze-Excitation (SE) ប្លុកស្ថាបត្យកម្មនៅក្នុង CNN ដែលជួយឱ្យម៉ូដែលចេះថ្លឹងថ្លែងពីសារៈសំខាន់នៃលក្ខណៈពិសេសនីមួយៗ (Channels) ដោយសង្កត់ធ្ងន់លើព័ត៌មានដែលសំខាន់បំផុត និងទម្លាក់ចោលព័ត៌មានដែលមិនសូវមានប្រយោជន៍។ ដូចជាការពាក់វ៉ែនតាដែលជួយកាត់ចំណាំងផ្លាត និងផ្តោតពន្លឺតែទៅលើចំណុចដែលយើងចង់មើលឱ្យបានច្បាស់ ខណៈពេលព្រិលផ្ទៃខាងក្រោយចោល។
Depthwise Separable Convolutions បច្ចេកទេសបំបែកការគណនា Convolution ជាពីរដំណាក់កាលដាច់ដោយឡែកពីគ្នា (តាមជម្រៅ និងតាមចំណុច) ដើម្បីកាត់បន្ថយទំហំនៃការគណនា និងចំនួនប៉ារ៉ាម៉ែត្ររបស់ម៉ូដែលយ៉ាងសន្ធឹកសន្ធាប់ ដោយមិនធ្វើឱ្យបាត់បង់ភាពត្រឹមត្រូវ។ ជំនួសឱ្យការធ្វើការងារស្មុគស្មាញមួយដោយកម្លាំងមនុស្សម្នាក់ វាដូចជាការបែងចែកការងារនោះជាពីរដំណាក់កាលតូចៗឱ្យមនុស្សពីរនាក់ធ្វើ ដែលលឿនជាង និងចំណាយកម្លាំងតិចជាង។
Data Augmentation បច្ចេកទេសក្នុងការបង្កើតទិន្នន័យហ្វឹកហាត់ថ្មីៗបន្ថែមពីទិន្នន័យដើមដែលមានស្រាប់ (ដូចជាការបង្វិលរូប ផ្លាស់ប្តូរពន្លឺ ឬពង្រីកបង្រួម) ដើម្បីជួយឱ្យម៉ូដែល AI រៀនបានកាន់តែច្រើន និងកាត់បន្ថយបញ្ហា Overfitting។ ដូចជាការឱ្យសិស្សហាត់ធ្វើលំហាត់ដដែលៗ ប៉ុន្តែគ្រូប្តូរតួលេខ និងរបៀបសួរ ដើម្បីឱ្យសិស្សចេះដោះស្រាយគ្រប់កាលៈទេសៈ មិនមែនគ្រាន់តែទន្ទេញចាំមាត់។
OneCycleLR យុទ្ធសាស្ត្រក្នុងការកែតម្រូវល្បឿននៃការរៀនសូត្រ (Learning Rate) របស់ម៉ូដែល AI អំឡុងពេលហ្វឹកហាត់ ដោយចាប់ផ្តើមពីល្បឿនយឺត រួចបង្កើនដល់ចំណុចកំពូល និងបន្ថយមកវិញ ដើម្បីជួយឱ្យម៉ូដែលរៀនបានលឿន និងចៀសផុតពីការជាប់គាំង។ ដូចជាការធាក់កង់ប្រណាំងអញ្ចឹង ចាប់ផ្តើមធាក់មួយៗសិនដើម្បីសន្សំកម្លាំង រួចបញ្ចេញកម្លាំងធាក់ឱ្យលឿនបំផុតនៅកណ្តាលទី និងបន្ថយល្បឿនបន្តិចម្តងៗវិញពេលជិតដល់ទីដៅ។
Adaptive-Average Pool ស្រទាប់នៅក្នុងបណ្ដាញសរសៃប្រសាទដែលបង្រួញទំហំផ្ទៃនៃទិន្នន័យរូបភាពឱ្យមកនៅទំហំថេរមួយដែលចង់បាន ដោយយកតម្លៃមធ្យមនៃតំបន់នីមួយៗ ដែលជួយកាត់បន្ថយប៉ារ៉ាម៉ែត្រមុននឹងបញ្ជូនទៅស្រទាប់ចុងក្រោយ។ ដូចជាការសង្ខេបសៀវភៅអត្ថបទដ៏វែងមួយឱ្យនៅសល់តែខ្លឹមសារសំខាន់ៗមួយទំព័រ ដើម្បីងាយស្រួលយល់ និងរហ័សក្នុងការអាន។
overfitting បញ្ហាដែលម៉ូដែល AI រៀនទន្ទេញចាំតែទិន្នន័យហ្វឹកហាត់បានល្អឥតខ្ចោះ ប៉ុន្តែមិនអាចធ្វើការទស្សន៍ទាយបានត្រឹមត្រូវទេនៅពេលវាជួបប្រទះទិន្នន័យថ្មីៗដែលវាមិនធ្លាប់ឃើញពីមុនមកក្នុងពិភពពិត។ ដូចជាសិស្សដែលទន្ទេញវិញ្ញាសាប្រឡងចាស់ចាំយ៉ាងស្ទាត់ ប៉ុន្តែពេលប្រឡងពិតប្រាកដចេញខុសពីវិញ្ញាសាចាស់បន្តិច ក៏ធ្វើមិនចេះតែម្តង។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖