Original Title: A Novel CNN Model for Fruit Leaf Disease Detection: A Lightweight Solution for Grapes, Figs, and Oranges
Source: doi.org/10.54216/FPA.190220
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ម៉ូដែល CNN ថ្មីសម្រាប់ការរកឃើញជំងឺលើស្លឹកឈើហូបផ្លែ៖ ដំណោះស្រាយស្រាលសម្រាប់ទំពាំងបាយជូរ ល្វា និងក្រូច

ចំណងជើងដើម៖ A Novel CNN Model for Fruit Leaf Disease Detection: A Lightweight Solution for Grapes, Figs, and Oranges

អ្នកនិពន្ធ៖ Dalya Anwar (Department of Computer Science, Salahaddin University, Erbil, Iraq)

ឆ្នាំបោះពុម្ព៖ 2025, Fusion: Practice and Applications (FPA)

វិស័យសិក្សា៖ Computer Vision

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ជំងឺរុក្ខជាតិបង្កការគំរាមកំហែងដល់សន្តិសុខស្បៀង ខណៈពេលដែលម៉ូដែលបញ្ញាសិប្បនិម្មិត (AI) បច្ចុប្បន្នភាគច្រើនមានទំហំធំ ទាមទារថាមពលកុំព្យូទ័រខ្ពស់ និងពិបាកយកទៅប្រើប្រាស់ក្នុងឧបករណ៍ដែលមានធនធានកម្រិតទាប។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានអភិវឌ្ឍម៉ូដែលបណ្ដាញសរសៃប្រសាទខុនវ៉ូលូសិន (CNN) ថ្មីមួយដែលស៊ីធនធានតិច ដោយប្រើប្រាស់ទិន្នន័យរូបភាពស្លឹករុក្ខជាតិពីចម្ការផ្ទាល់នៅក្នុងប្រទេសអ៊ីរ៉ាក់។

ការប្រមូល និងពង្រីកទិន្នន័យរូបភាពស្លឹកឈើហូបផ្លែ (Dataset collection and data augmentation)
ការប្រើប្រាស់ប្លុក Squeeze-Excitation (SE) និងស្រទាប់ Adaptive-Average Pool ដើម្បីកាត់បន្ថយទំហំគណនា (Computational complexity reduction)
ការប្រៀបធៀបដំណើរការម៉ូដែលស្នើឡើងជាមួយនឹងម៉ូដែលស្តង់ដារ (State-of-the-art model comparison)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ម៉ូដែល CNN ដែលបានស្នើឡើងទទួលបានភាពត្រឹមត្រូវ (Accuracy) កម្រិតភាពច្បាស់ (Precision) និងពិន្ទុ F1-score រហូតដល់ ៩៩% ក្នុងការរកឃើញជំងឺលើស្លឹកទំពាំងបាយជូរ ល្វា និងក្រូច។
ម៉ូដែលនេះទាមទារប៉ារ៉ាម៉ែត្រត្រឹមតែ ១៧២,៣១៤ និងដំណើរការគណនាប្រមាណ ៣៣៥ លាន FLOPs ដែលទាបជាងឆ្ងាយបើធៀបនឹងម៉ូដែលធំៗដូចជា ResNet50 ឫ VGG16។
លទ្ធផលនេះបញ្ជាក់ថាម៉ូដែលថ្មីនេះមានប្រសិទ្ធភាពខ្ពស់ ស៊ីម៉េមូរីតិច និងស័ក្តិសមបំផុតសម្រាប់ការដំឡើងប្រើប្រាស់ក្នុងវិស័យកសិកម្មតាមពេលវេលាជាក់ស្តែង (Real-time application) លើឧបករណ៍ដែលមានធនធានកម្រិតទាប។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Proposed CNN Model (Lightweight) ម៉ូដែល CNN ស្រាលដែលបានស្នើឡើង	មានភាពត្រឹមត្រូវខ្ពស់បំផុត និងប្រើប្រាស់ទំហំគណនាតិចតួចបំផុត ដែលស័ក្តិសមឥតខ្ចោះសម្រាប់ឧបករណ៍ដែលមានធនធានខ្សោយ។ មានសមត្ថភាពចាប់យកលក្ខណៈពិសេសបានល្អតាមរយៈប្លុក Squeeze-Excitation និង Global Context។	ដោយសារតែមានប៉ារ៉ាម៉ែត្រតិចតួច ម៉ូដែលនេះអាចប្រឈមនឹងការពិបាកក្នុងការវិភាគលើប្រភេទជំងឺដែលស្មុគស្មាញខ្លាំង ឬទិន្នន័យដែលមានភាពចម្រុះលើសពីកម្រិតដែលបានហ្វឹកហាត់។	ភាពត្រឹមត្រូវ ៩៩%, FLOPs ៣៣៥ លាន, ប៉ារ៉ាម៉ែត្រ ១៧២,៣១៤
EfficientNet_b0 ម៉ូដែល EfficientNet_b0	មានតុល្យភាពល្អរវាងភាពត្រឹមត្រូវ និងទំហំគណនា ដែលស៊ីធនធានតិចជាងម៉ូដែលធំៗដូចជា VGG16 និង ResNet។	ទោះជាមានទំហំតូចជាងម៉ូដែលជំនាន់មុន ក៏នៅតែទាមទារប៉ារ៉ាម៉ែត្រច្រើនជាងម៉ូដែលស្នើឡើងរហូតដល់ជាង ៣០ដង។	ភាពត្រឹមត្រូវ ៩២%, FLOPs ៧៤៦ លាន, ប៉ារ៉ាម៉ែត្រ ៥.២ លាន
ResNet50 ម៉ូដែល ResNet50	អាចរៀនពីលក្ខណៈពិសេសនៃរូបភាពដ៏ស្មុគស្មាញបានល្អ និងមានភាពត្រឹមត្រូវខ្ពស់ដោយសារស្ថាបត្យកម្មដ៏ជ្រៅរបស់វា។	ទាមទារថាមពលគណនា និងមេម៉ូរីខ្ពស់ខ្លាំង ដែលមិនស័ក្តិសមទាល់តែសោះសម្រាប់ឧបករណ៍ចល័ត ឬ Edge devices តូចៗ។	ភាពត្រឹមត្រូវ ៩៣%, FLOPs ៧.៦ ពាន់លាន, ប៉ារ៉ាម៉ែត្រ ២៥.៥ លាន
VGG16 ម៉ូដែល VGG16	មានរចនាសម្ព័ន្ធសាមញ្ញ និងងាយស្រួលយល់ ដែលអាចចាប់យកទម្រង់រាងនៃស្លឹកឈើបានល្អ។	ស៊ីមេម៉ូរី និងថាមពលគណនាច្រើនមហាសាល (FLOPs ជាង ២៧ ពាន់លាន) ព្រមទាំងងាយរងបញ្ហា Overfitting ។	ភាពត្រឹមត្រូវ ៩២%, FLOPs ២៧.២ ពាន់លាន, ប៉ារ៉ាម៉ែត្រ ១៣៨ លាន

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះផ្ដោតសំខាន់លើការរចនាម៉ូដែលដែលប្រើប្រាស់ធនធានកុំព្យូទ័រ (RAM, GPU, CPU) ក្នុងកម្រិតអប្បបរមាបំផុត ដើម្បីឱ្យអាចដំណើរការបានលើឧបករណ៍ចុងស្រវាយ (Edge devices)។

Hardware: ត្រូវការឧបករណ៍កុំព្យូទ័រសម្រាប់ហ្វឹកហាត់ (អាចជា GPU មធ្យម) និងឧបករណ៍ដែលមាន CPU/GPU ខ្សោយ ដូចជាទូរស័ព្ទដៃស្មាតហ្វូន ឫម៉ាស៊ីនខ្នាតតូចសម្រាប់ដំណើរការម៉ូដែលជាក់ស្តែងនៅទីវាល។
Software: ត្រូវការប្រព័ន្ធសរសេរកូដសម្រាប់ Deep Learning (ទោះមិនបញ្ជាក់ចំៗ តែជាទូទៅគឺ PyTorch ឫ TensorFlow) និងការប្រើប្រាស់ OneCycleLR learning rate scheduler ដើម្បីជួយសម្រួលដល់ការហ្វឹកហាត់។
Dataset: ទិន្នន័យរូបភាពស្លឹកឈើហូបផ្លែចំនួន ១,៣៨០ រូបភាព ដែលទទួលបានពីការថតនៅចម្ការផ្ទាល់ ក្នុងស្ទូឌីយោ និងការបង្កើនទិន្នន័យ (Data Augmentation - បង្វិល ផ្លាស់ប្តូរពន្លឺ)។
Expertise: ជំនាញលើផ្នែកកុំព្យូទ័រទស្សនៈ (Computer Vision) ការកែច្នៃស្ថាបត្យកម្ម CNN (Architecture engineering) និងការកំណត់ប៉ារ៉ាម៉ែត្រ (Hyperparameter tuning)។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ទិន្នន័យដែលប្រើក្នុងការសិក្សានេះ ត្រូវបានប្រមូលផ្តាច់មុខពីចម្ការនៅក្នុងប្រទេសអ៊ីរ៉ាក់ (Iraqi orchards) លើផ្លែក្រូច ល្វា និងទំពាំងបាយជូរ។ ការណ៍នេះអាចបណ្តាលឱ្យមានភាពលម្អៀង (Data Bias) ព្រោះអាកាសធាតុ ពន្លឺ និងពូជដំណាំនៅទីនោះអាចខុសគ្នាពីប្រទេសផ្សេងៗ។ សម្រាប់ប្រទេសកម្ពុជា ម៉ូដែលនេះចាំបាច់ត្រូវមានការហ្វឹកហាត់បន្ថែមជាមួយទិន្នន័យក្នុងស្រុក ដើម្បីអាចស្គាល់រោគសញ្ញាជំងឺរុក្ខជាតិដែលកើតមានក្នុងតំបន់ត្រូពិចបានត្រឹមត្រូវ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាប្រភពទិន្នន័យស្ថិតនៅតំបន់ផ្សេងក៏ដោយ ក៏ស្ថាបត្យកម្ម CNN ដ៏ស្រាលនេះមានសក្តានុពល និងអត្ថប្រយោជន៍ខ្ពស់បំផុតសម្រាប់ការយកមកកែច្នៃអនុវត្តក្នុងវិស័យកសិកម្មនៅកម្ពុជា។

ការវិភាគជំងឺក្រូចពោធិ៍សាត់ (ខេត្តបាត់ដំបង និងពោធិ៍សាត់): ការប្រើប្រាស់កម្មវិធីទូរស័ព្ទ (Mobile App) ដែលបំពាក់ម៉ូដែលនេះ អាចជួយកសិករខេត្តបាត់ដំបង និងពោធិ៍សាត់ វិភាគរោគសញ្ញាជំងឺលើស្លឹកក្រូចពោធិ៍សាត់បានលឿន ទោះស្ថិតនៅចម្ការដែលគ្មានសេវាអ៊ីនធឺណិតក៏ដោយ ដោយសារម៉ូដែលដំណើរការដោយផ្ទាល់លើឧបករណ៍ (Offline Edge AI)។
ដ្រូនកសិកម្មស្កេនចម្ការស្វាយ (ខេត្តកំពង់ចាម): ម៉ូដែលស៊ីធនធានតិចនេះ អាចត្រូវបានដំឡើងលើកាមេរ៉ាដ្រូន (បំពាក់នូវខួរក្បាលតូចៗដូចជា Raspberry Pi) ដើម្បីហោះស្កេនមើលជំងឺរុក្ខជាតិលើផ្ទៃដីចម្ការស្វាយកែវរមៀតធំៗនៅខេត្តកំពង់ចាម ដោយសន្សំសំចៃថាមពលថ្មដ្រូនបានយូរ។
វិទ្យាស្ថានស្រាវជ្រាវ និងអភិវឌ្ឍន៍កសិកម្មកម្ពុជា (CARDI): ស្ថាប័ននេះអាចយកគំរូនៃស្ថាបត្យកម្មម៉ូដែលនេះ ជាមូលដ្ឋានគ្រឹះក្នុងការបង្កើតប្រព័ន្ធតាមដានជំងឺលើដំណាំស្រូវ ដែលចំណាយថវិកាតិចលើការទិញឧបករណ៍ Server (Cloud computing)។

ជារួម ការសិក្សានេះបានផ្តល់នូវដំណោះស្រាយបច្ចេកវិទ្យាដ៏សមស្របមួយសម្រាប់ប្រទេសកំពុងអភិវឌ្ឍន៍ដូចជាកម្ពុជា ក្នុងការនាំយកបច្ចេកវិទ្យា AI ដែលមានតម្លៃថោក និងប្រសិទ្ធភាពខ្ពស់ ទៅដល់ដៃកសិករនៅទីវាលដោយផ្ទាល់។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាស្វែងយល់ពីប្លុកស្ថាបត្យកម្មស្រាល (Lightweight Architecture): និស្សិតគួរចាប់ផ្តើមសិក្សាពីទ្រឹស្ដី និងការអនុវត្តជាក់ស្តែងនៃបច្ចេកទេស Depthwise Separable Convolutions និង Squeeze-Excitation (SE) networks ដោយសាកល្បងសរសេរកូដនៅក្នុង PyTorch ឬ TensorFlow។
ប្រមូល និងរៀបចំទិន្នន័យក្នុងស្រុក (Local Dataset Creation): ចុះទៅចម្ការកសិកម្មក្នុងប្រទេសកម្ពុជា ដើម្បីថតប្រមូលរូបភាពស្លឹកឈើដែលមានជំងឺ និងគ្មានជំងឺ (ឧទាហរណ៍ ក្រូចពោធិ៍សាត់ ឬស្វាយ)។ បន្ទាប់មកត្រូវប្រើបច្ចេកទេស Data Augmentation ដូចជាការបង្វិល (Rotation) ឬកែពន្លឺ តាមរយៈបណ្ណាល័យ OpenCV ដើម្បីពង្រីកទំហំទិន្នន័យ។
កសាងម៉ូដែល និងប្រៀបធៀបដំណើរការ (Model Training & Benchmarking): រៀបចំកូដបង្កើតម៉ូដែលតាមការរចនាក្នុងឯកសារនេះ រួចធ្វើការហ្វឹកហាត់ដោយប្រើប្រាស់បច្ចេកទេស OneCycleLR។ ក្រោយមកត្រូវប្រៀបធៀបលទ្ធផល (Accuracy, FLOPs, Memory) ជាមួយនឹងម៉ូដែលទំនើបៗផ្សេងទៀតដូចជា MobileNetV3 ឬ EfficientNet_b0។
បំប្លែងម៉ូដែលសម្រាប់ឧបករណ៍ចល័ត (Mobile Optimization): ប្រើប្រាស់ TensorFlow Lite ឬ ONNX ដើម្បីកាត់បន្ថយទំហំម៉ូដែល (Quantization) បន្ថែមទៀត រួចបញ្ចូលវាទៅក្នុងកម្មវិធី Android/iOS ដែលអាចឱ្យអ្នកប្រើប្រាស់ថតរូប និងវិភាគរោគសញ្ញាផ្ទាល់ៗ (Real-time inference)។
សាកល្បងផ្ទាល់នៅទីវាល (Field Testing & Iteration): យកកម្មវិធីដែលបានបង្កើតទៅសាកល្បងប្រើប្រាស់ផ្ទាល់នៅចម្ការ (ស្ថិតក្រោមស្ថានភាពពន្លឺព្រះអាទិត្យខុសៗគ្នា) ដើម្បីកត់ត្រាពីចំណុចខ្សោយរបស់ម៉ូដែល និងប្រមូលទិន្នន័យថ្មីៗមកធ្វើបច្ចុប្បន្នភាពម៉ូដែលឱ្យកាន់តែសុក្រឹតនៅជំនាន់ក្រោយ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Convolutional Neural Network (CNN)	បណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតដែលត្រូវបានរចនាឡើងយ៉ាងពិសេសសម្រាប់វិភាគ និងទាញយកលក្ខណៈសម្បត្តិពីរូបភាព ដោយឆ្លងកាត់ស្រទាប់ចម្រោះ (Filters) ជាច្រើនតំណាក់កាលដើម្បីស្គាល់ទម្រង់ ឬវត្ថុផ្សេងៗ។	ដូចជាភ្នែក និងខួរក្បាលរបស់មនុស្សដែលសម្លឹងមើលរូបភាពមួយ រួចវិភាគពីពណ៌ រូបរាង និងលំនាំ ដើម្បីដឹងថារូបនោះជារូបអ្វីពិតប្រាកដ។
FLOPs	រង្វាស់នៃចំនួនប្រតិបត្តិការគណនាទសភាគ (Floating-Point Operations) ដែលម៉ូដែល AI ត្រូវធ្វើការ។ វាតំណាងឱ្យកម្រិតនៃទំហំការងារ និងថាមពលកុំព្យូទ័រដែលម៉ូដែលត្រូវការដើម្បីដំណើរការការទស្សន៍ទាយមួយ។	ដូចជាចំនួនជំហាននៃការគណនាលេខបូកដកគុណចែក ដែលសិស្សម្នាក់ត្រូវសរសេរដើម្បីរកចម្លើយលំហាត់គណិតវិទ្យាមួយអញ្ចឹង (កាន់តែច្រើន គឺកាន់តែហត់ និងស៊ីពេល)។
Squeeze-Excitation (SE)	ប្លុកស្ថាបត្យកម្មនៅក្នុង CNN ដែលជួយឱ្យម៉ូដែលចេះថ្លឹងថ្លែងពីសារៈសំខាន់នៃលក្ខណៈពិសេសនីមួយៗ (Channels) ដោយសង្កត់ធ្ងន់លើព័ត៌មានដែលសំខាន់បំផុត និងទម្លាក់ចោលព័ត៌មានដែលមិនសូវមានប្រយោជន៍។	ដូចជាការពាក់វ៉ែនតាដែលជួយកាត់ចំណាំងផ្លាត និងផ្តោតពន្លឺតែទៅលើចំណុចដែលយើងចង់មើលឱ្យបានច្បាស់ ខណៈពេលព្រិលផ្ទៃខាងក្រោយចោល។
Depthwise Separable Convolutions	បច្ចេកទេសបំបែកការគណនា Convolution ជាពីរដំណាក់កាលដាច់ដោយឡែកពីគ្នា (តាមជម្រៅ និងតាមចំណុច) ដើម្បីកាត់បន្ថយទំហំនៃការគណនា និងចំនួនប៉ារ៉ាម៉ែត្ររបស់ម៉ូដែលយ៉ាងសន្ធឹកសន្ធាប់ ដោយមិនធ្វើឱ្យបាត់បង់ភាពត្រឹមត្រូវ។	ជំនួសឱ្យការធ្វើការងារស្មុគស្មាញមួយដោយកម្លាំងមនុស្សម្នាក់ វាដូចជាការបែងចែកការងារនោះជាពីរដំណាក់កាលតូចៗឱ្យមនុស្សពីរនាក់ធ្វើ ដែលលឿនជាង និងចំណាយកម្លាំងតិចជាង។
Data Augmentation	បច្ចេកទេសក្នុងការបង្កើតទិន្នន័យហ្វឹកហាត់ថ្មីៗបន្ថែមពីទិន្នន័យដើមដែលមានស្រាប់ (ដូចជាការបង្វិលរូប ផ្លាស់ប្តូរពន្លឺ ឬពង្រីកបង្រួម) ដើម្បីជួយឱ្យម៉ូដែល AI រៀនបានកាន់តែច្រើន និងកាត់បន្ថយបញ្ហា Overfitting។	ដូចជាការឱ្យសិស្សហាត់ធ្វើលំហាត់ដដែលៗ ប៉ុន្តែគ្រូប្តូរតួលេខ និងរបៀបសួរ ដើម្បីឱ្យសិស្សចេះដោះស្រាយគ្រប់កាលៈទេសៈ មិនមែនគ្រាន់តែទន្ទេញចាំមាត់។
OneCycleLR	យុទ្ធសាស្ត្រក្នុងការកែតម្រូវល្បឿននៃការរៀនសូត្រ (Learning Rate) របស់ម៉ូដែល AI អំឡុងពេលហ្វឹកហាត់ ដោយចាប់ផ្តើមពីល្បឿនយឺត រួចបង្កើនដល់ចំណុចកំពូល និងបន្ថយមកវិញ ដើម្បីជួយឱ្យម៉ូដែលរៀនបានលឿន និងចៀសផុតពីការជាប់គាំង។	ដូចជាការធាក់កង់ប្រណាំងអញ្ចឹង ចាប់ផ្តើមធាក់មួយៗសិនដើម្បីសន្សំកម្លាំង រួចបញ្ចេញកម្លាំងធាក់ឱ្យលឿនបំផុតនៅកណ្តាលទី និងបន្ថយល្បឿនបន្តិចម្តងៗវិញពេលជិតដល់ទីដៅ។
Adaptive-Average Pool	ស្រទាប់នៅក្នុងបណ្ដាញសរសៃប្រសាទដែលបង្រួញទំហំផ្ទៃនៃទិន្នន័យរូបភាពឱ្យមកនៅទំហំថេរមួយដែលចង់បាន ដោយយកតម្លៃមធ្យមនៃតំបន់នីមួយៗ ដែលជួយកាត់បន្ថយប៉ារ៉ាម៉ែត្រមុននឹងបញ្ជូនទៅស្រទាប់ចុងក្រោយ។	ដូចជាការសង្ខេបសៀវភៅអត្ថបទដ៏វែងមួយឱ្យនៅសល់តែខ្លឹមសារសំខាន់ៗមួយទំព័រ ដើម្បីងាយស្រួលយល់ និងរហ័សក្នុងការអាន។
overfitting	បញ្ហាដែលម៉ូដែល AI រៀនទន្ទេញចាំតែទិន្នន័យហ្វឹកហាត់បានល្អឥតខ្ចោះ ប៉ុន្តែមិនអាចធ្វើការទស្សន៍ទាយបានត្រឹមត្រូវទេនៅពេលវាជួបប្រទះទិន្នន័យថ្មីៗដែលវាមិនធ្លាប់ឃើញពីមុនមកក្នុងពិភពពិត។	ដូចជាសិស្សដែលទន្ទេញវិញ្ញាសាប្រឡងចាស់ចាំយ៉ាងស្ទាត់ ប៉ុន្តែពេលប្រឡងពិតប្រាកដចេញខុសពីវិញ្ញាសាចាស់បន្តិច ក៏ធ្វើមិនចេះតែម្តង។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖