Original Title: Automated Microbial Classification from Microscopy Images Using Convolutional Neural Networks
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការចាត់ថ្នាក់មេរោគដោយស្វ័យប្រវត្តិពីរូបភាពមីក្រូទស្សន៍ ដោយប្រើបណ្តាញសរសៃប្រសាទខនវ៉ូលូសិន (Convolutional Neural Networks)

ចំណងជើងដើម៖ Automated Microbial Classification from Microscopy Images Using Convolutional Neural Networks

អ្នកនិពន្ធ៖ Brian Halubanza (School of Engineering and Technology, Mulungushi University), Emmanuel Singoyi (School of Engineering and Technology, Mulungushi University)

ឆ្នាំបោះពុម្ព៖ 2025 (Seventh International Conference in Information and Communication Technologies, Lusaka, Zambia)

វិស័យសិក្សា៖ Computer Science / Health Informatics

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការកំណត់អត្តសញ្ញាណមេរោគតាមបែបប្រពៃណីនៅមានកម្រិត ដោយសារការពឹងផ្អែកខ្លាំងលើកម្លាំងពលកម្ម ត្រូវការពេលវេលាយូរ និងងាយមានកំហុសបច្ចេកទេស ដែលជាបញ្ហាប្រឈមសម្រាប់តំបន់ដែលមានធនធានកម្រ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានអភិវឌ្ឍប្រព័ន្ធស្វ័យប្រវត្តិកម្មដោយប្រើបច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិត (AI) តាមរយៈគំរូ Convolutional Neural Networks (CNN) ដើម្បីវិភាគរូបភាពមីក្រូទស្សន៍ និងចាត់ថ្នាក់ប្រភេទមេរោគ។

ការប្រមូល និងកែច្នៃទិន្នន័យរូបភាព (Data Collection & Preprocessing)៖ ប្រើប្រាស់រូបភាពមីក្រូទស្សន៍ចំនួន ៨,០០០ និងអនុវត្តបច្ចេកទេសកាត់បន្ថយភាពមិនច្បាស់ (Gaussian filters) និងការបង្កើនកម្រិតពណ៌ (Histogram equalization)។
ការបណ្តុះបណ្តាលគំរូ (Model Training with Transfer Learning)៖ ការប្រើប្រាស់គំរូ MobileNetV2 ដែលមានស្រាប់ ដើម្បីបណ្តុះបណ្តាលលើទិន្នន័យថ្មីសម្រាប់ការចាត់ថ្នាក់។
ការអភិវឌ្ឍកម្មវិធីទូរស័ព្ទ (Mobile Application Development)៖ ការបង្កើតចំណុចប្រទាក់អ្នកប្រើប្រាស់ដោយប្រើ Flask និង TensorFlow Lite សម្រាប់ការប្រើប្រាស់ជាក់ស្តែង។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

គំរូ MobileNetV2 ទទួលបានអត្រាភាពត្រឹមត្រូវ (Accuracy) ខ្ពស់បំផុតគឺ ៩៦.៣% ជាមួយនឹងកម្រិត Precision ០.៩៦។
ប្រព័ន្ធនេះមានសមត្ថភាពខ្ពស់ជាងវិធីសាស្ត្រ Machine Learning បែបបុរាណដូចជា SVM និង KNN ប្រហែល ២០%។
ការធ្វើតេស្តបានបង្ហាញថា ប្រព័ន្ធនេះអាចដំណើរការយ៉ាងមានប្រសិទ្ធភាពនៅលើឧបករណ៍ចល័ត (Mobile Devices) ដែលជួយសម្រួលដល់ការធ្វើរោគវិនិច្ឆ័យនៅតាមតំបន់ដាច់ស្រយាល។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
SVM (Support Vector Machine) ម៉ាស៊ីនវ៉ិចទ័រគាំទ្រ (វិធីសាស្ត្រ Machine Learning បែបបុរាណ)	មានលក្ខណៈសាមញ្ញ និងងាយស្រួលក្នុងការអនុវត្តសម្រាប់ការចាត់ថ្នាក់ទិន្នន័យដែលមានលក្ខណៈសម្បត្តិមិនស្មុគស្មាញ។	ពឹងផ្អែកខ្លាំងលើការដកស្រង់លក្ខណៈសម្បត្តិដោយដៃ (Handcrafted features) និងមានប្រសិទ្ធភាពទាបលើទិន្នន័យរូបភាពស្មុគស្មាញ។	អត្រាភាពត្រឹមត្រូវ (Accuracy) ត្រឹមតែ ៧៨.៥%។
KNN (K-Nearest Neighbors) វិធីសាស្ត្រ KNN (ចាត់ថ្នាក់ដោយផ្អែកលើទិន្នន័យដែលនៅជិតបំផុត)	ងាយស្រួលយល់ និងមិនត្រូវការការបណ្តុះបណ្តាលគំរូ (Training) យូរដូចបណ្តាញសរសៃប្រសាទ។	ដំណើរការយឺតពេលមានទិន្នន័យច្រើន និងមានភាពត្រឹមត្រូវទាបជាង Deep Learning ក្នុងការវិភាគរូបភាព។	អត្រាភាពត្រឹមត្រូវ (Accuracy) ៨២.២%។
VGG16 & ResNet50 គំរូ CNN ខ្នាតធំ (Deep Learning Models)	ផ្តល់នូវអត្រាភាពត្រឹមត្រូវខ្ពស់ក្នុងការចាត់ថ្នាក់រូបភាព ដោយសារមានស្រទាប់ (Layers) ច្រើនសម្រាប់ចាប់យកលក្ខណៈសម្បត្តិ។	ទាមទារធនធានកុំព្យូទ័រខ្ពស់ មានទំហំធំ (Size) និងដំណើរការយឺត (Inference time) ដែលមិនសមស្របសម្រាប់ទូរស័ព្ទ។	អត្រាភាពត្រឹមត្រូវ VGG16 (៩៣.២%) និង ResNet50 (៩៤.៨%)។
MobileNetV2 (Proposed Method) គំរូ CNN សម្រាប់ឧបករណ៍ចល័ត (វិធីសាស្ត្រស្នើឡើង)	មានទំហំតូច (១៤ MB) ដំណើរការលឿន (៣៦ ms) និងមានប្រសិទ្ធភាពខ្ពស់សម្រាប់ការប្រើប្រាស់លើទូរស័ព្ទដៃ។	អាចត្រូវការការបណ្តុះបណ្តាលបន្ថែម (Fine-tuning) ប្រសិនបើប្រភេទមេរោគមានលក្ខណៈស្រដៀងគ្នាខ្លាំង។	អត្រាភាពត្រឹមត្រូវខ្ពស់បំផុត ៩៦.៣% និងផ្ទៃក្រោមខ្សែកោង (AUC) ០.៩៨។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តគម្រោងនេះទាមទារធនធានកម្រិតមធ្យមសម្រាប់ការបណ្តុះបណ្តាល ប៉ុន្តែមានតម្លៃទាបខ្លាំងនៅពេលដាក់ឱ្យប្រើប្រាស់ជាក់ស្តែង។

Hardware (Training): ត្រូវការកុំព្យូទ័រដែលមានអង្គដំណើរការក្រាហ្វិក (GPU) សម្រាប់បណ្តុះបណ្តាលគំរូ Deep Learning ឱ្យបានលឿន។
Hardware (Deployment): ស្មាតហ្វូនធម្មតា (Android/iOS) អាចដំណើរការកម្មវិធីនេះបាន ដោយសារគំរូ MobileNetV2 មានទំហំតូច។
Software & Libraries: ប្រើប្រាស់ភាសា Python, បណ្ណាល័យ TensorFlow/Keras, និង Flask សម្រាប់បង្កើត API ឬភ្ជាប់ជាមួយ Mobile App។
Dataset: ត្រូវការរូបភាពមីក្រូទស្សន៍ដែលមានគុណភាព និងការដាក់ស្លាក (Labeling) ត្រឹមត្រូវពីអ្នកជំនាញ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់រូបភាពចំនួន ៨,០០០ ពីឃ្លាំងទិន្នន័យសាធារណៈ និងសំណាកមន្ទីរពិសោធន៍ ប៉ុន្តែមិនបានបញ្ជាក់ច្បាស់ពីប្រភពភូមិសាស្ត្រនៃមេរោគនោះទេ។ សម្រាប់កម្ពុជា នេះជាចំណុចសំខាន់ព្រោះប្រភេទបាក់តេរី ឬផ្សិតនៅតំបន់ត្រូពិកអាចមានលក្ខណៈខុសប្លែកពីតំបន់អឺរ៉ុប ឬអាមេរិក ដូច្នេះការយកមកប្រើផ្ទាល់អាចមានកំហុសឆ្គងខ្លះ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកវិទ្យានេះមានសក្តានុពលខ្ពស់ណាស់សម្រាប់វិស័យសុខាភិបាលនៅកម្ពុជា ជាពិសេសនៅតាមតំបន់ជនបទ។

មណ្ឌលសុខភាពដាច់ស្រយាល (Rural Health Centers): ជួយដល់គ្រូពេទ្យនៅតាមខេត្តដូចជា រតនគិរី ឬ មណ្ឌលគិរី ដែលខ្វះខាតអ្នកជំនាញមីក្រូជីវសាស្ត្រក្នុងការធ្វើរោគវិនិច្ឆ័យបឋម។
ការសិក្សាស្រាវជ្រាវកសិកម្ម (Agricultural Research): អាចកែច្នៃសម្រាប់កសិករ ឬមន្ទីរកសិកម្មនៅ បាត់ដំបង ដើម្បីពិនិត្យជំងឺផ្សិតលើដំណាំតាមរយៈរូបភាពស្លឹក ឬឫស (ដូចដែលបានលើកឡើងក្នុងផ្នែក Related Work នៃអត្ថបទ)។
វិទ្យាស្ថានបណ្តុះបណ្តាលវេជ្ជសាស្ត្រ (Medical Education): ប្រើប្រាស់នៅសាកលវិទ្យាល័យវិទ្យាសាស្ត្រសុខាភិបាល (UHS) ដើម្បីជួយនិស្សិតក្នុងការផ្ទៀងផ្ទាត់លទ្ធផលពិនិត្យមីក្រូទស្សន៍របស់ពួកគេ។

វាគឺជាដំណោះស្រាយដែលមានតម្លៃសមរម្យ និងអាចពង្រីកវិសាលភាពបាន (Scalable) ដើម្បីកាត់បន្ថយគម្លាតនៃសេវាវេជ្ជសាស្ត្ររវាងទីក្រុង និងជនបទ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

ជំហានទី ១: សិក្សាមូលដ្ឋានគ្រឹះ Deep Learning: និស្សិតគួរចាប់ផ្តើមសិក្សាភាសា Python និងបណ្ណាល័យសំខាន់ៗដូចជា TensorFlow ឬ PyTorch ដោយផ្តោតលើការយល់ដឹងអំពី Convolutional Neural Networks (CNN)។
ជំហានទី ២: ការប្រមូល និងរៀបចំទិន្នន័យក្នុងស្រុក: សហការជាមួយ វិទ្យាស្ថានប៉ាស្ទ័រកម្ពុជា (Institut Pasteur du Cambodge) ឬមន្ទីរពេទ្យនានា ដើម្បីប្រមូលរូបភាពមីក្រូទស្សន៍នៃមេរោគដែលកើតមានញឹកញាប់នៅកម្ពុជា និងធ្វើការសម្អាតទិន្នន័យ (Data Preprocessing)។
ជំហានទី ៣: ការអនុវត្តគំរូ Transfer Learning: ប្រើប្រាស់គំរូ MobileNetV2 ដែលមានស្រាប់ (Pre-trained model) ហើយធ្វើការបណ្តុះបណ្តាលបន្ថែម (Fine-tuning) ជាមួយទិន្នន័យក្នុងស្រុក ដើម្បីសន្សំពេលនិងធនធាន។
ជំហានទី ៤: ការអភិវឌ្ឍកម្មវិធីទូរស័ព្ទ (Mobile Deployment): ប្រើប្រាស់ TensorFlow Lite ដើម្បីបំប្លែងគំរូឱ្យដំណើរការលើទូរស័ព្ទ និងបង្កើតកម្មវិធី Android ដោយប្រើ Flutter ឬ Java ដើម្បីធ្វើតេស្តសាកល្បង។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Convolutional Neural Networks (CNNs)	ជាប្រភេទនៃបច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិត (AI) ដែលមានជំនាញពិសេសក្នុងការវិភាគរូបភាព ដោយវាប្រើប្រាស់តម្រង (Filters) ដើម្បីស្កេន និងរៀនលំនាំ (Pattern) ដូចជា ខ្សែរាង ឬពណ៌ ដើម្បីសម្គាល់វត្ថុ។	ដូចជាក្មេងតូចរៀនស្គាល់សត្វឆ្មា ដោយមើលទៅលើត្រចៀក ឬកន្ទុយ មិនមែនដោយការវាស់ទំហំសត្វនោះទេ។
Transfer Learning	ជាបច្ចេកទេសដែលយកចំណេះដឹងពីគំរូ AI ដែលបានរៀនរួចរាល់ពីទិន្នន័យធំៗ (ដូចជា ImageNet) មកអនុវត្តបន្តលើបញ្ហាថ្មីដែលមានទិន្នន័យតិចជាង ដើម្បីចំណេញពេល និងបង្កើនប្រសិទ្ធភាព។	ដូចជាអ្នកចេះបើកឡានដឹកទំនិញស្រាប់ រៀនបើកឡានតូច គឺងាយស្រួល និងលឿនជាងអ្នកមិនចេះបើកបរទាល់តែសោះ។
Data Augmentation	ជាការបង្កើតទិន្នន័យបន្ថែមដោយការកែច្នៃរូបភាពដើម (ដូចជា បង្វិល ត្រឡប់ ឬប្តូរពន្លឺ) ដើម្បីឱ្យ AI រៀនបានច្រើនករណី និងកាត់បន្ថយការចងចាំទិន្នន័យដដែលៗ (Overfitting)។	ដូចជាការថតចម្លងរូបថតមួយសន្លឹក ប៉ុន្តែបង្វិលឆ្វេងស្តាំ ឬធ្វើឱ្យព្រាលបន្តិច ដើម្បីឱ្យកុំព្យូទ័ររៀនស្គាល់វត្ថុនោះ ទោះបីស្ថិតក្នុងស្ថានភាពខុសគ្នាក៏ដោយ។
MobileNetV2	ជាឈ្មោះនៃរចនាសម្ព័ន្ធបណ្តាញសរសៃប្រសាទ (Neural Network Architecture) ដែលត្រូវបានរចនាឡើងពិសេសឱ្យមានទំហំតូច និងដំណើរការលឿន សាកសមសម្រាប់ដាក់ក្នុងទូរស័ព្ទដៃ។	ដូចជាម៉ាស៊ីនឡានតូច (Eco car) ដែលស៊ីសាំងតិច និងរត់បានលឿនល្មម សាកសមសម្រាប់ការប្រើប្រាស់ប្រចាំថ្ងៃ។
Otsu’s Thresholding	ជាវិធីសាស្ត្រគណិតវិទ្យាសម្រាប់បែងចែករូបភាពជាពីរផ្នែកសំខាន់ៗ គឺវត្ថុដែលយើងចង់មើល (មេរោគ) និងផ្ទៃខាងក្រោយ (Background) ដោយស្វ័យប្រវត្តិ ដើម្បីងាយស្រួលវិភាគ។	ដូចជាការកាត់រូបមនុស្សចេញពីទេសភាពខាងក្រោយ ដើម្បីយកតែរូបមនុស្សមកពិនិត្យ។
Histogram Equalization	ជាបច្ចេកទេសកែរូបភាពឱ្យច្បាស់ ដោយការបែងចែកកម្រិតពន្លឺឱ្យស្មើគ្នា ធ្វើឱ្យឃើញលម្អិតនៃរូបភាពកាន់តែច្បាស់ ជាពិសេសនៅកន្លែងងងឹត ឬភ្លឺពេក។	ដូចជាការបន្ថែមពន្លឺទៅលើរូបថតដែលងងឹត ដើម្បីឱ្យយើងមើលឃើញរបស់នៅក្នុងនោះបានច្បាស់។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖