Original Title: Automated Microbial Classification from Microscopy Images Using Convolutional Neural Networks
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការចាត់ថ្នាក់មេរោគដោយស្វ័យប្រវត្តិពីរូបភាពមីក្រូទស្សន៍ ដោយប្រើបណ្តាញសរសៃប្រសាទខនវ៉ូលូសិន (Convolutional Neural Networks)

ចំណងជើងដើម៖ Automated Microbial Classification from Microscopy Images Using Convolutional Neural Networks

អ្នកនិពន្ធ៖ Brian Halubanza (School of Engineering and Technology, Mulungushi University), Emmanuel Singoyi (School of Engineering and Technology, Mulungushi University)

ឆ្នាំបោះពុម្ព៖ 2025 (Seventh International Conference in Information and Communication Technologies, Lusaka, Zambia)

វិស័យសិក្សា៖ Computer Science / Health Informatics

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការកំណត់អត្តសញ្ញាណមេរោគតាមបែបប្រពៃណីនៅមានកម្រិត ដោយសារការពឹងផ្អែកខ្លាំងលើកម្លាំងពលកម្ម ត្រូវការពេលវេលាយូរ និងងាយមានកំហុសបច្ចេកទេស ដែលជាបញ្ហាប្រឈមសម្រាប់តំបន់ដែលមានធនធានកម្រ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានអភិវឌ្ឍប្រព័ន្ធស្វ័យប្រវត្តិកម្មដោយប្រើបច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិត (AI) តាមរយៈគំរូ Convolutional Neural Networks (CNN) ដើម្បីវិភាគរូបភាពមីក្រូទស្សន៍ និងចាត់ថ្នាក់ប្រភេទមេរោគ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
SVM (Support Vector Machine)
ម៉ាស៊ីនវ៉ិចទ័រគាំទ្រ (វិធីសាស្ត្រ Machine Learning បែបបុរាណ)
មានលក្ខណៈសាមញ្ញ និងងាយស្រួលក្នុងការអនុវត្តសម្រាប់ការចាត់ថ្នាក់ទិន្នន័យដែលមានលក្ខណៈសម្បត្តិមិនស្មុគស្មាញ។ ពឹងផ្អែកខ្លាំងលើការដកស្រង់លក្ខណៈសម្បត្តិដោយដៃ (Handcrafted features) និងមានប្រសិទ្ធភាពទាបលើទិន្នន័យរូបភាពស្មុគស្មាញ។ អត្រាភាពត្រឹមត្រូវ (Accuracy) ត្រឹមតែ ៧៨.៥%។
KNN (K-Nearest Neighbors)
វិធីសាស្ត្រ KNN (ចាត់ថ្នាក់ដោយផ្អែកលើទិន្នន័យដែលនៅជិតបំផុត)
ងាយស្រួលយល់ និងមិនត្រូវការការបណ្តុះបណ្តាលគំរូ (Training) យូរដូចបណ្តាញសរសៃប្រសាទ។ ដំណើរការយឺតពេលមានទិន្នន័យច្រើន និងមានភាពត្រឹមត្រូវទាបជាង Deep Learning ក្នុងការវិភាគរូបភាព។ អត្រាភាពត្រឹមត្រូវ (Accuracy) ៨២.២%។
VGG16 & ResNet50
គំរូ CNN ខ្នាតធំ (Deep Learning Models)
ផ្តល់នូវអត្រាភាពត្រឹមត្រូវខ្ពស់ក្នុងការចាត់ថ្នាក់រូបភាព ដោយសារមានស្រទាប់ (Layers) ច្រើនសម្រាប់ចាប់យកលក្ខណៈសម្បត្តិ។ ទាមទារធនធានកុំព្យូទ័រខ្ពស់ មានទំហំធំ (Size) និងដំណើរការយឺត (Inference time) ដែលមិនសមស្របសម្រាប់ទូរស័ព្ទ។ អត្រាភាពត្រឹមត្រូវ VGG16 (៩៣.២%) និង ResNet50 (៩៤.៨%)។
MobileNetV2 (Proposed Method)
គំរូ CNN សម្រាប់ឧបករណ៍ចល័ត (វិធីសាស្ត្រស្នើឡើង)
មានទំហំតូច (១៤ MB) ដំណើរការលឿន (៣៦ ms) និងមានប្រសិទ្ធភាពខ្ពស់សម្រាប់ការប្រើប្រាស់លើទូរស័ព្ទដៃ។ អាចត្រូវការការបណ្តុះបណ្តាលបន្ថែម (Fine-tuning) ប្រសិនបើប្រភេទមេរោគមានលក្ខណៈស្រដៀងគ្នាខ្លាំង។ អត្រាភាពត្រឹមត្រូវខ្ពស់បំផុត ៩៦.៣% និងផ្ទៃក្រោមខ្សែកោង (AUC) ០.៩៨។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តគម្រោងនេះទាមទារធនធានកម្រិតមធ្យមសម្រាប់ការបណ្តុះបណ្តាល ប៉ុន្តែមានតម្លៃទាបខ្លាំងនៅពេលដាក់ឱ្យប្រើប្រាស់ជាក់ស្តែង។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់រូបភាពចំនួន ៨,០០០ ពីឃ្លាំងទិន្នន័យសាធារណៈ និងសំណាកមន្ទីរពិសោធន៍ ប៉ុន្តែមិនបានបញ្ជាក់ច្បាស់ពីប្រភពភូមិសាស្ត្រនៃមេរោគនោះទេ។ សម្រាប់កម្ពុជា នេះជាចំណុចសំខាន់ព្រោះប្រភេទបាក់តេរី ឬផ្សិតនៅតំបន់ត្រូពិកអាចមានលក្ខណៈខុសប្លែកពីតំបន់អឺរ៉ុប ឬអាមេរិក ដូច្នេះការយកមកប្រើផ្ទាល់អាចមានកំហុសឆ្គងខ្លះ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកវិទ្យានេះមានសក្តានុពលខ្ពស់ណាស់សម្រាប់វិស័យសុខាភិបាលនៅកម្ពុជា ជាពិសេសនៅតាមតំបន់ជនបទ។

វាគឺជាដំណោះស្រាយដែលមានតម្លៃសមរម្យ និងអាចពង្រីកវិសាលភាពបាន (Scalable) ដើម្បីកាត់បន្ថយគម្លាតនៃសេវាវេជ្ជសាស្ត្ររវាងទីក្រុង និងជនបទ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ជំហានទី ១: សិក្សាមូលដ្ឋានគ្រឹះ Deep Learning: និស្សិតគួរចាប់ផ្តើមសិក្សាភាសា Python និងបណ្ណាល័យសំខាន់ៗដូចជា TensorFlow ឬ PyTorch ដោយផ្តោតលើការយល់ដឹងអំពី Convolutional Neural Networks (CNN)។
  2. ជំហានទី ២: ការប្រមូល និងរៀបចំទិន្នន័យក្នុងស្រុក: សហការជាមួយ វិទ្យាស្ថានប៉ាស្ទ័រកម្ពុជា (Institut Pasteur du Cambodge) ឬមន្ទីរពេទ្យនានា ដើម្បីប្រមូលរូបភាពមីក្រូទស្សន៍នៃមេរោគដែលកើតមានញឹកញាប់នៅកម្ពុជា និងធ្វើការសម្អាតទិន្នន័យ (Data Preprocessing)។
  3. ជំហានទី ៣: ការអនុវត្តគំរូ Transfer Learning: ប្រើប្រាស់គំរូ MobileNetV2 ដែលមានស្រាប់ (Pre-trained model) ហើយធ្វើការបណ្តុះបណ្តាលបន្ថែម (Fine-tuning) ជាមួយទិន្នន័យក្នុងស្រុក ដើម្បីសន្សំពេលនិងធនធាន។
  4. ជំហានទី ៤: ការអភិវឌ្ឍកម្មវិធីទូរស័ព្ទ (Mobile Deployment): ប្រើប្រាស់ TensorFlow Lite ដើម្បីបំប្លែងគំរូឱ្យដំណើរការលើទូរស័ព្ទ និងបង្កើតកម្មវិធី Android ដោយប្រើ Flutter ឬ Java ដើម្បីធ្វើតេស្តសាកល្បង។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Convolutional Neural Networks (CNNs) ជាប្រភេទនៃបច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិត (AI) ដែលមានជំនាញពិសេសក្នុងការវិភាគរូបភាព ដោយវាប្រើប្រាស់តម្រង (Filters) ដើម្បីស្កេន និងរៀនលំនាំ (Pattern) ដូចជា ខ្សែរាង ឬពណ៌ ដើម្បីសម្គាល់វត្ថុ។ ដូចជាក្មេងតូចរៀនស្គាល់សត្វឆ្មា ដោយមើលទៅលើត្រចៀក ឬកន្ទុយ មិនមែនដោយការវាស់ទំហំសត្វនោះទេ។
Transfer Learning ជាបច្ចេកទេសដែលយកចំណេះដឹងពីគំរូ AI ដែលបានរៀនរួចរាល់ពីទិន្នន័យធំៗ (ដូចជា ImageNet) មកអនុវត្តបន្តលើបញ្ហាថ្មីដែលមានទិន្នន័យតិចជាង ដើម្បីចំណេញពេល និងបង្កើនប្រសិទ្ធភាព។ ដូចជាអ្នកចេះបើកឡានដឹកទំនិញស្រាប់ រៀនបើកឡានតូច គឺងាយស្រួល និងលឿនជាងអ្នកមិនចេះបើកបរទាល់តែសោះ។
Data Augmentation ជាការបង្កើតទិន្នន័យបន្ថែមដោយការកែច្នៃរូបភាពដើម (ដូចជា បង្វិល ត្រឡប់ ឬប្តូរពន្លឺ) ដើម្បីឱ្យ AI រៀនបានច្រើនករណី និងកាត់បន្ថយការចងចាំទិន្នន័យដដែលៗ (Overfitting)។ ដូចជាការថតចម្លងរូបថតមួយសន្លឹក ប៉ុន្តែបង្វិលឆ្វេងស្តាំ ឬធ្វើឱ្យព្រាលបន្តិច ដើម្បីឱ្យកុំព្យូទ័ររៀនស្គាល់វត្ថុនោះ ទោះបីស្ថិតក្នុងស្ថានភាពខុសគ្នាក៏ដោយ។
MobileNetV2 ជាឈ្មោះនៃរចនាសម្ព័ន្ធបណ្តាញសរសៃប្រសាទ (Neural Network Architecture) ដែលត្រូវបានរចនាឡើងពិសេសឱ្យមានទំហំតូច និងដំណើរការលឿន សាកសមសម្រាប់ដាក់ក្នុងទូរស័ព្ទដៃ។ ដូចជាម៉ាស៊ីនឡានតូច (Eco car) ដែលស៊ីសាំងតិច និងរត់បានលឿនល្មម សាកសមសម្រាប់ការប្រើប្រាស់ប្រចាំថ្ងៃ។
Otsu’s Thresholding ជាវិធីសាស្ត្រគណិតវិទ្យាសម្រាប់បែងចែករូបភាពជាពីរផ្នែកសំខាន់ៗ គឺវត្ថុដែលយើងចង់មើល (មេរោគ) និងផ្ទៃខាងក្រោយ (Background) ដោយស្វ័យប្រវត្តិ ដើម្បីងាយស្រួលវិភាគ។ ដូចជាការកាត់រូបមនុស្សចេញពីទេសភាពខាងក្រោយ ដើម្បីយកតែរូបមនុស្សមកពិនិត្យ។
Histogram Equalization ជាបច្ចេកទេសកែរូបភាពឱ្យច្បាស់ ដោយការបែងចែកកម្រិតពន្លឺឱ្យស្មើគ្នា ធ្វើឱ្យឃើញលម្អិតនៃរូបភាពកាន់តែច្បាស់ ជាពិសេសនៅកន្លែងងងឹត ឬភ្លឺពេក។ ដូចជាការបន្ថែមពន្លឺទៅលើរូបថតដែលងងឹត ដើម្បីឱ្យយើងមើលឃើញរបស់នៅក្នុងនោះបានច្បាស់។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖