Original Title: Metaheuristic Optimization in Monkeypox Detection: A Comprehensive Literature Review
Source: doi.org/10.54216/MOR.050105
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការធ្វើឱ្យប្រសើរឡើងដោយប្រើក្បួន Metaheuristic ក្នុងការរកឃើញជំងឺអុតស្វា៖ ការពិនិត្យឡើងវិញលើអក្សរសិល្ប៍គ្រប់ជ្រុងជ្រោយ

ចំណងជើងដើម៖ Metaheuristic Optimization in Monkeypox Detection: A Comprehensive Literature Review

អ្នកនិពន្ធ៖ Mostafa Abotaleb (Engineering School of Digital Technologies, Yugra State University)

ឆ្នាំបោះពុម្ព៖ 2026 Metaheuristic Optimization Review (MOR)

វិស័យសិក្សា៖ Artificial Intelligence in Public Health

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហានៃការខ្វះខាតវិធីសាស្ត្ររកឃើញជំងឺអុតស្វា (Mpox) និងកង្វះទិន្នន័យ ដែលទាមទារឱ្យមានប្រព័ន្ធវិនិច្ឆ័យរហ័ស និងម៉ូដែលព្យាករណ៍ត្រឹមត្រូវសម្រាប់ការទប់ស្កាត់ការផ្ទុះឡើងជាសកល។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានធ្វើការសំយោគអក្សរសិល្ប៍ជាប្រព័ន្ធដោយផ្តោតលើវិស័យស្រាវជ្រាវធំៗចំនួនបីនៃបញ្ញាសិប្បនិម្មិត (AI) ដែលអនុវត្តលើជំងឺអុតស្វា។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Convolutional Neural Networks (CNNs) & Transfer Learning
បណ្ដាញសរសៃប្រសាទវិភាគរូបភាព (CNNs) និងការផ្ទេរចំណេះដឹង
ពូកែចាប់យកលក្ខណៈពិសេសនៃវាយនភាព (texture) នៃរូបភាព និងងាយស្រួលប្រើជាមួយទិន្នន័យតូចតាចតាមរយៈ Transfer Learning។ អាចបាត់បង់ទំនាក់ទំនងទំហំទីតាំង (spatial hierarchies) នៃកន្ទួល និងងាយរងការ Overfitting ប្រសិនបើទិន្នន័យមានចំនួនតិច។ ផ្តល់លទ្ធផលល្អសម្រាប់ការរកឃើញកន្ទួលអុតស្វាជាមូលដ្ឋាន តែត្រូវការក្បួនធ្វើឱ្យប្រសើរឡើង (Optimization) ដើម្បីបង្កើនភាពជាក់លាក់។
Transformer-based architectures & Hybrids (e.g., RS-FME-SwinT)
ស្ថាបត្យកម្មម៉ូដែល Transformer និងម៉ូដែលកូនកាត់
អាចចាប់យកទំនាក់ទំនងបរិបទជារួមនៃរូបភាព (global context) និងផ្តល់ភាពងាយស្រួលក្នុងការបកស្រាយតាមរយៈផែនទីចំណាប់អារម្មណ៍ (Attention maps)។ ទាមទារថាមពលកុំព្យូទ័រខ្ពស់ជាងក្នុងការគណនា និងត្រូវការទិន្នន័យច្រើនប្រសិនបើមិនប្រើបច្ចេកទេសកូនកាត់ជាមួយ CNN ទេ។ មានដំណើរការល្អជាង CNN តែឯងក្នុងការថ្លឹងថ្លែង Precision-Recall ជាពិសេសសម្រាប់ករណីកន្ទួលដែលមិនសូវច្បាស់លាស់។
Multimodal Fusion Networks
បណ្ដាញរួមបញ្ចូលទិន្នន័យចម្រុះ (រូបភាព និងរោគសញ្ញា)
អាចរួមបញ្ចូលរូបភាពកន្ទួលជាមួយរោគសញ្ញាគ្លីនិក និងប្រវត្តិអ្នកជំងឺ ធ្វើឱ្យការវិនិច្ឆ័យកាន់តែមានភាពរឹងមាំ ទោះបីរូបភាពមិនច្បាស់ក៏ដោយ។ មានភាពស្មុគស្មាញក្នុងការរៀបចំទិន្នន័យ និងត្រូវការការធ្វើសមកាលកម្មទិន្នន័យពីប្រភពផ្សេងៗគ្នា។ បង្កើនភាពជឿជាក់ និងភាពរឹងមាំនៃការធ្វើរោគវិនិច្ឆ័យនៅពេលដែលទិន្នន័យមួយផ្នែកមានភាពខ្វះចន្លោះ ឬមិនច្បាស់លាស់។
Capsule Networks (CAPSMON)
បណ្ដាញ Capsule សម្រាប់ការបែងចែកចំណាត់ថ្នាក់
រក្សាបាននូវទំនាក់ទំនងនៃទំហំ និងទីតាំងរបស់កន្ទួល ដែលជួយក្នុងការបែងចែកដំណាក់កាលនៃជំងឺបានល្អ និងធន់នឹងការផ្លាស់ប្តូរទីតាំងរូបភាព។ ការបង្ហាត់ម៉ូដែលត្រូវការពេលវេលា និងធនធានគណនាច្រើនជាង CNN ធម្មតា។ គាំទ្រការធ្វើចំណាត់ថ្នាក់រង (subclassification) លម្អិតសម្រាប់ទម្រង់កន្ទួលផ្សេងៗគ្នា និងដំណាក់កាលនៃជំងឺអុតស្វា។

ការចំណាយលើធនធាន (Resource Cost)៖ ឯកសារនេះបានសង្កត់ធ្ងន់លើបញ្ហាខ្វះខាតទិន្នន័យគុណភាពខ្ពស់ និងតម្រូវការក្នុងការបង្រួមទំហំម៉ូដែល (Model compression) ដើម្បីអាចប្រើប្រាស់លើឧបករណ៍ចល័តបានក្នុងតំបន់ខ្វះខាតធនធាន។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះបានគូសបញ្ជាក់ថា សំណុំទិន្នន័យរូបភាពអុតស្វាជាសាធារណៈនៅមានទំហំតូច និងខ្វះភាពចម្រុះ ដែលភាគច្រើនផ្តោតលើតំបន់មានការរាតត្បាតខ្លាំង (ដូចជាទ្វីបអាហ្វ្រិក)។ នេះជាចំណុចសំខាន់សម្រាប់ប្រទេសកម្ពុជា ព្រោះម៉ូដែលដែលបង្ហាត់លើស្បែក ឬទិន្នន័យប្រជាសាស្ត្របរទេស អាចនឹងមិនផ្តល់ភាពត្រឹមត្រូវខ្ពស់នៅពេលអនុវត្តលើពណ៌ស្បែក និងលក្ខណៈជីវសាស្ត្ររបស់ប្រជាជនអាស៊ីអាគ្នេយ៍ឡើយ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រវិភាគរូបភាពដោយប្រើ AI និងការព្យាករណ៍ការផ្ទុះឡើងនេះ ពិតជាមានសារៈសំខាន់ខ្លាំងសម្រាប់ប្រព័ន្ធសុខាភិបាលកម្ពុជា ជាពិសេសក្នុងការត្រៀមលក្ខណៈទប់ទល់នឹងជំងឺឆ្លងថ្មីៗ។

ការអភិវឌ្ឍប្រព័ន្ធទាំងនេះដោយយកចិត្តទុកដាក់លើបរិបទក្នុងស្រុក នឹងជួយពង្រឹងសមត្ថភាពឆ្លើយតបជំងឺឆ្លងរបស់កម្ពុជា ផ្លាស់ប្តូរពីការរង់ចាំដោះស្រាយ ទៅជាការការពារទុកជាមុនប្រកបដោយប្រសិទ្ធភាពខ្ពស់។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃ Computer Vision និង Deep Learning: និស្សិតគួរសិក្សាពីរបៀបដំណើរការរបស់បណ្ដាញ CNN និង Transformer តាមរយៈការសរសេរកូដដោយប្រើប្រាស់ PyTorchTensorFlow ដើម្បីយល់ច្បាស់ពីការទាញយកលក្ខណៈពិសេសពីរូបភាពវេជ្ជសាស្ត្រ (Feature Extraction)។
  2. អនុវត្តក្បួនធ្វើឱ្យប្រសើរឡើង (Metaheuristic Optimization): ស្រាវជ្រាវ និងអនុវត្តក្បួនដូចជា Particle Swarm Optimization (PSO)Genetic Algorithms ដើម្បីស្វែងរកប៉ារ៉ាម៉ែត្រល្អបំផុត (Hyperparameter tuning) ដែលជួយឱ្យម៉ូដែលដំណើរការលឿន និងច្បាស់លាស់។
  3. អនុវត្តបច្ចេកទេសរៀបចំ និងពង្រីកសំណុំទិន្នន័យ (Data Preprocessing & Augmentation): សិក្សាពីការបង្កើតទិន្នន័យរូបភាពបន្ថែមសិប្បនិម្មិតតាមរយៈ GANs និងសម្អាតរូបភាពដោយប្រើបច្ចេកទេសពង្រឹងកម្រិតពន្លឺ CLAHE នៅក្នុង OpenCV ដើម្បីដោះស្រាយបញ្ហាខ្វះទិន្នន័យ។
  4. អភិវឌ្ឍម៉ូដែលទម្ងន់ស្រាលសម្រាប់ការប្រើប្រាស់ចល័ត (Edge Computing): សាកល្បងបង្ហាត់ម៉ូដែលខ្នាតតូចដូចជា MobileNetEfficientNet រួចបំប្លែងវាទៅជា TensorFlow Lite ដើម្បីដាក់ឱ្យដំណើរការលើ Android Mobile Apps សម្រាប់មណ្ឌលសុខភាពជនបទ។
  5. បង្កើតប្រព័ន្ធវិភាគទិន្នន័យចម្រុះ (Multimodal System Integration): រៀនពីរបៀបរួមបញ្ចូលទិន្នន័យរូបភាព (Images) ជាមួយទិន្នន័យរោគសញ្ញាគ្លីនិក (Tabular data ដូចជា គ្រុនក្តៅ ការឈឺសាច់ដុំ) តាមរយៈការប្រើប្រាស់បច្ចេកទេស Late Fusion ដើម្បីបង្កើនភាពត្រឹមត្រូវខ្ពស់បំផុតក្នុងការកំណត់រោគវិនិច្ឆ័យ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Metaheuristic Optimization ក្បួនដោះស្រាយបញ្ហាគណិតវិទ្យាស្មុគស្មាញដែលយកលំនាំតាមធម្មជាតិ (ដូចជាការចល័តរបស់ហ្វូងសត្វ ឬការវិវត្តនៃហ្សែន) ដើម្បីស្វែងរកការកំណត់ (Parameters) ល្អបំផុតសម្រាប់ម៉ូដែល AI ឱ្យដំណើរការបានលឿននិងច្បាស់លាស់ ដោយមិនចាំបាច់សាកល្បងគ្រប់ជម្រើសទាំងអស់។ ដូចជាការបណ្តោយឱ្យហ្វូងស្រមោចរាវរកផ្លូវខ្លីបំផុតទៅរកចំណី ជាជាងការឱ្យមនុស្សដើររកគ្រប់ច្រកល្ហក។
Convolutional Neural Networks (CNNs) បណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតដែលរចនាឡើងយ៉ាងពិសេសសម្រាប់វិភាគរូបភាព ដោយបំបែករូបភាពជាចំណែកតូចៗដើម្បីទាញយកលក្ខណៈសម្គាល់ជម្រៅដូចជា គែម ទម្រង់ ឬវាយនភាពនៃកន្ទួលស្បែក ដើម្បីយកទៅធ្វើការវិនិច្ឆ័យ។ ដូចជាការប្រើកែវពង្រីកសម្លឹងមើលសាច់ក្រណាត់ម្ដងមួយក្រឡាៗ ដើម្បីរកមើលស្នាមប្រឡាក់ឬកំហុស។
Transfer Learning បច្ចេកទេសបង្រៀន AI ដោយយកម៉ូដែលដែលធ្លាប់បានបង្ហាត់ឱ្យស្គាល់រូបភាពទូទៅរាប់លានប្រភេទរួចហើយ មកបង្ហាត់បន្ថែមបន្តិចបន្តួចឱ្យស្គាល់តែជំងឺអុតស្វា ដើម្បីសន្សំពេលវេលា និងដោះស្រាយបញ្ហាខ្វះខាតទិន្នន័យវេជ្ជសាស្ត្រ។ ដូចជាអ្នកចេះជិះកង់ស្រាប់ យកជំនាញតុល្យភាពនោះទៅរៀនជិះម៉ូតូ ដែលវាលឿនជាងអ្នកដែលមិនចេះជិះអ្វីសោះ។
Long Short-Term Memory (LSTM) ប្រភេទម៉ូដែល AI ដែលមានសមត្ថភាពចងចាំព័ត៌មានពីអតីតកាលបានយូរ ដែលត្រូវបានប្រើសម្រាប់វិភាគទិន្នន័យដែលប្រែប្រួលតាមពេលវេលា ដូចជាការព្យាករណ៍ចំនួនអ្នកឆ្លងជំងឺនៅថ្ងៃស្អែក ឬការបំប្លែងខ្លួននៃសេនេទិច (ហ្សែន) វីរុស។ ដូចជាអ្នកសរសេរកំណត់ហេតុរាល់ថ្ងៃ ដែលអាចទស្សន៍ទាយថាអាកាសធាតុថ្ងៃស្អែកនឹងទៅជាយ៉ាងណា ដោយផ្អែកលើការកត់ត្រាពីខែមុនៗ។
Federated Learning បច្ចេកទេសបង្ហាត់ AI ដែលអនុញ្ញាតឱ្យមន្ទីរពេទ្យជាច្រើននៅជុំវិញពិភពលោកចូលរួមបង្ហាត់ម៉ូដែលរួមគ្នា ដោយរក្សាទុកទិន្នន័យអ្នកជំងឺឱ្យនៅតែក្នុងមន្ទីរពេទ្យរៀងៗខ្លួន (មិនបញ្ជូនចេញ) ដើម្បីការពារឯកជនភាព។ ដូចជាចុងភៅច្រើននាក់រៀនធ្វើម្ហូបតាមរូបមន្តតែមួយ រួចចែករំលែកតែគន្លឹះដែលខ្លួនរកឃើញ តែមិនចែករំលែកគ្រឿងផ្សំសម្ងាត់របស់ខ្លួនឱ្យអ្នកផ្សេងឡើយ។
Vision Transformers (ViTs) ស្ថាបត្យកម្ម AI ទំនើបដែលកាត់រូបភាពជាបំណែកៗ រួចប្រើប្រាស់យន្តការទាក់ទាញ (Attention mechanisms) ដើម្បីយល់ពីទំនាក់ទំនងនៃបំណែកនីមួយៗ ទោះបីជាវានៅឆ្ងាយពីគ្នាក្នុងរូបភាពក៏ដោយ ដែលជួយកំណត់រោគសញ្ញាបានត្រឹមត្រូវជាងមុន។ ដូចជាការផ្គុំរូបភាព Jigsaw puzzle ដោយអាចមើលឃើញរូបភាពរួមទាំងមូល ជាជាងការសម្លឹងមើលតែបំណែកមួយៗដាច់ដោយឡែកពីគ្នា។
Gradient-weighted Class Activation Mapping (Grad-CAM) បច្ចេកទេសបង្កើត "ផែនទីកម្តៅ" (Heatmap) លើរូបភាព ដើម្បីពន្យល់ពីការសម្រេចចិត្តរបស់ AI តាមរយៈការបង្ហាញឱ្យគ្រូពេទ្យដឹងថា តើ AI កំពុងផ្តោតការយកចិត្តទុកដាក់លើចំណុចណាមួយនៃស្បែកក្នុងការសន្និដ្ឋានថាវាជាជំងឺអុតស្វា។ ដូចជាគ្រូបង្រៀនគូសរង្វង់ពណ៌ក្រហមលើចម្លើយរបស់សិស្ស ដើម្បីបញ្ជាក់ថាពាក្យមួយណាដែលធ្វើឱ្យសិស្សបានពិន្ទុ។
Generative Adversarial Networks (GANs) ប្រព័ន្ធ AI ដែលមានម៉ូដែលពីរប្រកួតប្រជែងគ្នា មួយព្យាយាមបង្កើតរូបភាពកន្ទួលសិប្បនិម្មិតឱ្យដូចពិតៗ ហើយមួយទៀតព្យាយាមចាប់កំហុស ក្នុងគោលបំណងបង្កើតទិន្នន័យថ្មីៗបន្ថែមសម្រាប់យកទៅបង្ហាត់ AI ផ្សេងទៀត។ ដូចជាអ្នកហាត់គូររូបលុយក្លែងក្លាយម្នាក់ និងប៉ូលីសម្នាក់ដែលរៀនចាប់លុយក្លែងក្លាយ ពួកគេប្រកួតគ្នារហូតដល់អ្នកគូរអាចគូរបានដូចលុយពិតបេះបិទ។
Capsule Networks ប្រព័ន្ធបណ្តាញសរសៃប្រសាទកម្រិតខ្ពស់ ដែលរក្សាទុកព័ត៌មានអំពីទីតាំង ទិសដៅ និងទំហំនៃរចនាសម្ព័ន្ធរូបភាព ដែលជួយឱ្យវាវិភាគវត្ថុមានលក្ខណៈបីវិមាត្រ (3D) បានល្អ ទោះបីជារូបភាពនោះត្រូវបង្វិល ឬប្តូរទំហំក៏ដោយ។ ដូចជាការចំណាំផ្ទៃមុខមនុស្សម្នាក់ ដោយដឹងថាភ្នែកត្រូវតែនៅត្រង់ណាធៀបនឹងច្រមុះ ទោះបីជាអ្នកនោះងាកមុខទៅស្តាំ ឬឆ្វេងក៏នៅតែអាចស្គាល់បានដដែល។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖