Original Title: Detection of Parkinson’s Disease using Machine Learning and Swarm Intelligence Algorithms: A Comprehensive Assessment
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការរកឃើញជំងឺផាកឃីនសាន់ (Parkinson’s Disease) ដោយប្រើប្រាស់ការរៀនដោយម៉ាស៊ីន និងក្បួនដោះស្រាយ Swarm Intelligence៖ ការវាយតម្លៃគ្រប់ជ្រុងជ្រោយ

ចំណងជើងដើម៖ Detection of Parkinson’s Disease using Machine Learning and Swarm Intelligence Algorithms: A Comprehensive Assessment

អ្នកនិពន្ធ៖ NEHA SINGH, SAPNA SINHA, LAXMAN SINGH

ឆ្នាំបោះពុម្ព៖ 2025 Degres Journal

វិស័យសិក្សា៖ Health Informatics / Machine Learning

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការធ្វើរោគវិនិច្ឆ័យជំងឺផាកឃីនសាន់ (Parkinson's Disease) តាមវិធីប្រពៃណីពឹងផ្អែកខ្លាំងលើការវាយតម្លៃរោគសញ្ញាគ្លីនិកដែលមានភាពយឺតយ៉ាវ និងមិនសូវមានសុក្រឹតភាព ដែលទាមទារឱ្យមានវិធីសាស្ត្រស្វ័យប្រវត្តិដើម្បីរកឃើញជំងឺនេះឱ្យបានលឿន និងច្បាស់លាស់។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានធ្វើការត្រួតពិនិត្យ និងវិភាគយ៉ាងលម្អិតលើអត្ថបទស្រាវជ្រាវចំនួន ៥០ (ពីឆ្នាំ ២០១៥ ដល់ ២០២៤) ដែលប្រើប្រាស់ក្បួនដោះស្រាយបញ្ញាសិប្បនិម្មិតផ្សេងៗដើម្បីរកឃើញជំងឺផាកឃីនសាន់។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Traditional ML & Neural Networks (NN)
ការប្រើប្រាស់ក្បួនដោះស្រាយ Machine Learning ប្រពៃណី និងបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត (NN)
ងាយស្រួលក្នុងការអនុវត្ត និងមានភាពច្បាស់លាស់ក្នុងការបកស្រាយលទ្ធផល (ឧទាហរណ៍៖ Decision Trees)។ មានកម្រិតភាពត្រឹមត្រូវទាបជាងម៉ូដែលកូនកាត់ និងជួបការលំបាកនៅពេលវិភាគលើទិន្នន័យដែលមានភាពស្មុគស្មាញខ្ពស់។ ទទួលបានភាពត្រឹមត្រូវក្នុងកម្រិតមធ្យម ប៉ុន្តែតែងតែត្រូវបានយកឈ្នះដោយវិធីសាស្ត្រដែលប្រើការបង្កើនប្រសិទ្ធភាព (Optimization)។
Swarm Intelligence (SI) Optimization
ក្បួនដោះស្រាយបង្កើនប្រសិទ្ធភាព Swarm Intelligence (ឧ. PSO, GWO)
មានប្រសិទ្ធភាពខ្ពស់បំផុតក្នុងការជ្រើសរើសលក្ខណៈពិសេស (Feature Selection) និងបង្កើនល្បឿនស្វែងរកក្នុងសំណុំទិន្នន័យធំៗ។ ជាទូទៅមិនអាចប្រើជាឧបករណ៍ចំណាត់ថ្នាក់ (Classifier) ឯករាជ្យបានទេ គឺតម្រូវឱ្យប្រើរួមផ្សំជាមួយ ML ឬ DL។ ជួយកែលម្អ និងបង្កើនភាពត្រឹមត្រូវនៃម៉ូដែល Machine Learning បានយ៉ាងប្រសើរនៅពេលប្រើសម្រាប់ទាញយកលក្ខណៈទិន្នន័យ។
Hybrid Models (ML/DL + SI)
ម៉ូដែលកូនកាត់ដែលរួមបញ្ចូល ML/DL និង Swarm Intelligence
ទាញយកចំណុចខ្លាំងនៃការធ្វើចំណាត់ថ្នាក់របស់ DL និងការជ្រើសរើសទិន្នន័យរបស់ SI ដែលផ្តល់នូវភាពត្រឹមត្រូវខ្ពស់បំផុត និងមានភាពរឹងមាំ។ ទាមទារកម្លាំងម៉ាស៊ីនគណនាខ្ពស់ និងខ្វះសមត្ថភាពក្នុងការបកស្រាយដំណើរការនៃការសម្រេចចិត្ត (បញ្ហា Black Box)។ ទទួលបានភាពត្រឹមត្រូវខ្ពស់បំផុតរហូតដល់ ៩៩.៤% ជាពិសេសលើទិន្នន័យសំឡេង (Voice/Speech)។

ការចំណាយលើធនធាន (Resource Cost)៖ បើទោះបីជាការហ្វឹកហាត់ម៉ូដែល Deep Learning ទាមទារកម្លាំងម៉ាស៊ីនកម្រិតខ្ពស់ ប៉ុន្តែការអនុវត្តក្បួនដោះស្រាយ Swarm Intelligence និង ML សម្រាប់ការធ្វើរោគវិនិច្ឆ័យនេះអាចប្រើប្រាស់ឧបករណ៍ដែលមានតម្លៃទាប និងមិនមានការឈឺចាប់ដល់អ្នកជំងឺឡើយ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សាភាគច្រើនប្រើប្រាស់សំណុំទិន្នន័យតូចៗ និងស្ថិតក្នុងការគ្រប់គ្រងកម្រិតខ្ពស់ ដែលមិនមានស្តង់ដាររួម ហើយភាគច្រើនប្រមូលពីបរិបទលោកខាងលិច (Western contexts)។ សម្រាប់ប្រទេសកម្ពុជា ការប្រើប្រាស់ម៉ូដែលដែលហ្វឹកហាត់លើទិន្នន័យសំឡេងនិយាយភាសាបរទេស អាចនឹងមិនមានភាពត្រឹមត្រូវនៅពេលអនុវត្តលើអ្នកជំងឺដែលនិយាយភាសាខ្មែរឡើយ ដោយសារលក្ខណៈសូរសព្ទខុសគ្នា ដែលទាមទារឱ្យមានការប្រមូលទិន្នន័យក្នុងស្រុក។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រធ្វើរោគវិនិច្ឆ័យដោយមិនប្រើការវះកាត់ ឬម៉ាស៊ីនស្កែនថ្លៃៗនេះ គឺមានសក្ដានុពលខ្លាំងក្នុងការអនុវត្តសម្រាប់ប្រព័ន្ធសុខាភិបាលក្នុងប្រទេសកម្ពុជា។

ការបំពាក់នូវបច្ចេកវិទ្យាទាំងនេះនឹងជួយធ្វើឱ្យការពិនិត្យរកជំងឺផាកឃីនសាន់មានភាពទូលំទូលាយ ចំណាយតិច និងកាត់បន្ថយការពឹងផ្អែកទាំងស្រុងលើម៉ាស៊ីនស្កែនខួរក្បាល (MRI/PET scans) ដែលមានតម្លៃថ្លៃក្នុងប្រទេសកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃការរៀនដោយម៉ាស៊ីន (ML/DL Basics): ចាប់ផ្តើមដោយការរៀនភាសា Python និងបណ្ណាល័យសំខាន់ៗដូចជា Scikit-Learn, TensorFlow, ឬ PyTorch ដើម្បីយល់ពីរបៀបដំណើរការបណ្ដាញសរសៃប្រសាទ (Neural Networks)។
  2. ស្វែងយល់ពីក្បួនដោះស្រាយ Swarm Intelligence: សិក្សាពីក្បួនដោះស្រាយដូចជា Particle Swarm Optimization (PSO) និង Grey Wolf Optimizer (GWO) សម្រាប់ការជ្រើសរើសទិន្នន័យ (Feature Selection) ដោយសាកល្បងប្រើប្រាស់បណ្ណាល័យ mealpyniapy ក្នុង Python។
  3. ប្រមូល និងរៀបចំសំណុំទិន្នន័យអនុវត្ត (Data Collection): ទាញយកទិន្នន័យបើកទូលាយ (Open-source) ពី UCI Machine Learning Repository (Parkinson's Data Set) ដើម្បីយកមកហ្វឹកហាត់ ឬសហការជាមួយមន្ទីរពេទ្យក្នុងស្រុកដើម្បីប្រមូលគំរូសំឡេងអ្នកជំងឺជាភាសាខ្មែរ។
  4. អភិវឌ្ឍម៉ូដែលកូនកាត់ (Build Hybrid Models): សាកល្បងសរសេរកូដរួមបញ្ចូលគ្នារវាងក្បួន Deep Learning (CNNs) ជាមួយនឹង Swarm Intelligence ដើម្បីទាញយកលក្ខណៈពិសេសសំខាន់ៗពីទិន្នន័យសំឡេង (Speech data) និងប្រៀបធៀបភាពត្រឹមត្រូវ។
  5. អនុវត្តបច្ចេកទេសបកស្រាយម៉ូដែល (Explainable AI - XAI): ដោយសារ DL ជា Black-box អ្នកត្រូវប្រើប្រាស់ឧបករណ៍ដូចជា SHAP (SHapley Additive exPlanations)LIME ដើម្បីពន្យល់ពីមូលហេតុដែលម៉ូដែលសម្រេចចិត្តទស្សន៍ទាយបែបនេះ ដែលជួយឱ្យគ្រូពេទ្យមានទំនុកចិត្តក្នុងការប្រើប្រាស់លទ្ធផល។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Swarm Intelligence គឺជាក្បួនដោះស្រាយបញ្ញាសិប្បនិម្មិតដែលយកគំរូតាមអាកប្បកិរិយាជាហ្វូងរបស់សត្វ (ដូចជាហ្វូងបក្សី ឬហ្វូងស្រមោច) ដើម្បីដោះស្រាយបញ្ហាស្មុគស្មាញ និងស្វែងរកចម្លើយដ៏ល្អបំផុត (Optimization) ក្នុងការជ្រើសរើសទិន្នន័យ។ ដូចជាការសហការគ្នារបស់ហ្វូងស្រមោចក្នុងការស្វែងរកផ្លូវខ្លីបំផុតទៅកាន់ចំណី ដោយផ្ដល់ព័ត៌មានអោយគ្នាទៅវិញទៅមក។
Feature Selection គឺជាដំណើរការនៃការជ្រើសរើសយកតែទិន្នន័យឬលក្ខណៈសម្បត្តិណាដែលសំខាន់បំផុត និងពាក់ព័ន្ធបំផុតពីសំណុំទិន្នន័យធំៗ ដើម្បីយកទៅបង្រៀនម៉ូដែល Machine Learning ឱ្យដើរលឿន និងមានភាពត្រឹមត្រូវខ្ពស់ក្នុងការទស្សន៍ទាយ។ ដូចជាការរើសយកតែសៀវភៅណាដែលត្រូវនឹងមុខវិជ្ជាប្រឡងចេញពីបណ្ណាល័យដ៏ធំមួយ ដើម្បីអានយកពិន្ទុឱ្យបានលឿននិងល្អ។
Hybrid Models គឺជាការរួមបញ្ចូលគ្នានូវក្បួនដោះស្រាយពីរ ឬច្រើនបញ្ចូលគ្នា (ឧទាហរណ៍ ការរួមបញ្ចូល Deep Learning ជាមួយក្បួន Swarm Intelligence) ដើម្បីទាញយកចំណុចខ្លាំងនៃក្បួននីមួយៗ និងកាត់បន្ថយចំណុចខ្សោយសម្រាប់ការវិភាគទិន្នន័យ។ ដូចជាការបង្កើតរថយន្តកូនកាត់ (Hybrid) ដែលប្រើទាំងសាំង និងអគ្គិសនី ដើម្បីសន្សំសំចៃផង និងមានកម្លាំងខ្លាំងផង។
Multimodal Data សំដៅលើការប្រមូលផ្ដុំទិន្នន័យច្រើនទម្រង់ខុសៗគ្នា (ដូចជា សំឡេង ការដើរ និងការសរសេរដោយដៃ) ដើម្បីយកមកវិភាគរួមគ្នា ជួយឱ្យការធ្វើរោគវិនិច្ឆ័យមានភាពច្បាស់លាស់ និងគ្រប់ជ្រុងជ្រោយជាងការប្រើទិន្នន័យតែមួយមុខ។ ដូចជាការវាយតម្លៃសិស្សម្នាក់ដោយមើលទាំងពិន្ទុប្រឡង អត្តចរិត និងការចូលរួមក្នុងថ្នាក់ ជាជាងមើលតែពិន្ទុប្រឡងតែមួយមុខ។
Neurodegenerative Disorder គឺជាប្រភេទជំងឺដែលកើតឡើងដោយសារការខូចខាត ឬការងាប់បន្តិចម្ដងៗនៃកោសិកាសរសៃប្រសាទក្នុងខួរក្បាល ដែលបណ្ដាលឱ្យបាត់បង់មុខងារចលនា ឬការចងចាំ ដូចជាជំងឺផាកឃីនសាន់ (Parkinson's Disease) ជាដើម។ ដូចជាខ្សែភ្លើងចាស់ដែលរេចរឹលបន្តិចម្ដងៗ ធ្វើឱ្យចរន្តអគ្គិសនីដើរមិនស្រួល និងធ្វើឱ្យម៉ាស៊ីនដំណើរការខុសប្រក្រតី។
Overfitting ជាបញ្ហាក្នុងការរៀនដោយម៉ាស៊ីន (Machine Learning) នៅពេលដែលម៉ូដែលរៀនទន្ទេញចាំទិន្នន័យហ្វឹកហាត់បានល្អឥតខ្ចោះពេក ប៉ុន្តែបែរជាមិនអាចធ្វើការទស្សន៍ទាយបានត្រឹមត្រូវនៅពេលជួបប្រទះទិន្នន័យថ្មីដែលវាមិនធ្លាប់ឃើញ។ ដូចជាសិស្សដែលទន្ទេញចាំលំហាត់ក្នុងសៀវភៅបានល្អ តែប្រឡងធ្លាក់នៅពេលគ្រូចេញលំហាត់ថ្មីដែលគ្រាន់តែប្ដូរលេខ។
Support Vector Machines (SVM) គឺជាក្បួនដោះស្រាយ Machine Learning ដ៏មានប្រជាប្រិយភាពមួយដែលប្រើសម្រាប់ចាត់ថ្នាក់ទិន្នន័យ (Classification) ដោយស្វែងរកបន្ទាត់ ឬប្លង់ដ៏ល្អបំផុតដែលអាចខណ្ឌចែកក្រុមទិន្នន័យខុសៗគ្នាឱ្យនៅដាច់ពីគ្នាបានច្បាស់លាស់។ ដូចជាការគូសបន្ទាត់ព្រំដែនដ៏ល្អបំផុតនៅចំកណ្ដាលដើម្បីបំបែកសិស្សពាក់អាវស និងសិស្សពាក់អាវខៀវឱ្យនៅម្ខាងម្នាក់ដោយមិនឱ្យលាយឡំគ្នា។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖