Original Title: Study of Neurodegenerative Disease Progression and Early Detection using Deep Learning Algorithms
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការសិក្សាអំពីការវិវត្តនៃជំងឺប្រព័ន្ធប្រសាទ និងការរកឃើញដំបូងដោយប្រើក្បួនដោះស្រាយការរៀនស៊ីជម្រៅ (Deep Learning Algorithms)

ចំណងជើងដើម៖ Study of Neurodegenerative Disease Progression and Early Detection using Deep Learning Algorithms

អ្នកនិពន្ធ៖ Sabyasachi Chakraborty (Department of Computer Engineering, Inje University)

ឆ្នាំបោះពុម្ព៖ 2020

វិស័យសិក្សា៖ Computer Engineering / Medical Imaging

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការរកឃើញដំបូងនៃជំងឺប្រព័ន្ធប្រសាទ (Neurodegenerative Diseases) ដូចជាជំងឺផាកឃីនសុន និងអាល់ហ្សៃមេ មានសារៈសំខាន់ណាស់ ប៉ុន្តែការវិភាគដោយភ្នែកលើរូបភាព MRI មានការលំបាកក្នុងការរកឃើញការផ្លាស់ប្តូរតូចតាចនៅដំណាក់កាលដំបូង។ ការសិក្សានេះដោះស្រាយបញ្ហានៃកំហុសក្នុងការធ្វើរោគវិនិច្ឆ័យ និងតម្រូវការសម្រាប់ប្រព័ន្ធស្វ័យប្រវត្តិដែលមានភាពជាក់លាក់ខ្ពស់។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានអភិវឌ្ឍប្រព័ន្ធជំនួយដោយកុំព្យូទ័រ (Computer-Aided Detection) ដោយប្រើប្រាស់ការវិភាគវាយនភាពជាមួយនឹងបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (ANN) និងបណ្តាញសរសៃប្រសាទ 3D CNN ដើម្បីវិភាគរូបភាព MRI ។

ការប្រមូលទិន្នន័យរូបភាព MRI ពីមូលដ្ឋានទិន្នន័យ PPMI និង ADNI (MRI Dataset Collection)
ការបែងចែកតំបន់នៃចំណាប់អារម្មណ៍ផ្អែកលើ Atlas (Atlas-based ROI Segmentation)
ការវិភាគលក្ខណៈវាយនភាព សណ្ឋានដី និងស្ថិតិ (Textural, Morphological, and Statistical Analysis)
ការប្រើប្រាស់បណ្តាញសរសៃប្រសាទ 3D Convolutional Neural Networks (3D CNN)
ការប្រើប្រាស់ផែនទីសកម្មភាពថ្នាក់ (Class Activation Maps) ដើម្បីកំណត់ទីតាំងខួរក្បាលដែលរងផលប៉ះពាល់

លទ្ធផលសំខាន់ៗ (The Verdict)៖

គំរូ Artificial Neural Network (ANN) ដែលប្រើប្រាស់លក្ខណៈពិសេសវាយនភាពទទួលបានភាពត្រឹមត្រូវ ៩៥.៣% ក្នុងការចាត់ថ្នាក់ជំងឺផាកឃីនសុន (Parkinson’s Disease)។
គំរូ 3D CNN ទទួលបានភាពត្រឹមត្រូវ ៩៥.២៩% សម្រាប់ការរកឃើញជំងឺផាកឃីនសុន និង ៩៥.៨៨% សម្រាប់ជំងឺអាល់ហ្សៃមេ (Alzheimer’s Disease)។
បច្ចេកទេស Class Activation Maps បានបង្ហាញយ៉ាងច្បាស់នូវតំបន់ដែលរងផលប៉ះពាល់ គឺតំបន់ Substantia Nigra សម្រាប់ជំងឺផាកឃីនសុន និងតំបន់ Hippocampus សម្រាប់ជំងឺអាល់ហ្សៃមេ។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
3D Convolutional Neural Networks (3D CNN) បណ្តាញសរសៃប្រសាទសិប្បនិម្មិតបែប Convolutional 3D	មានសមត្ថភាពរៀនលក្ខណៈពិសេសដោយស្វ័យប្រវត្តិពីទិន្នន័យរូបភាព MRI ដោយមិនចាំបាច់មានការកំណត់លក្ខណៈដោយដៃ (Handcrafted features)។ វាមានប្រសិទ្ធភាពខ្ពស់ក្នុងការវិភាគទិន្នន័យដែលមានលក្ខណៈ 3D ដូចជាខួរក្បាល។	ទាមទារធនធានកុំព្យូទ័រខ្ពស់ (High Computational Cost) និងទិន្នន័យបណ្តុះបណ្តាលច្រើន។ ម៉្យាងទៀតវាមានភាពស្មុគស្មាញក្នុងការបកស្រាយលទ្ធផល (Black Box) ប្រសិនបើមិនប្រើបច្ចេកទេសជំនួយ។	ទទួលបានភាពត្រឹមត្រូវ (Accuracy) ៩៥.២៩% សម្រាប់ជំងឺផាកឃីនសុន និង ៩៥.៨៨% សម្រាប់ជំងឺអាល់ហ្សៃមេ។
Feature Engineering + Artificial Neural Network (ANN) ការដកស្រង់លក្ខណៈពិសេស (វាយនភាព/សណ្ឋានដី) បូកនឹងបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត	មានប្រសិទ្ធភាពខ្ពស់នៅពេលដែលលក្ខណៈពិសេស (Features) ត្រូវបានជ្រើសរើសបានល្អ។ ដំណើរការលឿនជាង CNN ក្នុងការបណ្តុះបណ្តាល និងអនុវត្ត។	ពឹងផ្អែកខ្លាំងលើការបែងចែកតំបន់ (Segmentation) និងការគណនាលក្ខណៈពិសេសដោយដៃ ដែលអាចមានកំហុសប្រសិនបើគុណភាពរូបភាពមិនល្អ។	ទទួលបានភាពត្រឹមត្រូវ ៩៥.៣% ក្នុងការចាត់ថ្នាក់ជំងឺផាកឃីនសុន។
Support Vector Machine (SVM) / Random Forest ក្បួនដោះស្រាយម៉ាស៊ីនរៀនបែបប្រពៃណី (SVM និង Random Forest)	ងាយស្រួលក្នុងការអនុវត្ត និងត្រូវការធនធានតិចជាង Deep Learning។	មិនអាចចាប់យកភាពស្មុគស្មាញនៃទិន្នន័យរូបភាព 3D បានល្អដូច ANN ឬ CNN ឡើយ ដោយទទួលបានលទ្ធផលទាបជាងនៅក្នុងការសិក្សានេះ។	ទទួលបានភាពត្រឹមត្រូវទាបជាង ៩០% (ឧទាហរណ៍ SVM បានត្រឹមតែ ៧៩.១៥% ប៉ុណ្ណោះក្នុងការធ្វើតេស្តខ្លះ)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តវិធីសាស្ត្រនេះទាមទារនូវធនធានកុំព្យូទ័រដែលមានសមត្ថភាពខ្ពស់ និងចំណេះដឹងឯកទេសផ្នែករូបភាពវេជ្ជសាស្ត្រ។

Hardware: តម្រូវឱ្យមានកុំព្យូទ័រដែលមានអង្គដំណើរការក្រាហ្វិក (GPU) ខ្លាំង ដើម្បីបណ្តុះបណ្តាលម៉ូដែល 3D CNN លើរូបភាព MRI ។
Software: ប្រើប្រាស់ភាសា Python និងបណ្ណាល័យសំខាន់ៗដូចជា ANTsPy (សម្រាប់ការចុះបញ្ជីរូបភាព), Keras/TensorFlow (សម្រាប់ Deep Learning) និងឧបករណ៍ Bayesian Optimization។
Dataset: ទិន្នន័យរូបភាព MRI ដែលមានគុណភាពខ្ពស់ពីមូលដ្ឋានទិន្នន័យអន្តរជាតិ PPMI និង ADNI ដែលតម្រូវឱ្យមានការស្នើសុំសិទ្ធិជាមុន។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់ទិន្នន័យពី PPMI និង ADNI ដែលភាគច្រើនជាប្រជាជននៅបស្ចិមប្រទេស (អាមេរិក និងអឺរ៉ុប)។ សម្រាប់ប្រទេសកម្ពុជា នេះអាចជាបញ្ហាប្រឈមដោយសារភាពខុសគ្នានៃហ្សែន កត្តាបរិស្ថាន និងកម្រិតនៃការទទួលបានសេវាសុខភាព ដែលអាចធ្វើឱ្យម៉ូដែលដំណើរការមិនសូវមានប្រសិទ្ធភាពលើអ្នកជំងឺខ្មែរ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់សម្រាប់វិស័យសុខាភិបាលនៅកម្ពុជា ជាពិសេសក្នុងការជួយដល់គ្រូពេទ្យជំនាញក្នុងការធ្វើរោគវិនិច្ឆ័យ។

មន្ទីរពេទ្យកម្រិតខ្ពស់ (Tertiary Hospitals): អាចប្រើប្រាស់នៅមន្ទីរពេទ្យដូចជា មន្ទីរពេទ្យកាល់ម៉ែត ឬ សាន់រ៉ាយ ដែលមានម៉ាស៊ីន MRI ទំនើប ដើម្បីជួយវិភាគរូបភាពខួរក្បាលអ្នកជំងឺចាស់ជរា។
វិស័យស្រាវជ្រាវ និងអប់រំ (Education & Research): សាកលវិទ្យាល័យដូចជា វិទ្យាស្ថានបច្ចេកវិទ្យាកម្ពុជា (ITC) អាចប្រើប្រាស់ឯកសារនេះជាមូលដ្ឋានសម្រាប់ការស្រាវជ្រាវផ្នែកវិស្វកម្មជីវវេជ្ជសាស្ត្រ (Biomedical Engineering)។

ទោះបីជាបច្ចេកវិទ្យានេះទំនើបក៏ដោយ ការអនុវត្តជាក់ស្តែងនៅកម្ពុជាត្រូវការការបង្កើតមូលដ្ឋានទិន្នន័យរូបភាព MRI ក្នុងស្រុកជាមុនសិន ដើម្បីធានាភាពត្រឹមត្រូវ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះ Deep Learning និង Python: និស្សិតគួរចាប់ផ្តើមរៀនសរសេរកូដ Python និងប្រើប្រាស់បណ្ណាល័យដូចជា (TensorFlow) ឬ (PyTorch) ដោយផ្តោតលើស្ថាបត្យកម្ម CNN ។
ស្វែងយល់ពីការដំណើរការរូបភាពវេជ្ជសាស្ត្រ (Medical Image Processing): សិក្សាអំពីទម្រង់ទិន្នន័យ NIfTI និងការប្រើប្រាស់ឧបករណ៍ដូចជា (ANTsPy) ឬ (SimpleITK) ដើម្បីធ្វើការចុះបញ្ជីរូបភាព (Image Registration) និងបែងចែកផ្នែក (Segmentation)។
ស្នើសុំការចូលប្រើទិន្នន័យ (Data Access): ចុះឈ្មោះ និងស្នើសុំទិន្នន័យពីគេហទំព័រ (PPMI) និង (ADNI) ដើម្បីទទួលបានរូបភាព MRI សម្រាប់ការពិសោធន៍។
ការអភិវឌ្ឍ និងបណ្តុះបណ្តាលម៉ូដែល: សាកល្បងបង្កើតម៉ូដែល 3D CNN ដោយប្រើប្រាស់ស្ថាបត្យកម្មដែលបានរៀបរាប់ក្នុងឯកសារ និងប្រើប្រាស់បច្ចេកទេស (Bayesian Optimization) ដើម្បីស្វែងរកប៉ារ៉ាម៉ែត្រដែលល្អបំផុត។
ការបកស្រាយលទ្ធផល (Interpretability): អនុវត្តបច្ចេកទេស (Class Activation Maps - CAM) ដើម្បីមើលឃើញតំបន់នៃខួរក្បាលដែលម៉ូដែលបានប្រើដើម្បីធ្វើការសម្រេចចិត្ត ធានាថាវាសមស្របតាមលក្ខណៈវេជ្ជសាស្ត្រ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
3D Convolutional Neural Network (3D CNN)	ជាប្រភេទនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតដែលត្រូវបានរចនាឡើងដើម្បីវិភាគទិន្នន័យដែលមានលក្ខណៈបីវិមាត្រ (ទទឹង បណ្តោយ និងជម្រៅ)។ នៅក្នុងបរិបទវេជ្ជសាស្ត្រ វាមានសមត្ថភាពស្វែងរកលំនាំស្មុគស្មាញនៅក្នុងរូបភាព MRI ដោយពិនិត្យមើលទំនាក់ទំនងរវាងផ្នែកផ្សេងៗក្នុងលំហទាំងមូលនៃខួរក្បាល។	ដូចជាការស្កេនមើលដុំនំប៉័ងទាំងមូលដើម្បីរកមើលគ្រាប់ទំពាំងបាយជូរនៅខាងក្នុង មិនមែនគ្រាន់តែមើលតែមួយចំណិតដូចម៉ាស៊ីនថតធម្មតានោះទេ។
Voxel	ពាក្យនេះមកពីការរួមបញ្ចូលគ្នានៃ "Volume" និង "Pixel"។ វាគឺជាឯកតាតូចបំផុតនៅក្នុងរូបភាព 3D (ដូចជា MRI) ដែលតំណាងឱ្យតម្លៃមួយនៅក្នុងលំហបីវិមាត្រ ខុសពី Pixel ដែលមានតែពីរវិមាត្រ។	ប្រសិនបើ Pixel គឺជាការ៉ូមួយផ្ទាំងនៅលើឥដ្ឋ Voxel គឺជាដុំឥដ្ឋមួយដុំ (Lego) ដែលគេយកមកសង់ជាជញ្ជាំងឬរូបរាងអ្វីមួយ។
Class Activation Map (CAM)	ជាបច្ចេកទេសដែលជួយឱ្យយើងមើលឃើញថា តើផ្នែកណាមួយនៃរូបភាពដែលកុំព្យូទ័របានយកចិត្តទុកដាក់ខ្លាំងជាងគេនៅពេលវាធ្វើការសម្រេចចិត្ត ឬធ្វើរោគវិនិច្ឆ័យ។ វាជួយឱ្យគ្រូពេទ្យយល់ពីមូលហេតុដែល AI វិនិច្ឆ័យថាមានជំងឺ។	ប្រៀបដូចជាផែនទីកម្ដៅដែលបង្ហាញថាភ្នែករបស់អ្នកបើកបរបានសម្លឹងទៅមើលកន្លែងណាខ្លះ មុនពេលគាត់សម្រេចចិត្តបត់ចង្កូត។
Atlas-based ROI Segmentation	គឺជាដំណើរការនៃការប្រើប្រាស់ផែនទីខួរក្បាលស្តង់ដារ (Atlas) ដើម្បីកំណត់ទីតាំង និងកាត់យកតំបន់ជាក់លាក់ណាមួយនៃខួរក្បាលរបស់អ្នកជំងឺ (Region of Interest - ROI) ដើម្បីយកទៅវិភាគដាច់ដោយឡែកពីផ្នែកផ្សេងទៀត។	ដូចជាការយកក្រដាសដែលមានគូសវាសផែនទីស្រាប់ ទៅដាក់ពីលើរូបថតពីផ្កាយរណប ដើម្បីរកមើលទីតាំងភូមិឬស្រុកណាមួយឱ្យបានលឿននិងត្រឹមត្រូវ។
Recursive Feature Elimination	ជាវិធីសាស្ត្រស្ថិតិដែលប្រើដើម្បីជ្រើសរើសយកតែទិន្នន័យ ឬលក្ខណៈពិសេស (Features) ដែលសំខាន់បំផុតសម្រាប់ការវិភាគ។ វាធ្វើការដោយបង្កើតម៉ូដែលសាកល្បង ហើយដកចេញនូវព័ត៌មានណាដែលមិនសូវមានប្រយោជន៍ម្តងមួយៗ រហូតដល់សល់តែព័ត៌មានដែលល្អបំផុត។	ប្រៀបបាននឹងការរៀបចំកាតាបដើរព្រៃ ដោយដកចេញនូវរបស់ណាដែលមិនសូវចាំបាច់ម្តងមួយៗ រហូតដល់សល់តែរបស់ដែលសំខាន់បំផុតដែលត្រូវយកទៅ ដើម្បីកុំឱ្យធ្ងន់។
Bayesian Sequential Model-Based Optimization (SMBO)	ជាក្បួនដោះស្រាយដ៏ឆ្លាតវៃមួយសម្រាប់កែតម្រូវការកំណត់របស់ម៉ូដែល AI (Hyperparameters)។ វាប្រើប្រាស់លទ្ធផលពីការពិសោធន៍មុនៗ ដើម្បីទស្សន៍ទាយថាការកំណត់មួយណាគួរតែសាកល្បងបន្ទាប់ ដើម្បីទទួលបានលទ្ធផលល្អបំផុតដោយចំណាយពេលតិច។	ដូចជាចុងភៅភ្លក់សម្ល ហើយប៉ាន់ស្មានយ៉ាងត្រឹមត្រូវថាត្រូវថែមអំបិលប៉ុន្មានទៀត ដោយផ្អែកលើរសជាតិបច្ចុប្បន្ន ជាជាងការចេះតែថែមដោយចៃដន្យ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖