Original Title: MULTIMODAL AI-DRIVEN EARLY DETECTION OF PARKINSON’S DISEASE USING NEURO-MOTOR BIOMARKERS FROM KEYSTROKE DYNAMICS AND HANDWRITING ANALYSIS
Source: www.jatit.org
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការរកឃើញជំងឺផាកឃីនសុន (Parkinson’s Disease) ដំណាក់កាលដំបូងដោយប្រើបញ្ញាសិប្បនិមិត្តពហុទម្រង់ តាមរយៈសញ្ញាសម្គាល់សរសៃប្រសាទ-ចលនាពីថាមវន្តនៃការចុចក្ដារចុច និងការវិភាគការសរសេរដោយដៃ

ចំណងជើងដើម៖ MULTIMODAL AI-DRIVEN EARLY DETECTION OF PARKINSON’S DISEASE USING NEURO-MOTOR BIOMARKERS FROM KEYSTROKE DYNAMICS AND HANDWRITING ANALYSIS

អ្នកនិពន្ធ៖ MRS. G.MANI (Gitam University), DR.S.V.G.REDDY (Gitam University)

ឆ្នាំបោះពុម្ព៖ 2025, Journal of Theoretical and Applied Information Technology

វិស័យសិក្សា៖ Artificial Intelligence in Healthcare

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការធ្វើរោគវិនិច្ឆ័យជំងឺ Parkinson (PD) នៅដំណាក់កាលដំបូងជួបប្រទះការលំបាកដោយសារកង្វះវិធីសាស្ត្រដែលអាចពង្រីកបាន និងមិនមានការឈឺចាប់ ខណៈដែលការប្រើប្រាស់ទិន្នន័យទម្រង់ទោល (Unimodal) នៅមានកម្រិតក្នុងការចាប់យករោគសញ្ញាសរសៃប្រសាទ-ចលនាឱ្យបានពេញលេញ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានស្នើឡើងនូវក្របខ័ណ្ឌបញ្ញាសិប្បនិមិត្តពហុទម្រង់ (Multimodal AI) ដែលរួមបញ្ចូលការវិភាគទិន្នន័យសកម្មភាពចលនាដៃតាមពេលវេលា និងលំហ ដើម្បីបង្កើនភាពត្រឹមត្រូវនៃការរកឃើញជំងឺ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
FTT Only (Gradient Boosting Machine - GBM)
ម៉ូដែលទម្រង់ទោលប្រើទិន្នន័យថាមវន្តនៃការចុចក្ដារចុច (FTT) ជាមួយ GBM
មានប្រសិទ្ធភាពខ្ពស់ក្នុងការចាប់យកភាពមិនប្រក្រតីតាមពេលវេលា ដូចជាចង្វាក់នៃការវាយអក្សរ និងរោគសញ្ញាចលនាយឺត (Bradykinesia) ដោយទទួលបានភាពត្រឹមត្រូវខ្ពស់គួរសម។ មិនអាចចាប់យកភាពមិនប្រក្រតីខាងផ្នែកលំហ (Spatial distortions) ដូចជារោគសញ្ញាញ័រដៃ និងមានអត្រាអវិជ្ជមានក្លែងក្លាយ (False Negatives) ខ្ពស់ជាងម៉ូដែលរួមបញ្ចូលគ្នា។ ទទួលបានភាពត្រឹមត្រូវ 96.12% និងតម្លៃ AUC 0.97។
HWT Only (Convolutional Neural Network - CNN)
ម៉ូដែលទម្រង់ទោលប្រើទិន្នន័យវិភាគការសរសេរដោយដៃ (HWT) ជាមួយ CNN
ពូកែក្នុងការទាញយកលក្ខណៈពិសេសតាមលំហពីរូបភាពគំនូរ ដូចជារោគសញ្ញាញ័រ និងទំហំអក្សរតូចខុសធម្មតា (Micrographia)។ ទទួលបានភាពត្រឹមត្រូវទាបជាងគេ ងាយរងឥទ្ធិពលពីភាពខុសគ្នានៃទម្លាប់សរសេររបស់បុគ្គល និងងាយមានកំហុសដោយសារគុណភាពរូបភាពទាប។ ទទួលបានភាពត្រឹមត្រូវ 86.70% និងតម្លៃ AUC 0.90។
Multimodal Fusion (FTT + HWT)
ម៉ូដែលបញ្ចូលគ្នាពហុទម្រង់ (ចុចក្ដារចុច + សរសេរដោយដៃ)
ផ្ដល់នូវភាពត្រឹមត្រូវ និងភាពរសើបខ្ពស់បំផុតក្នុងការធ្វើរោគវិនិច្ឆ័យ ដោយកាត់បន្ថយអត្រាអវិជ្ជមានក្លែងក្លាយបានយ៉ាងមានប្រសិទ្ធភាពបំផុតតាមរយៈការរួមបញ្ចូលសញ្ញាទាំងពេលវេលា និងលំហ។ ទាមទារការប្រមូលទិន្នន័យពីប្រភពចំនួនពីរផ្សេងគ្នា ដែលប្រើប្រាស់ពេលវេលានិងធនធានគណនាច្រើនជាងម៉ូដែលទោល។ ទទួលបានភាពត្រឹមត្រូវសរុបខ្ពស់បំផុតរហូតដល់ 98.21%។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តប្រព័ន្ធនេះទាមទារធនធានកម្រិតមធ្យមទៅខ្ពស់ ជាពិសេសកម្លាំងម៉ាស៊ីនសម្រាប់ដំណើរការម៉ូដែល Deep Learning ក៏ដូចជាឧបករណ៍ប្រមូលទិន្នន័យច្បាស់លាស់។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់ទិន្នន័យសាធារណៈ (Tappy Keystroke និង Kaggle Handwriting) ដែលភាគច្រើនប្រមូលពីប្រជាជននៅប្រទេសលោកខាងលិច។ ភាពខុសគ្នានៃទម្លាប់វាយអក្សរ (ឧទាហរណ៍ ការវាយអក្សរខ្មែរធៀបនឹងអង់គ្លេស) ទំហំម្រាមដៃ និងរបៀបសរសេរដោយដៃ អាចធ្វើឱ្យម៉ូដែលនេះមិនទាន់មានភាពសុក្រឹតខ្ពស់សម្រាប់ប្រជាជនកម្ពុជាឡើយ ដែលទាមទារឱ្យមានការប្រមូលទិន្នន័យក្នុងស្រុកបន្ថែម។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់សម្រាប់ការអនុវត្តនៅប្រទេសកម្ពុជា ដោយសារវាមានចំណាយទាប មិនប៉ះពាល់រាងកាយ និងងាយស្រួលពង្រីកសម្រាប់ការប្រើប្រាស់ពីចម្ងាយ (Telemedicine)។

ជារួម ការធ្វើមូលដ្ឋានីយកម្មប្រព័ន្ធ AI នេះដោយប្រើទិន្នន័យក្នុងស្រុក អាចជួយធ្វើបដិវត្តន៍ការពិនិត្យជំងឺ Parkinson ឱ្យកាន់តែទូលំទូលាយ ចំណាយតិច និងជួយអ្នកជំងឺកម្ពុជាឱ្យទទួលបានការព្យាបាលទាន់ពេលវេលា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃទិន្នន័យសកម្មភាព និងក្បួនដោះស្រាយ: ស្វែងយល់ពីក្បួនដោះស្រាយ Gradient Boosting Machine (GBM) និង Convolutional Neural Networks (CNN) ព្រមទាំងការទាញយកលក្ខណៈពិសេសតាមពេលវេលា (Temporal features) តាមរយៈវគ្គសិក្សានៅលើ Coursera ផ្នែក Deep Learning សម្រាប់សុខាភិបាល។
  2. ការទាញយក និងសម្អាតសំណុំទិន្នន័យ: ចូលទៅកាន់វេទិកា Kaggle ដើម្បីទាញយកសំណុំទិន្នន័យ Tappy Keystroke Dataset និងទិន្នន័យរូបភាព PaHaW។ បន្ទាប់មក អនុវត្តការសម្អាតទិន្នន័យ (Data Preprocessing) ដោយប្រើបណ្ណាល័យ Pandas សម្រាប់ទិន្នន័យលេខ និង OpenCV សម្រាប់កាត់បន្ថយ Noise លើរូបភាព។
  3. ការអភិវឌ្ឍម៉ូដែលទម្រង់ទោល (Unimodal Models): សរសេរកូដហ្វឹកហាត់ម៉ូដែល GBM ដោយប្រើ Scikit-learn សម្រាប់ទិន្នន័យថាមវន្តនៃការចុចក្ដារចុច និងបង្កើតស្ថាបត្យកម្ម CNN ដោយប្រើ TensorFlow/Keras ដើម្បីធ្វើចំណាត់ថ្នាក់រូបភាពគំនូរគូសរង្វង់និងរលក។
  4. ការអនុវត្តបច្ចេកទេសបញ្ចូលគ្នាពហុទម្រង់ (Multimodal Fusion): សិក្សានិងអនុវត្តក្បួន Decision-level Late Fusion ដើម្បីបូកបញ្ចូលលទ្ធផលទស្សន៍ទាយ (Predictions) ពីម៉ូដែល FTT និង HWT ដោយប្រើរូបមន្តមេគុណទម្ងន់ទិន្នន័យ (Weighted strategy) ដើម្បីបង្កើនភាពត្រឹមត្រូវរហូតដល់លើស 95%។
  5. ការប្រមូលទិន្នន័យពិត និងធ្វើតេស្តសាកល្បងនៅកម្ពុជា: សហការជាមួយមន្ទីរពេទ្យ ឬគ្លីនិកក្នុងស្រុក ដើម្បីបង្កើតកម្មវិធី Web Application តូចមួយដោយប្រើ Streamlit សម្រាប់ប្រមូលទិន្នន័យចុចក្ដារចុចជាភាសាខ្មែរ និងរូបភាពគូសវ៉ាសពីអ្នកជំងឺពិតប្រាកដ ដើម្បីវាស់ស្ទង់សុពលភាពម៉ូដែលនៅក្នុងបរិបទជាក់ស្ដែង។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Multimodal Fusion ដំណើរការនៃការរួមបញ្ចូលទិន្នន័យពីប្រភពពីរឬច្រើនផ្សេងគ្នា (ដូចជាពេលវេលាចុចក្ដារចុច និងលំហនៃការសរសេរ) ដើម្បីបង្កើតការព្យាករណ៍រោគវិនិច្ឆ័យរួមមួយដែលមានភាពត្រឹមត្រូវខ្ពស់ជាងការប្រើប្រភពតែមួយ។ ដូចជាគ្រូពេទ្យពិនិត្យមើលទាំងលទ្ធផលឈាម និងរូបភាពអ៊ិចកាំរស្មី (X-ray) បញ្ចូលគ្នា ដើម្បីធ្វើរោគវិនិច្ឆ័យជំងឺឱ្យកាន់តែច្បាស់ ជំនួសឱ្យការមើលតែមួយមុខ។
Neuro-Motor biomarkers សូចនាករដែលអាចវាស់វែងបានពីសកម្មភាពសរសៃប្រសាទនិងសាច់ដុំ ដែលបញ្ជាក់ពីកម្រិតនៃការគ្រប់គ្រងចលនារបស់រាងកាយ (ឧ. ចង្វាក់នៃការគោះម្រាមដៃ ឬភាពរលូននៃការសរសេរ)។ ដូចជាការស្តាប់សំឡេងម៉ាស៊ីនរថយន្តលោត ដើម្បីដឹងថាម៉ាស៊ីននៅដំណើរការល្អឬមានបញ្ហា។
Keystroke dynamics ការវាស់ស្ទង់ពីចលនានិងចង្វាក់នៃការវាយអក្សរលើក្ដារចុច ដូចជារយៈពេលដែលសង្កត់លើប៊ូតុងមួយ (Hold time) និងពេលវេលាផ្លាស់ទីពីប៊ូតុងមួយទៅប៊ូតុងមួយទៀត (Flight time)។ ដូចជាការសម្គាល់មនុស្សម្នាក់តាមរយៈរបៀប និងល្បឿនដែលពួកគេដើរ ឬចុចទូរស័ព្ទប្រចាំថ្ងៃ។
Bradykinesia រោគសញ្ញានៃការថយចុះល្បឿន ឬភាពយឺតយ៉ាវខុសប្រក្រតីក្នុងការធ្វើចលនារាងកាយ ដែលជារោគសញ្ញាចម្បងមួយនៃជំងឺផាកឃីនសុន (Parkinson's Disease)។ ដូចជាចលនារបស់វីដេអូដែលត្រូវបានចាក់ក្នុងល្បឿនយឺត (Slow-motion) ដែលធ្វើឱ្យរាងកាយពិបាកនឹងចាប់ផ្តើមធ្វើចលនាអ្វីមួយភ្លាមៗ។
Micrographia ស្ថានភាពមិនប្រក្រតីដែលអ្នកជំងឺសរសេរអក្សរមានទំហំតូចទៅៗបន្តិចម្ដងៗខុសពីធម្មតា ដែលបង្កឡើងដោយការថយចុះសមត្ថភាពបញ្ជាចលនាសាច់ដុំដៃ។ ដូចជាការសរសេរអក្សរដែលផ្ដើមឡើងធំច្បាស់ល្អ តែរួញតូចទៅៗនៅចុងបន្ទាត់ដូចជាអ្នកសរសេរអស់កម្លាំង។
Convolutional Neural Networks (CNNs) ប្រភេទនៃបណ្ដាញសរសៃប្រសាទបញ្ញាសិប្បនិមិត្តដែលត្រូវបានរចនាឡើងយ៉ាងពិសេសសម្រាប់វិភាគ និងទាញយកលក្ខណៈសម្គាល់ពីរូបភាព (ឧ. រូបភាពគំនូរគូសរង្វង់) តាមរយៈការត្រងនិងកាត់បន្ថយទំហំទិន្នន័យដោយមិនបាត់បង់ព័ត៌មានសំខាន់។ ដូចជាមនុស្សម្នាក់ដែលពាក់វ៉ែនតាកែវពង្រីក ដើម្បីស្វែងរកកំហុសឬស្នាមប្រេះតូចៗនៅលើផ្ទាំងគំនូរ។
Gradient Boosting Machine (GBM) ក្បួនដោះស្រាយម៉ាស៊ីនរៀន (Machine Learning) ដែលបង្កើតម៉ូដែលតូចៗជាបន្តបន្ទាប់ ដោយម៉ូដែលនីមួយៗព្យាយាមកែតម្រូវកំហុសរបស់ម៉ូដែលមុន ដើម្បីទទួលបានការព្យាករណ៍ចុងក្រោយដ៏សុក្រឹតបំផុត។ ដូចជាការធ្វើការងារជាក្រុម ដែលសមាជិកម្នាក់ៗជួយកែចំណុចខ្វះខាតរបស់សមាជិកមុន រហូតទទួលបានលទ្ធផលរួមមួយដែលល្អឥតខ្ចោះ។
Area Under the Curve (AUC) រង្វាស់ស្តង់ដារសម្រាប់វាយតម្លៃប្រសិទ្ធភាពរបស់ម៉ូដែលចំណាត់ថ្នាក់ ដោយបង្ហាញពីសមត្ថភាពរបស់វាក្នុងការបែងចែកឱ្យបានត្រឹមត្រូវរវាងក្រុមអ្នកជំងឺ និងក្រុមមនុស្សធម្មតា (ពិន្ទុកាន់តែខិតជិត ១ គឺកាន់តែល្អ)។ ដូចជាពិន្ទុប្រឡងសរុបរបស់សិស្ស ដែលប្រាប់យើងថាគាត់រៀនពូកែកម្រិតណាក្នុងការបែងចែកចម្លើយត្រូវនិងខុស។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖