Original Title: Human Movement Disorders Analysis with Graph Neural Networks
Source: etheses.dur.ac.uk
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការវិភាគវិបល្លាសចលនាមនុស្សដោយប្រើបណ្ដាញសរសៃប្រសាទក្រាហ្វ

ចំណងជើងដើម៖ Human Movement Disorders Analysis with Graph Neural Networks

អ្នកនិពន្ធ៖ Haozheng Zhang (The University of Durham)

ឆ្នាំបោះពុម្ព៖ 2023, The University of Durham

វិស័យសិក្សា៖ Computer Science

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការធ្វើរោគវិនិច្ឆ័យវិបល្លាសចលនារបស់មនុស្ស ដូចជាជំងឺខួរក្បាលចំពោះទារក (Cerebral Palsy - CP) និងជំងឺផាកឃីនសុន (Parkinson's Disease - PD) ច្រើនតែពឹងផ្អែកលើការពិនិត្យផ្ទាល់ដោយគ្រូពេទ្យឯកទេស ដែលចំណាយពេលច្រើន និងមានធនធានតិចតួច។ ការស្រាវជ្រាវនេះដោះស្រាយបញ្ហានេះដោយប្រើប្រាស់បច្ចេកវិទ្យាកុំព្យូទ័រវីដេអូដើម្បីតាមដាន និងវិភាគចលនាតាមបែបស្វ័យប្រវត្តិ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់បណ្ដាញសរសៃប្រសាទប្រភេទក្រាហ្វរួមបញ្ចូលជាមួយយន្តការយកចិត្តទុកដាក់ (Attention-informed Graph Neural Networks) ដើម្បីទាញយកលក្ខណៈពិសេសនៃឥរិយាបថពីវីដេអូកាមេរ៉ាធម្មតា។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
SAFA-GCN (Spatial and Frequency Attention Based GCN)
បណ្ដាញសរសៃប្រសាទក្រាហ្វប្រើប្រាស់យន្តការយកចិត្តទុកដាក់លើលំហនិងប្រេកង់
ផ្តល់ភាពត្រឹមត្រូវខ្ពស់ដោយរួមបញ្ចូលទិន្នន័យនៃទម្រង់លំហនិងប្រេកង់នៃចលនា ព្រមទាំងមានសមត្ថភាពបង្ហាញពីមូលហេតុនៃការសម្រេចចិត្តរបស់ប្រព័ន្ធ (Interpretability) យ៉ាងច្បាស់លាស់។ ត្រូវការការគណនាច្រើន និងស្មុគស្មាញជាងប្រព័ន្ធមូលដ្ឋាន ដោយសារដំណើរការបណ្ដាញពីរស្របគ្នា (Two-stream) និងការបូកបញ្ចូលទិន្នន័យកាត់ជាផ្នែកតូចៗ (Clipping-and-Fusion)។ សម្រេចបានភាពត្រឹមត្រូវ (Accuracy) ៩៧,៣៧% និងពិន្ទុ F1 ៩០,៩១% សម្រាប់ការទស្សន៍ទាយជំងឺខួរក្បាល (CP) លើទិន្នន័យ RVI-38។
SPA-PTA (Spatial Pyramidal Attention Network)
បណ្ដាញកាត់បន្ថយទំហំលំហរូបភាពរាងពីរ៉ាមីតសម្រាប់ការវិភាគការញ័រ
មានប្រសិទ្ធភាពខ្ពស់ក្នុងការតាមដានចលនាញ័រញាប់ៗ ជួយត្រងយកតែទិន្នន័យចាំបាច់ និងកាត់បន្ថយសំឡេងរំខាន (Noise)។ មិនសូវមានប្រសិទ្ធភាពក្នុងការចាប់យកចលនាយឺតៗ (Low-frequency) ដូចជាចលនារបស់ទារកឡើយ។ សម្រេចបានភាពត្រឹមត្រូវ ៩១,៣% សម្រាប់ការបែងចែកប្រភេទជំងឺញ័រផាកឃីនសុន (PT) និង ៧៦,៤% សម្រាប់វាយតម្លៃកម្រិតនៃការញ័រ។
ST-GCN (Spatial Temporal Graph Convolutional Network)
បណ្ដាញសរសៃប្រសាទក្រាហ្វវិភាគលំហនិងពេលវេលា
ជាម៉ូដែលស្តង់ដារដ៏ល្អសម្រាប់រៀនពីទំនាក់ទំនងនៃរចនាសម្ព័ន្ធឆ្អឹងនិងពេលវេលា។ មិនអាចវិភាគលើប្រេកង់នៃចលនាបាន ហើយដំណើរការធ្លាក់ចុះនៅពេលទិន្នន័យហ្វឹកហាត់មានទំហំតូច។ ទទួលបានភាពត្រឹមត្រូវ ៨៩,៤៧% លើការទស្សន៍ទាយជំងឺ CP និង ៨៤,៦% លើការវិភាគជំងឺ PT។
Ens-2 (Ensemble Machine Learning)
ប្រព័ន្ធសិក្សាម៉ាស៊ីនរួមបញ្ចូលគ្នា (Machine Learning Ensemble)
មានដំណើរការលឿន និងផ្តល់លទ្ធផលល្អប្រហាក់ប្រហែលនឹង Deep Learning នៅពេលទិន្នន័យមានចំនួនតិចតួច។ ពឹងផ្អែកខ្លាំងលើការទាញយកលក្ខណៈពិសេសដោយផ្ទាល់ពីមនុស្ស (Manual feature engineering) និងមិនសូវមានស្ថិរភាពពេលបែងចែកសំណាកតេស្ត។ ទទួលបានភាពត្រឹមត្រូវ ៩៧,៣៧% លើទិន្នន័យ RVI-38 តែធ្លាក់មកត្រឹម ៩២,១១% ពេលតេស្តដោយវិធី 3-fold CV។

ការចំណាយលើធនធាន (Resource Cost)៖ ប្រព័ន្ធនេះទាមទារធនធានកុំព្យូទ័រក្នុងកម្រិតមធ្យមសម្រាប់ការហ្វឹកហាត់ម៉ូដែល ប៉ុន្តែអាចដំណើរការទាញយកលទ្ធផល (Inference) បានយ៉ាងលឿននៅលើកុំព្យូទ័រធម្មតា ដោយប្រើប្រាស់ត្រឹមតែកាមេរ៉ាទូទៅប៉ុណ្ណោះ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងដោយផ្អែកលើទិន្នន័យវីដេអូពីមន្ទីរពេទ្យនៅចក្រភពអង់គ្លេស អឺរ៉ុប និងប្រទេសហូឡង់ (មានសំណាកទារក ៣៨នាក់ និងអ្នកជំងឺ ៥៥នាក់)។ សម្រាប់ប្រទេសកម្ពុជា កង្វះខាតភាពចម្រុះនៃជាតិសាសន៍ ការស្លៀកពាក់ និងពន្លឺបរិយាកាសនៅក្នុងទិន្នន័យដើមនេះ អាចធ្វើឱ្យប្រព័ន្ធបាត់បង់ភាពត្រឹមត្រូវនៅពេលយកមកអនុវត្តជាក់ស្តែងលើប្រជាជនក្នុងស្រុក។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកវិទ្យានេះមានសក្តានុពលខ្ពស់សម្រាប់ប្រទេសកម្ពុជា ដោយសារវាជាវិធីសាស្រ្តប្រើប្រាស់ត្រឹមតែកាមេរ៉ាធម្មតាដែលមានតម្លៃថោក និងមិនត្រូវការឧបករណ៍សេនស័រ (Wearable sensors) ថ្លៃៗ។

ជារួម ការដាក់ឱ្យដំណើរការប្រព័ន្ធបញ្កាញសរសៃប្រសាទក្រាហ្វផ្អែកលើវីដេអូនេះ អាចជួយពង្រីកលទ្ធភាពនៃការធ្វើរោគវិនិច្ឆ័យជំងឺសរសៃប្រសាទឱ្យបានទូលំទូលាយ និងកាត់បន្ថយសម្ពាធចំណាយនៅក្នុងប្រព័ន្ធសុខាភិបាលកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ជំហានទី១៖ សិក្សាមូលដ្ឋានគ្រឹះកុំព្យូទ័រទស្សនៈ និងបណ្ដាញក្រាហ្វ: និស្សិតគួរចាប់ផ្តើមសិក្សាពីការទាញយកចំណុចសន្លាក់ដោយប្រើប្រាស់ AlphaPose និងសិក្សាពីទ្រឹស្តីមូលដ្ឋាននៃ Graph Convolutional Networks (GCN) តាមរយៈការអនុវត្តជាមួយបណ្ណាល័យ PyTorch
  2. ជំហានទី២៖ ស្វែងយល់ពីការបម្លែងប្រេកង់: ត្រូវរៀនសរសេរកូដ Python ក្នុងការប្រើប្រាស់ក្បួនដោះស្រាយគណិតវិទ្យា Fast Fourier Transform (FFT) ដើម្បីបម្លែងចលនាទីតាំងក្នុងលំហ (Time-series spatial data) ទៅជាទិន្នន័យប្រភេទប្រេកង់ (Frequency domain) ដើម្បីងាយស្រួលត្រងយកចំណុចញ័រ។
  3. ជំហានទី៣៖ ប្រមូលនិងរៀបចំទិន្នន័យក្នុងស្រុក (Local Dataset): សហការជាមួយគ្លីនិក ឬពេទ្យស្ម័គ្រចិត្តដើម្បីថតវីដេអូខ្លីៗពីកាយវិការអ្នកជំងឺ ឬទារកនៅកម្ពុជា ដោយប្រើប្រាស់កាមេរ៉ាស្មាតហ្វូនធម្មតា ព្រមទាំងសម្អាតទិន្នន័យ (Data preprocessing) ដោយបិទបាំងផ្ទៃមុខដើម្បីរក្សាឯកជនភាព។
  4. ជំហានទី៤៖ អនុវត្តកូដផ្ទាល់ និងធ្វើការកែលម្អ: ទាញយកកូដកូដចំហរ (Open-source code) ពីឃ្លាំង https://github.com/zhz95/SAFA-GCN យកមកដំណើរការ (Run) លើម៉ាស៊ីនដែលមាន NVIDIA GPU ព្រមទាំងសាកល្បងបញ្ចូលទិន្នន័យក្នុងស្រុកដែលប្រមូលបាននៅជំហានទី៣ ដើម្បីវាស់ស្ទង់និងកែលម្អភាពត្រឹមត្រូវនៃម៉ូដែល។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Graph Neural Networks (GNNs) ជាប្រភេទបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតដែលត្រូវបានរចនាឡើងយ៉ាងពិសេសសម្រាប់ដំណើរការទិន្នន័យដែលមានរចនាសម្ព័ន្ធជាក្រាហ្វ (មានចំណុច និងខ្សែតភ្ជាប់គ្នា) ដូចជារចនាសម្ព័ន្ធនៃគ្រោងឆ្អឹងមនុស្ស ដែលវាអាចសិក្សាពីទំនាក់ទំនងនិងកម្លាំងរវាងសន្លាក់នីមួយៗក្នុងលំហបានយ៉ាងមានប្រសិទ្ធភាព។ ដូចជាការសិក្សាពីបណ្ដាញសង្គម ដែលយើងមិនត្រឹមតែមើលលើបុគ្គលម្នាក់ៗទេ តែយើងវិភាគស៊ីជម្រៅលើទំនាក់ទំនងនិងខ្សែបណ្ដាញរវាងពួកគេទាំងអស់គ្នា។
Attention Mechanism ជាបច្ចេកទេសក្នុងបញ្ញាសិប្បនិម្មិតដែលអនុញ្ញាតឱ្យប្រព័ន្ធកុំព្យូទ័រអាចថ្លឹងថ្លែង និងផ្ដោតការយកចិត្តទុកដាក់តែទៅលើលក្ខណៈពិសេស ឬផ្នែកសំខាន់ៗនៃទិន្នន័យ (ឧទាហរណ៍៖ ទីតាំងសន្លាក់កដៃ ឬជង្គង់ដែលញ័រខ្លាំង) ខណៈពេលផាត់ចោលនូវព័ត៌មានដែលមិនសូវសំខាន់។ ដូចជាពេលយើងកំពុងស្ដាប់មិត្តភក្តិនិយាយក្នុងពិធីជប់លៀងដែលមានសម្លេងអ៊ូអរ ខួរក្បាលយើងផ្ដោតយកចិត្តទុកដាក់តែលើសម្លេងមិត្តភក្តិ និងមិនខ្វល់ពីសម្លេងរំខានជុំវិញខ្លួន។
Fast Fourier Transform (FFT) ជាក្បួនដោះស្រាយគណិតវិទ្យាដ៏មានឥទ្ធិពលសម្រាប់បំប្លែងទិន្នន័យសញ្ញាពីទម្រង់ពេលវេលា (Time domain) ទៅជាទម្រង់ប្រេកង់ (Frequency domain) ដែលជួយឱ្យប្រព័ន្ធងាយស្រួលចាប់យកល្បឿន ការញ័រញាប់ និងចង្វាក់នៃចលនារបស់អ្នកជំងឺ។ ដូចជាការញែកពន្លឺព្រះអាទិត្យ (ទិន្នន័យចលនា) ឱ្យឆ្លងកាត់កញ្ចក់ព្រីស (FFT) ដើម្បីបំបែកចេញជាពណ៌ផ្សេងៗនៃឥន្ទធនូ (កម្រិតប្រេកង់) ដែលធ្វើឱ្យយើងងាយស្រួលមើលពណ៌នីមួយៗដាច់ពីគ្នា។
Pose Estimation គឺជាបច្ចេកវិទ្យាកុំព្យូទ័រទស្សនៈ (Computer Vision) ដែលអាចស្វែងរក គណនា និងតាមដានទីតាំងសន្លាក់សំខាន់ៗនៅលើរាងកាយមនុស្ស (ដូចជា កែងដៃ ជង្គង់ ក) ពីក្នុងរូបភាព ឬវីដេអូដោយស្វ័យប្រវត្តិ ដើម្បីបង្កើតជារចនាសម្ព័ន្ធគ្រោងឆ្អឹងឌីជីថលសម្រាប់យកទៅវិភាគបន្ត។ ដូចជាការគូសចំណុចៗលើរូបថតមនុស្ស ហើយអូសបន្ទាត់ភ្ជាប់ចំណុចទាំងនោះដើម្បីបង្កើតជារូបមនុស្សឈើគូស (Stickman) ដែលកំពុងធ្វើចលនា។
Eulerian Video Magnification (EVM) ជាបច្ចេកទេសកែច្នៃសញ្ញាវីដេអូដែលជួយពង្រីក (Magnify) នូវបម្រែបម្រួលតូចៗដែលភ្នែកមនុស្សពិបាកនឹងមើលឃើញ ដូចជាការញ័រតិចៗរបស់កដៃអ្នកជំងឺ ដើម្បីពង្រីកសញ្ញាទាំងនោះឱ្យប្រព័ន្ធកុំព្យូទ័រអាចវិភាគរោគសញ្ញាជំងឺផាកឃីនសុនបានកាន់តែច្បាស់។ ដូចជាការប្រើប្រាស់កែវពង្រីក ឬមីក្រូទស្សន៍ឆ្លាតវៃ ដើម្បីឆ្លុះបញ្ចេញឱ្យច្បាស់នូវចលនាញ័រតូចៗបំផុតនៅលើរាងកាយដែលយើងមើលនឹងភ្នែកទទេមិនឃើញ។
Frequency-binning គឺជាយុទ្ធសាស្ត្រក្នុងការប្រមូលផ្តុំនិងចាត់ថ្នាក់ទិន្នន័យប្រេកង់ទៅជាប្រអប់ (Bins) កម្រិតផ្សេងៗគ្នា ដោយរចនាឡើងដើម្បីរក្សាទុកនូវប្រេកង់សំខាន់ៗនៃចលនាទារក និងច្រោះចោលនូវព័ត៌មានរំខាន (High-frequency noise)។ ដូចជាការចម្រោះយកគ្រាប់ខ្សាច់ ដោយប្រើកន្ត្រងដែលមានប្រហោងទំហំផ្សេងៗគ្នា ដើម្បីរើសយកតែគ្រាប់ខ្សាច់ដែលត្រូវការ និងត្រងចោលនូវគ្រាប់ក្រួសធំៗ។
General Movements Assessment (GMA) ជាវិធីសាស្ត្រគ្លីនិកសម្រាប់វាយតម្លៃកាយវិការសន្លាក់ និងចលនាទូទៅរបស់ទារកទើបនឹងកើត ដើម្បីព្យាករណ៍ពីហានិភ័យនៃបញ្ហាប្រព័ន្ធសរសៃប្រសាទ ឬជំងឺខួរក្បាល (Cerebral Palsy) នៅមុនពេលដែលរោគសញ្ញាជាក់លាក់លេចឡើងយ៉ាងច្បាស់។ ដូចជាការទស្សន៍ទាយថាតើកូនរុក្ខជាតិនឹងធំធាត់លូតលាស់ដោយមានសុខភាពល្អឬអត់ តាមរយៈការសង្កេតមើលរបៀបដែលស្លឹកវារើបម្រះនៅពេលត្រូវពន្លឺព្រះអាទិត្យនាប៉ុន្មានសប្តាហ៍ដំបូង។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖