បញ្ហា (The Problem)៖ ឯកសារនេះផ្តោតលើការដោះស្រាយបញ្ហានៃការវិភាគសញ្ញាវាស់ចង្វាក់បេះដូង (ECG) ដោយស្វ័យប្រវត្តិ ដើម្បីរកមើលភាពមិនប្រក្រតីនៃចង្វាក់បេះដូង (Arrhythmia) ឆ្លើយតបទៅនឹងអត្រាកំណើននៃជំងឺបេះដូង និងជួយសម្រួលដល់កង្វះខាតអ្នកជំនាញបេះដូង។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះស្នើឡើងនូវវិធីសាស្ត្ររៀនស៊ីជម្រៅបែបចម្រុះ (Ensemble Deep Learning) ដែលទាញយកលក្ខណៈពិសេសទាំងពីសញ្ញាដើមផ្ទាល់ និងពីរូបភាពតំណាងសញ្ញា ដើម្បីធ្វើការចាត់ថ្នាក់យ៉ាងសុក្រឹត។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Ensemble: Convolutional Autoencoder + EfficientNet (Proposed) វិធីសាស្ត្រចម្រុះរួមបញ្ចូល Convolutional Autoencoder និង EfficientNet (ស្នើឡើង) |
ទទួលបានភាពត្រឹមត្រូវខ្ពស់បំផុត និងមានស្ថិរភាពល្អក្នុងការទាញយកលក្ខណៈពិសេសទាំងពីសញ្ញាដើមនិងរូបភាព Spectrogram។ | ទាមទារថាមពលកុំព្យូទ័រខ្ពស់ និងពេលវេលាច្រើនក្នុងការហ្វឹកហាត់ម៉ូដែលបណ្ដាញសរសៃប្រសាទទាំងពីរស្របគ្នា។ | ភាពត្រឹមត្រូវ (Accuracy) ៩៩.៦៧%, F1-Score ៩៩.៧០% |
| 2D Convolutional Neural Network (Jun et al.) បណ្ដាញសរសៃប្រសាទ 2D CNN (Jun និងសហការី) |
មានប្រសិទ្ធភាពខ្ពស់ក្នុងការវិភាគរូបភាពសញ្ញា ECG (Grayscale images) សម្រាប់ការចាត់ថ្នាក់ចំណាត់ថ្នាក់ចង្វាក់បេះដូង។ | ពឹងផ្អែកតែលើរូបភាពតំណាង (Image representation) ដោយមិនបានទាញយកលក្ខណៈពិសេសពីទម្រង់សញ្ញាដើម (Raw signals) ផ្ទាល់នោះទេ។ | ភាពត្រឹមត្រូវ (Accuracy) ៩៩.០៥% |
| K-Nearest Neighbor with DCT (Acharya et al.) ក្បួនដោះស្រាយ K-Nearest Neighbor ប្រើជាមួយលក្ខណៈពិសេស DCT |
ម៉ូដែលមិនសូវស្មុគស្មាញ និងត្រូវការថាមពលកុំព្យូទ័រតិចជាងការរៀនស៊ីជម្រៅ (Deep Learning)។ | ត្រូវការអ្នកជំនាញដើម្បីទាញយកលក្ខណៈពិសេសដោយដៃ (Manual feature extraction) ជាមុនសិន ដែលស៊ីពេលនិងលំបាក។ | ភាពត្រឹមត្រូវ (Accuracy) ៩៨.៥០% |
ការចំណាយលើធនធាន (Resource Cost)៖ ឯកសារនេះបានបញ្ជាក់យ៉ាងច្បាស់អំពីតម្រូវការផ្នែករឹង (Hardware) និងកម្មវិធី (Software) ដែលមានកម្រិតមធ្យមទៅខ្ពស់ សម្រាប់ដំណើរការម៉ូដែលរៀនស៊ីជម្រៅនេះ។
ការសិក្សានេះប្រើប្រាស់ទិន្នន័យពីអ្នកជំងឺចំនួន ៣០,០០០ នាក់ ដែលប្រមូលបានពីមន្ទីរពេទ្យនៅប្រទេសអ៊ីរ៉ាក់ផ្តាច់មុខ។ ទិន្នន័យនេះអាចមានកម្រិតលំអៀងទៅលើហ្សែន របៀបរស់នៅ និងប្រវត្តិវេជ្ជសាស្ត្ររបស់ប្រជាជនតំបន់មជ្ឈិមបូព៌ា។ សម្រាប់ប្រទេសកម្ពុជា ការអនុវត្តម៉ូដែលនេះតម្រូវឱ្យមានការសាកល្បង និងកែសម្រួលបន្ថែម (Fine-tuning) ជាមួយទិន្នន័យប្រជាជនកម្ពុជាផ្ទាល់ ដើម្បីធានាបាននូវភាពសុក្រឹតមុននឹងដាក់ឱ្យប្រើប្រាស់ក្នុងគ្លីនិក។
វិធីសាស្ត្រនេះមានសក្តានុពលធំធេងសម្រាប់ប្រព័ន្ធសុខាភិបាលកម្ពុជា ជាពិសេសក្នុងការជួយគាំទ្រដល់គ្រូពេទ្យទូទៅនៅតំបន់ដែលខ្វះខាតអ្នកឯកទេសបេះដូង។
សរុបមក ការធ្វើស្វ័យប្រវត្តិកម្មលើការវិភាគ ECG នឹងចូលរួមចំណែកយ៉ាងសំខាន់ក្នុងការកាត់បន្ថយអត្រាមរណភាពដោយជំងឺបេះដូងនៅកម្ពុជា តាមរយៈការរកឃើញរោគសញ្ញាបានទាន់ពេលវេលា។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Electrocardiogram (ECG) | ជាបច្ចេកទេសវេជ្ជសាស្ត្រដែលវាស់ និងកត់ត្រាសកម្មភាពអគ្គិសនីរបស់បេះដូងក្នុងទម្រង់ជារលកសញ្ញា ដើម្បីពិនិត្យមើលភាពប្រក្រតី ឬបញ្ហានៃការលោតរបស់បេះដូងអ្នកជំងឺ។ | ដូចជាការថតចម្លងចរន្តភ្លើងដែលរត់កាត់ម៉ាស៊ីនបូមទឹក ដើម្បីដឹងថាម៉ាស៊ីននោះដើរស្រួលឬមានបញ្ហាខូចខាត។ |
| Arrhythmia | ជាស្ថានភាពដែលចង្វាក់បេះដូងលោតខុសប្រក្រតី វាអាចថាលោតញាប់ពេក យឺតពេក ឬលោតរអាក់រអួល ដែលជារោគសញ្ញាបញ្ជាក់ពីវត្តមាននៃជំងឺបេះដូងធ្ងន់ធ្ងរ។ | ដូចជានាឡិកាដែលដើររំលងវិនាទី ឬដើរលឿនខុសធម្មតា ដែលបញ្ជាក់ថាថ្ម ឬគ្រឿងក្នុងរបស់វាមានបញ្ហា។ |
| Convolutional Autoencoders (CAE) | ជាប្រភេទបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតដែលរៀនបង្រួមទិន្នន័យ (Encode) ទៅជាទម្រង់តូចបំផុត រួចពង្រីកវាវិញ (Decode) ដើម្បីចាប់យកលក្ខណៈពិសេសសំខាន់ៗបំផុតរបស់ទិន្នន័យនោះដោយស្វ័យប្រវត្តិ។ | ដូចជាការសង្ខេបសៀវភៅមួយក្បាលក្រាស់ឱ្យសល់ត្រឹមមួយទំព័រដែលផ្ទុកតែអត្ថន័យសំខាន់ រួចអាចសរសេរពង្រីកសាច់រឿងនោះឡើងវិញបានដោយមិនបាត់បង់អត្ថន័យដើម។ |
| Transfer Learning | ជាវិធីសាស្ត្រក្នុងបញ្ញាសិប្បនិម្មិត (AI) ដែលយកម៉ូដែលធ្លាប់បានហ្វឹកហាត់រួចជាស្រេចលើការងារមួយដ៏ធំ មកប្រើប្រាស់ និងកែសម្រួលបន្តិចបន្តួចសម្រាប់ការងារថ្មីមួយទៀតដែលស្រដៀងគ្នា ដើម្បីចំណេញពេលវេលា និងធនធាន។ | ដូចជាការយកអ្នកដែលចេះជិះកង់ស្ទាត់ជំនាញស្រាប់ ទៅបង្រៀនឱ្យជិះម៉ូតូ ដែលគាត់អាចរៀនចេះលឿនជាងអ្នកដែលមិនធ្លាប់ចេះជិះអ្វីសោះ។ |
| Spectrogram | ជារូបភាពតំណាងដែលបង្ហាញពីបំរែបំរួលប្រេកង់ (Frequency) នៃរលកសញ្ញាណាមួយធៀបនឹងពេលវេលា ដែលជួយឱ្យកុំព្យូទ័រអាចមើលឃើញសញ្ញាអគ្គិសនីជាទម្រង់រូបភាពមានពណ៌ផ្សេងៗ។ | ដូចជាការបំប្លែងសម្លេងចម្រៀងទៅជាគំនូរពណ៌រលកតន្ត្រីនៅលើអេក្រង់ ដើម្បីឱ្យយើងអាចមើលឃើញកម្រិតសំឡេងឡើងចុះដោយផ្ទាល់ភ្នែក។ |
| Latent Space | ជាទំហំផ្ទុកទិន្នន័យតូចចង្អៀតដែលត្រូវបានបង្រួមដោយកូដន័រ (Encoder) នៅក្នុង Autoencoder ដែលវាផ្ទុកនូវលក្ខណៈពិសេសស្នូល និងអត្ថន័យសំខាន់ៗបំផុតនៃទិន្នន័យដើមដោយគ្មានរឿងរំខាន (Noise)។ | ដូចជាការបំប្លែងផ្លែឈើស្រស់មួយកន្ត្រកធំ ទៅជាទឹកស៊ីរ៉ូមួយដបតូចដែលនៅតែរក្សាបាននូវរសជាតិនិងខ្លឹមសារវីតាមីនដើមរបស់ផ្លែឈើនោះទាំងស្រុង។ |
| EfficientNet | ជាស្ថាបត្យកម្មបណ្ដាញសរសៃប្រសាទ (CNN) កម្រិតខ្ពស់ដែលត្រូវបានបង្កើនប្រសិទ្ធភាពក្នុងការទាញយកលក្ខណៈពិសេសពីរូបភាព ដោយវាធ្វើការពង្រីកទំហំ ជម្រៅ និងទទឹងរបស់បណ្ដាញដោយប្រើរូបមន្តគណិតវិទ្យាសមាមាត្រ។ | ដូចជាការប្រើប្រាស់កែវពង្រីកឆ្លាតវៃដែលអាចមើលឃើញទាំងទិដ្ឋភាពជារួម និងចំណុចល្អិតៗនៃរូបភាពក្នុងពេលតែមួយ ដោយមិនចាំបាច់ប្រើកាមេរ៉ាធំកម្រិតខ្ពស់ឡើយ។ |
| Confusion Matrix | ជាតារាងរង្វាយតម្លៃដែលប្រើដើម្បីបង្ហាញយ៉ាងលម្អិតពីចំនួនទស្សន៍ទាយត្រូវ (True Positives/Negatives) និងចំនួនទស្សន៍ទាយខុស (False Positives/Negatives) របស់ម៉ូដែល AI ធៀបនឹងទិន្នន័យពិតជាក់ស្តែង។ | ដូចជាតារាងកត់ត្រាពិន្ទុប្រឡង ដែលប្រាប់យ៉ាងច្បាស់ថាសិស្សម្នាក់ឆ្លើយត្រូវប៉ុន្មានសំណួរ ឆ្លើយខុសប៉ុន្មាន និងរំលងប៉ុន្មាន ដើម្បីដឹងពីចំណុចខ្សោយរបស់គាត់។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖