Original Title: Explainable Federated Learning for Multi-Class Heart Disease Diagnosis via ECG Fiducial Features
Source: doi.org/10.3390/diagnostics15243110
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការរៀនបែបសហព័ន្ធដែលអាចពន្យល់បានសម្រាប់ការធ្វើរោគវិនិច្ឆ័យជំងឺបេះដូងពហុប្រភេទតាមរយៈលក្ខណៈពិសេស ECG Fiducial

ចំណងជើងដើម៖ Explainable Federated Learning for Multi-Class Heart Disease Diagnosis via ECG Fiducial Features

អ្នកនិពន្ធ៖ Tanjila Alam Sathi (Islamic University of Technology), Rafsan Jany (Islamic University of Technology), AKM Azad (Imam Mohammad Ibn Saud Islamic University), Md Azam Hossain (Islamic University of Technology)

ឆ្នាំបោះពុម្ព៖ 2025 (Diagnostics)

វិស័យសិក្សា៖ Health Informatics / Artificial Intelligence

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ជំងឺសរសៃឈាមបេះដូង (CVD) គឺជាមូលហេតុចម្បងនៃការស្លាប់ ប៉ុន្តែការបកស្រាយទិន្នន័យ ECG ពីស្ថាប័នច្រើនមានការលំបាកដោយសារបញ្ហាឯកជនភាពទិន្នន័យ និងកង្វះតម្លាភាពក្នុងគំរូ AI ដែលមានស្រាប់។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះស្នើឡើងនូវក្របខណ្ឌការរៀនបែបសហព័ន្ធ (Federated Learning) ដោយប្រើគំរូ FL-LSTM ដើម្បីចាត់ថ្នាក់ជំងឺបេះដូងដោយមិនចាំបាច់ចែករំលែកទិន្នន័យអ្នកជំងឺ ដោយរួមបញ្ចូលបច្ចេកទេស XAI សម្រាប់បកស្រាយលទ្ធផល។

Federated Learning with LSTM model (ការរៀនបែបសហព័ន្ធជាមួយគំរូ LSTM)
ECG Fiducial Feature Extraction (ការទាញយកលក្ខណៈពិសេស ECG ដូចជា P-wave, QRS, QT)
Explainable AI techniques: SHAP & LIME (បច្ចេកទេស AI ដែលអាចពន្យល់បាន)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

គំរូនេះទទួលបានភាពត្រឹមត្រូវ ៩២% (Accuracy) និង ៩៩% AUC លើការចាត់ថ្នាក់ជំងឺបីប្រភេទគឺ ជំងឺចង្វាក់បេះដូងខុសប្រក្រតី (Arrhythmia), ជំងឺស្ទះសរសៃឈាមបេះដូង (Ischemia), និងស្ថានភាពសុខភាពល្អ។
វាមានសមត្ថភាពខ្ពស់ជាងវិធីសាស្ត្រដែលមានស្រាប់ ដោយអាចរក្សាឯកជនភាពអ្នកជំងឺ និងធ្វើការវិនិច្ឆ័យលើទិន្នន័យពីប្រភពផ្សេងៗគ្នា (Heterogeneous datasets)។
ការប្រើប្រាស់ SHAP និង LIME ជួយបង្ហាញយ៉ាងច្បាស់នូវលក្ខណៈជីវសាស្ត្រសំខាន់ៗ (ដូចជាកម្ពស់ P-wave និងចន្លោះ QT) ដែលជួយបង្កើនទំនុកចិត្តដល់គ្រូពេទ្យក្នុងការសម្រេចចិត្ត។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Federated LSTM (FL-LSTM - Proposed) ការរៀនសហព័ន្ធដោយប្រើបណ្តាញ LSTM (វិធីសាស្ត្រស្នើឡើង)	ការពារឯកជនភាពទិន្នន័យបានល្អបំផុត មានសមត្ថភាពវិភាគជំងឺច្រើនប្រភេទ (Multi-class) និងអាចពន្យល់លទ្ធផលបានតាមរយៈ XAI។	ទាមទារហេដ្ឋារចនាសម្ព័ន្ធបណ្តាញរវាង Server និង Client ដែលមានស្ថេរភាព និងស្មុគស្មាញជាងការរៀនបែបកណ្តាល។	ភាពត្រឹមត្រូវ (Accuracy) ៩២%, AUC ៩៩%, F1 Score ៩១%។
Centralized LSTM ការរៀនដោយប្រើបណ្តាញ LSTM បែបប្រមូលផ្តុំទិន្នន័យនៅកន្លែងតែមួយ	ងាយស្រួលក្នុងការអនុវត្ត និងបណ្តុះបណ្តាលនៅពេលទិន្នន័យទាំងអស់ស្ថិតនៅកន្លែងតែមួយ។	មានហានិភ័យខ្ពស់ចំពោះឯកជនភាពអ្នកជំងឺ និងពិបាកក្នុងការប្រមូលទិន្នន័យពីមន្ទីរពេទ្យច្រើនដោយសារបញ្ហាច្បាប់។	ភាពត្រឹមត្រូវ (Accuracy) ៩០.១% (ទាបជាង FL-LSTM បន្តិច)។
DP-FedAvg (Differential Privacy) ការរៀនសហព័ន្ធដោយបន្ថែមបច្ចេកទេស Differential Privacy	ផ្តល់ការការពារឯកជនភាពកម្រិតខ្ពស់បំផុត។	ការបន្ថែម 'Noise' ដើម្បីការពារទិន្នន័យធ្វើឱ្យប៉ះពាល់ដល់ភាពត្រឹមត្រូវនៃគំរូយ៉ាងខ្លាំង។	ភាពត្រឹមត្រូវប្រហែល ៨១% (យោងតាមការសិក្សារបស់ Agrawal et al.)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះប្រើប្រាស់ធនធានកុំព្យូទ័រកម្រិតមធ្យមសម្រាប់ការបណ្តុះបណ្តាល ប៉ុន្តែត្រូវការធនធានតិចតួចសម្រាប់ការប្រើប្រាស់ជាក់ស្តែង (Inference)។

Hardware (ផ្នែករឹង): ប្រើប្រាស់ NVIDIA Tesla T4 GPU (15GB Memory) និង Intel Xeon CPU សម្រាប់ការបណ្តុះបណ្តាល។ សម្រាប់ Inference អាចដំណើរការលើ CPU ធម្មតាបាន។
Software (ផ្នែកទន់): បង្កើតឡើងដោយប្រើ Python និង PyTorch framework ដំណើរការលើ Google Colab។
Data Processing (ការរៀបចំទិន្នន័យ): ត្រូវការការទាញយកលក្ខណៈពិសេស (Feature Extraction) ពីសញ្ញា ECG (ដូចជា P-wave, QRS) ជាមុនសិន មិនមែនប្រើ Raw Waveform ផ្ទាល់ទេ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់ទិន្នន័យសាធារណៈចំនួន ៣ (MIT-BIH, European ST-T, FANTASIA) ដែលភាគច្រើនជាទិន្នន័យជនជាតិស្បែកស ឬលោកខាងលិច។ សម្រាប់កម្ពុជា នេះអាចជាបញ្ហាដោយសារសរីរវិទ្យា និងប្រភេទជំងឺបេះដូងអាចមានភាពខុសគ្នាតិចតួច ដែលទាមទារការសាកល្បងបន្ថែមលើទិន្នន័យក្នុងស្រុក។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានប្រយោជន៍ខ្លាំងសម្រាប់ប្រព័ន្ធសុខាភិបាលកម្ពុជាដែលកំពុងធ្វើឌីជីថលូបនីយកម្ម និងខ្វះខាតអ្នកជំនាញបេះដូង។

មន្ទីរពេទ្យបង្អែកខេត្ត (Provincial Referral Hospitals): អាចជួយគ្រូពេទ្យនៅតាមខេត្តក្នុងការវិភាគ ECG ស្វ័យប្រវត្តិដើម្បីរកជំងឺបេះដូង ដោយមិនចាំបាច់មានអ្នកជំនាញបេះដូងប្រចាំការភ្លាមៗ។
កិច្ចសហប្រតិបត្តិការអន្តរមន្ទីរពេទ្យ (Inter-hospital Collaboration): អនុញ្ញាតឱ្យមន្ទីរពេទ្យរដ្ឋធំៗ (ដូចជា Calmette) និងមន្ទីរពេទ្យឯកជនសហការគ្នាបង្កើតគំរូ AI រួមគ្នាដោយមិនបាច់ចែករំលែកទិន្នន័យអ្នកជំងឺ ដែលស្របតាមច្បាប់ការពារឯកជនភាព។
ឧបករណ៍តាមដានសុខភាពពីចម្ងាយ (Remote Health Monitoring): ដោយសារគំរូនេះត្រូវការធនធានតិច វាអាចដាក់បញ្ចូលក្នុងឧបករណ៍ចល័តសម្រាប់តាមដានអ្នកជំងឺនៅតំបន់ដាច់ស្រយាល។

បច្ចេកវិទ្យានេះផ្តល់នូវដំណោះស្រាយតុល្យភាពរវាងការប្រើប្រាស់ AI កម្រិតខ្ពស់ និងការការពារឯកជនភាពអ្នកជំងឺ ដែលជាតម្រូវការចាំបាច់សម្រាប់ទំនើបកម្មវិស័យសុខាភិបាលកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះនៃ Federated Learning: និស្សិតគួរចាប់ផ្តើមស្វែងយល់ពីរបៀបដំណើរការនៃក្បួនដោះស្រាយ Federated Averaging (FedAvg) ដោយប្រើបណ្ណាល័យ Python ដូចជា (PySyft) ឬ (Flower)។
ការរៀបចំនិងវិភាគទិន្នន័យ ECG: រៀនប្រើប្រាស់ឧបករណ៍សម្រាប់បំបែកសញ្ញា ECG និងទាញយក Fiducial Features (P, QRS, T) ដោយប្រើបណ្ណាល័យដូចជា (NeuroKit2) ឬ (BioSPPy)។
ការបង្កើតគំរូ LSTM: អនុវត្តការបង្កើតគំរូ Deep Learning ប្រភេទ (LSTM) ដោយប្រើ (PyTorch) ដើម្បីចាត់ថ្នាក់ទិន្នន័យស계រវេលា (Time-series data)។
ការអនុវត្ត XAI សម្រាប់តម្លាភាព: សាកល្បងប្រើប្រាស់បច្ចេកទេស (SHAP) និង (LIME) លើគំរូដែលបានបង្កើត ដើម្បីយល់ថាហេតុអ្វីបានជា AI ធ្វើការសម្រេចចិត្តបែបនោះ (ឧ. តើវាផ្អែកលើកម្ពស់ R-wave ឬយ៉ាងណា?)។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Federated Learning	ជាវិធីសាស្ត្របង្រៀនម៉ាស៊ីន (Machine Learning) បែបថ្មីដែលអនុញ្ញាតឱ្យកុំព្យូទ័រនៅតាមស្ថាប័នផ្សេងៗគ្នា (ដូចជាមន្ទីរពេទ្យ) អាចសហការគ្នាបង្កើតគំរូ AI តែមួយ ដោយមិនចាំបាច់បញ្ជូនទិន្នន័យអ្នកជំងឺចេញពីកន្លែងដើមឡើយ។ វាជួយការពារឯកជនភាពទិន្នន័យបានយ៉ាងល្អ។	ដូចជាចុងភៅនៅតាមហាងផ្សេងៗគ្នារៀនធ្វើម្ហូបនៅផ្ទះបាយរៀងខ្លួន ហើយគ្រាន់តែផ្ញើរូបមន្តដែលឆ្ងាញ់ទៅចែករំលែកគ្នា ដោយមិនបាច់ដឹកជញ្ជូនគ្រឿងផ្សំទៅកន្លែងតែមួយ។
Long Short-Term Memory (LSTM)	ជាប្រភេទបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (Neural Network) ពិសេសម្យ៉ាងដែលត្រូវបានរចនាឡើងដើម្បីចងចាំព័ត៌មានក្នុងរយៈពេលយូរ។ វាមានប្រសិទ្ធភាពខ្ពស់ក្នុងការវិភាគទិន្នន័យដែលកើតឡើងជាបន្តបន្ទាប់គ្នា (Time-series) ដូចជាចង្វាក់បេះដូង ដើម្បីស្វែងរកភាពមិនប្រក្រតី។	ដូចជាការអានសៀវភៅដែលយើងចងចាំសាច់រឿងតាំងពីដើមដល់ចប់ ដើម្បីយល់ន័យសរុប មិនមែនអានមួយម៉ាត់ភ្លេចមួយម៉ាត់នោះទេ។
Fiducial Features	ជាចំណុចសំខាន់ៗជាក់លាក់នៅលើក្រាហ្វ ECG (ដូចជាកម្ពស់ P-wave, រយៈពេល QRS, ឬចន្លោះ QT) ដែលត្រូវបានស្រង់ចេញដើម្បីប្រើជាទិន្នន័យគោលសម្រាប់ការវិភាគ ជាជាងការប្រើប្រាស់រូបភាពក្រាហ្វទាំងមូល។ ការប្រើចំណុចទាំងនេះជួយឱ្យ AI យល់ពីលក្ខណៈបេះដូងបានច្បាស់លាស់ជាង។	ដូចជាការសម្គាល់មនុស្សដោយមើលលើចំណុចពិសេសដូចជា 'ពណ៌ភ្នែក' ឬ 'កម្ពស់' ជាជាងការមើលរូបថតពេញខ្លួន។
Explainable AI (XAI)	ជាបច្ចេកវិទ្យាដែលធ្វើឱ្យប្រព័ន្ធ AI អាចពន្យល់ពីមូលហេតុនៃការសម្រេចចិត្តរបស់វា។ នៅក្នុងវិស័យសុខាភិបាល វាជួយឱ្យគ្រូពេទ្យដឹងថាហេតុអ្វីបានជា AI វិនិច្ឆ័យថាអ្នកជំងឺមានជំងឺបេះដូង (ឧទាហរណ៍៖ ដោយសារកម្ពស់រលក P ខ្ពស់ពេក)។	ដូចជាសិស្សគណិតវិទ្យាដែលមិនត្រឹមតែសរសេរចម្លើយត្រូវទេ តែថែមទាំងបង្ហាញវិធីធ្វើឱ្យគ្រូមើលដើម្បីឱ្យដឹងថាគេពិតជាយល់មេរៀន។
SHAP (SHapley Additive exPlanations)	ជាវិធីសាស្ត្រមួយក្នុង XAI ដែលប្រើដើម្បីគណនាថា តើលក្ខណៈនីមួយៗ (Feature) មានឥទ្ធិពលខ្លាំងប៉ុណ្ណាទៅលើការសម្រេចចិត្តចុងក្រោយរបស់ AI។ វាជួយបំបែកលទ្ធផលដើម្បីឱ្យដឹងថាចំណុចណាជាកត្តាសំខាន់ជាងគេ។	ដូចជាការវាយតម្លៃថា តើកីឡាករបាល់ទាត់ម្នាក់ៗក្នុងក្រុមបានរួមចំណែកប៉ុណ្ណាក្នុងការរកគ្រាប់បាល់ឈ្នះ។
LIME (Local Interpretable Model-agnostic Explanations)	ជាបច្ចេកទេសពន្យល់លទ្ធផល AI សម្រាប់ករណីនីមួយៗដាច់ដោយឡែក។ វាបង្កើតគំរូសាមញ្ញមួយនៅជុំវិញទិន្នន័យជាក់លាក់ណាមួយ ដើម្បីពន្យល់ថាហេតុអ្វីបានជា AI ធ្វើការទស្សន៍ទាយបែបនោះសម្រាប់អ្នកជំងឺម្នាក់នោះ។	ដូចជាការសួរវេជ្ជបណ្ឌិតថា "ហេតុអ្វីបានជាលោកគ្រូដាក់ថ្នាំនេះឱ្យខ្ញុំ?" ហើយគាត់ពន្យល់ពីអាការៈជាក់លាក់របស់អ្នក។
Federated Averaging (FedAvg)	ជាក្បួនដោះស្រាយ (Algorithm) ស្នូលនៃការរៀនសហព័ន្ធ។ វាមានតួនាទីប្រមូលយកការរៀន (Weights) ពីកុំព្យូទ័រនៅតាមមន្ទីរពេទ្យនីមួយៗមកគណនារកមធ្យមភាគ ដើម្បីធ្វើបច្ចុប្បន្នភាពគំរូ AI សកលឱ្យកាន់តែឆ្លាតវៃ។	ដូចជាការប្រមូលយកពិន្ទុសិស្សពីគ្រប់ថ្នាក់មកបូកបញ្ចូលគ្នាដើម្បីរកពិន្ទុមធ្យមភាគនៃសាលារៀនទាំងមូល។
Ischemia	ជាស្ថានភាពជំងឺដែលចរន្តឈាមទៅចិញ្ចឹមសាច់ដុំបេះដូងមានការថយចុះ ឬស្ទះ ដែលបណ្តាលឱ្យកោសិកាបេះដូងខ្វះអុកស៊ីសែន។ នៅក្នុង ECG វាតែងតែបង្ហាញសញ្ញាតាមរយៈការប្រែប្រួលនៃ ST-segment ឬ T-wave។	ដូចជាបំពង់ទឹកដែលត្រូវគេកាច់ ឬស្ទះ ធ្វើឱ្យទឹកហូរទៅស្រោចដំណាំមិនគ្រប់គ្រាន់។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖