Original Title: A NOVEL EXPLAINABLE AI MODEL FOR MEDICAL DATA ANALYSIS
Source: doi.org/10.2478/jaiscr-2024-0007
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

គំរូបញ្ញាសិប្បនិម្មិតដែលអាចពន្យល់បានថ្មីមួយសម្រាប់ការវិភាគទិន្នន័យវេជ្ជសាស្ត្រ

ចំណងជើងដើម៖ A NOVEL EXPLAINABLE AI MODEL FOR MEDICAL DATA ANALYSIS

អ្នកនិពន្ធ៖ Nataliya Shakhovska (Lviv Polytechnic National University), Andrii Shebeko (Lviv Polytechnic National University), Yarema Prykarpatskyy (University of Agriculture in Krakow)

ឆ្នាំបោះពុម្ព៖ 2024, JAISCR

វិស័យសិក្សា៖ Artificial Intelligence in Medicine

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ បញ្ហាចម្បងគឺបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត (Deep Neural Networks) ដែលប្រើប្រាស់ក្នុងការវិភាគទិន្នន័យវេជ្ជសាស្ត្រមានលក្ខណៈជា 'ប្រអប់ខ្មៅ' (Black-box) ដែលធ្វើឱ្យគ្រូពេទ្យពិបាកយល់ពីមូលហេតុ និងភាពជឿជាក់នៃការសម្រេចចិត្តរបស់ម៉ូដែលទាំងនេះ។

វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះស្នើឡើងនូវប្រព័ន្ធកូនកាត់ (Hybrid system) ដែលរួមបញ្ចូលបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតជាមួយនឹងវិធីសាស្ត្របកស្រាយបាន ដើម្បីវិភាគរូបភាព MRI។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Proposed Approach (MRNet + SHAP + CAM)
គំរូស្នើឡើង (ការរួមបញ្ចូលបណ្ដាញ CNN ជាមួយវិធីសាស្ត្រពន្យល់ SHAP និង CAM)
មានតម្លាភាពខ្ពស់ អាចប្រាប់ពីមូលហេតុនៃការសម្រេចចិត្ត និងអាចបង្ហាញទីតាំងជំងឺច្បាស់លាស់។ មានអត្រាភាពត្រឹមត្រូវខ្ពស់ជាងម៉ូដែលទូទៅជាច្រើន។ ត្រូវការធនធានគណនាច្រើនបន្តិចក្នុងការទាញយកការពន្យល់ (SHAP values) ទោះបីជាមានការធ្វើឲ្យប្រសើរឡើងនូវល្បឿនក៏ដោយ។ ទទួលបានតម្លៃ AUC ខ្ពស់បំផុតរហូតដល់ 0.956 សម្រាប់ការវិភាគ ACL លើប្លង់ Coronal និង 0.936 លើប្លង់ Sagittal។
VGG-16
បណ្ដាញសរសៃប្រសាទ VGG-16
មានសមត្ថភាពខ្ពស់ក្នុងការទាញយកលក្ខណៈពិសេសពីរូបភាព និងមានភាពត្រឹមត្រូវគួរកត់សម្គាល់ក្នុងករណីខ្លះ។ ដំណើរការជាប្រអប់ខ្មៅ (Black-box) ដែលមិនអាចពន្យល់ពីមូលហេតុនៃការសម្រេចចិត្តបាន ធ្វើឲ្យគ្រូពេទ្យពិបាកទុកចិត្ត។ ទទួលបានតម្លៃ AUC 0.919 លើប្លង់ Axial សម្រាប់ភាពមិនប្រក្រតីទូទៅ ប៉ុន្តែអត្រាផ្សេងទៀតនៅទាបជាងគំរូស្នើឡើង។
AlexNet
បណ្ដាញសរសៃប្រសាទ AlexNet
ងាយស្រួលប្រើប្រាស់ជាម៉ូដែលមូលដ្ឋាន (Baseline) និងដើរលឿនដោយសារមានទំហំតូចជាងបណ្ដាញជ្រៅៗដទៃ។ អត្រាភាពត្រឹមត្រូវនៅមានកម្រិតទាបខ្លាំងបើប្រៀបធៀបទៅនឹងបណ្ដាញទំនើបជាង និងគ្មានមុខងារពន្យល់បកស្រាយ។ ទទួលបានតម្លៃ AUC ត្រឹមតែ 0.616 ប៉ុណ្ណោះសម្រាប់ការវិភាគ ACL លើប្លង់ Coronal។

ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះទាមទារធនធានកុំព្យូទ័រដែលមានសមត្ថភាពខ្ពស់ (GPU) សម្រាប់ដំណើរការបណ្ដុះបណ្ដាលម៉ូដែលកម្រិតជ្រៅ និងការគណនាទិន្នន័យដើម្បីបង្កើតការពន្យល់។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការស្រាវជ្រាវនេះប្រើប្រាស់ទិន្នន័យ (MRNet) ដែលប្រមូលពីមជ្ឈមណ្ឌលវេជ្ជសាស្ត្រនៃសាកលវិទ្យាល័យ Stanford សហរដ្ឋអាមេរិក។ លក្ខណៈជីវសាស្ត្រ (Demographics) របស់អ្នកជំងឺ និងបច្ចេកវិទ្យាម៉ាស៊ីនថត MRI អាចមានភាពខុសគ្នាពីប្រជាជនកម្ពុជា។ នេះទាមទារឲ្យមានការសាកល្បង និងបង្វឹកម៉ូដែលឡើងវិញជាមួយទិន្នន័យក្នុងស្រុក ដើម្បីបញ្ៀសភាពលម្អៀង (Bias) មុននឹងដាក់ឲ្យប្រើប្រាស់ជាក់ស្តែង។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្របញ្ញាសិប្បនិម្មិតដែលអាចពន្យល់បាន (Explainable AI) នេះមានសារៈសំខាន់ណាស់ក្នុងការគាំទ្រការសម្រេចចិត្តរបស់គ្រូពេទ្យនៅកម្ពុជាឱ្យកាន់តែមានទំនុកចិត្ត។

បច្ចេកវិទ្យានេះមានសក្តានុពលខ្ពស់ក្នុងការលើកកម្ពស់គុណភាពរោគវិនិច្ឆ័យនៅកម្ពុជា ប្រសិនបើត្រូវបានយកមកអភិវឌ្ឍបន្ថែមជាមួយទិន្នន័យក្នុងស្រុក និងការបណ្តុះបណ្តាលគ្រូពេទ្យឱ្យចេះប្រើប្រាស់។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃបណ្ដាញសរសៃប្រសាទកម្រិតជ្រៅ (Deep Learning): ចាប់ផ្តើមអនុវត្តការសរសេរកូដដើម្បីទាញយកលក្ខណៈពីរូបភាពវេជ្ជសាស្ត្រ ដោយប្រើប្រាស់ PyTorch framework និងការបង្វឹកម៉ូដែល (Fine-tuning) លើបណ្ដាញដូចជា AlexNet ឬ ResNet។
  2. ស្វែងយល់ និងអនុវត្តបច្ចេកទេស Explainable AI (XAI): សិក្សាពីរបៀបប្រើប្រាស់បណ្ណាល័យ SHAP និង CAM ដោយផ្តោតលើ GradientExplainer ដើម្បីវាយតម្លៃពីឥទ្ធិពលនៃភីកសែល (Pixels) នីមួយៗទៅលើការទស្សន៍ទាយរបស់ម៉ូដែល។
  3. ប្រមូល និងរៀបចំទិន្នន័យរូបភាពវេជ្ជសាស្ត្រ: ទាញយកកញ្ចប់ទិន្នន័យជាសាធារណៈដូចជា MRNet Dataset រួចប្រើប្រាស់ OpenCV សម្រាប់សម្អាត ទាញយក និងរៀបចំរូបភាព MRI តាមប្លង់នីមួយៗ (Axial, Coronal, Sagittal)។
  4. បង្វឹកម៉ូដែលនៅលើបរិស្ថាន Cloud ផ្ទាល់: រៀបចំការសរសេរកូដ (Notebook) និងបង្វឹកម៉ូដែលខាងលើតាមរយៈ Google Colab ដោយទាញយកអត្ថប្រយោជន៍ពីការប្រើប្រាស់ GPU ឥតគិតថ្លៃដើម្បីកាត់បន្ថយពេលវេលាគណនា។
  5. អភិវឌ្ឍចំណុចប្រទាក់សម្រាប់អ្នកប្រើប្រាស់ (User Interface): សាងសង់កម្មវិធីខ្នាតតូចតាមទម្រង់ Client-Server ដោយប្រើ FastAPI ឬ Streamlit ដើម្បីឲ្យអ្នកប្រើប្រាស់អាចបញ្ចូលរូបភាព MRI ហើយប្រព័ន្ធនឹងបង្ហាញលទ្ធផលទស្សន៍ទាយអមដោយផែនទីកម្ដៅ (Heatmaps) ជាការបកស្រាយ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Explainable AI (XAI) បច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិតដែលមិនត្រឹមតែផ្តល់លទ្ធផលវិភាគប៉ុណ្ណោះទេ ថែមទាំងអាចពន្យល់បកស្រាយពីមូលហេតុ និងដំណើរការនៃការសម្រេចចិត្តរបស់វា ដើម្បីឱ្យមនុស្ស (ជាពិសេសគ្រូពេទ្យ) ងាយយល់ ងាយស្រាវជ្រាវកំហុស និងអាចជឿទុកចិត្តបានក្នុងការប្រើប្រាស់ក្នុងគ្លីនិក។ ដូចជាសិស្សដែលមិនត្រឹមតែឆ្លើយត្រូវនូវលំហាត់គណិតវិទ្យា ប៉ុន្តែថែមទាំងអាចបង្ហាញប្រាប់ពីរបៀបគណនាមួយជំហានម្តងៗប្រាប់គ្រូ។
Convolutional Neural Networks (CNNs) ប្រភេទនៃបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតជ្រៅ (Deep Learning) ដែលត្រូវបានរចនាឡើងយ៉ាងពិសេសសម្រាប់វិភាគ និងទាញយកលក្ខណៈសម្គាល់ពីរូបភាពវេជ្ជសាស្ត្រ ដោយស្កេនមើលផ្នែកតូចៗនៃរូបភាពម្តងមួយៗដើម្បីស្វែងរកទម្រង់នៃជំងឺដែលភ្នែកមនុស្សពិបាកមើលឃើញ។ ដូចជាមនុស្សដែលប្រើកែវពង្រីកដើរឆ្លុះមើលផ្ទាំងគំនូរធំមួយ ដោយពិនិត្យមើលចំណុចតូចៗម្តងមួយៗដើម្បីយល់ពីអត្ថន័យនៃគំនូរទាំងមូល។
SHAP (SHapley Additive exPlanations) វិធីសាស្ត្រគណិតវិទ្យាផ្អែកលើទ្រឹស្តីល្បែង (Game Theory) ដែលវាស់ស្ទង់ និងបែងចែកពិន្ទុឥទ្ធិពលទៅឱ្យទិន្នន័យនីមួយៗ (ដូចជាភីកសែលនីមួយៗលើរូបភាព) ដើម្បីបង្ហាញថាចំណុចណាខ្លះដែលជំរុញយ៉ាងខ្លាំងឱ្យម៉ូដែលទស្សន៍ទាយចេញលទ្ធផលបែបនោះ។ ដូចជាការវាយតម្លៃថាកីឡាករម្នាក់ៗនៅក្នុងក្រុមបាល់ទាត់ មានចំណែកជួយប៉ុន្មានភាគរយក្នុងការធ្វើឱ្យក្រុមទទួលបានជ័យជម្នះ។
Class Activation Mapping (CAM) បច្ចេកទេសបង្កើត 'ផែនទីកម្ដៅ' (Heatmap) ដែលគ្របពីលើរូបភាពដើម ដើម្បីរំលេចពណ៌បង្ហាញពីតំបន់ជាក់លាក់ណាមួយ (ដូចជាដំបៅ ឬការរហែកសរសៃ) ដែលបណ្ដាញកុំព្យូទ័របានផ្ដោតការយកចិត្តទុកដាក់ខ្លាំងបំផុតក្នុងការធ្វើរោគវិនិច្ឆ័យ។ ដូចជាការប្រើប្រាស់ប៊ិចហ្វឺតពណ៌លឿង (Highlighter) គូសបញ្ជាក់លើពាក្យសំខាន់ៗនៅក្នុងសៀវភៅ ដើម្បីប្រាប់អ្នកដទៃថាចំណុចនេះហើយដែលសំខាន់ជាងគេ។
Transfer Learning ការយកម៉ូដែលបញ្ញាសិប្បនិម្មិតដែលត្រូវបានបង្វឹកឲ្យចេះរៀនពីទិន្នន័យរូបភាពរាប់លានរួចមកហើយ (Pre-trained model ដូចជា AlexNet) មកបន្តបង្ហាត់បន្ថែមលើកិច្ចការថ្មីមួយទៀត (ដូចជាការមើលរូបភាពសន្លាក់ជង្គង់ MRI) ដើម្បីចំណេញពេលវេលា និងទទួលបានលទ្ធផលល្អលឿនជាងការចាប់ផ្តើមបង្វឹកពីសូន្យ។ ដូចជាការយកចុងភៅដែលពូកែធ្វើម្ហូបអឺរ៉ុបរួចទៅហើយ មកបង្ហាត់បន្ថែមបន្តិចបន្តួចឱ្យចេះធ្វើម្ហូបខ្មែរ ដោយមិនបាច់បង្រៀនពីរបៀបកាន់កាំបិតឡើងវិញ។
Logistic Regression វិធីសាស្ត្រស្ថិតិដែលត្រូវបានប្រើប្រាស់នៅក្នុងដំណាក់កាលចុងក្រោយនៃប្រព័ន្ធនេះ ដើម្បីប្រមូលផ្តុំលទ្ធផលវិភាគដែលបានមកពីបណ្ដាញ CNN លើប្លង់រូបភាពទាំង៣ទិសដៅ រួចធ្វើការគណនារកប្រូបាប៊ីលីតេ (ភាគរយ) នៃការកើតមានជំងឺជាការសម្រេចចិត្តចុងក្រោយ។ ដូចជាចៅក្រមដែលស្តាប់សេចក្តីសន្និដ្ឋានពីមេធាវីទាំង៣រូប រួចថ្លឹងថ្លែងរកហេតុផលរួមមួយដើម្បីកាត់ក្តីថាជនជាប់ចោទមានទោស ឬមិនមានទោស។
AUC-ROC score រង្វាស់ស្តង់ដារដែលប្រើសម្រាប់វាយតម្លៃសមត្ថភាពរបស់ម៉ូដែលចំណាត់ថ្នាក់ (Classification Model) ដោយវាស់ស្ទង់ថាតើម៉ូដែលនោះមានភាពសុក្រឹតកម្រិតណា ក្នុងការបែងចែកឱ្យបានត្រឹមត្រូវរវាងអ្នកដែលមានជំងឺ និងអ្នកដែលគ្មានជំងឺ ក្រោមលក្ខខណ្ឌវិនិច្ឆ័យផ្សេងៗគ្នា។ ដូចជាពិន្ទុប្រឡងសញ្ញាបត្រប្រចាំឆ្នាំ ដែលជួយបញ្ជាក់ថាវិទ្យាល័យមួយមានសមត្ថភាពបណ្តុះបណ្តាលសិស្សបានពូកែកម្រិតណាបើធៀបនឹងវិទ្យាល័យដទៃ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖