Original Title: XAIMed: A Diagnostic Support Tool for Explaining AI Decisions on Medical Images
Source: doi.org/10.5220/0012942000003886
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

XAIMed៖ ឧបករណ៍គាំទ្រការធ្វើរោគវិនិច្ឆ័យសម្រាប់ពន្យល់ពីការសម្រេចចិត្តរបស់បញ្ញាសិប្បនិម្មិត (AI) លើរូបភាពវេជ្ជសាស្ត្រ

ចំណងជើងដើម៖ XAIMed: A Diagnostic Support Tool for Explaining AI Decisions on Medical Images

អ្នកនិពន្ធ៖ Mattia Daole (University of Pisa), Pietro Ducange (University of Pisa), Francesco Marcelloni (University of Pisa), Giustino Claudio Miglionico (University of Pisa), Alessandro Renda (University of Pisa), Alessio Schiavo (University of Pisa & LogObject AG)

ឆ្នាំបោះពុម្ព៖ 2024 (EXPLAINS 2024)

វិស័យសិក្សា៖ Explainable AI, Medical Image Analysis

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ទោះបីជាបណ្តាញសរសៃប្រសាទ (CNNs) បង្ហាញពីភាពត្រឹមត្រូវខ្ពស់ក្នុងការវិភាគរូបភាពវេជ្ជសាស្ត្រក៏ដោយ ប៉ុន្តែភាពស្មុគស្មាញនៃម៉ូដែល (Opaque nature) បានរារាំងដល់ការទទួលយកមកប្រើប្រាស់ក្នុងគ្លីនិក ដែលទាមទារឱ្យមានឧបករណ៍ពន្យល់ AI ដែលវេជ្ជបណ្ឌិតអាចទុកចិត្តបាន។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកនិពន្ធបានអភិវឌ្ឍកម្មវិធីងាយស្រួលប្រើឈ្មោះថា XAIMed ដែលរួមបញ្ចូលវិធីសាស្ត្រពន្យល់ AI ជាច្រើនប្រភេទ ដើម្បីផ្តល់ជារូបភាពបង្ហាញពីមូលហេតុនៃការសម្រេចចិត្តរបស់ម៉ូដែល AI។

Convolutional Neural Networks (CNNs)៖ ប្រើប្រាស់ម៉ូដែល Deep Learning សម្រាប់ធ្វើចំណាត់ថ្នាក់រូបភាពវេជ្ជសាស្ត្រ។
Saliency Maps (ផែនទីរំលេចចំណុចសំខាន់)៖ ប្រើប្រាស់វិធីសាស្ត្រ LIME, RISE, Grad-CAM, និង Grad-CAM++ ដើម្បីរំលេចតំបន់ក្នុងរូបភាពដែលមានឥទ្ធិពលបំផុតលើការសម្រេចចិត្តរបស់ម៉ូដែល។
Cumulative Explanation (ការពន្យល់រួមបញ្ចូលគ្នា)៖ បង្កើតយុទ្ធសាស្ត្របូកសរុបលទ្ធផលពីវិធីសាស្ត្រទាំង៤ខាងលើជាទិដ្ឋភាពតែមួយ ដើម្បីវាស់ស្ទង់កម្រិតនៃការយល់ស្របគ្នា។
Case Study (ករណីសិក្សា)៖ អនុវត្តការធ្វើតេស្តលើសំណុំទិន្នន័យរូបភាពមហារីកសុដន់ (Invasive Ductal Carcinoma) ដើម្បីបង្ហាញពីដំណើរការ និងប្រសិទ្ធភាពរបស់កម្មវិធី។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

XAIMed ផ្តល់នូវចំណុចប្រទាក់ក្រាហ្វិក (GUI) ដ៏វិចារណញាណ ដែលជួយឱ្យវេជ្ជបណ្ឌិតអាចពិនិត្យមើលការព្យាករណ៍ និងកម្រិតទំនុកចិត្តរបស់ AI បានយ៉ាងងាយស្រួល។
ការបង្ហាញការពន្យល់រួមបញ្ចូលគ្នា (Cumulative SM) ជួយឱ្យវេជ្ជបណ្ឌិតផ្តោតការយកចិត្តទុកដាក់លើតំបន់សំខាន់ៗនៃរូបភាព (Macro-regions) ជាជាងព័ត៌មានលម្អិតដែលមិនសូវសំខាន់។
កម្មវិធីនេះត្រូវបានរចនាឡើងជាទម្រង់ម៉ូឌុល (Modular fashion) ដែលជួយសម្រួលដល់ការបន្ថែមភារកិច្ចថ្មី ម៉ូដែលថ្មី និងវិធីសាស្ត្រពន្យល់ AI ថ្មីៗបានយ៉ាងងាយស្រួលនាពេលអនាគត។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
LIME (Local Interpretable Model-agnostic Explanations) វិធីសាស្ត្រពន្យល់ម៉ូដែលមូលដ្ឋានដោយមិនគិតពីប្រភេទម៉ូដែល ដោយប្រើការផ្លាស់ប្តូរទិន្នន័យ (Perturbation-based)	អាចអនុវត្តបានជាមួយគ្រប់ប្រភេទម៉ូដែល (Model-agnostic) និងផ្តល់ការពន្យល់ជាក់លាក់សម្រាប់ការព្យាករណ៍នីមួយៗ។	ត្រូវការការគណនាច្រើននិងប្រើពេលយូរ (អាចចំណាយពេលប៉ុន្មានវិនាទី) និងអាចផ្តល់ផែនទីរំលេចចំណុចសំខាន់ (Saliency Maps) ដែលមិនសូវលម្អិត។	បង្កើត Saliency Maps ដែលត្រូវបានបញ្ចូលទៅក្នុងទិដ្ឋភាពរួម (Cumulative View) នៃកម្មវិធី XAIMed សម្រាប់ការវិភាគរូបភាព។
RISE (Randomized Input Sampling for Explanation) វិធីសាស្ត្របង្កើតផែនទីរំលេចចំណុចសំខាន់ដោយធ្វើការបិទបាំងផ្នែកខ្លះនៃរូបភាពដោយចៃដន្យ	ផ្តល់នូវ Saliency Maps ដែលមានភាពរឹងមាំ និងគ្របដណ្តប់បានល្អលើលក្ខណៈទូទៅនៃរូបភាព។	ស៊ីធនធានកុំព្យូទ័រខ្លាំង (Computationally expensive) ដោយសារត្រូវការបញ្ជូនទិន្នន័យឆ្លងកាត់ម៉ូដែលជាច្រើនដង។	រួមចំណែកក្នុងការពន្យល់បែបម៉ាក្រូ (Macro-perspective) នៅក្នុងកម្មវិធី ដោយទាមទារពេលវេលារង់ចាំបន្តិចបន្តួច។
Grad-CAM / Grad-CAM++ វិធីសាស្ត្រប្រើប្រាស់ជម្រាល (Gradients) នៃបណ្តាញសរសៃប្រសាទកម្រិតជ្រៅ (CNN) ដើម្បីបង្កើតផែនទីរំលេច	ដំណើរការបានលឿនខ្លាំង (ស្ទើរតែភ្លាមៗ) និងមានប្រសិទ្ធភាពខ្ពស់ក្នុងការរំលេចតំបន់ដែលមានអត្ថន័យសំខាន់ៗ (High-level semantics)។	អាចខ្វះព័ត៌មានលម្អិត (Fine-grained details) និងមានកម្រិតក្នុងការប្រើប្រាស់បានតែជាមួយម៉ូដែលប្រភេទ CNN ប៉ុណ្ណោះ។	បង្កើតផែនទីពន្យល់ភ្លាមៗ និងមានប្រសិទ្ធភាពក្នុងការចាប់យករូបភាពវត្ថុច្រើន (Grad-CAM++)។
Cumulative Saliency Map ផែនទីរំលេចចំណុចសំខាន់រួមបញ្ចូលគ្នា (វិធីសាស្ត្រស្នើឡើងក្នុងកម្មវិធី XAIMed)	ផ្តល់នូវទិដ្ឋភាពរួមនិងងាយយល់ ដោយបង្ហាញពីកម្រិតនៃការយល់ស្របគ្នារវាងវិធីសាស្ត្រពន្យល់ (XAI) ទាំង៤។	អាចបាត់បង់ព័ត៌មានលម្អិតតូចៗមួយចំនួន ដោយសារការបែងចែកជារូបក្រឡាចត្រង្គ (Grid partitioning) ទំហំ 3x3 ។	ជួយសម្រួលដល់ការផ្តោតអារម្មណ៍របស់វេជ្ជបណ្ឌិតទៅលើតំបន់ម៉ាក្រូនៃរូបភាពដែលម៉ូដែលគិតថាសំខាន់បំផុត។

ការចំណាយលើធនធាន (Resource Cost)៖ ការដំណើរការកម្មវិធី XAIMed ទាមទារធនធានកុំព្យូទ័រក្នុងកម្រិតមធ្យមទៅខ្ពស់ អាស្រ័យលើវិធីសាស្ត្រពន្យល់ AI ដែលបានជ្រើសរើស (ជាពិសេស LIME និង RISE ដែលស៊ីធនធានគណនាច្រើន)។

Hardware: ត្រូវការកុំព្យូទ័រដែលមានអង្គគណនាដាច់ដោយឡែក (GPU) ដើម្បីធានាបាននូវការទាញយកការពន្យល់បានលឿន និងដំណើរការម៉ូដែល Deep Learning ដោយរលូន។
Software: ប្រើប្រាស់បរិស្ថាន Python ជាមួយនឹងបណ្ណាល័យ PyTorch (ទាមទារឯកសារ weights.pt និង architecture.py) រួមទាំងប្រព័ន្ធចំណុចប្រទាក់ក្រាហ្វិក (GUI) សម្រាប់ Desktop។
Dataset: ត្រូវការរូបភាពវេជ្ជសាស្ត្រដែលបានរៀបចំរួចរាល់ ដូចជាសំណុំទិន្នន័យ Breast Histopathology Images (រូបភាពទំហំ 50x50 ភីកសែល)។
Expertise: ទាមទារអ្នកបច្ចេកទេស (Technical User) ដើម្បីរៀបចំរចនាសម្ព័ន្ធ Folder និងម៉ូដែល ព្រមទាំងវេជ្ជបណ្ឌិត (Physician User) ដើម្បីវិភាគលទ្ធផល។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យរូបភាព Breast Histopathology ដែលទាញចេញពីសំណាកអ្នកជំងឺមហារីកសុដន់ចំនួន ១៦២នាក់ (ភាគច្រើនទំនងជានៅលោកខាងលិច) ហើយទិន្នន័យមានភាពអតុល្យភាព (Unbalanced dataset)។ សម្រាប់ប្រទេសកម្ពុជា ការយកម៉ូដែលនេះមកប្រើប្រាស់ទាមទារឱ្យមានការបង្ហាត់បន្ថែម (Fine-tuning) លើទិន្នន័យពិតរបស់អ្នកជំងឺក្នុងស្រុក ដើម្បីជៀសវាងភាពលម្អៀងផ្នែកហ្សែន និងធានាបាននូវភាពត្រឹមត្រូវខ្ពស់។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

កម្មវិធី XAIMed មានសក្តានុពលខ្ពស់និងអាចអនុវត្តបានយ៉ាងល្អនៅក្នុងវិស័យសុខាភិបាលកម្ពុជា ជាពិសេសក្នុងការប្រើប្រាស់ AI ដើម្បីគាំទ្រការធ្វើរោគវិនិច្ឆ័យ។

មន្ទីរពេទ្យថ្នាក់ជាតិ (ឧ. មន្ទីរពេទ្យកាល់ម៉ែត): អាចប្រើប្រាស់កម្មវិធីនេះដើម្បីជួយវេជ្ជបណ្ឌិតផ្នែករោគវិទ្យា (Pathology) ក្នុងការវិភាគរូបភាពកាំរស្មីអ៊ិច ឬ MRI ឱ្យបានកាន់តែលឿននិងមានទំនុកចិត្តខ្ពស់តាមរយៈការពន្យល់របស់ AI។
ការបណ្តុះបណ្តាលនៅសាកលវិទ្យាល័យវិទ្យាសាស្ត្រសុខាភិបាល (UHS): អាចបញ្ចូលកម្មវិធីនេះជាឧបករណ៍សិក្សា ដើម្បីឱ្យនិស្សិតពេទ្យបានយល់ដឹងពីបច្ចេកវិទ្យា AI ជំនាន់ថ្មី និងរបៀបដែល AI កំណត់ចំណុចកោសិកាមហារីក។
មន្ទីរពេទ្យបង្អែកតាមបណ្តាខេត្ត: អាចប្រើប្រាស់ជាឧបករណ៍ជំនួយការសម្រេចចិត្តទីពីរ (Second opinion tool) នៅតាមតំបន់ដែលខ្វះខាតវេជ្ជបណ្ឌិតឯកទេសកម្រិតខ្ពស់ ដោយមានការផ្ទៀងផ្ទាត់ហេតុផលច្បាស់លាស់។

ជារួម ការរួមបញ្ចូលបច្ចេកវិទ្យា Explainable AI (XAI) គឺជាកត្តាគន្លឹះក្នុងការកសាងទំនុកចិត្តរវាងវេជ្ជបណ្ឌិតកម្ពុជា និងប្រព័ន្ធបញ្ញាសិប្បនិម្មិតទំនើបៗ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះនៃ CNNs: រៀនពីរបៀបស្ថាបនាម៉ូដែល Convolutional Neural Networks (CNNs) សម្រាប់ធ្វើចំណាត់ថ្នាក់រូបភាពវេជ្ជសាស្ត្រដោយប្រើប្រាស់ PyTorch តាមរយៈឯកសាររៀនសូត្រពី Fast.ai ឬ Coursera។
ស្វែងយល់ និងអនុវត្តបច្ចេកវិទ្យា XAI: សិក្សាពីរបៀបទាញយក Saliency Maps ដោយប្រើបណ្ណាល័យ Captum សម្រាប់ Grad-CAM និងកូដបើកចំហររបស់ LIME ដើម្បីពន្យល់ពីការសម្រេចចិត្តរបស់ម៉ូដែល។
អភិវឌ្ឍចំណុចប្រទាក់ក្រាហ្វិក (GUI): បង្កើតកម្មវិធី Desktop ឬ Web App ងាយស្រួលប្រើសម្រាប់វេជ្ជបណ្ឌិត ដោយប្រើប្រាស់ Streamlit ឬ PyQt ដើម្បីបង្ហាញទិន្នន័យរូបភាព និង Saliency Maps ទន្ទឹមគ្នា។
សាកល្បងជាមួយទិន្នន័យវេជ្ជសាស្ត្រសាធារណៈ: ទាញយកសំណុំទិន្នន័យរូបភាពមហារីកសុដន់ (Invasive Ductal Carcinoma) ពីវេទិកា Kaggle មកសាកល្បងបង្ហាត់ និងសាកល្បងយន្តការការពន្យល់រួមបញ្ចូលគ្នា (Cumulative Explanation)។
សហការ និងធ្វើតេស្តក្នុងបរិស្ថានគ្លីនិក: យកគំរូកម្មវិធីទៅសាកល្បងដោយផ្ទាល់ជាមួយនិស្សិតពេទ្យ ឬវេជ្ជបណ្ឌិតកម្ពុជា ដើម្បីវាយតម្លៃលើភាពងាយស្រួល (Usability) និងកែលម្អប្រព័ន្ធតាមមតិត្រឡប់របស់ពួកគេ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Explainable AI (XAI)	ជាផ្នែកមួយនៃបញ្ញាសិប្បនិម្មិតដែលផ្តោតលើការបង្កើតឧបករណ៍ឬបច្ចេកទេស ដើម្បីពន្យល់ពីដំណើរការនៃការសម្រេចចិត្តរបស់ម៉ូដែលកុំព្យូទ័រទៅកាន់មនុស្ស ធ្វើយ៉ាងណាឱ្យវេជ្ជបណ្ឌិតអាចយល់ ជឿទុកចិត្ត និងផ្ទៀងផ្ទាត់ហេតុផលរបស់ AI បាន។	ដូចជាការដែលសិស្សមិនត្រឹមតែប្រាប់ចម្លើយគណិតវិទ្យាដល់គ្រូប៉ុណ្ណោះទេ តែត្រូវបង្ហាញវិធីសាស្រ្តដោះស្រាយមួយជំហានម្តងៗ ដើម្បីឱ្យគ្រូជឿជាក់ថាគេពិតជាចេះមែន។
Convolutional Neural Networks (CNNs)	ជាប្រភេទបណ្តាញសរសៃប្រសាទកម្រិតជ្រៅ (Deep Learning) ដែលពូកែខាងវិភាគរូបភាពវេជ្ជសាស្ត្រ ដោយប្រើប្រាស់តម្រង (Filters) ជាច្រើនស្រទាប់ ដើម្បីទាញយកលក្ខណៈសម្បត្តិដូចជា គែម ទ្រង់ទ្រាយ និងរចនាសម្ព័ន្ធកោសិកាដោយស្វ័យប្រវត្តិ។	ដូចជាអ្នកជំនាញដែលមើលផ្ទាំងគំនូរ ដោយដំបូងផ្តោតលើបន្ទាត់និងពណ៌ បន្ទាប់មកផ្គុំវាបញ្ចូលគ្នាដើម្បីមើលឱ្យដឹងថារូបនោះជារូបអ្វី។
Saliency Maps	ជាផែនទីរូបភាពដែលប្រើពណ៌ (ឧទាហរណ៍ កន្លែងក្រហមខ្លាំង) ដើម្បីរំលេចបង្ហាញពីតំបន់ជាក់លាក់ណាមួយលើរូបភាពដើម ដែលមានឥទ្ធិពលខ្លាំងជាងគេបំផុតក្នុងការធ្វើឱ្យម៉ូដែល AI សម្រេចចិត្តទាយលទ្ធផលរោគវិនិច្ឆ័យ។	ដូចជាការប្រើប៊ិចហ្វឺតពណ៌ (Highlighter) គូសបញ្ជាក់លើពាក្យសំខាន់ៗនៅក្នុងសៀវភៅ ដើម្បីប្រាប់ថាហេតុអ្វីបានជាអ្នកសន្និដ្ឋានអត្ថន័យនៃអត្ថបទនោះ។
LIME	ជាវិធីសាស្រ្តពន្យល់ AI ដែលធ្វើការបិទបាំងឬផ្លាស់ប្តូរផ្នែកខ្លះនៃរូបភាពដោយចៃដន្យ រួចមើលថាតើម៉ូដែលនឹងផ្លាស់ប្តូរការទស្សន៍ទាយរបស់វាឬទេ ប្រសិនបើផ្លាស់ប្តូរ នោះបញ្ជាក់ថាផ្នែកដែលបានបិទបាំងនោះពិតជាសំខាន់ខ្លាំងណាស់។	ដូចជាការយកដៃបិទភ្នែក មាត់ ឬច្រមុះរបស់រូបថតម្នាក់ម្តងៗ ដើម្បីដឹងថាតើចំណុចមួយណាដែលធ្វើឱ្យយើងចំណាំថាគាត់ជានរណា។
Grad-CAM	ជាវិធីសាស្ត្រគណនាជម្រាល (Gradients) នៅស្រទាប់ចុងក្រោយនៃបណ្តាញ CNN ដើម្បីតាមដានថាតើព័ត៌មានរូបភាពមួយណាមានទម្ងន់ធ្ងន់ជាងគេ ក្នុងការកំណត់ថារូបភាពនោះមានផ្ទុកកោសិកាមហារីកឬអត់។	ដូចជាការតាមដានដានជើងរបស់សត្វនៅក្នុងព្រៃ ដើម្បីស្វែងរកទីតាំងសម្បុករបស់វាយ៉ាងច្បាស់លាស់។
Superpixels	ជាការប្រមូលផ្តុំភីកសែល (Pixels) តូចៗដែលនៅក្បែរគ្នា និងមានពណ៌ឬកម្រិតពន្លឺស្រដៀងគ្នា ទៅជាប្លុកធំមួយ ដើម្បីងាយស្រួលដល់ម៉ូដែលក្នុងការកែប្រែនិងវិភាគ ដោយបន្ថយភាពស្មុគស្មាញនៃការគណនាភីកសែលម្តងមួយៗ។	ដូចជាការផ្គុំបំណែករូបភាព (Jigsaw puzzle) ដែលមានពណ៌ដូចគ្នាចូលគ្នាជាដុំៗ មុននឹងមើលជារូបរាងធំ។
Invasive Ductal Carcinoma (IDC)	ជាប្រភេទជំងឺមហារីកសុដន់ទូទៅបំផុត ដែលកោសិកាមហារីកកកើតឡើងនៅបំពង់ទឹកដោះ រួចរាលដាលជ្រៀតចូលទៅក្នុងជាលិកាសុដន់ជុំវិញ ដែលជាបញ្ហាវេជ្ជសាស្ត្រត្រូវបានលើកយកមកធ្វើតេស្តសាកល្បងដោយ AI ក្នុងឯកសារនេះ។	ដូចជាស្មៅអាក្រក់ដែលដុះចេញពីបំពង់ទឹក រួចចាប់ផ្តើមចាក់ឫសរាលដាលទៅបំផ្លាញដីសួនច្បារដែលនៅក្បែរៗនោះ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖