Original Title: XAIMed: A Diagnostic Support Tool for Explaining AI Decisions on Medical Images
Source: doi.org/10.5220/0012942000003886
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

XAIMed៖ ឧបករណ៍គាំទ្រការធ្វើរោគវិនិច្ឆ័យសម្រាប់ពន្យល់ពីការសម្រេចចិត្តរបស់បញ្ញាសិប្បនិម្មិត (AI) លើរូបភាពវេជ្ជសាស្ត្រ

ចំណងជើងដើម៖ XAIMed: A Diagnostic Support Tool for Explaining AI Decisions on Medical Images

អ្នកនិពន្ធ៖ Mattia Daole (University of Pisa), Pietro Ducange (University of Pisa), Francesco Marcelloni (University of Pisa), Giustino Claudio Miglionico (University of Pisa), Alessandro Renda (University of Pisa), Alessio Schiavo (University of Pisa & LogObject AG)

ឆ្នាំបោះពុម្ព៖ 2024 (EXPLAINS 2024)

វិស័យសិក្សា៖ Explainable AI, Medical Image Analysis

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ទោះបីជាបណ្តាញសរសៃប្រសាទ (CNNs) បង្ហាញពីភាពត្រឹមត្រូវខ្ពស់ក្នុងការវិភាគរូបភាពវេជ្ជសាស្ត្រក៏ដោយ ប៉ុន្តែភាពស្មុគស្មាញនៃម៉ូដែល (Opaque nature) បានរារាំងដល់ការទទួលយកមកប្រើប្រាស់ក្នុងគ្លីនិក ដែលទាមទារឱ្យមានឧបករណ៍ពន្យល់ AI ដែលវេជ្ជបណ្ឌិតអាចទុកចិត្តបាន។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកនិពន្ធបានអភិវឌ្ឍកម្មវិធីងាយស្រួលប្រើឈ្មោះថា XAIMed ដែលរួមបញ្ចូលវិធីសាស្ត្រពន្យល់ AI ជាច្រើនប្រភេទ ដើម្បីផ្តល់ជារូបភាពបង្ហាញពីមូលហេតុនៃការសម្រេចចិត្តរបស់ម៉ូដែល AI។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
LIME (Local Interpretable Model-agnostic Explanations)
វិធីសាស្ត្រពន្យល់ម៉ូដែលមូលដ្ឋានដោយមិនគិតពីប្រភេទម៉ូដែល ដោយប្រើការផ្លាស់ប្តូរទិន្នន័យ (Perturbation-based)
អាចអនុវត្តបានជាមួយគ្រប់ប្រភេទម៉ូដែល (Model-agnostic) និងផ្តល់ការពន្យល់ជាក់លាក់សម្រាប់ការព្យាករណ៍នីមួយៗ។ ត្រូវការការគណនាច្រើននិងប្រើពេលយូរ (អាចចំណាយពេលប៉ុន្មានវិនាទី) និងអាចផ្តល់ផែនទីរំលេចចំណុចសំខាន់ (Saliency Maps) ដែលមិនសូវលម្អិត។ បង្កើត Saliency Maps ដែលត្រូវបានបញ្ចូលទៅក្នុងទិដ្ឋភាពរួម (Cumulative View) នៃកម្មវិធី XAIMed សម្រាប់ការវិភាគរូបភាព។
RISE (Randomized Input Sampling for Explanation)
វិធីសាស្ត្របង្កើតផែនទីរំលេចចំណុចសំខាន់ដោយធ្វើការបិទបាំងផ្នែកខ្លះនៃរូបភាពដោយចៃដន្យ
ផ្តល់នូវ Saliency Maps ដែលមានភាពរឹងមាំ និងគ្របដណ្តប់បានល្អលើលក្ខណៈទូទៅនៃរូបភាព។ ស៊ីធនធានកុំព្យូទ័រខ្លាំង (Computationally expensive) ដោយសារត្រូវការបញ្ជូនទិន្នន័យឆ្លងកាត់ម៉ូដែលជាច្រើនដង។ រួមចំណែកក្នុងការពន្យល់បែបម៉ាក្រូ (Macro-perspective) នៅក្នុងកម្មវិធី ដោយទាមទារពេលវេលារង់ចាំបន្តិចបន្តួច។
Grad-CAM / Grad-CAM++
វិធីសាស្ត្រប្រើប្រាស់ជម្រាល (Gradients) នៃបណ្តាញសរសៃប្រសាទកម្រិតជ្រៅ (CNN) ដើម្បីបង្កើតផែនទីរំលេច
ដំណើរការបានលឿនខ្លាំង (ស្ទើរតែភ្លាមៗ) និងមានប្រសិទ្ធភាពខ្ពស់ក្នុងការរំលេចតំបន់ដែលមានអត្ថន័យសំខាន់ៗ (High-level semantics)។ អាចខ្វះព័ត៌មានលម្អិត (Fine-grained details) និងមានកម្រិតក្នុងការប្រើប្រាស់បានតែជាមួយម៉ូដែលប្រភេទ CNN ប៉ុណ្ណោះ។ បង្កើតផែនទីពន្យល់ភ្លាមៗ និងមានប្រសិទ្ធភាពក្នុងការចាប់យករូបភាពវត្ថុច្រើន (Grad-CAM++)។
Cumulative Saliency Map
ផែនទីរំលេចចំណុចសំខាន់រួមបញ្ចូលគ្នា (វិធីសាស្ត្រស្នើឡើងក្នុងកម្មវិធី XAIMed)
ផ្តល់នូវទិដ្ឋភាពរួមនិងងាយយល់ ដោយបង្ហាញពីកម្រិតនៃការយល់ស្របគ្នារវាងវិធីសាស្ត្រពន្យល់ (XAI) ទាំង៤។ អាចបាត់បង់ព័ត៌មានលម្អិតតូចៗមួយចំនួន ដោយសារការបែងចែកជារូបក្រឡាចត្រង្គ (Grid partitioning) ទំហំ 3x3 ។ ជួយសម្រួលដល់ការផ្តោតអារម្មណ៍របស់វេជ្ជបណ្ឌិតទៅលើតំបន់ម៉ាក្រូនៃរូបភាពដែលម៉ូដែលគិតថាសំខាន់បំផុត។

ការចំណាយលើធនធាន (Resource Cost)៖ ការដំណើរការកម្មវិធី XAIMed ទាមទារធនធានកុំព្យូទ័រក្នុងកម្រិតមធ្យមទៅខ្ពស់ អាស្រ័យលើវិធីសាស្ត្រពន្យល់ AI ដែលបានជ្រើសរើស (ជាពិសេស LIME និង RISE ដែលស៊ីធនធានគណនាច្រើន)។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យរូបភាព Breast Histopathology ដែលទាញចេញពីសំណាកអ្នកជំងឺមហារីកសុដន់ចំនួន ១៦២នាក់ (ភាគច្រើនទំនងជានៅលោកខាងលិច) ហើយទិន្នន័យមានភាពអតុល្យភាព (Unbalanced dataset)។ សម្រាប់ប្រទេសកម្ពុជា ការយកម៉ូដែលនេះមកប្រើប្រាស់ទាមទារឱ្យមានការបង្ហាត់បន្ថែម (Fine-tuning) លើទិន្នន័យពិតរបស់អ្នកជំងឺក្នុងស្រុក ដើម្បីជៀសវាងភាពលម្អៀងផ្នែកហ្សែន និងធានាបាននូវភាពត្រឹមត្រូវខ្ពស់។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

កម្មវិធី XAIMed មានសក្តានុពលខ្ពស់និងអាចអនុវត្តបានយ៉ាងល្អនៅក្នុងវិស័យសុខាភិបាលកម្ពុជា ជាពិសេសក្នុងការប្រើប្រាស់ AI ដើម្បីគាំទ្រការធ្វើរោគវិនិច្ឆ័យ។

ជារួម ការរួមបញ្ចូលបច្ចេកវិទ្យា Explainable AI (XAI) គឺជាកត្តាគន្លឹះក្នុងការកសាងទំនុកចិត្តរវាងវេជ្ជបណ្ឌិតកម្ពុជា និងប្រព័ន្ធបញ្ញាសិប្បនិម្មិតទំនើបៗ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃ CNNs: រៀនពីរបៀបស្ថាបនាម៉ូដែល Convolutional Neural Networks (CNNs) សម្រាប់ធ្វើចំណាត់ថ្នាក់រូបភាពវេជ្ជសាស្ត្រដោយប្រើប្រាស់ PyTorch តាមរយៈឯកសាររៀនសូត្រពី Fast.aiCoursera
  2. ស្វែងយល់ និងអនុវត្តបច្ចេកវិទ្យា XAI: សិក្សាពីរបៀបទាញយក Saliency Maps ដោយប្រើបណ្ណាល័យ Captum សម្រាប់ Grad-CAM និងកូដបើកចំហររបស់ LIME ដើម្បីពន្យល់ពីការសម្រេចចិត្តរបស់ម៉ូដែល។
  3. អភិវឌ្ឍចំណុចប្រទាក់ក្រាហ្វិក (GUI): បង្កើតកម្មវិធី Desktop ឬ Web App ងាយស្រួលប្រើសម្រាប់វេជ្ជបណ្ឌិត ដោយប្រើប្រាស់ StreamlitPyQt ដើម្បីបង្ហាញទិន្នន័យរូបភាព និង Saliency Maps ទន្ទឹមគ្នា។
  4. សាកល្បងជាមួយទិន្នន័យវេជ្ជសាស្ត្រសាធារណៈ: ទាញយកសំណុំទិន្នន័យរូបភាពមហារីកសុដន់ (Invasive Ductal Carcinoma) ពីវេទិកា Kaggle មកសាកល្បងបង្ហាត់ និងសាកល្បងយន្តការការពន្យល់រួមបញ្ចូលគ្នា (Cumulative Explanation)។
  5. សហការ និងធ្វើតេស្តក្នុងបរិស្ថានគ្លីនិក: យកគំរូកម្មវិធីទៅសាកល្បងដោយផ្ទាល់ជាមួយនិស្សិតពេទ្យ ឬវេជ្ជបណ្ឌិតកម្ពុជា ដើម្បីវាយតម្លៃលើភាពងាយស្រួល (Usability) និងកែលម្អប្រព័ន្ធតាមមតិត្រឡប់របស់ពួកគេ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Explainable AI (XAI) ជាផ្នែកមួយនៃបញ្ញាសិប្បនិម្មិតដែលផ្តោតលើការបង្កើតឧបករណ៍ឬបច្ចេកទេស ដើម្បីពន្យល់ពីដំណើរការនៃការសម្រេចចិត្តរបស់ម៉ូដែលកុំព្យូទ័រទៅកាន់មនុស្ស ធ្វើយ៉ាងណាឱ្យវេជ្ជបណ្ឌិតអាចយល់ ជឿទុកចិត្ត និងផ្ទៀងផ្ទាត់ហេតុផលរបស់ AI បាន។ ដូចជាការដែលសិស្សមិនត្រឹមតែប្រាប់ចម្លើយគណិតវិទ្យាដល់គ្រូប៉ុណ្ណោះទេ តែត្រូវបង្ហាញវិធីសាស្រ្តដោះស្រាយមួយជំហានម្តងៗ ដើម្បីឱ្យគ្រូជឿជាក់ថាគេពិតជាចេះមែន។
Convolutional Neural Networks (CNNs) ជាប្រភេទបណ្តាញសរសៃប្រសាទកម្រិតជ្រៅ (Deep Learning) ដែលពូកែខាងវិភាគរូបភាពវេជ្ជសាស្ត្រ ដោយប្រើប្រាស់តម្រង (Filters) ជាច្រើនស្រទាប់ ដើម្បីទាញយកលក្ខណៈសម្បត្តិដូចជា គែម ទ្រង់ទ្រាយ និងរចនាសម្ព័ន្ធកោសិកាដោយស្វ័យប្រវត្តិ។ ដូចជាអ្នកជំនាញដែលមើលផ្ទាំងគំនូរ ដោយដំបូងផ្តោតលើបន្ទាត់និងពណ៌ បន្ទាប់មកផ្គុំវាបញ្ចូលគ្នាដើម្បីមើលឱ្យដឹងថារូបនោះជារូបអ្វី។
Saliency Maps ជាផែនទីរូបភាពដែលប្រើពណ៌ (ឧទាហរណ៍ កន្លែងក្រហមខ្លាំង) ដើម្បីរំលេចបង្ហាញពីតំបន់ជាក់លាក់ណាមួយលើរូបភាពដើម ដែលមានឥទ្ធិពលខ្លាំងជាងគេបំផុតក្នុងការធ្វើឱ្យម៉ូដែល AI សម្រេចចិត្តទាយលទ្ធផលរោគវិនិច្ឆ័យ។ ដូចជាការប្រើប៊ិចហ្វឺតពណ៌ (Highlighter) គូសបញ្ជាក់លើពាក្យសំខាន់ៗនៅក្នុងសៀវភៅ ដើម្បីប្រាប់ថាហេតុអ្វីបានជាអ្នកសន្និដ្ឋានអត្ថន័យនៃអត្ថបទនោះ។
LIME ជាវិធីសាស្រ្តពន្យល់ AI ដែលធ្វើការបិទបាំងឬផ្លាស់ប្តូរផ្នែកខ្លះនៃរូបភាពដោយចៃដន្យ រួចមើលថាតើម៉ូដែលនឹងផ្លាស់ប្តូរការទស្សន៍ទាយរបស់វាឬទេ ប្រសិនបើផ្លាស់ប្តូរ នោះបញ្ជាក់ថាផ្នែកដែលបានបិទបាំងនោះពិតជាសំខាន់ខ្លាំងណាស់។ ដូចជាការយកដៃបិទភ្នែក មាត់ ឬច្រមុះរបស់រូបថតម្នាក់ម្តងៗ ដើម្បីដឹងថាតើចំណុចមួយណាដែលធ្វើឱ្យយើងចំណាំថាគាត់ជានរណា។
Grad-CAM ជាវិធីសាស្ត្រគណនាជម្រាល (Gradients) នៅស្រទាប់ចុងក្រោយនៃបណ្តាញ CNN ដើម្បីតាមដានថាតើព័ត៌មានរូបភាពមួយណាមានទម្ងន់ធ្ងន់ជាងគេ ក្នុងការកំណត់ថារូបភាពនោះមានផ្ទុកកោសិកាមហារីកឬអត់។ ដូចជាការតាមដានដានជើងរបស់សត្វនៅក្នុងព្រៃ ដើម្បីស្វែងរកទីតាំងសម្បុករបស់វាយ៉ាងច្បាស់លាស់។
Superpixels ជាការប្រមូលផ្តុំភីកសែល (Pixels) តូចៗដែលនៅក្បែរគ្នា និងមានពណ៌ឬកម្រិតពន្លឺស្រដៀងគ្នា ទៅជាប្លុកធំមួយ ដើម្បីងាយស្រួលដល់ម៉ូដែលក្នុងការកែប្រែនិងវិភាគ ដោយបន្ថយភាពស្មុគស្មាញនៃការគណនាភីកសែលម្តងមួយៗ។ ដូចជាការផ្គុំបំណែករូបភាព (Jigsaw puzzle) ដែលមានពណ៌ដូចគ្នាចូលគ្នាជាដុំៗ មុននឹងមើលជារូបរាងធំ។
Invasive Ductal Carcinoma (IDC) ជាប្រភេទជំងឺមហារីកសុដន់ទូទៅបំផុត ដែលកោសិកាមហារីកកកើតឡើងនៅបំពង់ទឹកដោះ រួចរាលដាលជ្រៀតចូលទៅក្នុងជាលិកាសុដន់ជុំវិញ ដែលជាបញ្ហាវេជ្ជសាស្ត្រត្រូវបានលើកយកមកធ្វើតេស្តសាកល្បងដោយ AI ក្នុងឯកសារនេះ។ ដូចជាស្មៅអាក្រក់ដែលដុះចេញពីបំពង់ទឹក រួចចាប់ផ្តើមចាក់ឫសរាលដាលទៅបំផ្លាញដីសួនច្បារដែលនៅក្បែរៗនោះ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖