Original Title: Saliency Maps as an Explainable AI Method in Medical Imaging: A Case Study on Brain Tumor Classification
Source: www.kaggle.com
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ផែនទី Saliency ជាវិធីសាស្ត្របញ្ញាសិប្បនិម្មិតដែលអាចពន្យល់បាន (Explainable AI) ក្នុងការថតរូបភាពវេជ្ជសាស្ត្រ៖ ការសិក្សាស្រាវជ្រាវលើការចំណាត់ថ្នាក់ដុំសាច់ខួរក្បាល

ចំណងជើងដើម៖ Saliency Maps as an Explainable AI Method in Medical Imaging: A Case Study on Brain Tumor Classification

អ្នកនិពន្ធ៖ Ayse Keles (General Directorate of Health Information Systems, Ministry of Health, Türkiye), Ozan Akcay (Department of Biomechanics, Dokuz Eylül University, Türkiye), Halil Kul (School of Medicine, Department of Neurosurgery, Ankara Yıldırım Beyazıt University, Türkiye), Malika Bendechache (ADAPT Research Centre, School of Computer Science, University of Galway, Ireland)

ឆ្នាំបោះពុម្ព៖ 2023

វិស័យសិក្សា៖ Medical Imaging / Artificial Intelligence

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហាកង្វះតម្លាភាព (Black-box solutions) នៃប្រព័ន្ធបញ្ញាសិប្បនិម្មិត (AI) ក្នុងវិស័យរូបភាពវេជ្ជសាស្ត្រ ដោយផ្តោតលើភាពចាំបាច់ក្នុងការធ្វើឱ្យ AI អាចពន្យល់បាន (Explainable AI) សម្រាប់ការចំណាត់ថ្នាក់ដុំសាច់ខួរក្បាល ដើម្បីទទួលបានទំនុកចិត្តពីគ្រូពេទ្យ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់វិធីសាស្ត្របណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត និងបច្ចេកទេសពន្យល់រូបភាព ដើម្បីវិភាគពីរបៀបដែលម៉ូដែល AI ធ្វើការសម្រេចចិត្តចំណាត់ថ្នាក់ដុំសាច់ខួរក្បាល។

ការបង្ហាត់ម៉ូដែលបណ្ដាញសរសៃប្រសាទ (Convolutional Neural Network - CNN) ជាមួយសំណុំទិន្នន័យរូបភាពស្កេនខួរក្បាល (BR35H MRI Dataset) ចំនួន ៣០០០ រូបភាព
ការបង្កើតផែនទីបញ្ជាក់តំបន់សំខាន់ៗដោយផ្អែកលើជម្រាល (Gradient-based Saliency Maps) តាមរយៈ TensorFlow (TensorFlow built-in functions)
ការប្រៀបធៀបផែនទី Saliency រវាងការទស្សន៍ទាយត្រឹមត្រូវ (Correctly predicted MRIs) និងទស្សន៍ទាយខុស (Misclassified MRIs)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

លទ្ធផលបង្ហាញថា ភីកសែលនៃដុំសាច់និងតំបន់ជុំវិញ (Tumor and surrounding pixels) ដើរតួនាទីយ៉ាងសំខាន់បំផុតក្នុងការចំណាត់ថ្នាក់រូបភាព MRI ដែលមានដុំសាច់។
ម៉ូដែល AI ជួបការលំបាកក្នុងការកំណត់អត្តសញ្ញាណ និងចំណាត់ថ្នាក់ដុំសាច់ដែលមានរូបរាងស្មុគស្មាញ (Complex shapes) ឬព្រំដែនមិនច្បាស់លាស់។
ការសិក្សាបានផ្តល់អនុសាសន៍ឱ្យបន្ថែមជំហានទាញយកទិន្នន័យឆ្អឹងចេញ (Bone extraction / Skull-stripping) មុនពេលបង្ហាត់ម៉ូដែល ដើម្បីកាត់បន្ថយការភាន់ច្រឡំ និងបង្កើនភាពត្រឹមត្រូវនៃម៉ូដែល (Improved accuracy)។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
CNN with Gradient-based Saliency Maps បណ្ដាញ CNN ជាមួយផែនទី Saliency ផ្អែកលើជម្រាល	ផ្តល់នូវការពន្យល់ជាលក្ខណៈរូបភាព (Visual explanation) ដែលបង្ហាញពីតំបន់សំខាន់ៗនៃដុំសាច់។ ជួយឱ្យយល់ពីរបៀបដែលម៉ូដែល AI ធ្វើការសម្រេចចិត្តក្នុងវិស័យវេជ្ជសាស្ត្រ។	មិនមានកម្រិតកំណត់ (Threshold) ច្បាស់លាស់សម្រាប់កំណត់សារៈសំខាន់នៃតំបន់នីមួយៗ។ ងាយរងការរំខាន និងភាន់ច្រឡំពីរូបរាងដុំសាច់ស្មុគស្មាញ និងឆ្អឹងលលាដ៍ក្បាល។	ទទួលបានពិន្ទុ F1-score ០.៧៤ សម្រាប់ការចំណាត់ថ្នាក់រូបភាពមានដុំសាច់ (Yes class) និង ០.៨៤ សម្រាប់រូបភាពគ្មានដុំសាច់ (No class)។
CNN with Bone Extraction (Skull-stripping) Preprocessing បណ្ដាញ CNN ជាមួយនឹងការកែច្នៃទិន្នន័យដកឆ្អឹងចេញជាមុន	កាត់បន្ថយការភាន់ច្រឡំរបស់ម៉ូដែលទៅលើរចនាសម្ព័ន្ធឆ្អឹង។ ជួយបង្វែរចំណាប់អារម្មណ៍របស់ម៉ូដែលឱ្យផ្តោតទៅលើតែតំបន់ជាលិកាទន់ (Soft tissue) វិញ ដែលបង្កើនភាពត្រឹមត្រូវ។	ទាមទារពេលវេលា និងក្បួនដោះស្រាយបន្ថែមក្នុងការធ្វើកែច្នៃទិន្នន័យ (Preprocessing pipeline) មុនពេលអាចចាប់ផ្តើមបង្ហាត់ម៉ូដែលបាន។	នេះគឺជាអនុសាសន៍ក្នុងឯកសារដែលត្រូវអនុវត្តបន្ត ដើម្បីដោះស្រាយបញ្ហាទស្សន៍ទាយខុស (Misclassification) ដែលបង្ហាញដោយផែនទី Saliency។

ការចំណាយលើធនធាន (Resource Cost)៖ ឯកសារមិនបានបញ្ជាក់ពីទំហំថវិកាជាក់លាក់ទេ ប៉ុន្តែការអនុវត្តទាមទារធនធានកុំព្យូទ័រសម្រាប់ការហ្វឹកហាត់ម៉ូដែល Deep Learning និងសំណុំទិន្នន័យរូបភាពវេជ្ជសាស្ត្រ។

Dataset: សំណុំទិន្នន័យរូបភាពស្កេនខួរក្បាល BR35H ពី Kaggle (រូបភាព MRI ចំនួន ៣០០០សន្លឹក ដែលមានវិមាត្រផ្សេងៗគ្នា)។
Software: បណ្ណាល័យសរសេរកូដ Python ដូចជា Keras សម្រាប់បង្កើតម៉ូដែល និង TensorFlow ធ្វើជា Backend និងសម្រាប់បង្កើត Saliency Maps។
Hardware: ទាមទារម៉ាស៊ីនកុំព្យូទ័រដែលមានសមត្ថភាពខ្ពស់ (ជាទូទៅត្រូវការ GPU) សម្រាប់ដំណើរការ និងបង្ហាត់ម៉ូដែល CNN ចំនួន ៥០ Epochs។
Expertise: ចំណេះដឹងស៊ីជម្រៅផ្នែកបញ្ញាសិប្បនិម្មិត (Deep Learning/XAI) និងជំនាញពីគ្រូពេទ្យឯកទេស (Medical Experts) ក្នុងការផ្ទៀងផ្ទាត់ភាពត្រឹមត្រូវនៃលទ្ធផលរូបភាព។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យកូដបើកចំហ (BR35H Dataset ពីវេបសាយ Kaggle) ដែលមិនបានបញ្ជាក់ពីប្រភពប្រជាសាស្ត្ររបស់អ្នកជំងឺ (អាយុ, ភេទ, ឬពូជសាសន៍) នោះទេ។ សម្រាប់ប្រទេសកម្ពុជា ការខ្វះទិន្នន័យពិតប្រាកដក្នុងស្រុកអាចធ្វើឱ្យម៉ូដែលដំណើរការមិនបានល្អ (Model Bias) នៅពេលអនុវត្តផ្ទាល់ជាមួយរូបភាព MRI ពីមន្ទីរពេទ្យខ្មែរ ដោយសារភាពខុសគ្នានៃគុណភាពម៉ាស៊ីនស្កេន និងលក្ខណៈជីវសាស្ត្រ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកទេស Explainable AI (XAI) នេះមានសក្តានុពលខ្លាំងក្នុងការអភិវឌ្ឍវិស័យសុខាភិបាលឌីជីថលនៅកម្ពុជា ដើម្បីជួយគ្រូពេទ្យក្នុងការវិភាគជំងឺបានលឿន និងមានតម្លាភាព។

មន្ទីរពេទ្យកាល់ម៉ែត និងមន្ទីរពេទ្យមិត្តភាពខ្មែរ-សូវៀត: អាចប្រើប្រាស់បច្ចេកវិទ្យានេះជាប្រព័ន្ធជំនួយគាំទ្រការសម្រេចចិត្តព្យាបាល (Clinical Decision Support Systems - CDSS) សម្រាប់គ្រូពេទ្យផ្នែកសរសៃប្រសាទ ដើម្បីវិនិច្ឆ័យដុំសាច់ខួរក្បាលបានលឿន និងមានទំនុកចិត្តខ្ពស់។
សាកលវិទ្យាល័យវិទ្យាសាស្ត្រសុខាភិបាល (UHS): អាចបញ្ចូលការសិក្សានេះជាឧបករណ៍អប់រំសម្រាប់និស្សិតពេទ្យ ដើម្បីស្វែងយល់ពីទំនាក់ទំនងរវាងរូបភាពវេជ្ជសាស្ត្រ នីតិវិធីនៃការធ្វើរោគវិនិច្ឆ័យ និងការប្រើប្រាស់បញ្ញាសិប្បនិម្មិតក្នុងសម័យកាលឌីជីថល។
ក្រុមហ៊ុនអភិវឌ្ឍន៍បច្ចេកវិទ្យាសុខាភិបាល (HealthTech Startups): ក្រុមហ៊ុនក្នុងស្រុកអាចប្រើប្រាស់វិធីសាស្ត្រ Saliency Maps នេះ ដើម្បីបង្កើតកម្មវិធី AI ក្នុងស្រុកដែលអាចពន្យល់ពីមូលហេតុនៃការធ្វើរោគវិនិច្ឆ័យដល់អ្នកជំងឺ កាត់បន្ថយភាពភ័យខ្លាចចំពោះបច្ចេកវិទ្យា។

ការរួមបញ្ចូលប្រព័ន្ធ AI ដែលអាចពន្យល់បាន (XAI) នឹងជួយបង្កើនទំនុកចិត្តរវាងគ្រូពេទ្យ និងប្រព័ន្ធកុំព្យូទ័រ ព្រមទាំងលើកកម្ពស់គុណភាពនៃការព្យាបាលជំងឺកម្រិតធ្ងន់នៅកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះនៃទិន្នន័យរូបភាពវិទ្យុសកម្ម: ស្វែងយល់ពីរបៀបដំណើរការរូបភាពវេជ្ជសាស្ត្រ (MRI) ដោយប្រើប្រាស់បណ្ណាល័យដូចជា OpenCV និង NumPy ដើម្បីបំប្លែងប្រភេទឯកសារទៅជា float32 និងបង្រួមទំហំរូបភាព (Rescaling 128x128) ដូចដែលបានរៀបរាប់ក្នុងការសិក្សា។
អនុវត្តការកែច្នៃទិន្នន័យកម្រិតខ្ពស់ (Preprocessing): ទាញយករូបភាពពីសំណុំទិន្នន័យ BR35H ពីវេបសាយ Kaggle និងសរសេរកូដអនុវត្តបច្ចេកទេស Skull-stripping (Bone Extraction) ដើម្បីដកឆ្អឹងលលាដ៍ក្បាលចេញមុនពេលបង្ហាត់ម៉ូដែល ដើម្បីបង្កើនភាពត្រឹមត្រូវ។
កសាងម៉ូដែល CNN (Convolutional Neural Network): ប្រើប្រាស់បណ្ណាល័យ Keras ដោយមាន TensorFlow ជា Backend ដើម្បីសរសេរកូដបង្កើតបណ្ដាញ CNN សាមញ្ញ ដែលមាន Convolutional layers ចំនួនពីរ រួមជាមួយ ReLU activation និងក្បួន 2x2 MaxPooling។
បង្កើតផែនទីពន្យល់ XAI (Saliency Maps): ប្រើប្រាស់មុខងារមានស្រាប់ (built-in functions) នៅក្នុង TensorFlow ដើម្បីទាញយក Gradient-based Saliency Maps ដែលជួយគូសបញ្ជាក់ជាពណ៌លើតំបន់ដែលម៉ូដែលបានប្រើសម្រាប់ធ្វើការសម្រេចចិត្តចំណាត់ថ្នាក់ដុំសាច់។
វាយតម្លៃ និងប្រឹក្សាយោបល់ជាមួយអ្នកជំនាញ: គណនាពិន្ទុ F1-Score, Precision, Recall តាមរយៈ Confusion Matrix ហើយនាំយកលទ្ធផលរូបភាព Saliency Maps ទៅពិភាក្សាជាមួយគ្រូពេទ្យឯកទេសវិទ្យុសកម្ម (Radiologists) ក្នុងស្រុក ដើម្បីផ្ទៀងផ្ទាត់ភាពត្រឹមត្រូវនៃតំបន់ដុំសាច់។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Explainable Artificial Intelligence (XAI)	គឺជាវិធីសាស្ត្រក្នុងការអភិវឌ្ឍប្រព័ន្ធបញ្ញាសិប្បនិម្មិតដែលអនុញ្ញាតឱ្យមនុស្សអាចមើលឃើញ និងយល់ពីមូលហេតុ ឬដំណើរការទាញសេចក្តីសន្និដ្ឋានរបស់កុំព្យូទ័រ ជាជាងគ្រាន់តែផ្តល់ចម្លើយ។ វាមានសារៈសំខាន់ខ្លាំងក្នុងវិស័យពេទ្យដើម្បីធានាភាពជឿជាក់។	ដូចជាសិស្សពូកែគណិតវិទ្យាដែលមិនត្រឹមតែប្រាប់ចម្លើយ ប៉ុន្តែថែមទាំងបង្ហាញពីរបៀបគណនាមួយជំហានម្តងៗឱ្យគ្រូបានឃើញសាច់រឿង។
Saliency Maps	ជាបច្ចេកទេសបង្កើតរូបភាពបង្ហាញពណ៌ (Highlight) លើតំបន់ ឬភីកសែលជាក់លាក់ណាមួយនៃរូបភាពដើម ដែលម៉ូដែល AI ផ្តោតការយកចិត្តទុកដាក់ខ្លាំងជាងគេក្នុងការសម្រេចចិត្ត (ឧទាហរណ៍៖ ការបញ្ជាក់ពណ៌លើតំបន់ដែលមានដុំសាច់ខួរក្បាល)។	ដូចជាការប្រើហ្វឺតពណ៌ (Highlighter) គូសបញ្ជាក់លើពាក្យ ឬប្រយោគសំខាន់ៗនៅក្នុងសៀវភៅ ដើម្បីងាយស្រួលចំណាំអត្ថន័យ។
Black-box solutions	សំដៅលើប្រព័ន្ធ AI ដែលមានភាពស្មុគស្មាញខ្លាំង ដែលអ្នកប្រើប្រាស់អាចដឹងត្រឹមតែទិន្នន័យបញ្ចូល (Input) និងលទ្ធផលចេញ (Output) ប៉ុន្តែមិនអាចយល់ ឬតាមដានពីដំណើរការគណនាខាងក្នុងរបស់វាបានឡើយ។	ដូចជាម៉ាស៊ីនធ្វើសាច់ក្រក ដែលយើងដឹងថាយើងដាក់សាច់ចូល និងទទួលបានសាច់ក្រកចេញមក ប៉ុន្តែយើងមើលមិនឃើញថាម៉ាស៊ីនកិន និងលាយគ្រឿងផ្សំយ៉ាងម៉េចខ្លះនៅខាងក្នុងនោះទេ។
Convolutional neural network (CNN)	ជាប្រភេទបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតជ្រៅ (Deep Learning) ដែលត្រូវបានរចនាឡើងយ៉ាងពិសេសសម្រាប់វិភាគ និងចំណាត់ថ្នាក់ទិន្នន័យរូបភាព ដោយវាចេះស្វែងរកទម្រង់ ពណ៌ និងគែមរបស់វត្ថុក្នុងរូបភាពដោយស្វ័យប្រវត្តិ។	ដូចជាមនុស្សម្នាក់ដែលពាក់វ៉ែនតាពង្រីក (Magnifying glass) សម្លឹងមើលរូបភាពមួយប្លុកម្តងៗ ដើម្បីស្វែងរកលក្ខណៈសម្គាល់ពិសេសៗរហូតដល់អាចទាយដឹងថារូបនោះជារូបអ្វី។
Gradient-based methods	ជាបច្ចេកទេសគណនាក្នុងគណិតវិទ្យា (ការដេរីវេ) ដើម្បីវាស់ស្ទង់មើលថា តើការផ្លាស់ប្តូរតូចមួយនៃភីកសែលណាមួយក្នុងរូបភាព នឹងជះឥទ្ធិពលខ្លាំងប៉ុណ្ណាដល់ការសម្រេចចិត្ត ឬការទស្សន៍ទាយចុងក្រោយរបស់ម៉ូដែល AI។	ដូចជាការសាកល្បងដកគ្រឿងផ្សំចេញម្តងមួយមុខពីរូបមន្តម្ហូប ដើម្បីចង់ដឹងថាគ្រឿងផ្សំណាមួយដែលធ្វើឱ្យម្ហូបនោះមានរសជាតិឆ្ងាញ់ជាងគេ។
Magnetic Resonance Imaging (MRI)	គឺជាបច្ចេកវិទ្យាថតរូបភាពវេជ្ជសាស្ត្រដែលប្រើប្រាស់ដែនម៉ាញេទិក និងរលកវិទ្យុ ដើម្បីបង្កើតជារូបភាពលម្អិតនៃសរីរាង្គ និងជាលិកាខាងក្នុងរាងកាយ (ជាពិសេសខួរក្បាល) ដោយមិនប្រើកាំរស្មីអ៊ិច (X-ray) ដែលប៉ះពាល់សុខភាព។	ដូចជាម៉ាស៊ីនស្កេន 3D ទំនើបដែលអាចថតមើលរចនាសម្ព័ន្ធខាងក្នុងនៃផ្លែឪឡឹកបានយ៉ាងច្បាស់ ដោយមិនចាំបាច់ពុះវាឡើយ។
Skull-stripping	ជាដំណើរការកែច្នៃទិន្នន័យរូបភាពស្កេនខួរក្បាលជាមុន ដោយប្រើកុំព្យូទ័រដើម្បីលុបបំបាត់រូបភាពផ្នែកឆ្អឹងលលាដ៍ក្បាលចេញ និងរក្សាទុកតែរូបភាពជាលិកាខួរក្បាលទន់ៗ ដើម្បីកុំឱ្យម៉ូដែល AI មានការភាន់ច្រឡំក្នុងការវិភាគ។	ដូចជាការបកសំបកផ្លែក្រូចចេញ មុននឹងយកសាច់ក្រូចទៅកិនធ្វើទឹកក្រូចស្រស់ ដើម្បីកុំឱ្យវាមានរសជាតិល្វីង ឬខូចគុណភាពដោយសារសំបក។
Perturbation-based methods	វិធីសាស្ត្រវាយតម្លៃម៉ូដែល AI ដោយការសាកល្បងបិទបាំង កែប្រែ ឬដាក់ការរំខាន (Noise) លើផ្នែកខ្លះនៃរូបភាពបញ្ចូល ដើម្បីសង្កេតមើលថាតើការធ្វើបែបនេះធ្វើឱ្យប្រព័ន្ធ AI ផ្លាស់ប្តូរចម្លើយរបស់វាឬក៏អត់។	ដូចជាការយកដៃបិទភ្នែកម្ខាងរបស់មិត្តភក្តិ ហើយសួរគេថាអាចមើលឃើញផ្លូវច្បាស់ដូចមុនឬអត់ ដើម្បីតេស្តថាភ្នែកម្ខាងនោះសំខាន់ប៉ុណ្ណាសម្រាប់ការមើលឃើញ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖