Original Title: Chapter 5: XAI for medical image segmentation in medical decision support systems
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ជំពូកទី៥៖ បញ្ញាសិប្បនិម្មិតដែលអាចពន្យល់បាន (XAI) សម្រាប់ការបែងចែកផ្នែករូបភាពវេជ្ជសាស្ត្រនៅក្នុងប្រព័ន្ធគាំទ្រការសម្រេចចិត្តផ្នែកវេជ្ជសាស្ត្រ

ចំណងជើងដើម៖ Chapter 5: XAI for medical image segmentation in medical decision support systems

អ្នកនិពន្ធ៖ Abasiama Godwin Akpan (Department of Computer Science & Mathematics, Evangel University, Nigeria), Flavious Bobuin Nkubli (Department of Medical Radiography, University of Maiduguri, Nigeria), Victoria Nnaemeka Ezeano (Department of Computer Science & Mathematics, Evangel University, Nigeria), Anayo Christian Okwor (Department of Radiography & Radiation Sciences, Evangel University, Nigeria), Mabel Chikodili Ugwuja (Department of Radiography & Radiation Sciences, Evangel University, Nigeria), Udeme Offiong (Department of Psychology, Chukwuemeka Odumegu University, Nigeria)

ឆ្នាំបោះពុម្ព៖ 2023

វិស័យសិក្សា៖ Health Informatics & Artificial Intelligence

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហានៃភាពមិនច្បាស់លាស់ (Black-box nature) នៅក្នុងម៉ូដែលបញ្ញាសិប្បនិម្មិត (AI) សម្រាប់ការបែងចែកផ្នែករូបភាពវេជ្ជសាស្ត្រ ដែលបណ្តាលឱ្យមានកង្វះទំនុកចិត្តពីសំណាក់គ្រូពេទ្យ និងអ្នកជំងឺ ជាពិសេសក្នុងការរកឃើញដុំសាច់ខួរក្បាលតាមរយៈរូបភាព MRI ។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកនិពន្ធបានស្នើឡើងនូវប្រព័ន្ធកូនកាត់ (Hybrid System) ដែលរួមបញ្ចូលគ្នានូវក្បួនដោះស្រាយ Fuzzy C-means ជាមួយនឹងបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (ANN) ដើម្បីដំណើរការ និងវិភាគរូបភាព MRI ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Fuzzy C-means algorithm
ក្បួនដោះស្រាយកម្រងទិន្នន័យ Fuzzy C-means
មិនតម្រូវឱ្យមានការបង្វឹកទុកជាមុន (Unsupervised) និងអាចគិតគូរពីភាពមិនច្បាស់លាស់ (Uncertainty) នៅក្នុងរូបភាពវេជ្ជសាស្ត្រ។ មិនមានដំណោះស្រាយល្អបំផុតជាក់លាក់ ងាយរងឥទ្ធិពលពីការកំណត់តម្លៃដំបូង និងមិនសូវដំណើរការល្អសម្រាប់រូបភាពដែលមានសំឡេងរំខាន (Noisy images)។ បង្កើតជាមូលដ្ឋានក្នុងការបែងចែករូបភាព ប៉ុន្តែទាមទារការបន្សុទ្ធរូបភាពបន្ថែម។
Artificial Neural Network (ANN)
បណ្តាញសរសៃប្រសាទសិប្បនិម្មិត
ងាយស្រួលក្នុងការអនុវត្ត និងអាចអនុវត្តបានចំពោះបញ្ហាធ្វើចំណាត់ថ្នាក់ផ្សេងៗគ្នាជាច្រើន។ មានភាពលំបាកក្នុងការជ្រើសរើសទម្រង់ស្ថាបត្យកម្ម និងមានបញ្ហាប្រអប់ខ្មៅ (Black-box problem) ដែលធ្វើឱ្យគ្រូពេទ្យពិបាកយល់ពីមូលហេតុនៃការសម្រេចចិត្ត។ ផ្តល់ការធ្វើចំណាត់ថ្នាក់ដុំសាច់បានត្រឹមត្រូវ ប៉ុន្តែខ្វះតម្លាភាពក្នុងការបកស្រាយ។
Proposed Hybrid System (Enhanced Fuzzy C-means + ANN)
ប្រព័ន្ធកូនកាត់ដែលបានស្នើឡើង (ការរួមបញ្ចូល Fuzzy C-means ជាមួយ ANN)
ចំណាយតិច ផ្តល់នូវអនុបាតសញ្ញាធៀបនឹងសំឡេងរំខាន (Peak signal-to-noise ratio) កាន់តែប្រសើរ និងមានកំហុសមធ្យមការ៉េ (Mean square error) ទាបជាងមុន។ មានភាពស្មុគស្មាញខ្ពស់ជាងវិធីសាស្ត្រដាច់ដោយឡែក ហើយកម្មវិធី ឬភាសាកូដមួយចំនួនអាចនឹងមិនមានបន្ទាប់ពីដាក់ឱ្យដំណើរការ។ អាចរកឃើញដុំសាច់ខួរក្បាលនៅទីតាំងណាមួយបានយ៉ាងសុក្រឹត និងមានការពន្យល់ច្បាស់លាស់ (Explainability) សម្រាប់គាំទ្រការសម្រេចចិត្តវេជ្ជសាស្ត្រ។

ការចំណាយលើធនធាន (Resource Cost)៖ ទោះបីជាឯកសារមិនបានបញ្ជាក់ពីទំហំថវិកាផ្ទាល់ក៏ដោយ ប៉ុន្តែបានសង្កត់ធ្ងន់លើតម្រូវការផ្នែកទន់ និងធនធានកុំព្យូទ័រសម្រាប់ការដំណើរការរូបភាពវេជ្ជសាស្ត្រកម្រិត 3D ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានស្រាវជ្រាវ និងសរសេរដោយអ្នកជំនាញមកពីសាកលវិទ្យាល័យនានាក្នុងប្រទេសនីហ្សេរីយ៉ា (Nigeria)។ ការសិក្សាមិនបានបញ្ជាក់ពីប្រភពជាក់លាក់នៃសំណុំទិន្នន័យ MRI ទេ ដែលអាចជាទិន្នន័យស្ដង់ដារទូទៅ។ សម្រាប់ប្រទេសកម្ពុជា ការយកម៉ូដែលនេះមកប្រើប្រាស់ ចាំបាច់ត្រូវមានការធ្វើតេស្តផ្ទៀងផ្ទាត់ជាមួយសំណុំទិន្នន័យ MRI របស់ប្រជាជនកម្ពុជាផ្ទាល់ ដើម្បីចៀសវាងភាពលម្អៀង និងធានាបាននូវភាពសុក្រឹតក្នុងការរកឃើញដុំសាច់។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ប្រព័ន្ធកូនកាត់បញ្ញាសិប្បនិម្មិតដែលអាចពន្យល់បាន (XAI Hybrid System) នេះ ពិតជាមានសក្តានុពល និងសារៈសំខាន់ខ្លាំងសម្រាប់ការអភិវឌ្ឍវិស័យសុខាភិបាលឌីជីថលនៅកម្ពុជា។

សរុបមក ការដាក់បញ្ចូលប្រព័ន្ធកូនកាត់ XAI នេះទៅក្នុងប្រតិបត្តិការរបស់មន្ទីរពេទ្យនៅកម្ពុជា នឹងជួយបង្កើនប្រសិទ្ធភាពក្នុងការព្យាបាល ផ្តល់ទំនុកចិត្តដល់គ្រូពេទ្យ និងកាត់បន្ថយពេលវេលានៃការធ្វើរោគវិនិច្ឆ័យ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះកែច្នៃរូបភាពវេជ្ជសាស្ត្រ: ចាប់ផ្តើមដោយការរៀនប្រើប្រាស់ MATLAB ឬបណ្ណាល័យជំនួយរបស់ Python (OpenCV, Scikit-image) ដើម្បីអនុវត្តបច្ចេកទេសកាត់បន្ថយសំឡេងរំខាន ដូចជា Gaussian convolution និង Median filters ទៅលើរូបភាពវេជ្ជសាស្ត្រពិតៗ។
  2. អនុវត្តក្បួនដោះស្រាយបែងចែករូបភាព: សរសេរកូដសាកល្បងដោយប្រើក្បួនដោះស្រាយ Fuzzy C-means បញ្ចូលគ្នាជាមួយ Region growing technique ដោយប្រើប្រាស់សំណុំទិន្នន័យរូបភាព MRI សាធារណៈដូចជាសំណុំទិន្នន័យ BraTS ជាដើម។
  3. រៀបចំនិងបង្វឹកបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (ANN): ស្ថាបនាទម្រង់ ANN ដើម្បីធ្វើចំណាត់ថ្នាក់ប្រភេទដុំសាច់ (Mass ឬ Malignant) ដោយប្រើប្រាស់លក្ខណៈពិសេស (Features) ដែលបានទាញយកពីដំណាក់កាល Segmentation តាមរយៈការប្រើប្រាស់ឧបករណ៍ TensorFlowPyTorch
  4. បញ្ចូលប្រព័ន្ធពន្យល់បានទៅក្នុងម៉ូដែល (XAI): ប្រើប្រាស់បណ្ណាល័យគាំទ្រ XAI ដូចជា LIMESHAP ដើម្បីបង្កើតជារូបភាពបង្ហាញពីមូលហេតុ (Saliency maps) ដែលបញ្ជាក់ពីទីតាំងដែលម៉ូដែល ANN ប្រើដើម្បីកំណត់ថាវាជាដុំសាច់ ដើម្បីធានាបាននូវតម្លាភាពសម្រាប់គ្រូពេទ្យ។
  5. អភិវឌ្ឍប្រព័ន្ធគាំទ្រការសម្រេចចិត្តអ្នកជំងឺបញ្ចប់ (MDSS Interface): រៀបចំចំណុចប្រទាក់អ្នកប្រើប្រាស់ (User Interface) សាមញ្ញមួយ ដែលអនុញ្ញាតឱ្យគ្រូពេទ្យអាចបញ្ចូល (Upload) រូបភាព MRI និងទទួលបានលទ្ធផលនៃការវិភាគអមដោយការពន្យល់លម្អិត និងកម្រិតភាគរយនៃភាពត្រឹមត្រូវ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Explainable artificial intelligence (XAI) បច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិតដែលមិនត្រឹមតែអាចផ្តល់លទ្ធផលវិភាគបានត្រឹមត្រូវប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងមានសមត្ថភាពអាចពន្យល់យ៉ាងច្បាស់លាស់ពីមូលហេតុ និងដំណើរការដែលនាំឱ្យវាសម្រេចចិត្តបែបនេះទៅកាន់មនុស្ស (ជាពិសេសគ្រូពេទ្យ) ដើម្បីបង្កើតទំនុកចិត្តនិងសុវត្ថិភាព។ ដូចជាសិស្សពូកែម្នាក់ដែលមិនត្រឹមតែប្រាប់ចម្លើយគណិតវិទ្យាត្រឹមត្រូវទេ តែថែមទាំងសរសេរប្រាប់ពីរបៀបគិតមួយជំហានម្តងៗដើម្បីឱ្យគ្រូជឿជាក់។
Medical image segmentation ដំណើរការនៃការកាត់បំបែករូបភាពវេជ្ជសាស្ត្រ (ដូចជាកាំរស្មីអ៊ិច ឬ MRI) ជាផ្នែកតូចៗ ឬជាតំបន់ដាច់ដោយឡែកពីគ្នា (Pixels) ដើម្បីជួយកុំព្យូទ័រឱ្យងាយស្រួលក្នុងការកំណត់ព្រំដែនសរីរាង្គ ឬស្វែងរកទីតាំងដុំសាច់ខុសប្រក្រតីបានយ៉ាងសុក្រឹត។ ដូចជាការយកប៉ិចហ្វឺតពណ៌មកគូសរង្វង់ព័ទ្ធជុំវិញទីតាំងផ្ទះ ឬបឹងនៅលើផែនទីមួយផ្ទាំង ដើម្បីងាយស្រួលឱ្យគេមើលឃើញចំណុចសំខាន់ៗលេចធ្លោឡើង។
Fuzzy C-means algorithm ក្បួនដោះស្រាយសម្រាប់ចាត់ថ្នាក់ទិន្នន័យ (Clustering) ដែលខុសពីវិធីទូទៅ ដោយវាអនុញ្ញាតឱ្យចំណុចទិន្នន័យ (Pixel) មួយអាចស្ថិតនៅក្នុងក្រុមច្រើនជាងមួយក្នុងកម្រិតភាគរយផ្សេងៗគ្នា ដែលស័ក្តិសមបំផុតសម្រាប់កាត់ព្រំដែនដុំសាច់ក្នុងរូបភាពវេជ្ជសាស្ត្រដែលព្រាលៗមិនសូវច្បាស់លាស់។ ដូចជាការបែងចែកពណ៌ ដែលពណ៌ទឹកក្រូចមិនមែនជាពណ៌ក្រហមសុទ្ធ ឬលឿងសុទ្ធនោះទេ តែវាជាការលាយបញ្ចូលគ្នានៃពណ៌ទាំងពីរក្នុងកម្រិតភាគរយជាក់លាក់ណាមួយ។
Artificial neural network (ANN) ប្រព័ន្ធកុំព្យូទ័រដែលត្រូវបានរចនាឡើងដោយត្រាប់តាមបណ្តាញសរសៃប្រសាទខួរក្បាលរបស់មនុស្ស ដើម្បីរៀនពីទិន្នន័យចាស់ៗ ស្គាល់លំនាំ (Patterns) និងធ្វើការទស្សន៍ទាយទៅលើទិន្នន័យថ្មី (ឧទាហរណ៍៖ វិភាគថាដុំសាច់នេះជាប្រភេទកាច ឬស្លូត)។ ដូចជាកូនក្មេងដែលរៀនស្គាល់សត្វឆ្កែតាមរយៈការមើលរូបភាពសត្វឆ្កែច្រើនដង រហូតដល់ថ្ងៃក្រោយគេអាចចំណាំសត្វឆ្កែគ្រប់ប្រភេទបានដោយខ្លួនឯង។
Medical decision support systems (MDSSs) ប្រព័ន្ធព័ត៌មានវិទ្យាដែលប្រើប្រាស់ទិន្នន័យអ្នកជំងឺ និងក្បួនដោះស្រាយបញ្ញាសិប្បនិម្មិត ដើម្បីជួយផ្តល់យោបល់ វិភាគ និងគាំទ្រដល់ការសម្រេចចិត្តរបស់គ្រូពេទ្យក្នុងការព្យាបាល ឬធ្វើរោគវិនិច្ឆ័យជំងឺឱ្យកាន់តែមានប្រសិទ្ធភាព។ ដូចជាត្រីវិស័យ ឬផែនទីកញ្ចក់រថយន្ត (GPS) ដែលជួយប្រាប់ផ្លូវនិងផ្តល់យោបល់ឱ្យអ្នកបើកបរទៅដល់គោលដៅប្រកបដោយសុវត្ថិភាពនិងត្រឹមត្រូវបំផុត។
Data augmentation បច្ចេកទេសក្នុងការបង្កើតទិន្នន័យថ្មីៗបន្ថែមពីលើទិន្នន័យដើមដែលមានស្រាប់ (តាមរយៈការបង្វិល ពង្រីក ឬកែប្រែពន្លឺរូបភាព) ដើម្បីបង្កើនទំហំសំណុំទិន្នន័យសម្រាប់យកទៅបង្វឹកម៉ូដែល AI ឱ្យកាន់តែឆ្លាតវៃ និងមិនងាយទន្ទេញចាំស៊ុម។ ដូចជាការថតរូបមនុស្សម្នាក់ពីជ្រុងផ្សេងៗគ្នា និងក្នុងពន្លឺផ្សេងៗគ្នា ដើម្បីឱ្យកាមេរ៉ាអាចចំណាំមុខមនុស្សនោះបាន ទោះស្ថិតក្នុងស្ថានភាពណាក៏ដោយ។
Region growing វិធីសាស្ត្រនៃការបែងចែករូបភាពដែលចាប់ផ្តើមពីចំណុចដើមមួយ (Seed point) រួចពង្រីកផ្ទៃរបស់វាបន្តិចម្តងៗទៅកាន់ចំណុចជិតខាងដែលមានលក្ខណៈស្រដៀងគ្នា (ឧទាហរណ៍៖ កម្រិតពណ៌ប្រផេះដូចគ្នា) រហូតដល់អស់ព្រំដែនដុំសាច់។ ដូចជាការបន្តក់ទឹកថ្នាំលើក្រដាសជ្រាប ដែលទឹកថ្នាំនឹងរាលដាលសន្សឹមៗទៅលើសាច់ក្រដាស រហូតដល់អស់កម្លាំងជ្រាប ឬប៉ះនឹងទឹកថ្នាំពណ៌ផ្សេង។
Binarization ដំណើរការបំប្លែងរូបភាពដែលសម្បូរពណ៌ ឬមានស្រមោលពណ៌ប្រផេះច្រើន ទៅជារូបភាពសាមញ្ញដែលមានតែ២ពណ៌គត់ គឺសនិងខ្មៅ (តំណាងដោយតម្លៃលេខ 0 និង 1 សម្រាប់កុំព្យូទ័រ) ដើម្បីងាយស្រួលក្នុងការគណនាទំហំ ឬផ្ទៃក្រឡារបស់ដុំសាច់។ ដូចជាការប្រែរូបភាពចម្រុះពណ៌ ទៅជាទម្រង់ស្រមោលខ្មៅដិតនៅលើផ្ទាំងក្រណាត់ស ដែលធ្វើឱ្យយើងមើលឃើញរូបរាងស៊ុមរបស់វាបានយ៉ាងច្បាស់។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖