Original Title: Explainable Artificial Intelligence (XAI) Model for Cancer Image Classification
Source: doi.org/10.32604/cmes.2024.051363
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

គំរូបញ្ញាសិប្បនិម្មិតដែលអាចពន្យល់បាន (XAI) សម្រាប់ការចាត់ថ្នាក់រូបភាពជំងឺមហារីក

ចំណងជើងដើម៖ Explainable Artificial Intelligence (XAI) Model for Cancer Image Classification

អ្នកនិពន្ធ៖ Amit Singhal (Raj Kumar Goel Institute of Technology), Krishna Kant Agrawal (Galgotias University), Angeles Quezada (Tecnológico Nacional de México), Adrian Rodriguez Aguiñaga (Universidad Autónoma de Baja California), Samantha Jiménez (Universidad Autónoma de Baja California), Satya Prakash Yadav (G.L. Bajaj Institute of Technology and Management)

ឆ្នាំបោះពុម្ព៖ 2024 (Computer Modeling in Engineering & Sciences)

វិស័យសិក្សា៖ Computer Science, Medical Imaging, Artificial Intelligence

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការស្រាវជ្រាវនេះដោះស្រាយបញ្ហានៃកង្វះតម្លាភាពក្នុងការសម្រេចចិត្តរបស់ប្រព័ន្ធបញ្ញាសិប្បនិម្មិត (Black-box AI) នៅក្នុងវិស័យសុខាភិបាល ដែលធ្វើឱ្យគ្រូពេទ្យពិបាកក្នុងការទុកចិត្តលើលទ្ធផលវិភាគ ជាពិសេសក្នុងការកំណត់រោគវិនិច្ឆ័យជំងឺមហារីកដែលមានភាពស្មុគស្មាញ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះស្នើឡើងនូវក្របខ័ណ្ឌថ្មីមួយដែលធ្វើសមាហរណកម្មគំរូបញ្ញាសិប្បនិម្មិតដែលអាចពន្យល់បាន (XAI) ជាមួយបច្ចេកទេសសិក្សាស៊ីជម្រៅ (Deep Learning) និងការវិភាគរូបភាពវេជ្ជសាស្ត្រកម្រិតខ្ពស់។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Proposed XAIM (Explainable AI Model)
គំរូបញ្ញាសិប្បនិម្មិតដែលអាចពន្យល់បានដែលបានស្នើឡើង
មានភាពត្រឹមត្រូវខ្ពស់បំផុត និងផ្តល់នូវតម្លាភាពក្នុងការសម្រេចចិត្ត (Transparency) ដែលអនុញ្ញាតឱ្យគ្រូពេទ្យយល់ពីមូលហេតុនៃរោគវិនិច្ឆ័យ។ ត្រូវការធនធានកុំព្យូទ័រខ្លាំង (Computational Power) និងមានភាពស្មុគស្មាញក្នុងការអនុវត្តជាងគំរូធម្មតា។ សម្រេចបានភាពត្រឹមត្រូវ (Accuracy) ៩៧.៧២% និង F1-Score ៩៦.៧២%។
DLMIC (Deep Learning Based Medical Imaging Classification)
ការចាត់ថ្នាក់រូបភាពវេជ្ជសាស្រ្តផ្អែកលើការសិក្សាស៊ីជម្រៅ
មានសមត្ថភាពល្អក្នុងការចាត់ថ្នាក់រូបភាពវេជ្ជសាស្រ្តទូទៅ និងមានភាពត្រឹមត្រូវខ្ពស់គួរសម។ ជាប្រព័ន្ធប្រអប់ខ្មៅ (Black-box) ដែលខ្វះការពន្យល់លម្អិតអំពីការសម្រេចចិត្ត ធ្វើឱ្យពិបាកក្នុងការធ្វើសវនកម្មវេជ្ជសាស្រ្ត។ សម្រេចបានភាពត្រឹមត្រូវ (Accuracy) ៨៤.២៥%។
DLMIA (Deep Learning for Medical Image Analysis)
ការសិក្សាស៊ីជម្រៅសម្រាប់ការវិភាគរូបភាពវេជ្ជសាស្រ្ត
ជាវិធីសាស្ត្រមូលដ្ឋានដែលត្រូវបានប្រើប្រាស់យ៉ាងទូលំទូលាយក្នុងការស្រាវជ្រាវកន្លងមក។ មានភាពត្រឹមត្រូវទាប និងអត្រាវិនិច្ឆ័យខុស (False Discovery Rate) ខ្ពស់ ដែលអាចនាំឱ្យមានការយល់ច្រឡំ។ សម្រេចបានភាពត្រឹមត្រូវ (Accuracy) ត្រឹមតែ ៤៨.៥៧% ប៉ុណ្ណោះ។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះតម្រូវឱ្យមានការប្រើប្រាស់ធនធានបច្ចេកវិទ្យាកម្រិតខ្ពស់ ដើម្បីដំណើរការក្បួនដោះស្រាយដ៏ស្មុគស្មាញ និងការបណ្តុះបណ្តាលគំរូ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់ទិន្នន័យពីបណ្តុំទិន្នន័យសាធារណៈ (Kaggle) ដែលអាចមិនឆ្លុះបញ្ចាំងពីលក្ខណៈជីវសាស្ត្រ ឬហ្សែនរបស់ប្រជាជននៅតំបន់អាស៊ីអាគ្នេយ៍ រួមទាំងកម្ពុជា។ ភាពលំអៀងនៃទិន្នន័យ (Data Bias) អាចកើតមានឡើងប្រសិនបើរូបភាពមិនមានភាពចម្រុះគ្រប់គ្រាន់ ដែលអាចប៉ះពាល់ដល់ប្រសិទ្ធភាពនៃការធ្វើរោគវិនិច្ឆ័យលើអ្នកជំងឺខ្មែរ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់សម្រាប់វិស័យសុខាភិបាលនៅកម្ពុជា ជាពិសេសក្នុងការជួយគាំទ្រដល់គ្រូពេទ្យក្នុងការវិនិច្ឆ័យជំងឺមហារីកឱ្យបានរហ័ស។

ការអនុវត្តគំរូនេះអាចកាត់បន្ថយការខុសឆ្គងក្នុងការវិនិច្ឆ័យ និងបង្កើនប្រសិទ្ធភាពព្យាបាល ប៉ុន្តែទាមទារឱ្យមានការវិនិយោគលើហេដ្ឋារចនាសម្ព័ន្ធឌីជីថល និងការបណ្តុះបណ្តាលធនធានមនុស្សបន្ថែម។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ការសិក្សាមូលដ្ឋានគ្រឹះនៃ XAI: និស្សិតគួរចាប់ផ្តើមសិក្សាអំពីបណ្ណាល័យ Python សម្រាប់ការបកស្រាយ AI ដូចជា (SHAP) ឬ (LIME) និងស្វែងយល់ពីរបៀបដែលវាធ្វើការជាមួយគំរូ Deep Learning ។
  2. ការរៀបចំទិន្នន័យ: ទាញយកបណ្តុំទិន្នន័យមហារីកពី Kaggle (ដូចដែលបានរៀបរាប់ក្នុងឯកសារ) និងអនុវត្តបច្ចេកទេស Pre-processing ដូចជាការប្តូរទំហំរូបភាព (Image Resizing) និងការលុបសម្លេងរំខាន (Noise Removal)។
  3. ការកសាងគំរូ Hybrid: សាកល្បងបង្កើតគំរូដោយរួមបញ្ចូលគ្នារវាង (EfficientNet) ឬ (ResNet-50) សម្រាប់ការទាញយកលក្ខណៈពិសេស និងប្រើប្រាស់ (SVM Classifier) សម្រាប់ការចាត់ថ្នាក់ចុងក្រោយ។
  4. ការវាយតម្លៃ និងការបកស្រាយ: ប្រើប្រាស់រង្វាស់រង្វាល់ដូចជា F1-score និង FDR ដើម្បីវាយតម្លៃគំរូ ហើយបង្កើត Visual Explanations (ដូចជា Heatmaps) ដើម្បីបង្ហាញពីតំបន់នៃរូបភាពដែលម៉ាស៊ីនកំណត់ថាជាមហារីក។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Explainable Artificial Intelligence (XAI) ជាបច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិតដែលមិនត្រឹមតែផ្តល់ចម្លើយប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងអាចពន្យល់ពីមូលហេតុ និងដំណើរការនៃការសម្រេចចិត្តរបស់វា ដើម្បីឱ្យគ្រូពេទ្យ ឬអ្នកប្រើប្រាស់អាចយល់ និងវាយតម្លៃពីភាពត្រឹមត្រូវនៃលទ្ធផលនោះ។ ដូចសិស្សពូកែគណិតវិទ្យាដែលមិនត្រឹមតែសរសេរចម្លើយត្រូវទេ តែថែមទាំងបង្ហាញពីរបៀបគណនាគ្រប់ជំហានឱ្យគ្រូពិនិត្យមើល។
Black-box nature សំដៅលើប្រព័ន្ធ AI (ដូចជា Deep Learning) ដែលដំណើរការផ្ទៃក្នុងរបស់វាមានភាពស្មុគស្មាញខ្លាំង រហូតដល់មនុស្សមិនអាចមើលឃើញ ឬយល់ពីរបៀបដែលវាបម្លែងទិន្នន័យចូលទៅជាចម្លើយចេញមកក្រៅបាន។ ដូចជាប្រអប់វេទមន្តដែលយើងដាក់វត្ថុចូល ហើយទទួលបានលទ្ធផលមកវិញ ប៉ុន្តែយើងមិនដឹងថាមានអ្វីកើតឡើងនៅក្នុងប្រអប់នោះទេ។
Convolutional Neural Network (CNN) ជាប្រភេទនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតដែលត្រូវបានរចនាឡើងពិសេសសម្រាប់វិភាគរូបភាព ដោយប្រើប្រាស់តម្រង (Filters) ដើម្បីចាប់យកលក្ខណៈពិសេសដូចជា ខ្សែ រូបរាង និងពណ៌ ដើម្បីសម្គាល់វត្ថុ។ ដូចជាការប្រើវ៉ែនតាពិសេសច្រើនជាន់ ដើម្បីពិនិត្យមើលចំណុចតូចៗ និងលម្អិតនៅក្នុងរូបភាពដែលភ្នែកធម្មតាមើលមិនឃើញ។
Feature Extraction ដំណើរការនៃការជ្រើសរើស និងទាញយកព័ត៌មានសំខាន់ៗ ឬលក្ខណៈពិសេសចេញពីរូបភាពដើម (ដូចជាទំហំ ឬសណ្ឋានដុំសាច់) ដើម្បីឱ្យកុំព្យូទ័រងាយស្រួលក្នុងការវិភាគ និងធ្វើការចាត់ថ្នាក់។ ដូចជាការសង្ខេបសាច់រឿងវែងមួយ ដោយយកតែចំណុចសំខាន់ៗ និងតួអង្គឯកមកនិយាយ ដើម្បីងាយស្រួលយល់។
False Discovery Rate (FDR) ជារង្វាស់ដែលបង្ហាញពីអត្រានៃកំហុសក្នុងការរកឃើញ ពោលគឺសមាមាត្រនៃករណីដែលប្រព័ន្ធទាយថាមានជំងឺមហារីក ប៉ុន្តែការពិតគឺគ្មានជំងឺ (False Positives) ធៀបនឹងចំនួនដែលទាយថាមានជំងឺទាំងអស់។ ដូចជាកណ្ដឹងប្រកាសអាសន្នដែលរោទ៍ព្រមានថាមានចោរចូល ប៉ុន្តែតាមពិតគ្មានចោរនោះទេ (ការព្រមានខុស)។
Diagnostic Odds Ratio (DOR) ជាមេគុណស្ថិតិដែលវាស់វែងប្រសិទ្ធភាពនៃការធ្វើរោគវិនិច្ឆ័យ ដោយប្រៀបធៀបឱកាសនៃការទាយត្រូវ (ទាំងវិជ្ជមាន និងអវិជ្ជមាន) ទៅនឹងឱកាសនៃការទាយខុស។ តម្លៃ DOR កាន់តែខ្ពស់ បង្ហាញថាប្រព័ន្ធមានភាពត្រឹមត្រូវកាន់តែខ្លាំង។ ជាពិន្ទុរួមមួយដែលប្រាប់យើងថា តើម៉ាស៊ីននោះពូកែប៉ុណ្ណាក្នុងការបែងចែករវាងអ្នកឈឺ និងអ្នកជា។
Image Segmentation បច្ចេកទេសបែងចែករូបភាពទៅជាផ្នែកតូចៗផ្សេងគ្នា ដើម្បីកំណត់ទីតាំង និងព្រំដែននៃវត្ថុនៅក្នុងរូបភាពនោះ (ឧទាហរណ៍៖ ការកាត់យកតែផ្នែកដុំសាច់មហារីកចេញពីរូបភាពសរីរាង្គទាំងមូល)។ ដូចជាការគូសរង្វង់ជុំវិញកន្លែងដែលមានបញ្ហានៅលើផែនទី ដើម្បីឱ្យយើងផ្តោតមើលតែចំណុចនោះ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖