Original Title: An Efficient Explainable AI Model for Accurate Brain Tumor Detection Using MRI Images
Source: doi.org/10.32604/cmes.2025.067195
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ម៉ូដែល AI អាចពន្យល់បានប្រកបដោយប្រសិទ្ធភាពសម្រាប់ការរកឃើញដុំសាច់ខួរក្បាលបានយ៉ាងត្រឹមត្រូវដោយប្រើរូបភាព MRI

ចំណងជើងដើម៖ An Efficient Explainable AI Model for Accurate Brain Tumor Detection Using MRI Images

អ្នកនិពន្ធ៖ Fatma M. Talaat (Kafrelsheikh University, Egypt), Mohamed Salem (Kafrelsheikh University, Egypt), Mohamed Shehata (University of Louisville, USA), Warda M. Shaban (Nile Higher Institute, Egypt)

ឆ្នាំបោះពុម្ព៖ 2025 (Computer Modeling in Engineering & Sciences)

វិស័យសិក្សា៖ Computer Science & Medical Imaging

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ បញ្ហាចម្បងគឺការធ្វើរោគវិនិច្ឆ័យដុំសាច់ខួរក្បាលតាមបែបប្រពៃណីត្រូវការពេលវេលាច្រើន និងពឹងផ្អែកខ្លាំងលើជំនាញរបស់គ្រូពេទ្យជំនាញ ដែលងាយនឹងមានកំហុស ខណៈដែលប្រព័ន្ធ AI បច្ចុប្បន្នមួយចំនួនខ្វះតម្លាភាពក្នុងការបកស្រាយលទ្ធផល (Black Boxes) ធ្វើឱ្យពិបាកក្នុងការជឿទុកចិត្តលើការសម្រេចចិត្តផ្នែកវេជ្ជសាស្រ្ត។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះស្នើឡើងនូវម៉ូដែលរកឃើញដុំសាច់ខួរក្បាល (BTD) ដែលរួមបញ្ចូលគ្នានូវបច្ចេកទេសរៀនសូត្ររបស់ម៉ាស៊ីន (Machine Learning) ជាច្រើន និងប្រព័ន្ធ AI ដែលអាចពន្យល់បាន ដើម្បីបង្កើនភាពត្រឹមត្រូវ និងតម្លាភាព។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Proposed Algorithm (IGWO + XGBoost & ANN Voting)
ម៉ូដែលស្នើឡើង (ការប្រើប្រាស់ IGWO និងការបោះឆ្នោតរួមរវាង XGBoost និង ANN)
មានភាពត្រឹមត្រូវខ្ពស់បំផុត និងផ្តល់នូវការពន្យល់អំពីការសម្រេចចិត្តតាមរយៈ LIME ដែលជួយបង្កើនទំនុកចិត្តដល់គ្រូពេទ្យ។ មានភាពស្មុគស្មាញក្នុងការអនុវត្តជាងម៉ូដែលទោល និងត្រូវការពេលវេលាគណនាបន្ថែមសម្រាប់ដំណាក់កាលជ្រើសរើសលក្ខណៈពិសេស (Feature Selection)។ ភាពត្រឹមត្រូវ (Accuracy) ៩៨.៥% និង F1-score ៩៨%
Artificial Neural Network (ANN) - Standalone
បណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (ANN) តែឯកឯង
មានសមត្ថភាពល្អក្នុងការរៀនលំនាំស្មុគស្មាញពីទិន្នន័យដោយមិនត្រូវការការជ្រើសរើសលក្ខណៈពិសេសច្រើន។ ដំណើរការដូចប្រអប់ខ្មៅ (Black-box) ពិបាកបកស្រាយ និងមានភាពត្រឹមត្រូវទាបជាងម៉ូដែលចម្រុះ។ ភាពត្រឹមត្រូវ (Accuracy) ៩៦.១%
XGBoost - Standalone
XGBoost តែឯកឯង
មានល្បឿនលឿន និងប្រសិទ្ធភាពខ្ពស់លើទិន្នន័យដែលមានរចនាសម្ព័ន្ធ។ ប្រសិទ្ធភាពថយចុះបន្តិចបន្តួចនៅពេលមិនមានការជ្រើសរើសលក្ខណៈពិសេស (Feature Selection) ឱ្យបានត្រឹមត្រូវ។ ភាពត្រឹមត្រូវ (Accuracy) ៩៥.២%
Random Forest (RF)
Random Forest (RF)
ងាយស្រួលអនុវត្ត និងមិនសូវមានបញ្ហា Overfitting។ ទទួលបានលទ្ធផលទាបជាងបច្ចេកទេស Boosting និង Neural Networks ក្នុងការសិក្សានេះ។ ភាពត្រឹមត្រូវ (Accuracy) ៩២.៤%

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះតម្រូវឱ្យមានធនធានគណនាកម្រិតមធ្យមទៅខ្ពស់ ដោយសារការប្រើប្រាស់ក្បួនដោះស្រាយ Optimization និងការបណ្តុះបណ្តាលម៉ូដែលចម្រុះ (Ensemble Model)។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់ទិន្នន័យសាធារណៈ (Kaggle dataset) ដែលមានចំនួនតិច (ត្រឹមតែ ២៥២ រូបភាព) និងអាចមិនឆ្លុះបញ្ចាំងពីភាពចម្រុះនៃអ្នកជំងឺនៅក្នុងប្រទេសកម្ពុជា។ លើសពីនេះ កង្វះព័ត៌មានអំពីប្រភពដើមនៃទិន្នន័យ (ដូចជាឧបករណ៍ MRI ដែលប្រើ ឬប្រជាសាស្ត្ររបស់អ្នកជំងឺ) អាចធ្វើឱ្យម៉ូដែលលំអៀងទៅរកលក្ខណៈជាក់លាក់នៃទិន្នន័យនោះ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកទេសនេះមានប្រយោជន៍ខ្លាំងសម្រាប់វិស័យសុខាភិបាលនៅកម្ពុជា ជាពិសេសក្នុងការជួយគាំទ្រដល់គ្រូពេទ្យវិទ្យុសាស្ត្រ (Radiologists)។

ទោះបីជាមានសក្តានុពលខ្ពស់ ប៉ុន្តែការដាក់ឱ្យប្រើប្រាស់ជាក់ស្តែងទាមទារឱ្យមានការធ្វើតេស្តជាមួយទិន្នន័យអ្នកជំងឺក្នុងស្រុក និងការត្រួតពិនិត្យដោយផ្ទាល់ពីគ្រូពេទ្យជំនាញជាមុនសិន។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះ និងប្រមូលទិន្នន័យ: និស្សិតគួរចាប់ផ្តើមរៀនភាសា Python និងបណ្ណាល័យដូចជា OpenCV សម្រាប់ការរבודរូបភាព។ ទាញយក Dataset ពី Kaggle ដែលមាននៅក្នុងឯកសារយោង ដើម្បីធ្វើការពិសោធន៍។
  2. អនុវត្តការទាញយកលក្ខណៈពិសេស (Feature Extraction): សរសេរកូដដើម្បីទាញយកលក្ខណៈពិសេសពីរូបភាពដោយប្រើវិធីសាស្ត្រ GLCM (សម្រាប់វាយនភាព), HOG (សម្រាប់រូបរាង), និង LBP (សម្រាប់លំនាំ) ដោយប្រើបណ្ណាល័យ scikit-image ។
  3. អភិវឌ្ឍន៍ក្បួនដោះស្រាយ Optimization: សិក្សា និងអនុវត្តក្បួនដោះស្រាយ Gray Wolf Optimization (GWO) ដើម្បីជ្រើសរើសលក្ខណៈពិសេសដែលសំខាន់បំផុត។ អាចប្រើកូដដែលមានស្រាប់ជាគំរូ ឬសរសេរថ្មីដោយផ្អែកលើទ្រឹស្តី។
  4. កសាង និងបណ្តុះបណ្តាលម៉ូដែលចម្រុះ: បង្កើតម៉ូដែល XGBoost និង ANN ហើយប្រើបច្ចេកទេស Voting Classifier ដើម្បីបញ្ចូលលទ្ធផលរបស់វា។ ធ្វើការប្រៀបធៀបលទ្ធផលជាមួយម៉ូដែលទោល។
  5. អនុវត្ត Explainable AI (XAI): ប្រើប្រាស់បណ្ណាល័យ LIME ដើម្បីបង្កើតរូបភាពពន្យល់ (Heatmaps) ដែលបង្ហាញថាផ្នែកណានៃខួរក្បាលដែលម៉ូដែលប្រើដើម្បីធ្វើការសម្រេចចិត្ត។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Improved Gray Wolf Optimization (IGWO) ជាក្បួនដោះស្រាយគណិតវិទ្យាដែលយកគំរូតាមរបៀបសត្វចចកប្រផេះបរបាញ់ចំណី ដើម្បីស្វែងរកនិងជ្រើសរើសយកតែទិន្នន័យ (លក្ខណៈពិសេស) ដែលសំខាន់បំផុតសម្រាប់ការវិភាគ និងបោះបង់ទិន្នន័យដែលមិនចាំបាច់ចោល ដើម្បីបង្កើនប្រសិទ្ធភាពម៉ូដែល។ ដូចជាក្រុមអ្នករុករកដែលធ្វើការរួមគ្នាដើម្បីស្វែងរកផ្លូវកាត់ដ៏ល្អបំផុតទៅកាន់គោលដៅ ដោយមិនចំណាយពេលដើរគ្រប់ផ្លូវដែលមិនចាំបាច់។
Explainable AI (XAI) បច្ចេកវិទ្យាដែលជួយបកស្រាយលទ្ធផលរបស់ AI ឱ្យមនុស្សយល់បាន។ នៅក្នុងការសិក្សានេះ វាប្រើដើម្បីបង្ហាញថាផ្នែកណាមួយនៃរូបភាពខួរក្បាលដែលម៉ូដែលបានប្រើដើម្បីកំណត់ថាមានដុំសាច់ ជៀសវាងការជឿលើ AI ដោយងងឹតងងុល។ ដូចជាគ្រូដែលសុំឱ្យសិស្សបង្ហាញពីរបៀបដោះស្រាយលំហាត់គណិតវិទ្យា ដើម្បីឱ្យដឹងថាហេតុអ្វីបានជាសិស្សរកឃើញចម្លើយនោះ។
Ensemble Learning វិធីសាស្ត្រនៃការប្រើប្រាស់ម៉ូដែលកុំព្យូទ័រជាច្រើន (ដូចជា XGBoost និង ANN) រួមគ្នាដើម្បីធ្វើការទស្សន៍ទាយ។ លទ្ធផលចុងក្រោយត្រូវបានសម្រេចដោយការបោះឆ្នោត (Voting) ពីម៉ូដែលនីមួយៗ ដើម្បីឱ្យមានភាពត្រឹមត្រូវខ្ពស់ជាងការប្រើម៉ូដែលតែមួយ។ ដូចជាការសួរយោបល់ពីគ្រូពេទ្យជំនាញជាច្រើននាក់ មុននឹងសម្រេចចិត្តលើការព្យាបាល ដើម្បីធានាថាវាត្រឹមត្រូវបំផុត។
Gray Level Co-occurrence Matrix (GLCM) វិធីសាស្ត្រស្ថិតិសម្រាប់វិភាគ "វាយនភាព" (Texture) នៃរូបភាព ដោយពិនិត្យមើលទំនាក់ទំនងរវាងកម្រិតពន្លឺនៃភីកសែលដែលនៅក្បែរគ្នា ដើម្បីសម្គាល់ភាពខុសគ្នារវាងកោសិកាធម្មតា និងកោសិកាដុំសាច់។ ដូចជាការពិនិត្យមើលក្រឡានៃសាច់ក្រណាត់យ៉ាងជិត ដើម្បីដឹងថាវាជាសូត្រ ឬជាកប្បាស ដោយមើលលើភាពរលោងឬគ្រើមរបស់វា។
Histogram of Oriented Gradients (HOG) បច្ចេកទេសដែលប្រើដើម្បីចាប់យកទ្រង់ទ្រាយ និងគែមនៃវត្ថុនៅក្នុងរូបភាព ដោយវាស់ទិសដៅនៃការផ្លាស់ប្តូរពន្លឺ។ វាជួយឱ្យកុំព្យូទ័រមើលឃើញ "រូបរាង" នៃដុំសាច់បានច្បាស់ ទោះបីជាពន្លឺក្នុងរូបភាពប្រែប្រួលក៏ដោយ។ ដូចជាការគូសវាសរូបភាពដោយប្រើតែគំនូសព្រាងនៃគែម (Outlines) ដើម្បីឱ្យគេមើលដឹងថាជារូបអ្វី ដោយមិនបាច់លាបពណ៌លម្អិត។
Feature Selection ដំណើរការនៃការចម្រោះយកតែព័ត៌មានដែលសំខាន់បំផុតពីរូបភាពមកប្រើប្រាស់ និងកាត់ចោលព័ត៌មានដែលរំខាន (Noise) ឬមិនចាំបាច់ ដើម្បីឱ្យម៉ូដែលដំណើរការលឿន និងត្រឹមត្រូវជាងមុន។ ដូចជាការរៀបចំកាបូបសម្រាប់ការធ្វើដំណើរ ដោយជ្រើសរើសយកតែរបស់របរដែលចាំបាច់បំផុត និងទុករបស់ដែលមិនត្រូវការចោល ដើម្បីកុំឱ្យធ្ងន់។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖