Original Title: Evaluating the Impact of Data Augmentation on Explainable AI in Medical Image Analysis
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការវាយតម្លៃលើឥទ្ធិពលនៃការបង្កើនទិន្នន័យទៅលើបញ្ញាសិប្បនិម្មិតដែលអាចពន្យល់បានក្នុងការវិភាគរូបភាពវេជ្ជសាស្ត្រ

ចំណងជើងដើម៖ Evaluating the Impact of Data Augmentation on Explainable AI in Medical Image Analysis

អ្នកនិពន្ធ៖ Freddie X.Liu (Eindhoven University of Technology)

ឆ្នាំបោះពុម្ព៖ 2024, Eindhoven University of Technology

វិស័យសិក្សា៖ Artificial Intelligence / Medical Image Analysis

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ កង្វះតម្លាភាព និងលទ្ធភាពអាចពន្យល់បាននៅក្នុងម៉ូដែល Deep Learning ដ៏ស្មុគស្មាញ បង្កើនក្តីបារម្ភផ្នែកក្រមសីលធម៌ និងច្បាប់នៅក្នុងវិស័យថែទាំសុខភាព។ និក្ខេបបទនេះដោះស្រាយបញ្ហាខ្វះខាតនៃការស្រាវជ្រាវទាក់ទងនឹងរបៀបដែលវិធីសាស្ត្របង្កើនទិន្នន័យ (Data Augmentation) ផ្សេងៗគ្នាជះឥទ្ធិពលដល់លទ្ធភាពពន្យល់ (Explainability) នៃម៉ូដែលទស្សន៍ទាយក្នុងការធ្វើចំណាត់ថ្នាក់រូបភាពវេជ្ជសាស្ត្រ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានអនុវត្តម៉ូដែល Deep Learning ប្រភេទ DenseNet-121 លើសំណុំទិន្នន័យកាំរស្មីអ៊ិចទ្រូង (Chest X-ray) ដោយប្រើបច្ចេកទេសបង្កើនទិន្នន័យផ្សេងៗ បន្ទាប់មកអនុវត្តវិធីសាស្ត្រ XAI ដើម្បីវាយតម្លៃភាពពេញលេញ ភាពត្រឹមត្រូវ និងភាពស៊ីសង្វាក់គ្នានៃការពន្យល់។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Baseline (No Augmentation)
ម៉ូដែលគោល (គ្មានការបង្កើនទិន្នន័យ)
ងាយស្រួលយល់ និងមិនត្រូវការកម្លាំងម៉ាស៊ីនដើម្បីដំណើរការការកែប្រែទិន្នន័យបន្ថែមកំឡុងពេលហ្វឹកហាត់។ ងាយរងការចងចាំទិន្នន័យហួសកម្រិត (Overfitting) និងមានលទ្ធផលភាពត្រឹមត្រូវនៃការទស្សន៍ទាយទាបជាងគេ។ ទទួលបានភាពត្រឹមត្រូវទូទៅ (Overall Accuracy) ៩៣.៩៤% និងពិន្ទុ F1 ០.៩៣៩៣។
Flipping + Cropping
ការត្រឡប់និងកាត់រូបភាព (វិធីសាស្ត្រប្រពៃណី)
ងាយស្រួលអនុវត្តបំផុត និងមានឥទ្ធិពលវិជ្ជមានទៅលើភាពស៊ីសង្វាក់គ្នានៃការពន្យល់ (Coherence) ពេលប្រើជាមួយវិធីសាស្ត្រ LIME។ ធ្វើឱ្យធ្លាក់ចុះនូវភាពពេញលេញ (Fidelity/Completeness) នៃការពន្យល់របស់ម៉ូដែល ដែលមានន័យថាការពន្យល់មិនសូវស៊ីសង្វាក់ជាមួយម៉ូដែលដើម។ ទទួលបានភាពត្រឹមត្រូវទូទៅ ៩៥.៦៧% និងពិន្ទុ F1 ០.៩៥៦៩។
TrivialAugment
ការបង្កើនទិន្នន័យតាមរយៈការស្វែងរកដោយចៃដន្យ (TrivialAugment)
ផ្តល់លទ្ធផលល្អបំផុតទាំងភាពត្រឹមត្រូវនៃការទស្សន៍ទាយ និងបង្កើនភាពពេញលេញ (Completeness) ព្រមទាំងភាពស៊ីសង្វាក់គ្នានៃការពន្យល់។ ទោះបីជាវាមិនត្រូវការការកំណត់ប៉ារ៉ាម៉ែត្រស្មុគស្មាញ វាអាចនឹងកែប្រែរូបភាពហួសហេតុក្នុងករណីខ្លះបើធៀបនឹងវិធីប្រពៃណី។ សម្រេចបានការកែលម្អខ្ពស់បំផុតដោយមានភាពត្រឹមត្រូវទូទៅ ៩៥.៩៩% និងពិន្ទុ F1 ០.៩៦០០។
Mixup (50%)
ការលាយបញ្ចូលរូបភាពនិងស្លាកទិន្នន័យបញ្ចូលគ្នា (Mixup លាយ ៥០%)
ជួយកាត់បន្ថយ Overfitting យ៉ាងមានប្រសិទ្ធភាព និងបង្កើនភាពត្រឹមត្រូវនៃម៉ូដែលបានយ៉ាងល្អ។ ធ្វើឱ្យរូបភាពមើលទៅមិនច្បាស់លាស់តាមបែបធម្មជាតិ ប៉ះពាល់អវិជ្ជមានដល់ភាពស៊ីសង្វាក់គ្នានៃការពន្យល់ (ជាពិសេសពេលប្រើជាមួយ SHAP) និងកាត់បន្ថយ Fidelity។ ទទួលបានភាពត្រឹមត្រូវទូទៅ ៩៥.៨៧% និងពិន្ទុ F1 ០.៩៥៨៩។

ការចំណាយលើធនធាន (Resource Cost)៖ ឯកសារនេះបានបញ្ជាក់យ៉ាងច្បាស់អំពីធនធានដែលត្រូវបានប្រើប្រាស់សម្រាប់ការពិសោធន៍ ជាពិសេសផ្នែករឹង (Hardware) និងផ្នែកទន់ (Software) ក៏ដូចជាទិន្នន័យ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យ COVID-19 Radiography Database ដែលប្រមូលបានពីប្រទេសកាតា បង់ក្លាដែស ប៉ាគីស្ថាន និងម៉ាឡេស៊ី។ ទោះបីជាវាបានតំណាងឱ្យប្រជាសាស្ត្រអាស៊ីមួយចំនួនក៏ដោយ វាមិនអាចឆ្លុះបញ្ចាំងទាំងស្រុងអំពីបរិបទរបស់អ្នកជំងឺកម្ពុជា លក្ខណៈបច្ចេកទេសនៃម៉ាស៊ីនថតកាំរស្មីអ៊ិចតាមមន្ទីរពេទ្យខេត្ត ឬការលាយឡំនៃជំងឺផ្សេងៗ (Co-morbidities) ដែលតែងតែកើតមាននៅកម្ពុជានោះទេ។ ការពឹងផ្អែកលើទិន្នន័យនេះទាំងស្រុងអាចធ្វើឱ្យម៉ូដែលខ្វះភាពសុក្រឹតនៅពេលអនុវត្តផ្ទាល់នៅកម្ពុជា។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះជាយ៉ាងណាក៏ដោយ វិធីសាស្ត្រក្នុងការស្រាវជ្រាវនេះមានតម្លៃខ្លាំងណាស់ក្នុងការជួយដោះស្រាយបញ្ហាខ្វះខាតធនធានគ្រូពេទ្យជំនាញ និងបញ្ហាកង្វះទិន្នន័យនៅកម្ពុជា តាមរយៈការប្រើប្រាស់ Data Augmentation និង XAI។

ជារួម ការរួមបញ្ចូលបច្ចេកទេសបង្កើនទិន្នន័យ (Data Augmentation) ជាមួយនឹង AI ដែលអាចពន្យល់បាន (XAI) គឺជាស្ពានដ៏សំខាន់មួយដែលអាចជួយឱ្យវិស័យសុខាភិបាលកម្ពុជាហ៊ានទទួលយកបច្ចេកវិទ្យា AI មកប្រើប្រាស់ប្រកបដោយតម្លាភាព និងក្រមសីលធម៌។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃ Computer Vision ក្នុងវិស័យវេជ្ជសាស្ត្រ: ស្វែងយល់ពីរបៀបដំណើរការរបស់បណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត (CNNs) និងស្ថាបត្យកម្មល្បីៗដូចជា DenseNet-121 ដោយប្រើប្រាស់ភាសាសរសេរកូដ Python និងបណ្ណាល័យ PyTorch ជាមូលដ្ឋានសម្រាប់ការទាញយកលក្ខណៈសម្គាល់ពីរូបភាព។
  2. អនុវត្តបច្ចេកទេស Data Augmentation ប្លែកៗ: រៀនសរសេរកូដដើម្បីអនុវត្តវិធីសាស្ត្របង្កើនទិន្នន័យតាមបែបប្រពៃណី និងបែបទំនើបដូចជា Mixup រួមទាំងវិធីសាស្ត្រ TrivialAugment តាមរយៈបណ្ណាល័យ Torchvision ដើម្បីដោះស្រាយបញ្ហាកង្វះខាតរូបភាពវេជ្ជសាស្ត្រពិតប្រាកដ។
  3. សិក្សាស៊ីជម្រៅពីក្បួន Explainable AI (XAI): ស្វែងយល់ពីទ្រឹស្តីក្បួនគណនានិងការអនុវត្តជាក់ស្តែងនៃកញ្ចប់កូដ LIME និងកញ្ចប់កូដ SHAP ដើម្បីរៀនពីរបៀបបកស្រាយចំណុចសំខាន់ៗដែល AI ប្រើសម្រាប់ធ្វើការសម្រេចចិត្ត និងវាយតម្លៃលើភាពត្រឹមត្រូវនៃការពន្យល់ទាំងនោះ។
  4. រៀបចំការពិសោធន៍ឡើងវិញលើ Cloud: ប្រើប្រាស់បរិយាកាស Google Colab ដើម្បីទទួលបាន GPU ដោយឥតគិតថ្លៃ រួចទាញយកសំណុំទិន្នន័យស្តីពី Chest X-ray មកហ្វឹកហាត់ម៉ូដែល និងសាកល្បងធ្វើការត្រួតពិនិត្យភាពត្រឹមត្រូវ (Sanity Checks) តាមរយៈការសរសេរកូដដោយខ្លួនឯង។
  5. ប្រមូលទិន្នន័យក្នុងស្រុកនិងតេស្តក្នុងបរិបទកម្ពុជា: ចាប់ផ្តើមសហការជាមួយមន្ទីរពេទ្យ ឬសាកលវិទ្យាល័យផ្នែកសុខាភិបាលក្នុងស្រុកដើម្បីប្រមូលទិន្នន័យរូបភាព X-ray របស់អ្នកជំងឺកម្ពុជាយកមកធ្វើតេស្តជាមួយម៉ូដែលដែលបានបង្កើតរួច ដើម្បីផ្ទៀងផ្ទាត់ប្រសិទ្ធភាព និងរៀបចំជាគម្រោងសរសេរសារណាបញ្ចប់ការសិក្សា។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Explainable AI (XAI) គឺជាបច្ចេកទេស និងក្បួនអានុមានដែលជួយបំប្លែងម៉ូដែលបញ្ញាសិប្បនិម្មិតដ៏ស្មុគស្មាញ (Black-box models) ឱ្យទៅជាទម្រង់ដែលមានតម្លាភាព ដោយវាអាចពន្យល់ប្រាប់មនុស្សពីមូលហេតុដែលវាកំណត់លទ្ធផលឬធ្វើការសម្រេចចិត្តបែបនោះ (ឧទាហរណ៍៖ ការបង្ហាញពណ៌លើតំបន់សួតដែលមានជំងឺ)។ ដូចជាគ្រូពេទ្យម្នាក់ដែលមិនត្រឹមតែប្រាប់ថាយើងមានជំងឺអ្វីនោះទេ តែថែមទាំងចង្អុលបង្ហាញរោគសញ្ញាលើរាងកាយដែលធ្វើឱ្យគាត់សន្និដ្ឋានបែបនេះទៀតផង។
Data Augmentation គឺជាដំណើរការនៃការបង្កើតទិន្នន័យហ្វឹកហាត់ថ្មីៗបន្ថែមពីលើទិន្នន័យដែលមានស្រាប់ តាមរយៈការកែប្រែទម្រង់រូបភាព (ដូចជាការបង្វិល ការត្រឡប់ ការកាត់ ឬការលាយពណ៌) ដើម្បីជួយឱ្យម៉ូដែលរៀនបានកាន់តែទូលំទូលាយ និងការពារកុំឱ្យវាទន្ទេញចាំទិន្នន័យចាស់ៗពេក (Overfitting)។ ដូចជាការថតរូបមួយសន្លឹកពីជ្រុងផ្សេងៗគ្នា និងពន្លឺផ្សេងៗគ្នា ដើម្បីបង្រៀនឱ្យកូនក្មេងចំណាំមុខមនុស្សម្នាក់នោះកាន់តែច្បាស់ ទោះស្ថិតក្នុងស្ថានភាពណាក៏ដោយ។
LIME (Local Interpretable Model-agnostic Explanations) គឺជាវិធីសាស្ត្រ XAI មួយដែលព្យាយាមពន្យល់ការសម្រេចចិត្តរបស់ម៉ូដែល AI ដ៏ស្មុគស្មាញសម្រាប់ករណីនីមួយៗ (Local) ដោយវាបង្កើតម៉ូដែលគណិតវិទ្យាដ៏សាមញ្ញមួយមកធ្វើការប៉ាន់ស្មាននិងសិក្សាពីឥទ្ធិពលនៃការផ្លាស់ប្តូរទិន្នន័យបញ្ចូលតូចៗនៅជុំវិញករណីនោះ។ ដូចជាការយកផែនទីពិភពលោកដ៏ស្មុគស្មាញមួយ មកពង្រីកកាត់យកតែតំបន់ភូមិរបស់យើងដើម្បីងាយស្រួលយល់ និងរៀបរាប់ប្រាប់គេពីផ្លូវក្នុងភូមិ។
SHAP (SHapley Additive exPlanations) គឺជាក្បួនពន្យល់ AI ដែលផ្អែកលើទ្រឹស្តីល្បែង (Game Theory) ផ្នែកសេដ្ឋកិច្ច ដោយវាធ្វើការគណនានិងបែងចែកពិន្ទុឥទ្ធិពល (Importance value) ទៅឱ្យចំណុចនីមួយៗ (Pixels) នៃរូបភាព ដើម្បីបង្ហាញថាចំណុចណាខ្លះដែលរួមចំណែករុញច្រានឱ្យ AI សម្រេចចិត្តបែបនេះ។ ដូចជាការបែងចែកប្រាក់រង្វាន់ដល់កីឡាករម្នាក់ៗក្នុងក្រុមបាល់ទាត់ ដោយផ្អែកលើទំហំនៃការប្រឹងប្រែងរបស់ពួកគេក្នុងការទាត់បញ្ចូលទី។
Sanity Check (Cascading model randomization) គឺជាការធ្វើតេស្តដើម្បីផ្ទៀងផ្ទាត់ថាតើវិធីសាស្ត្រពន្យល់របស់ AI (XAI) ពិតជាដំណើរការត្រឹមត្រូវនិងគួរឱ្យទុកចិត្តដែរឬទេ តាមរយៈការសាកល្បងផ្លាស់ប្តូរទិន្នន័យចំណេះដឹងក្នុងបណ្តាញម៉ូដែល (Weights) ទៅជាតម្លៃចៃដន្យម្តងមួយស្រទាប់ៗ ប្រសិនបើការពន្យល់នៅតែដូចដើម មានន័យថាក្បួនពន្យល់នោះគ្មានប្រសិទ្ធភាពទេ។ ដូចជាការសាកល្បងដោះគ្រឿងបន្លាស់ម៉ាស៊ីនចេញម្តងមួយៗ ប្រសិនបើម៉ាស៊ីននៅតែអាចដើរបាន មានន័យថាការវិភាគរកមុខងារគ្រឿងបន្លាស់នោះគឺខុសស្រឡះហើយ។
Fidelity Score គឺជារង្វាស់ដែលប្រើដើម្បីវាយតម្លៃកម្រិតភាពពេញលេញ (Completeness) នៃការពន្យល់របស់ XAI ដោយវាវាស់ស្ទង់ថាតើម៉ូដែលសាមញ្ញ (Surrogate model) អាចចម្លងអាកប្បកិរិយា និងលទ្ធផលរបស់ម៉ូដែលដើមដ៏ស្មុគស្មាញ (Black-box) បានត្រឹមត្រូវកម្រិតណា។ ដូចជាការប្រៀបធៀបរូបគំនូរព្រាងរបស់វិចិត្រករ ថាតើវាមានភាពស្រដៀងគ្នាប៉ុនណាទៅនឹងរូបថតពិតប្រាកដរបស់មនុស្សម្នាក់។
Overlapping Score ជារង្វាស់ពិន្ទុដែលត្រូវបានបង្កើតឡើងក្នុងការសិក្សានេះដើម្បីវាយតម្លៃភាពស៊ីសង្វាក់គ្នា (Coherence) ដោយគណនាភាគរយនៃតំបន់ដែល AI បានគូសចំណាំ (Highlight) ថាមានការត្រួតស៊ីគ្នាប៉ុនណាទៅនឹងតំបន់ជំងឺពិតប្រាកដដែលត្រូវបានគូសវណ្ឌដោយគ្រូពេទ្យជំនាញ។ ដូចជាការយកផ្ទាំងចម្លើយសិស្ស មកដាក់ត្រួតពីលើផ្ទាំងកេសចម្លើយរបស់គ្រូ ដើម្បីរាប់មើលថាតើសិស្សគូសត្រូវចំចំណុចប៉ុន្មានភាគរយពិតប្រាកដ។
Mixup គឺជាបច្ចេកទេសបង្កើនទិន្នន័យបែបទំនើបមួយ ដែលដំណើរការដោយការយកទិន្នន័យរូបភាពពីរខុសគ្នា មកលាយបញ្ចូលគ្នា (Blend) រួមទាំងលាយបញ្ជូលស្លាកឈ្មោះរបស់វាផងដែរ ដើម្បីបង្កើតជារូបភាពព្រាលៗថ្មីមួយសម្រាប់បង្រៀនឱ្យម៉ូដែលចេះបែងចែកលក្ខណៈទូទៅបានល្អជាងមុន។ ដូចជាការយកថ្នាំពណ៌ក្រហមពាក់កណ្តាល លាយជាមួយពណ៌ខៀវពាក់កណ្តាល ដើម្បីបង្កើតបានជាពណ៌ស្វាយថ្មីមួយសម្រាប់ឱ្យកុំព្យូទ័ររៀនស្គាល់។
TrivialAugment គឺជាវិធីសាស្ត្របង្កើនទិន្នន័យបែបស្វែងរកដោយស្វ័យប្រវត្តិ (Search-based) ដែលវានឹងជ្រើសរើសយកប្រតិបត្តិការកែប្រែរូបភាពមួយមុខដោយចៃដន្យ (ឧទាហរណ៍៖ ការប្តូរកម្រិតពន្លឺ) និងអនុវត្តវាទៅលើរូបភាពក្នុងកម្រិតភាពខ្លាំងខ្សោយដោយចៃដន្យដោយមិនចាំបាច់កំណត់ប៉ារ៉ាម៉ែត្រទុកមុន។ ដូចជាចុងភៅដែលចាប់យកគ្រឿងទេសមួយមុខដោយចៃដន្យ (ឧទាហរណ៍៖ អំបិល) ហើយដាក់ក្នុងបរិមាណតិចឬច្រើនដោយចៃដន្យចូលទៅក្នុងសម្ល ដើម្បីសាកល្បងរសជាតិថ្មីៗ។
DenseNet-121 គឺជាស្ថាបត្យកម្មនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (CNN) ដ៏មានប្រសិទ្ធភាពមួយ ដែលស្រទាប់នីមួយៗមានតំណភ្ជាប់ផ្ទាល់ទៅកាន់ស្រទាប់បន្តបន្ទាប់ទាំងអស់នៅក្នុងបណ្តាញ ដែលជួយកាត់បន្ថយការបាត់បង់ព័ត៌មានកំឡុងពេលទាញយកលក្ខណៈសម្គាល់ពីរូបភាព និងប្រើប្រាស់ប៉ារ៉ាម៉ែត្រតិច។ ដូចជារោងចក្រដែលកម្មករគ្រប់ផ្នែកទាំងអស់អាចផ្ញើព័ត៌មានដោយផ្ទាល់ទៅកាន់កម្មករនៅផ្នែកបន្ទាប់ៗទាំងអស់ដោយមិនបាច់ឆ្លងកាត់មេកើយតាមលំដាប់ថ្នាក់ ដើម្បីកុំឱ្យបាត់បង់ចន្លោះប្រហោងព័ត៌មាន។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖