បញ្ហា (The Problem)៖ កង្វះតម្លាភាព និងលទ្ធភាពអាចពន្យល់បាននៅក្នុងម៉ូដែល Deep Learning ដ៏ស្មុគស្មាញ បង្កើនក្តីបារម្ភផ្នែកក្រមសីលធម៌ និងច្បាប់នៅក្នុងវិស័យថែទាំសុខភាព។ និក្ខេបបទនេះដោះស្រាយបញ្ហាខ្វះខាតនៃការស្រាវជ្រាវទាក់ទងនឹងរបៀបដែលវិធីសាស្ត្របង្កើនទិន្នន័យ (Data Augmentation) ផ្សេងៗគ្នាជះឥទ្ធិពលដល់លទ្ធភាពពន្យល់ (Explainability) នៃម៉ូដែលទស្សន៍ទាយក្នុងការធ្វើចំណាត់ថ្នាក់រូបភាពវេជ្ជសាស្ត្រ។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានអនុវត្តម៉ូដែល Deep Learning ប្រភេទ DenseNet-121 លើសំណុំទិន្នន័យកាំរស្មីអ៊ិចទ្រូង (Chest X-ray) ដោយប្រើបច្ចេកទេសបង្កើនទិន្នន័យផ្សេងៗ បន្ទាប់មកអនុវត្តវិធីសាស្ត្រ XAI ដើម្បីវាយតម្លៃភាពពេញលេញ ភាពត្រឹមត្រូវ និងភាពស៊ីសង្វាក់គ្នានៃការពន្យល់។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Baseline (No Augmentation) ម៉ូដែលគោល (គ្មានការបង្កើនទិន្នន័យ) |
ងាយស្រួលយល់ និងមិនត្រូវការកម្លាំងម៉ាស៊ីនដើម្បីដំណើរការការកែប្រែទិន្នន័យបន្ថែមកំឡុងពេលហ្វឹកហាត់។ | ងាយរងការចងចាំទិន្នន័យហួសកម្រិត (Overfitting) និងមានលទ្ធផលភាពត្រឹមត្រូវនៃការទស្សន៍ទាយទាបជាងគេ។ | ទទួលបានភាពត្រឹមត្រូវទូទៅ (Overall Accuracy) ៩៣.៩៤% និងពិន្ទុ F1 ០.៩៣៩៣។ |
| Flipping + Cropping ការត្រឡប់និងកាត់រូបភាព (វិធីសាស្ត្រប្រពៃណី) |
ងាយស្រួលអនុវត្តបំផុត និងមានឥទ្ធិពលវិជ្ជមានទៅលើភាពស៊ីសង្វាក់គ្នានៃការពន្យល់ (Coherence) ពេលប្រើជាមួយវិធីសាស្ត្រ LIME។ | ធ្វើឱ្យធ្លាក់ចុះនូវភាពពេញលេញ (Fidelity/Completeness) នៃការពន្យល់របស់ម៉ូដែល ដែលមានន័យថាការពន្យល់មិនសូវស៊ីសង្វាក់ជាមួយម៉ូដែលដើម។ | ទទួលបានភាពត្រឹមត្រូវទូទៅ ៩៥.៦៧% និងពិន្ទុ F1 ០.៩៥៦៩។ |
| TrivialAugment ការបង្កើនទិន្នន័យតាមរយៈការស្វែងរកដោយចៃដន្យ (TrivialAugment) |
ផ្តល់លទ្ធផលល្អបំផុតទាំងភាពត្រឹមត្រូវនៃការទស្សន៍ទាយ និងបង្កើនភាពពេញលេញ (Completeness) ព្រមទាំងភាពស៊ីសង្វាក់គ្នានៃការពន្យល់។ | ទោះបីជាវាមិនត្រូវការការកំណត់ប៉ារ៉ាម៉ែត្រស្មុគស្មាញ វាអាចនឹងកែប្រែរូបភាពហួសហេតុក្នុងករណីខ្លះបើធៀបនឹងវិធីប្រពៃណី។ | សម្រេចបានការកែលម្អខ្ពស់បំផុតដោយមានភាពត្រឹមត្រូវទូទៅ ៩៥.៩៩% និងពិន្ទុ F1 ០.៩៦០០។ |
| Mixup (50%) ការលាយបញ្ចូលរូបភាពនិងស្លាកទិន្នន័យបញ្ចូលគ្នា (Mixup លាយ ៥០%) |
ជួយកាត់បន្ថយ Overfitting យ៉ាងមានប្រសិទ្ធភាព និងបង្កើនភាពត្រឹមត្រូវនៃម៉ូដែលបានយ៉ាងល្អ។ | ធ្វើឱ្យរូបភាពមើលទៅមិនច្បាស់លាស់តាមបែបធម្មជាតិ ប៉ះពាល់អវិជ្ជមានដល់ភាពស៊ីសង្វាក់គ្នានៃការពន្យល់ (ជាពិសេសពេលប្រើជាមួយ SHAP) និងកាត់បន្ថយ Fidelity។ | ទទួលបានភាពត្រឹមត្រូវទូទៅ ៩៥.៨៧% និងពិន្ទុ F1 ០.៩៥៨៩។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ឯកសារនេះបានបញ្ជាក់យ៉ាងច្បាស់អំពីធនធានដែលត្រូវបានប្រើប្រាស់សម្រាប់ការពិសោធន៍ ជាពិសេសផ្នែករឹង (Hardware) និងផ្នែកទន់ (Software) ក៏ដូចជាទិន្នន័យ។
ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យ COVID-19 Radiography Database ដែលប្រមូលបានពីប្រទេសកាតា បង់ក្លាដែស ប៉ាគីស្ថាន និងម៉ាឡេស៊ី។ ទោះបីជាវាបានតំណាងឱ្យប្រជាសាស្ត្រអាស៊ីមួយចំនួនក៏ដោយ វាមិនអាចឆ្លុះបញ្ចាំងទាំងស្រុងអំពីបរិបទរបស់អ្នកជំងឺកម្ពុជា លក្ខណៈបច្ចេកទេសនៃម៉ាស៊ីនថតកាំរស្មីអ៊ិចតាមមន្ទីរពេទ្យខេត្ត ឬការលាយឡំនៃជំងឺផ្សេងៗ (Co-morbidities) ដែលតែងតែកើតមាននៅកម្ពុជានោះទេ។ ការពឹងផ្អែកលើទិន្នន័យនេះទាំងស្រុងអាចធ្វើឱ្យម៉ូដែលខ្វះភាពសុក្រឹតនៅពេលអនុវត្តផ្ទាល់នៅកម្ពុជា។
ទោះជាយ៉ាងណាក៏ដោយ វិធីសាស្ត្រក្នុងការស្រាវជ្រាវនេះមានតម្លៃខ្លាំងណាស់ក្នុងការជួយដោះស្រាយបញ្ហាខ្វះខាតធនធានគ្រូពេទ្យជំនាញ និងបញ្ហាកង្វះទិន្នន័យនៅកម្ពុជា តាមរយៈការប្រើប្រាស់ Data Augmentation និង XAI។
ជារួម ការរួមបញ្ចូលបច្ចេកទេសបង្កើនទិន្នន័យ (Data Augmentation) ជាមួយនឹង AI ដែលអាចពន្យល់បាន (XAI) គឺជាស្ពានដ៏សំខាន់មួយដែលអាចជួយឱ្យវិស័យសុខាភិបាលកម្ពុជាហ៊ានទទួលយកបច្ចេកវិទ្យា AI មកប្រើប្រាស់ប្រកបដោយតម្លាភាព និងក្រមសីលធម៌។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Explainable AI (XAI) | គឺជាបច្ចេកទេស និងក្បួនអានុមានដែលជួយបំប្លែងម៉ូដែលបញ្ញាសិប្បនិម្មិតដ៏ស្មុគស្មាញ (Black-box models) ឱ្យទៅជាទម្រង់ដែលមានតម្លាភាព ដោយវាអាចពន្យល់ប្រាប់មនុស្សពីមូលហេតុដែលវាកំណត់លទ្ធផលឬធ្វើការសម្រេចចិត្តបែបនោះ (ឧទាហរណ៍៖ ការបង្ហាញពណ៌លើតំបន់សួតដែលមានជំងឺ)។ | ដូចជាគ្រូពេទ្យម្នាក់ដែលមិនត្រឹមតែប្រាប់ថាយើងមានជំងឺអ្វីនោះទេ តែថែមទាំងចង្អុលបង្ហាញរោគសញ្ញាលើរាងកាយដែលធ្វើឱ្យគាត់សន្និដ្ឋានបែបនេះទៀតផង។ |
| Data Augmentation | គឺជាដំណើរការនៃការបង្កើតទិន្នន័យហ្វឹកហាត់ថ្មីៗបន្ថែមពីលើទិន្នន័យដែលមានស្រាប់ តាមរយៈការកែប្រែទម្រង់រូបភាព (ដូចជាការបង្វិល ការត្រឡប់ ការកាត់ ឬការលាយពណ៌) ដើម្បីជួយឱ្យម៉ូដែលរៀនបានកាន់តែទូលំទូលាយ និងការពារកុំឱ្យវាទន្ទេញចាំទិន្នន័យចាស់ៗពេក (Overfitting)។ | ដូចជាការថតរូបមួយសន្លឹកពីជ្រុងផ្សេងៗគ្នា និងពន្លឺផ្សេងៗគ្នា ដើម្បីបង្រៀនឱ្យកូនក្មេងចំណាំមុខមនុស្សម្នាក់នោះកាន់តែច្បាស់ ទោះស្ថិតក្នុងស្ថានភាពណាក៏ដោយ។ |
| LIME (Local Interpretable Model-agnostic Explanations) | គឺជាវិធីសាស្ត្រ XAI មួយដែលព្យាយាមពន្យល់ការសម្រេចចិត្តរបស់ម៉ូដែល AI ដ៏ស្មុគស្មាញសម្រាប់ករណីនីមួយៗ (Local) ដោយវាបង្កើតម៉ូដែលគណិតវិទ្យាដ៏សាមញ្ញមួយមកធ្វើការប៉ាន់ស្មាននិងសិក្សាពីឥទ្ធិពលនៃការផ្លាស់ប្តូរទិន្នន័យបញ្ចូលតូចៗនៅជុំវិញករណីនោះ។ | ដូចជាការយកផែនទីពិភពលោកដ៏ស្មុគស្មាញមួយ មកពង្រីកកាត់យកតែតំបន់ភូមិរបស់យើងដើម្បីងាយស្រួលយល់ និងរៀបរាប់ប្រាប់គេពីផ្លូវក្នុងភូមិ។ |
| SHAP (SHapley Additive exPlanations) | គឺជាក្បួនពន្យល់ AI ដែលផ្អែកលើទ្រឹស្តីល្បែង (Game Theory) ផ្នែកសេដ្ឋកិច្ច ដោយវាធ្វើការគណនានិងបែងចែកពិន្ទុឥទ្ធិពល (Importance value) ទៅឱ្យចំណុចនីមួយៗ (Pixels) នៃរូបភាព ដើម្បីបង្ហាញថាចំណុចណាខ្លះដែលរួមចំណែករុញច្រានឱ្យ AI សម្រេចចិត្តបែបនេះ។ | ដូចជាការបែងចែកប្រាក់រង្វាន់ដល់កីឡាករម្នាក់ៗក្នុងក្រុមបាល់ទាត់ ដោយផ្អែកលើទំហំនៃការប្រឹងប្រែងរបស់ពួកគេក្នុងការទាត់បញ្ចូលទី។ |
| Sanity Check (Cascading model randomization) | គឺជាការធ្វើតេស្តដើម្បីផ្ទៀងផ្ទាត់ថាតើវិធីសាស្ត្រពន្យល់របស់ AI (XAI) ពិតជាដំណើរការត្រឹមត្រូវនិងគួរឱ្យទុកចិត្តដែរឬទេ តាមរយៈការសាកល្បងផ្លាស់ប្តូរទិន្នន័យចំណេះដឹងក្នុងបណ្តាញម៉ូដែល (Weights) ទៅជាតម្លៃចៃដន្យម្តងមួយស្រទាប់ៗ ប្រសិនបើការពន្យល់នៅតែដូចដើម មានន័យថាក្បួនពន្យល់នោះគ្មានប្រសិទ្ធភាពទេ។ | ដូចជាការសាកល្បងដោះគ្រឿងបន្លាស់ម៉ាស៊ីនចេញម្តងមួយៗ ប្រសិនបើម៉ាស៊ីននៅតែអាចដើរបាន មានន័យថាការវិភាគរកមុខងារគ្រឿងបន្លាស់នោះគឺខុសស្រឡះហើយ។ |
| Fidelity Score | គឺជារង្វាស់ដែលប្រើដើម្បីវាយតម្លៃកម្រិតភាពពេញលេញ (Completeness) នៃការពន្យល់របស់ XAI ដោយវាវាស់ស្ទង់ថាតើម៉ូដែលសាមញ្ញ (Surrogate model) អាចចម្លងអាកប្បកិរិយា និងលទ្ធផលរបស់ម៉ូដែលដើមដ៏ស្មុគស្មាញ (Black-box) បានត្រឹមត្រូវកម្រិតណា។ | ដូចជាការប្រៀបធៀបរូបគំនូរព្រាងរបស់វិចិត្រករ ថាតើវាមានភាពស្រដៀងគ្នាប៉ុនណាទៅនឹងរូបថតពិតប្រាកដរបស់មនុស្សម្នាក់។ |
| Overlapping Score | ជារង្វាស់ពិន្ទុដែលត្រូវបានបង្កើតឡើងក្នុងការសិក្សានេះដើម្បីវាយតម្លៃភាពស៊ីសង្វាក់គ្នា (Coherence) ដោយគណនាភាគរយនៃតំបន់ដែល AI បានគូសចំណាំ (Highlight) ថាមានការត្រួតស៊ីគ្នាប៉ុនណាទៅនឹងតំបន់ជំងឺពិតប្រាកដដែលត្រូវបានគូសវណ្ឌដោយគ្រូពេទ្យជំនាញ។ | ដូចជាការយកផ្ទាំងចម្លើយសិស្ស មកដាក់ត្រួតពីលើផ្ទាំងកេសចម្លើយរបស់គ្រូ ដើម្បីរាប់មើលថាតើសិស្សគូសត្រូវចំចំណុចប៉ុន្មានភាគរយពិតប្រាកដ។ |
| Mixup | គឺជាបច្ចេកទេសបង្កើនទិន្នន័យបែបទំនើបមួយ ដែលដំណើរការដោយការយកទិន្នន័យរូបភាពពីរខុសគ្នា មកលាយបញ្ចូលគ្នា (Blend) រួមទាំងលាយបញ្ជូលស្លាកឈ្មោះរបស់វាផងដែរ ដើម្បីបង្កើតជារូបភាពព្រាលៗថ្មីមួយសម្រាប់បង្រៀនឱ្យម៉ូដែលចេះបែងចែកលក្ខណៈទូទៅបានល្អជាងមុន។ | ដូចជាការយកថ្នាំពណ៌ក្រហមពាក់កណ្តាល លាយជាមួយពណ៌ខៀវពាក់កណ្តាល ដើម្បីបង្កើតបានជាពណ៌ស្វាយថ្មីមួយសម្រាប់ឱ្យកុំព្យូទ័ររៀនស្គាល់។ |
| TrivialAugment | គឺជាវិធីសាស្ត្របង្កើនទិន្នន័យបែបស្វែងរកដោយស្វ័យប្រវត្តិ (Search-based) ដែលវានឹងជ្រើសរើសយកប្រតិបត្តិការកែប្រែរូបភាពមួយមុខដោយចៃដន្យ (ឧទាហរណ៍៖ ការប្តូរកម្រិតពន្លឺ) និងអនុវត្តវាទៅលើរូបភាពក្នុងកម្រិតភាពខ្លាំងខ្សោយដោយចៃដន្យដោយមិនចាំបាច់កំណត់ប៉ារ៉ាម៉ែត្រទុកមុន។ | ដូចជាចុងភៅដែលចាប់យកគ្រឿងទេសមួយមុខដោយចៃដន្យ (ឧទាហរណ៍៖ អំបិល) ហើយដាក់ក្នុងបរិមាណតិចឬច្រើនដោយចៃដន្យចូលទៅក្នុងសម្ល ដើម្បីសាកល្បងរសជាតិថ្មីៗ។ |
| DenseNet-121 | គឺជាស្ថាបត្យកម្មនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (CNN) ដ៏មានប្រសិទ្ធភាពមួយ ដែលស្រទាប់នីមួយៗមានតំណភ្ជាប់ផ្ទាល់ទៅកាន់ស្រទាប់បន្តបន្ទាប់ទាំងអស់នៅក្នុងបណ្តាញ ដែលជួយកាត់បន្ថយការបាត់បង់ព័ត៌មានកំឡុងពេលទាញយកលក្ខណៈសម្គាល់ពីរូបភាព និងប្រើប្រាស់ប៉ារ៉ាម៉ែត្រតិច។ | ដូចជារោងចក្រដែលកម្មករគ្រប់ផ្នែកទាំងអស់អាចផ្ញើព័ត៌មានដោយផ្ទាល់ទៅកាន់កម្មករនៅផ្នែកបន្ទាប់ៗទាំងអស់ដោយមិនបាច់ឆ្លងកាត់មេកើយតាមលំដាប់ថ្នាក់ ដើម្បីកុំឱ្យបាត់បង់ចន្លោះប្រហោងព័ត៌មាន។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖