បញ្ហា (The Problem)៖ ទោះបីជាបណ្តាញសរសៃប្រសាទ (CNNs) បង្ហាញពីភាពត្រឹមត្រូវខ្ពស់ក្នុងការវិភាគរូបភាពវេជ្ជសាស្ត្រក៏ដោយ ប៉ុន្តែភាពស្មុគស្មាញនៃម៉ូដែល (Opaque nature) បានរារាំងដល់ការទទួលយកមកប្រើប្រាស់ក្នុងគ្លីនិក ដែលទាមទារឱ្យមានឧបករណ៍ពន្យល់ AI ដែលវេជ្ជបណ្ឌិតអាចទុកចិត្តបាន។
វិធីសាស្ត្រ (The Methodology)៖ អ្នកនិពន្ធបានអភិវឌ្ឍកម្មវិធីងាយស្រួលប្រើឈ្មោះថា XAIMed ដែលរួមបញ្ចូលវិធីសាស្ត្រពន្យល់ AI ជាច្រើនប្រភេទ ដើម្បីផ្តល់ជារូបភាពបង្ហាញពីមូលហេតុនៃការសម្រេចចិត្តរបស់ម៉ូដែល AI។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| LIME (Local Interpretable Model-agnostic Explanations) វិធីសាស្ត្រពន្យល់ម៉ូដែលមូលដ្ឋានដោយមិនគិតពីប្រភេទម៉ូដែល ដោយប្រើការផ្លាស់ប្តូរទិន្នន័យ (Perturbation-based) |
អាចអនុវត្តបានជាមួយគ្រប់ប្រភេទម៉ូដែល (Model-agnostic) និងផ្តល់ការពន្យល់ជាក់លាក់សម្រាប់ការព្យាករណ៍នីមួយៗ។ | ត្រូវការការគណនាច្រើននិងប្រើពេលយូរ (អាចចំណាយពេលប៉ុន្មានវិនាទី) និងអាចផ្តល់ផែនទីរំលេចចំណុចសំខាន់ (Saliency Maps) ដែលមិនសូវលម្អិត។ | បង្កើត Saliency Maps ដែលត្រូវបានបញ្ចូលទៅក្នុងទិដ្ឋភាពរួម (Cumulative View) នៃកម្មវិធី XAIMed សម្រាប់ការវិភាគរូបភាព។ |
| RISE (Randomized Input Sampling for Explanation) វិធីសាស្ត្របង្កើតផែនទីរំលេចចំណុចសំខាន់ដោយធ្វើការបិទបាំងផ្នែកខ្លះនៃរូបភាពដោយចៃដន្យ |
ផ្តល់នូវ Saliency Maps ដែលមានភាពរឹងមាំ និងគ្របដណ្តប់បានល្អលើលក្ខណៈទូទៅនៃរូបភាព។ | ស៊ីធនធានកុំព្យូទ័រខ្លាំង (Computationally expensive) ដោយសារត្រូវការបញ្ជូនទិន្នន័យឆ្លងកាត់ម៉ូដែលជាច្រើនដង។ | រួមចំណែកក្នុងការពន្យល់បែបម៉ាក្រូ (Macro-perspective) នៅក្នុងកម្មវិធី ដោយទាមទារពេលវេលារង់ចាំបន្តិចបន្តួច។ |
| Grad-CAM / Grad-CAM++ វិធីសាស្ត្រប្រើប្រាស់ជម្រាល (Gradients) នៃបណ្តាញសរសៃប្រសាទកម្រិតជ្រៅ (CNN) ដើម្បីបង្កើតផែនទីរំលេច |
ដំណើរការបានលឿនខ្លាំង (ស្ទើរតែភ្លាមៗ) និងមានប្រសិទ្ធភាពខ្ពស់ក្នុងការរំលេចតំបន់ដែលមានអត្ថន័យសំខាន់ៗ (High-level semantics)។ | អាចខ្វះព័ត៌មានលម្អិត (Fine-grained details) និងមានកម្រិតក្នុងការប្រើប្រាស់បានតែជាមួយម៉ូដែលប្រភេទ CNN ប៉ុណ្ណោះ។ | បង្កើតផែនទីពន្យល់ភ្លាមៗ និងមានប្រសិទ្ធភាពក្នុងការចាប់យករូបភាពវត្ថុច្រើន (Grad-CAM++)។ |
| Cumulative Saliency Map ផែនទីរំលេចចំណុចសំខាន់រួមបញ្ចូលគ្នា (វិធីសាស្ត្រស្នើឡើងក្នុងកម្មវិធី XAIMed) |
ផ្តល់នូវទិដ្ឋភាពរួមនិងងាយយល់ ដោយបង្ហាញពីកម្រិតនៃការយល់ស្របគ្នារវាងវិធីសាស្ត្រពន្យល់ (XAI) ទាំង៤។ | អាចបាត់បង់ព័ត៌មានលម្អិតតូចៗមួយចំនួន ដោយសារការបែងចែកជារូបក្រឡាចត្រង្គ (Grid partitioning) ទំហំ 3x3 ។ | ជួយសម្រួលដល់ការផ្តោតអារម្មណ៍របស់វេជ្ជបណ្ឌិតទៅលើតំបន់ម៉ាក្រូនៃរូបភាពដែលម៉ូដែលគិតថាសំខាន់បំផុត។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការដំណើរការកម្មវិធី XAIMed ទាមទារធនធានកុំព្យូទ័រក្នុងកម្រិតមធ្យមទៅខ្ពស់ អាស្រ័យលើវិធីសាស្ត្រពន្យល់ AI ដែលបានជ្រើសរើស (ជាពិសេស LIME និង RISE ដែលស៊ីធនធានគណនាច្រើន)។
ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យរូបភាព Breast Histopathology ដែលទាញចេញពីសំណាកអ្នកជំងឺមហារីកសុដន់ចំនួន ១៦២នាក់ (ភាគច្រើនទំនងជានៅលោកខាងលិច) ហើយទិន្នន័យមានភាពអតុល្យភាព (Unbalanced dataset)។ សម្រាប់ប្រទេសកម្ពុជា ការយកម៉ូដែលនេះមកប្រើប្រាស់ទាមទារឱ្យមានការបង្ហាត់បន្ថែម (Fine-tuning) លើទិន្នន័យពិតរបស់អ្នកជំងឺក្នុងស្រុក ដើម្បីជៀសវាងភាពលម្អៀងផ្នែកហ្សែន និងធានាបាននូវភាពត្រឹមត្រូវខ្ពស់។
កម្មវិធី XAIMed មានសក្តានុពលខ្ពស់និងអាចអនុវត្តបានយ៉ាងល្អនៅក្នុងវិស័យសុខាភិបាលកម្ពុជា ជាពិសេសក្នុងការប្រើប្រាស់ AI ដើម្បីគាំទ្រការធ្វើរោគវិនិច្ឆ័យ។
ជារួម ការរួមបញ្ចូលបច្ចេកវិទ្យា Explainable AI (XAI) គឺជាកត្តាគន្លឹះក្នុងការកសាងទំនុកចិត្តរវាងវេជ្ជបណ្ឌិតកម្ពុជា និងប្រព័ន្ធបញ្ញាសិប្បនិម្មិតទំនើបៗ។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Explainable AI (XAI) | ជាផ្នែកមួយនៃបញ្ញាសិប្បនិម្មិតដែលផ្តោតលើការបង្កើតឧបករណ៍ឬបច្ចេកទេស ដើម្បីពន្យល់ពីដំណើរការនៃការសម្រេចចិត្តរបស់ម៉ូដែលកុំព្យូទ័រទៅកាន់មនុស្ស ធ្វើយ៉ាងណាឱ្យវេជ្ជបណ្ឌិតអាចយល់ ជឿទុកចិត្ត និងផ្ទៀងផ្ទាត់ហេតុផលរបស់ AI បាន។ | ដូចជាការដែលសិស្សមិនត្រឹមតែប្រាប់ចម្លើយគណិតវិទ្យាដល់គ្រូប៉ុណ្ណោះទេ តែត្រូវបង្ហាញវិធីសាស្រ្តដោះស្រាយមួយជំហានម្តងៗ ដើម្បីឱ្យគ្រូជឿជាក់ថាគេពិតជាចេះមែន។ |
| Convolutional Neural Networks (CNNs) | ជាប្រភេទបណ្តាញសរសៃប្រសាទកម្រិតជ្រៅ (Deep Learning) ដែលពូកែខាងវិភាគរូបភាពវេជ្ជសាស្ត្រ ដោយប្រើប្រាស់តម្រង (Filters) ជាច្រើនស្រទាប់ ដើម្បីទាញយកលក្ខណៈសម្បត្តិដូចជា គែម ទ្រង់ទ្រាយ និងរចនាសម្ព័ន្ធកោសិកាដោយស្វ័យប្រវត្តិ។ | ដូចជាអ្នកជំនាញដែលមើលផ្ទាំងគំនូរ ដោយដំបូងផ្តោតលើបន្ទាត់និងពណ៌ បន្ទាប់មកផ្គុំវាបញ្ចូលគ្នាដើម្បីមើលឱ្យដឹងថារូបនោះជារូបអ្វី។ |
| Saliency Maps | ជាផែនទីរូបភាពដែលប្រើពណ៌ (ឧទាហរណ៍ កន្លែងក្រហមខ្លាំង) ដើម្បីរំលេចបង្ហាញពីតំបន់ជាក់លាក់ណាមួយលើរូបភាពដើម ដែលមានឥទ្ធិពលខ្លាំងជាងគេបំផុតក្នុងការធ្វើឱ្យម៉ូដែល AI សម្រេចចិត្តទាយលទ្ធផលរោគវិនិច្ឆ័យ។ | ដូចជាការប្រើប៊ិចហ្វឺតពណ៌ (Highlighter) គូសបញ្ជាក់លើពាក្យសំខាន់ៗនៅក្នុងសៀវភៅ ដើម្បីប្រាប់ថាហេតុអ្វីបានជាអ្នកសន្និដ្ឋានអត្ថន័យនៃអត្ថបទនោះ។ |
| LIME | ជាវិធីសាស្រ្តពន្យល់ AI ដែលធ្វើការបិទបាំងឬផ្លាស់ប្តូរផ្នែកខ្លះនៃរូបភាពដោយចៃដន្យ រួចមើលថាតើម៉ូដែលនឹងផ្លាស់ប្តូរការទស្សន៍ទាយរបស់វាឬទេ ប្រសិនបើផ្លាស់ប្តូរ នោះបញ្ជាក់ថាផ្នែកដែលបានបិទបាំងនោះពិតជាសំខាន់ខ្លាំងណាស់។ | ដូចជាការយកដៃបិទភ្នែក មាត់ ឬច្រមុះរបស់រូបថតម្នាក់ម្តងៗ ដើម្បីដឹងថាតើចំណុចមួយណាដែលធ្វើឱ្យយើងចំណាំថាគាត់ជានរណា។ |
| Grad-CAM | ជាវិធីសាស្ត្រគណនាជម្រាល (Gradients) នៅស្រទាប់ចុងក្រោយនៃបណ្តាញ CNN ដើម្បីតាមដានថាតើព័ត៌មានរូបភាពមួយណាមានទម្ងន់ធ្ងន់ជាងគេ ក្នុងការកំណត់ថារូបភាពនោះមានផ្ទុកកោសិកាមហារីកឬអត់។ | ដូចជាការតាមដានដានជើងរបស់សត្វនៅក្នុងព្រៃ ដើម្បីស្វែងរកទីតាំងសម្បុករបស់វាយ៉ាងច្បាស់លាស់។ |
| Superpixels | ជាការប្រមូលផ្តុំភីកសែល (Pixels) តូចៗដែលនៅក្បែរគ្នា និងមានពណ៌ឬកម្រិតពន្លឺស្រដៀងគ្នា ទៅជាប្លុកធំមួយ ដើម្បីងាយស្រួលដល់ម៉ូដែលក្នុងការកែប្រែនិងវិភាគ ដោយបន្ថយភាពស្មុគស្មាញនៃការគណនាភីកសែលម្តងមួយៗ។ | ដូចជាការផ្គុំបំណែករូបភាព (Jigsaw puzzle) ដែលមានពណ៌ដូចគ្នាចូលគ្នាជាដុំៗ មុននឹងមើលជារូបរាងធំ។ |
| Invasive Ductal Carcinoma (IDC) | ជាប្រភេទជំងឺមហារីកសុដន់ទូទៅបំផុត ដែលកោសិកាមហារីកកកើតឡើងនៅបំពង់ទឹកដោះ រួចរាលដាលជ្រៀតចូលទៅក្នុងជាលិកាសុដន់ជុំវិញ ដែលជាបញ្ហាវេជ្ជសាស្ត្រត្រូវបានលើកយកមកធ្វើតេស្តសាកល្បងដោយ AI ក្នុងឯកសារនេះ។ | ដូចជាស្មៅអាក្រក់ដែលដុះចេញពីបំពង់ទឹក រួចចាប់ផ្តើមចាក់ឫសរាលដាលទៅបំផ្លាញដីសួនច្បារដែលនៅក្បែរៗនោះ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖