បញ្ហា (The Problem)៖ បញ្ហាចម្បងគឺបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត (Deep Neural Networks) ដែលប្រើប្រាស់ក្នុងការវិភាគទិន្នន័យវេជ្ជសាស្ត្រមានលក្ខណៈជា 'ប្រអប់ខ្មៅ' (Black-box) ដែលធ្វើឱ្យគ្រូពេទ្យពិបាកយល់ពីមូលហេតុ និងភាពជឿជាក់នៃការសម្រេចចិត្តរបស់ម៉ូដែលទាំងនេះ។
វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះស្នើឡើងនូវប្រព័ន្ធកូនកាត់ (Hybrid system) ដែលរួមបញ្ចូលបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតជាមួយនឹងវិធីសាស្ត្របកស្រាយបាន ដើម្បីវិភាគរូបភាព MRI។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Proposed Approach (MRNet + SHAP + CAM) គំរូស្នើឡើង (ការរួមបញ្ចូលបណ្ដាញ CNN ជាមួយវិធីសាស្ត្រពន្យល់ SHAP និង CAM) |
មានតម្លាភាពខ្ពស់ អាចប្រាប់ពីមូលហេតុនៃការសម្រេចចិត្ត និងអាចបង្ហាញទីតាំងជំងឺច្បាស់លាស់។ មានអត្រាភាពត្រឹមត្រូវខ្ពស់ជាងម៉ូដែលទូទៅជាច្រើន។ | ត្រូវការធនធានគណនាច្រើនបន្តិចក្នុងការទាញយកការពន្យល់ (SHAP values) ទោះបីជាមានការធ្វើឲ្យប្រសើរឡើងនូវល្បឿនក៏ដោយ។ | ទទួលបានតម្លៃ AUC ខ្ពស់បំផុតរហូតដល់ 0.956 សម្រាប់ការវិភាគ ACL លើប្លង់ Coronal និង 0.936 លើប្លង់ Sagittal។ |
| VGG-16 បណ្ដាញសរសៃប្រសាទ VGG-16 |
មានសមត្ថភាពខ្ពស់ក្នុងការទាញយកលក្ខណៈពិសេសពីរូបភាព និងមានភាពត្រឹមត្រូវគួរកត់សម្គាល់ក្នុងករណីខ្លះ។ | ដំណើរការជាប្រអប់ខ្មៅ (Black-box) ដែលមិនអាចពន្យល់ពីមូលហេតុនៃការសម្រេចចិត្តបាន ធ្វើឲ្យគ្រូពេទ្យពិបាកទុកចិត្ត។ | ទទួលបានតម្លៃ AUC 0.919 លើប្លង់ Axial សម្រាប់ភាពមិនប្រក្រតីទូទៅ ប៉ុន្តែអត្រាផ្សេងទៀតនៅទាបជាងគំរូស្នើឡើង។ |
| AlexNet បណ្ដាញសរសៃប្រសាទ AlexNet |
ងាយស្រួលប្រើប្រាស់ជាម៉ូដែលមូលដ្ឋាន (Baseline) និងដើរលឿនដោយសារមានទំហំតូចជាងបណ្ដាញជ្រៅៗដទៃ។ | អត្រាភាពត្រឹមត្រូវនៅមានកម្រិតទាបខ្លាំងបើប្រៀបធៀបទៅនឹងបណ្ដាញទំនើបជាង និងគ្មានមុខងារពន្យល់បកស្រាយ។ | ទទួលបានតម្លៃ AUC ត្រឹមតែ 0.616 ប៉ុណ្ណោះសម្រាប់ការវិភាគ ACL លើប្លង់ Coronal។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះទាមទារធនធានកុំព្យូទ័រដែលមានសមត្ថភាពខ្ពស់ (GPU) សម្រាប់ដំណើរការបណ្ដុះបណ្ដាលម៉ូដែលកម្រិតជ្រៅ និងការគណនាទិន្នន័យដើម្បីបង្កើតការពន្យល់។
ការស្រាវជ្រាវនេះប្រើប្រាស់ទិន្នន័យ (MRNet) ដែលប្រមូលពីមជ្ឈមណ្ឌលវេជ្ជសាស្ត្រនៃសាកលវិទ្យាល័យ Stanford សហរដ្ឋអាមេរិក។ លក្ខណៈជីវសាស្ត្រ (Demographics) របស់អ្នកជំងឺ និងបច្ចេកវិទ្យាម៉ាស៊ីនថត MRI អាចមានភាពខុសគ្នាពីប្រជាជនកម្ពុជា។ នេះទាមទារឲ្យមានការសាកល្បង និងបង្វឹកម៉ូដែលឡើងវិញជាមួយទិន្នន័យក្នុងស្រុក ដើម្បីបញ្ៀសភាពលម្អៀង (Bias) មុននឹងដាក់ឲ្យប្រើប្រាស់ជាក់ស្តែង។
វិធីសាស្ត្របញ្ញាសិប្បនិម្មិតដែលអាចពន្យល់បាន (Explainable AI) នេះមានសារៈសំខាន់ណាស់ក្នុងការគាំទ្រការសម្រេចចិត្តរបស់គ្រូពេទ្យនៅកម្ពុជាឱ្យកាន់តែមានទំនុកចិត្ត។
បច្ចេកវិទ្យានេះមានសក្តានុពលខ្ពស់ក្នុងការលើកកម្ពស់គុណភាពរោគវិនិច្ឆ័យនៅកម្ពុជា ប្រសិនបើត្រូវបានយកមកអភិវឌ្ឍបន្ថែមជាមួយទិន្នន័យក្នុងស្រុក និងការបណ្តុះបណ្តាលគ្រូពេទ្យឱ្យចេះប្រើប្រាស់។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Explainable AI (XAI) | បច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិតដែលមិនត្រឹមតែផ្តល់លទ្ធផលវិភាគប៉ុណ្ណោះទេ ថែមទាំងអាចពន្យល់បកស្រាយពីមូលហេតុ និងដំណើរការនៃការសម្រេចចិត្តរបស់វា ដើម្បីឱ្យមនុស្ស (ជាពិសេសគ្រូពេទ្យ) ងាយយល់ ងាយស្រាវជ្រាវកំហុស និងអាចជឿទុកចិត្តបានក្នុងការប្រើប្រាស់ក្នុងគ្លីនិក។ | ដូចជាសិស្សដែលមិនត្រឹមតែឆ្លើយត្រូវនូវលំហាត់គណិតវិទ្យា ប៉ុន្តែថែមទាំងអាចបង្ហាញប្រាប់ពីរបៀបគណនាមួយជំហានម្តងៗប្រាប់គ្រូ។ |
| Convolutional Neural Networks (CNNs) | ប្រភេទនៃបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតជ្រៅ (Deep Learning) ដែលត្រូវបានរចនាឡើងយ៉ាងពិសេសសម្រាប់វិភាគ និងទាញយកលក្ខណៈសម្គាល់ពីរូបភាពវេជ្ជសាស្ត្រ ដោយស្កេនមើលផ្នែកតូចៗនៃរូបភាពម្តងមួយៗដើម្បីស្វែងរកទម្រង់នៃជំងឺដែលភ្នែកមនុស្សពិបាកមើលឃើញ។ | ដូចជាមនុស្សដែលប្រើកែវពង្រីកដើរឆ្លុះមើលផ្ទាំងគំនូរធំមួយ ដោយពិនិត្យមើលចំណុចតូចៗម្តងមួយៗដើម្បីយល់ពីអត្ថន័យនៃគំនូរទាំងមូល។ |
| SHAP (SHapley Additive exPlanations) | វិធីសាស្ត្រគណិតវិទ្យាផ្អែកលើទ្រឹស្តីល្បែង (Game Theory) ដែលវាស់ស្ទង់ និងបែងចែកពិន្ទុឥទ្ធិពលទៅឱ្យទិន្នន័យនីមួយៗ (ដូចជាភីកសែលនីមួយៗលើរូបភាព) ដើម្បីបង្ហាញថាចំណុចណាខ្លះដែលជំរុញយ៉ាងខ្លាំងឱ្យម៉ូដែលទស្សន៍ទាយចេញលទ្ធផលបែបនោះ។ | ដូចជាការវាយតម្លៃថាកីឡាករម្នាក់ៗនៅក្នុងក្រុមបាល់ទាត់ មានចំណែកជួយប៉ុន្មានភាគរយក្នុងការធ្វើឱ្យក្រុមទទួលបានជ័យជម្នះ។ |
| Class Activation Mapping (CAM) | បច្ចេកទេសបង្កើត 'ផែនទីកម្ដៅ' (Heatmap) ដែលគ្របពីលើរូបភាពដើម ដើម្បីរំលេចពណ៌បង្ហាញពីតំបន់ជាក់លាក់ណាមួយ (ដូចជាដំបៅ ឬការរហែកសរសៃ) ដែលបណ្ដាញកុំព្យូទ័របានផ្ដោតការយកចិត្តទុកដាក់ខ្លាំងបំផុតក្នុងការធ្វើរោគវិនិច្ឆ័យ។ | ដូចជាការប្រើប្រាស់ប៊ិចហ្វឺតពណ៌លឿង (Highlighter) គូសបញ្ជាក់លើពាក្យសំខាន់ៗនៅក្នុងសៀវភៅ ដើម្បីប្រាប់អ្នកដទៃថាចំណុចនេះហើយដែលសំខាន់ជាងគេ។ |
| Transfer Learning | ការយកម៉ូដែលបញ្ញាសិប្បនិម្មិតដែលត្រូវបានបង្វឹកឲ្យចេះរៀនពីទិន្នន័យរូបភាពរាប់លានរួចមកហើយ (Pre-trained model ដូចជា AlexNet) មកបន្តបង្ហាត់បន្ថែមលើកិច្ចការថ្មីមួយទៀត (ដូចជាការមើលរូបភាពសន្លាក់ជង្គង់ MRI) ដើម្បីចំណេញពេលវេលា និងទទួលបានលទ្ធផលល្អលឿនជាងការចាប់ផ្តើមបង្វឹកពីសូន្យ។ | ដូចជាការយកចុងភៅដែលពូកែធ្វើម្ហូបអឺរ៉ុបរួចទៅហើយ មកបង្ហាត់បន្ថែមបន្តិចបន្តួចឱ្យចេះធ្វើម្ហូបខ្មែរ ដោយមិនបាច់បង្រៀនពីរបៀបកាន់កាំបិតឡើងវិញ។ |
| Logistic Regression | វិធីសាស្ត្រស្ថិតិដែលត្រូវបានប្រើប្រាស់នៅក្នុងដំណាក់កាលចុងក្រោយនៃប្រព័ន្ធនេះ ដើម្បីប្រមូលផ្តុំលទ្ធផលវិភាគដែលបានមកពីបណ្ដាញ CNN លើប្លង់រូបភាពទាំង៣ទិសដៅ រួចធ្វើការគណនារកប្រូបាប៊ីលីតេ (ភាគរយ) នៃការកើតមានជំងឺជាការសម្រេចចិត្តចុងក្រោយ។ | ដូចជាចៅក្រមដែលស្តាប់សេចក្តីសន្និដ្ឋានពីមេធាវីទាំង៣រូប រួចថ្លឹងថ្លែងរកហេតុផលរួមមួយដើម្បីកាត់ក្តីថាជនជាប់ចោទមានទោស ឬមិនមានទោស។ |
| AUC-ROC score | រង្វាស់ស្តង់ដារដែលប្រើសម្រាប់វាយតម្លៃសមត្ថភាពរបស់ម៉ូដែលចំណាត់ថ្នាក់ (Classification Model) ដោយវាស់ស្ទង់ថាតើម៉ូដែលនោះមានភាពសុក្រឹតកម្រិតណា ក្នុងការបែងចែកឱ្យបានត្រឹមត្រូវរវាងអ្នកដែលមានជំងឺ និងអ្នកដែលគ្មានជំងឺ ក្រោមលក្ខខណ្ឌវិនិច្ឆ័យផ្សេងៗគ្នា។ | ដូចជាពិន្ទុប្រឡងសញ្ញាបត្រប្រចាំឆ្នាំ ដែលជួយបញ្ជាក់ថាវិទ្យាល័យមួយមានសមត្ថភាពបណ្តុះបណ្តាលសិស្សបានពូកែកម្រិតណាបើធៀបនឹងវិទ្យាល័យដទៃ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖