បញ្ហា (The Problem)៖ បញ្ហាចម្បងគឺការធ្វើរោគវិនិច្ឆ័យដុំសាច់ខួរក្បាលតាមបែបប្រពៃណីត្រូវការពេលវេលាច្រើន និងពឹងផ្អែកខ្លាំងលើជំនាញរបស់គ្រូពេទ្យជំនាញ ដែលងាយនឹងមានកំហុស ខណៈដែលប្រព័ន្ធ AI បច្ចុប្បន្នមួយចំនួនខ្វះតម្លាភាពក្នុងការបកស្រាយលទ្ធផល (Black Boxes) ធ្វើឱ្យពិបាកក្នុងការជឿទុកចិត្តលើការសម្រេចចិត្តផ្នែកវេជ្ជសាស្រ្ត។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះស្នើឡើងនូវម៉ូដែលរកឃើញដុំសាច់ខួរក្បាល (BTD) ដែលរួមបញ្ចូលគ្នានូវបច្ចេកទេសរៀនសូត្ររបស់ម៉ាស៊ីន (Machine Learning) ជាច្រើន និងប្រព័ន្ធ AI ដែលអាចពន្យល់បាន ដើម្បីបង្កើនភាពត្រឹមត្រូវ និងតម្លាភាព។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Proposed Algorithm (IGWO + XGBoost & ANN Voting) ម៉ូដែលស្នើឡើង (ការប្រើប្រាស់ IGWO និងការបោះឆ្នោតរួមរវាង XGBoost និង ANN) |
មានភាពត្រឹមត្រូវខ្ពស់បំផុត និងផ្តល់នូវការពន្យល់អំពីការសម្រេចចិត្តតាមរយៈ LIME ដែលជួយបង្កើនទំនុកចិត្តដល់គ្រូពេទ្យ។ | មានភាពស្មុគស្មាញក្នុងការអនុវត្តជាងម៉ូដែលទោល និងត្រូវការពេលវេលាគណនាបន្ថែមសម្រាប់ដំណាក់កាលជ្រើសរើសលក្ខណៈពិសេស (Feature Selection)។ | ភាពត្រឹមត្រូវ (Accuracy) ៩៨.៥% និង F1-score ៩៨% |
| Artificial Neural Network (ANN) - Standalone បណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (ANN) តែឯកឯង |
មានសមត្ថភាពល្អក្នុងការរៀនលំនាំស្មុគស្មាញពីទិន្នន័យដោយមិនត្រូវការការជ្រើសរើសលក្ខណៈពិសេសច្រើន។ | ដំណើរការដូចប្រអប់ខ្មៅ (Black-box) ពិបាកបកស្រាយ និងមានភាពត្រឹមត្រូវទាបជាងម៉ូដែលចម្រុះ។ | ភាពត្រឹមត្រូវ (Accuracy) ៩៦.១% |
| XGBoost - Standalone XGBoost តែឯកឯង |
មានល្បឿនលឿន និងប្រសិទ្ធភាពខ្ពស់លើទិន្នន័យដែលមានរចនាសម្ព័ន្ធ។ | ប្រសិទ្ធភាពថយចុះបន្តិចបន្តួចនៅពេលមិនមានការជ្រើសរើសលក្ខណៈពិសេស (Feature Selection) ឱ្យបានត្រឹមត្រូវ។ | ភាពត្រឹមត្រូវ (Accuracy) ៩៥.២% |
| Random Forest (RF) Random Forest (RF) |
ងាយស្រួលអនុវត្ត និងមិនសូវមានបញ្ហា Overfitting។ | ទទួលបានលទ្ធផលទាបជាងបច្ចេកទេស Boosting និង Neural Networks ក្នុងការសិក្សានេះ។ | ភាពត្រឹមត្រូវ (Accuracy) ៩២.៤% |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះតម្រូវឱ្យមានធនធានគណនាកម្រិតមធ្យមទៅខ្ពស់ ដោយសារការប្រើប្រាស់ក្បួនដោះស្រាយ Optimization និងការបណ្តុះបណ្តាលម៉ូដែលចម្រុះ (Ensemble Model)។
ការសិក្សានេះប្រើប្រាស់ទិន្នន័យសាធារណៈ (Kaggle dataset) ដែលមានចំនួនតិច (ត្រឹមតែ ២៥២ រូបភាព) និងអាចមិនឆ្លុះបញ្ចាំងពីភាពចម្រុះនៃអ្នកជំងឺនៅក្នុងប្រទេសកម្ពុជា។ លើសពីនេះ កង្វះព័ត៌មានអំពីប្រភពដើមនៃទិន្នន័យ (ដូចជាឧបករណ៍ MRI ដែលប្រើ ឬប្រជាសាស្ត្ររបស់អ្នកជំងឺ) អាចធ្វើឱ្យម៉ូដែលលំអៀងទៅរកលក្ខណៈជាក់លាក់នៃទិន្នន័យនោះ។
បច្ចេកទេសនេះមានប្រយោជន៍ខ្លាំងសម្រាប់វិស័យសុខាភិបាលនៅកម្ពុជា ជាពិសេសក្នុងការជួយគាំទ្រដល់គ្រូពេទ្យវិទ្យុសាស្ត្រ (Radiologists)។
ទោះបីជាមានសក្តានុពលខ្ពស់ ប៉ុន្តែការដាក់ឱ្យប្រើប្រាស់ជាក់ស្តែងទាមទារឱ្យមានការធ្វើតេស្តជាមួយទិន្នន័យអ្នកជំងឺក្នុងស្រុក និងការត្រួតពិនិត្យដោយផ្ទាល់ពីគ្រូពេទ្យជំនាញជាមុនសិន។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Improved Gray Wolf Optimization (IGWO) | ជាក្បួនដោះស្រាយគណិតវិទ្យាដែលយកគំរូតាមរបៀបសត្វចចកប្រផេះបរបាញ់ចំណី ដើម្បីស្វែងរកនិងជ្រើសរើសយកតែទិន្នន័យ (លក្ខណៈពិសេស) ដែលសំខាន់បំផុតសម្រាប់ការវិភាគ និងបោះបង់ទិន្នន័យដែលមិនចាំបាច់ចោល ដើម្បីបង្កើនប្រសិទ្ធភាពម៉ូដែល។ | ដូចជាក្រុមអ្នករុករកដែលធ្វើការរួមគ្នាដើម្បីស្វែងរកផ្លូវកាត់ដ៏ល្អបំផុតទៅកាន់គោលដៅ ដោយមិនចំណាយពេលដើរគ្រប់ផ្លូវដែលមិនចាំបាច់។ |
| Explainable AI (XAI) | បច្ចេកវិទ្យាដែលជួយបកស្រាយលទ្ធផលរបស់ AI ឱ្យមនុស្សយល់បាន។ នៅក្នុងការសិក្សានេះ វាប្រើដើម្បីបង្ហាញថាផ្នែកណាមួយនៃរូបភាពខួរក្បាលដែលម៉ូដែលបានប្រើដើម្បីកំណត់ថាមានដុំសាច់ ជៀសវាងការជឿលើ AI ដោយងងឹតងងុល។ | ដូចជាគ្រូដែលសុំឱ្យសិស្សបង្ហាញពីរបៀបដោះស្រាយលំហាត់គណិតវិទ្យា ដើម្បីឱ្យដឹងថាហេតុអ្វីបានជាសិស្សរកឃើញចម្លើយនោះ។ |
| Ensemble Learning | វិធីសាស្ត្រនៃការប្រើប្រាស់ម៉ូដែលកុំព្យូទ័រជាច្រើន (ដូចជា XGBoost និង ANN) រួមគ្នាដើម្បីធ្វើការទស្សន៍ទាយ។ លទ្ធផលចុងក្រោយត្រូវបានសម្រេចដោយការបោះឆ្នោត (Voting) ពីម៉ូដែលនីមួយៗ ដើម្បីឱ្យមានភាពត្រឹមត្រូវខ្ពស់ជាងការប្រើម៉ូដែលតែមួយ។ | ដូចជាការសួរយោបល់ពីគ្រូពេទ្យជំនាញជាច្រើននាក់ មុននឹងសម្រេចចិត្តលើការព្យាបាល ដើម្បីធានាថាវាត្រឹមត្រូវបំផុត។ |
| Gray Level Co-occurrence Matrix (GLCM) | វិធីសាស្ត្រស្ថិតិសម្រាប់វិភាគ "វាយនភាព" (Texture) នៃរូបភាព ដោយពិនិត្យមើលទំនាក់ទំនងរវាងកម្រិតពន្លឺនៃភីកសែលដែលនៅក្បែរគ្នា ដើម្បីសម្គាល់ភាពខុសគ្នារវាងកោសិកាធម្មតា និងកោសិកាដុំសាច់។ | ដូចជាការពិនិត្យមើលក្រឡានៃសាច់ក្រណាត់យ៉ាងជិត ដើម្បីដឹងថាវាជាសូត្រ ឬជាកប្បាស ដោយមើលលើភាពរលោងឬគ្រើមរបស់វា។ |
| Histogram of Oriented Gradients (HOG) | បច្ចេកទេសដែលប្រើដើម្បីចាប់យកទ្រង់ទ្រាយ និងគែមនៃវត្ថុនៅក្នុងរូបភាព ដោយវាស់ទិសដៅនៃការផ្លាស់ប្តូរពន្លឺ។ វាជួយឱ្យកុំព្យូទ័រមើលឃើញ "រូបរាង" នៃដុំសាច់បានច្បាស់ ទោះបីជាពន្លឺក្នុងរូបភាពប្រែប្រួលក៏ដោយ។ | ដូចជាការគូសវាសរូបភាពដោយប្រើតែគំនូសព្រាងនៃគែម (Outlines) ដើម្បីឱ្យគេមើលដឹងថាជារូបអ្វី ដោយមិនបាច់លាបពណ៌លម្អិត។ |
| Feature Selection | ដំណើរការនៃការចម្រោះយកតែព័ត៌មានដែលសំខាន់បំផុតពីរូបភាពមកប្រើប្រាស់ និងកាត់ចោលព័ត៌មានដែលរំខាន (Noise) ឬមិនចាំបាច់ ដើម្បីឱ្យម៉ូដែលដំណើរការលឿន និងត្រឹមត្រូវជាងមុន។ | ដូចជាការរៀបចំកាបូបសម្រាប់ការធ្វើដំណើរ ដោយជ្រើសរើសយកតែរបស់របរដែលចាំបាច់បំផុត និងទុករបស់ដែលមិនត្រូវការចោល ដើម្បីកុំឱ្យធ្ងន់។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖