បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហានៃការធ្វើរោគវិនិច្ឆ័យជំងឺមហារីកស្បែក និងបញ្ហាអតុល្យភាពថ្នាក់ (Class Imbalance) នៅក្នុងសំណុំទិន្នន័យវេជ្ជសាស្ត្រ ដែលធ្វើឱ្យម៉ូដែល AI ពិបាកក្នុងការកំណត់អត្តសញ្ញាណប្រភេទមហារីកកម្រឱ្យបានត្រឹមត្រូវ។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានប្រើប្រាស់ស្ថាបត្យកម្មបណ្តាញសរសៃប្រសាទខនវ៉ូលូសិន (CNN) ដែលបានកែសម្រួលផ្ទាល់ខ្លួន ដោយរួមបញ្ចូលជាមួយបច្ចេកទេសបង្កើនទិន្នន័យ ដើម្បីធ្វើចំណាត់ថ្នាក់ជំងឺមហារីកស្បែកជា ៧ ប្រភេទ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Custom CNN បណ្តាញសរសៃប្រសាទខនវ៉ូលូសិនដែលបានកែសម្រួលផ្ទាល់ខ្លួន (Custom CNN) |
មានភាពត្រឹមត្រូវខ្ពស់ ចំណាយពេលហ្វឹកហាត់មធ្យម និងប្រើប្រាស់ធនធានកុំព្យូទ័រតិច (Low Computational Cost) បើធៀបនឹងម៉ូដែលធំៗ។ | នៅមានកម្រិតក្នុងការធ្វើចំណាត់ថ្នាក់ប្រភេទមហារីកកម្រ (Class Imbalance) ទោះបីជាបានប្រើប្រាស់បច្ចេកទេសបង្កើនទិន្នន័យ (Data Augmentation) ក៏ដោយ។ | ទទួលបានភាពត្រឹមត្រូវ 98.17% និងចំណាយធនធានកុំព្យូទ័រតិចបំផុត។ |
| ResNet50 ស្ថាបត្យកម្មបណ្តាញ ResNet50 (Pre-trained Model) |
ជាម៉ូដែលស្តង់ដារដែលមានសមត្ថភាពខ្ពស់ និងអាចទាញយកលក្ខណៈពិសេសនៃរូបភាពវេជ្ជសាស្ត្របានយ៉ាងល្អតាមរយៈបច្ចេកទេសផ្ទេរការរៀនសូត្រ (Transfer Learning)។ | ទាមទារពេលវេលាហ្វឹកហាត់យូរ និងប្រើប្រាស់ធនធានកុំព្យូទ័រខ្ពស់ (High Computational Cost)។ | ទទួលបានភាពត្រឹមត្រូវ 94.59% ជាមួយការប្រើប្រាស់ធនធានគណនាខ្ពស់។ |
| EfficientNet ស្ថាបត្យកម្មបណ្តាញ EfficientNet |
មានប្រសិទ្ធភាពល្អបង្គួរក្នុងការធ្វើចំណាត់ថ្នាក់ដោយផ្តល់នូវតុល្យភាពរវាងភាពត្រឹមត្រូវ និងទំហំនៃម៉ូដែល។ | ទោះបីជាត្រូវបានរចនាឡើងដើម្បីសន្សំសំចៃធនធាន វានៅតែប្រើប្រាស់ធនធានច្រើនជាងម៉ូដែល Custom CNN ដែលបានស្នើឡើង។ | ទទួលបានភាពត្រឹមត្រូវ 96.78% ជាមួយការចំណាយធនធានកុំព្យូទ័រកម្រិតមធ្យម។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះបង្ហាញពីតម្រូវការធនធានកុំព្យូទ័រកម្រិតមធ្យមទៅខ្ពស់ ក្នុងការហ្វឹកហាត់ម៉ូដែល Deep Learning លើទិន្នន័យរូបភាពវេជ្ជសាស្ត្រជាង ១ម៉ឺនរូបភាព។
ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យ HAM10000 ដែលប្រមូលបានពីអ្នកជំងឺនៅបរទេស ដែលអាចមានលក្ខណៈជីវសាស្ត្រ និងទម្រង់ពណ៌ស្បែកខុសពីប្រជាជនអាស៊ី ឬកម្ពុជា។ លើសពីនេះ បញ្ហាអតុល្យភាពទិន្នន័យ (Class Imbalance) ដែលខ្វះខាតរូបភាពមហារីកស្បែកប្រភេទកម្រ អាចធ្វើឱ្យម៉ូដែលដំណើរការមិនសូវល្អនៅពេលអនុវត្តផ្ទាល់នៅកម្ពុជា ប្រសិនបើមិនមានការបន្ថែមទិន្នន័យក្នុងស្រុកដើម្បីយកទៅហ្វឹកហាត់ឡើងវិញ។
វិធីសាស្ត្រនេះមានសក្តានុពលខ្លាំងក្នុងការជួយសម្រួលដល់ការធ្វើរោគវិនិច្ឆ័យជំងឺមហារីកស្បែកនៅកម្ពុជា ជាពិសេសនៅតំបន់ដែលខ្វះខាតគ្រូពេទ្យឯកទេស។
ជារួម បច្ចេកវិទ្យានេះអាចជួយលើកកម្ពស់គុណភាពសេវាថែទាំសុខភាពស្បែកនៅកម្ពុជា ប៉ុន្តែទាមទារឱ្យមានការប្រមូលទិន្នន័យរូបភាពស្បែកក្នុងស្រុកបន្ថែមដើម្បីកែសម្រួលម៉ូដែល (Fine-tuning) ឱ្យស្របតាមស្ថានភាពជាក់ស្តែង។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Convolutional Neural Network (CNN) | ជាប្រភេទបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតដែលត្រូវបានរចនាឡើងយ៉ាងពិសេស ដើម្បីវិភាគ និងទាញយកលក្ខណៈពិសេសពីរូបភាព (ដូចជារូបរាង ពណ៌ ឬលំនាំនៃដំបៅស្បែក) តាមរយៈការប្រើប្រាស់តម្រងកុំព្យូទ័រ (Filters) ជាច្រើនជាន់ ដើម្បីធ្វើចំណាត់ថ្នាក់រូបភាពនោះ។ | ដូចជាភ្នែករបស់មនុស្សដែលប្រើកញ្ចក់ពង្រីកសម្លឹងមើលកាត់ម្តងមួយផ្នែកៗនៃរូបភាព ដើម្បីផ្តុំជារូបរាងរួម និងកាត់ក្តីថាជារូបអ្វីពិតប្រាកដ។ |
| Class Imbalance | ជាស្ថានភាពអតុល្យភាពនៅក្នុងសំណុំទិន្នន័យដែលចំនួនឧទាហរណ៍នៃប្រភេទនីមួយៗមិនស្មើគ្នាខ្លាំង។ ឧទាហរណ៍៖ មានរូបភាពមហារីកស្បែកធម្មតាច្រើនលើសលប់ ប៉ុន្តែមានរូបភាពមហារីកប្រភេទកម្រតែបន្តិចបន្តួច ដែលធ្វើឱ្យម៉ូដែល AI រៀនលម្អៀងទៅរកតែប្រភេទដែលមានច្រើន។ | ដូចជាសិស្សដែលអានតែសៀវភៅប្រវត្តិសាស្ត្រ ១០០ក្បាល តែអានសៀវភៅគណិតវិទ្យាបានតែ ១ក្បាល ពេលប្រឡងគាត់ច្បាស់ជាពូកែប្រវត្តិ តែទាយខុសរហូតចំពោះមុខវិជ្ជាគណិតវិទ្យា។ |
| Data Augmentation | ជាបច្ចេកទេសបង្កើតទិន្នន័យសិប្បនិម្មិតថ្មីៗបន្ថែមពីទិន្នន័យចាស់ដែលមានស្រាប់ តាមរយៈការបង្វិលរូបភាព ការត្រឡប់ចុះឡើង ការបង្រួមពង្រីក ឬប្តូរពន្លឺ ដើម្បីបង្រៀនម៉ូដែលឱ្យស្គាល់រូបភាពក្នុងជ្រុងខុសៗគ្នា និងជួយដោះស្រាយបញ្ហាខ្វះទិន្នន័យ។ | ដូចជាការថតរូបមនុស្សម្នាក់ពីប្លង់ផ្សេងៗគ្នា (មុខ ចំហៀង ងើប អោន) ដើម្បីឱ្យយើងនៅតែអាចចំណាំគាត់បាន ទោះគាត់ឈរក្នុងទម្រង់ណាក៏ដោយ។ |
| Transfer Learning | ជាវិធីសាស្ត្រយកម៉ូដែលបញ្ញាសិប្បនិម្មិតខ្នាតធំ (ដូចជា ResNet ឬ EfficientNet) ដែលត្រូវបានគេហ្វឹកហាត់រួចហើយលើទិន្នន័យរូបភាពទូទៅរាប់លានសន្លឹក មកបង្វឹកបន្តបន្តិចបន្តួចលើទិន្នន័យថ្មី (រូបភាពស្បែក) ដើម្បីសន្សំពេលវេលា និងបង្កើនភាពត្រឹមត្រូវ។ | ដូចជាការយកចុងភៅដែលពូកែធ្វើម្ហូបបរទេសរួចជាស្រេច មកបង្រៀនបន្ថែមពីរបៀបធ្វើម្ហូបខ្មែរ គឺលឿនជាងការបង្រៀនអ្នកដែលមិនធ្លាប់កាន់កាំបិតសោះ។ |
| Adam Optimizer | ជាក្បួនដោះស្រាយ (Algorithm) ដែលជួយកែតម្រូវកម្រិតទម្ងន់ (Weights) នៃបណ្តាញសរសៃប្រសាទដោយស្វ័យប្រវត្តិក្នុងអំឡុងពេលហ្វឹកហាត់ ដើម្បីឱ្យម៉ូដែលរៀនបានលឿន និងទាយបានកាន់តែត្រឹមត្រូវ ដោយកាត់បន្ថយកំហុសឱ្យនៅទាបបំផុត។ | ដូចជាអ្នកបើកបរឆ្លាតវៃដែលចេះសារ៉េចង្កូតបត់បែន និងបន្ថយល្បឿនដោយស្វ័យប្រវត្តិ ពេលផ្លូវមានកន្លែងកោងខ្លាំង ដើម្បីទៅដល់គោលដៅដោយសុវត្ថិភាពនិងលឿនបំផុត។ |
| Batch Normalization | ជាដំណើរការកែតម្រូវទិន្នន័យដែលឆ្លងកាត់ចន្លោះស្រទាប់នីមួយៗនៃបណ្តាញសរសៃប្រសាទ ឱ្យស្ថិតក្នុងទំហំកម្រិតស្តង់ដារមួយរួម (មានមធ្យមភាគ ០ និងរំលាតស្តង់ដារ ១) ដើម្បីជួយឱ្យការហ្វឹកហាត់ម៉ូដែលដំណើរការទៅមុខមានស្ថិរភាព និងលឿនជាងមុន។ | ដូចជាការប្តូររូបិយប័ណ្ណចម្រុះ (រៀល ដុល្លារ បាត) ទៅជារូបិយប័ណ្ណតែមួយជាមុនសិនមុននឹងបូកសរុប ដើម្បីកុំឱ្យច្របូកច្របល់តួលេខធំពេកឬតូចពេក។ |
| Confusion Matrix | ជាតារាងម៉ាទ្រីសដែលបង្ហាញយ៉ាងច្បាស់ពីការប្រៀបធៀបរវាងការទស្សន៍ទាយរបស់ម៉ូដែល AI និងលទ្ធផលពិតប្រាកដ (Labels) ដើម្បីឱ្យគេដឹងថាម៉ូដែលទាយត្រូវកម្រិតណា ហើយមានការភាន់ច្រឡំគ្នារវាងប្រភេទថ្នាក់នីមួយៗចំនួនប៉ុន្មានដង។ | ដូចជាតារាងផ្ទៀងផ្ទាត់បញ្ជីវត្តមាន ដែលបង្ហាញថាសិស្សណាខ្លះមកមែន សិស្សណាខ្លះអវត្តមានមែន និងសិស្សណាខ្លះដែលគ្រូកត់ច្រឡំថាអវត្តមាន តែតាមពិតគាត់មក។ |
| Explainable AI (Grad-CAM) | ជាបច្ចេកទេសដែលជួយបកស្រាយពីមូលហេតុដែលម៉ូដែល AI សម្រេចចិត្តធ្វើរោគវិនិច្ឆ័យ ដោយវាគូសចំណាំពណ៌ (Heatmap) លើតំបន់នៃរូបភាពដែលម៉ូដែលនោះបានផ្តោតការយកចិត្តទុកដាក់ខ្លាំងជាងគេ ជួយឱ្យគ្រូពេទ្យអាចជឿទុកចិត្តបាន។ | ដូចជាគ្រូបង្រៀនដែលតម្រូវឱ្យសិស្សមិនត្រឹមតែប្រាប់ចម្លើយគណិតវិទ្យាប៉ុណ្ណោះទេ តែត្រូវបង្ហាញក្រដាសព្រាងនៃការគណនា ដើម្បីឱ្យដឹងថាគេគិតតាមរបៀបណាទើបចេញចម្លើយនោះ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖