Original Title: A Deep Learning Framework for Multi-Class Skin Cancer Diagnosis: Addressing Class Imbalance and Performance Optimization Through Convolutional Neural Network Architectures
Source: doi.org/10.37745/ejcsit.2013/vol13n16371
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ក្របខណ្ឌរៀនស៊ីជម្រៅសម្រាប់ការធ្វើរោគវិនិច្ឆ័យជំងឺមហារីកស្បែកពហុថ្នាក់៖ ការដោះស្រាយអតុល្យភាពថ្នាក់ និងការបង្កើនប្រសិទ្ធភាពតាមរយៈស្ថាបត្យកម្មបណ្តាញសរសៃប្រសាទខនវ៉ូលូសិន

ចំណងជើងដើម៖ A Deep Learning Framework for Multi-Class Skin Cancer Diagnosis: Addressing Class Imbalance and Performance Optimization Through Convolutional Neural Network Architectures

អ្នកនិពន្ធ៖ Md Imamul Haque (Nanjing University of Information Science & Technology), Karima Khatun (Nanjing University of Information Science & Technology), Golam Rohman (Nanjing University of Information Science & Technology), Abdullah Al Rakib (Nanjing University of Information Science & Technology), Muhammad Maruf Billah (Nanjing University of Information Science & Technology)

ឆ្នាំបោះពុម្ព៖ 2025 European Journal of Computer Science and Information Technology

វិស័យសិក្សា៖ Artificial Intelligence in Medicine

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហានៃការធ្វើរោគវិនិច្ឆ័យជំងឺមហារីកស្បែក និងបញ្ហាអតុល្យភាពថ្នាក់ (Class Imbalance) នៅក្នុងសំណុំទិន្នន័យវេជ្ជសាស្ត្រ ដែលធ្វើឱ្យម៉ូដែល AI ពិបាកក្នុងការកំណត់អត្តសញ្ញាណប្រភេទមហារីកកម្រឱ្យបានត្រឹមត្រូវ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានប្រើប្រាស់ស្ថាបត្យកម្មបណ្តាញសរសៃប្រសាទខនវ៉ូលូសិន (CNN) ដែលបានកែសម្រួលផ្ទាល់ខ្លួន ដោយរួមបញ្ចូលជាមួយបច្ចេកទេសបង្កើនទិន្នន័យ ដើម្បីធ្វើចំណាត់ថ្នាក់ជំងឺមហារីកស្បែកជា ៧ ប្រភេទ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Custom CNN
បណ្តាញសរសៃប្រសាទខនវ៉ូលូសិនដែលបានកែសម្រួលផ្ទាល់ខ្លួន (Custom CNN)
មានភាពត្រឹមត្រូវខ្ពស់ ចំណាយពេលហ្វឹកហាត់មធ្យម និងប្រើប្រាស់ធនធានកុំព្យូទ័រតិច (Low Computational Cost) បើធៀបនឹងម៉ូដែលធំៗ។ នៅមានកម្រិតក្នុងការធ្វើចំណាត់ថ្នាក់ប្រភេទមហារីកកម្រ (Class Imbalance) ទោះបីជាបានប្រើប្រាស់បច្ចេកទេសបង្កើនទិន្នន័យ (Data Augmentation) ក៏ដោយ។ ទទួលបានភាពត្រឹមត្រូវ 98.17% និងចំណាយធនធានកុំព្យូទ័រតិចបំផុត។
ResNet50
ស្ថាបត្យកម្មបណ្តាញ ResNet50 (Pre-trained Model)
ជាម៉ូដែលស្តង់ដារដែលមានសមត្ថភាពខ្ពស់ និងអាចទាញយកលក្ខណៈពិសេសនៃរូបភាពវេជ្ជសាស្ត្របានយ៉ាងល្អតាមរយៈបច្ចេកទេសផ្ទេរការរៀនសូត្រ (Transfer Learning)។ ទាមទារពេលវេលាហ្វឹកហាត់យូរ និងប្រើប្រាស់ធនធានកុំព្យូទ័រខ្ពស់ (High Computational Cost)។ ទទួលបានភាពត្រឹមត្រូវ 94.59% ជាមួយការប្រើប្រាស់ធនធានគណនាខ្ពស់។
EfficientNet
ស្ថាបត្យកម្មបណ្តាញ EfficientNet
មានប្រសិទ្ធភាពល្អបង្គួរក្នុងការធ្វើចំណាត់ថ្នាក់ដោយផ្តល់នូវតុល្យភាពរវាងភាពត្រឹមត្រូវ និងទំហំនៃម៉ូដែល។ ទោះបីជាត្រូវបានរចនាឡើងដើម្បីសន្សំសំចៃធនធាន វានៅតែប្រើប្រាស់ធនធានច្រើនជាងម៉ូដែល Custom CNN ដែលបានស្នើឡើង។ ទទួលបានភាពត្រឹមត្រូវ 96.78% ជាមួយការចំណាយធនធានកុំព្យូទ័រកម្រិតមធ្យម។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះបង្ហាញពីតម្រូវការធនធានកុំព្យូទ័រកម្រិតមធ្យមទៅខ្ពស់ ក្នុងការហ្វឹកហាត់ម៉ូដែល Deep Learning លើទិន្នន័យរូបភាពវេជ្ជសាស្ត្រជាង ១ម៉ឺនរូបភាព។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យ HAM10000 ដែលប្រមូលបានពីអ្នកជំងឺនៅបរទេស ដែលអាចមានលក្ខណៈជីវសាស្ត្រ និងទម្រង់ពណ៌ស្បែកខុសពីប្រជាជនអាស៊ី ឬកម្ពុជា។ លើសពីនេះ បញ្ហាអតុល្យភាពទិន្នន័យ (Class Imbalance) ដែលខ្វះខាតរូបភាពមហារីកស្បែកប្រភេទកម្រ អាចធ្វើឱ្យម៉ូដែលដំណើរការមិនសូវល្អនៅពេលអនុវត្តផ្ទាល់នៅកម្ពុជា ប្រសិនបើមិនមានការបន្ថែមទិន្នន័យក្នុងស្រុកដើម្បីយកទៅហ្វឹកហាត់ឡើងវិញ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្តានុពលខ្លាំងក្នុងការជួយសម្រួលដល់ការធ្វើរោគវិនិច្ឆ័យជំងឺមហារីកស្បែកនៅកម្ពុជា ជាពិសេសនៅតំបន់ដែលខ្វះខាតគ្រូពេទ្យឯកទេស។

ជារួម បច្ចេកវិទ្យានេះអាចជួយលើកកម្ពស់គុណភាពសេវាថែទាំសុខភាពស្បែកនៅកម្ពុជា ប៉ុន្តែទាមទារឱ្យមានការប្រមូលទិន្នន័យរូបភាពស្បែកក្នុងស្រុកបន្ថែមដើម្បីកែសម្រួលម៉ូដែល (Fine-tuning) ឱ្យស្របតាមស្ថានភាពជាក់ស្តែង។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាពីមូលដ្ឋានគ្រឹះនៃ Computer Vision និងឧបករណ៍: ចាប់ផ្តើមរៀនភាសា Python និងបណ្ណាល័យ TensorFlowPyTorch ដោយផ្តោតលើការកសាង Convolutional Neural Networks (CNN) សាមញ្ញសម្រាប់ការធ្វើចំណាត់ថ្នាក់រូបភាព។
  2. ទាញយក និងរៀបចំសំណុំទិន្នន័យវេជ្ជសាស្ត្រ: ចូលទៅកាន់ Kaggle ដើម្បីទាញយកសំណុំទិន្នន័យ HAM10000។ អនុវត្តបច្ចេកទេស Data Preprocessing ដូចជាការប្ដូរទំហំរូបភាពទៅ 224x224 និងការធ្វើ Data Augmentation (ដូចជាការបង្វិល និងផ្លាស់ប្តូរពន្លឺ) ដើម្បីដោះស្រាយបញ្ហា Class Imbalance
  3. អភិវឌ្ឍ និងហ្វឹកហាត់ម៉ូដែលផ្ទាល់ខ្លួន: សាកល្បងសរសេរកូដបង្កើត Custom CNN Architecture ដែលមានស្រទាប់ Convolutional Layer, Batch Normalization, និង ReLU រួចហ្វឹកហាត់វាដោយប្រើប្រាស់ Adam Optimizer (Learning rate: 0.0001) ដូចដែលបានរៀបរាប់ក្នុងឯកសារស្រាវជ្រាវនេះ។
  4. អនុវត្តការផ្ទេរការរៀនសូត្រ (Transfer Learning): ប្រៀបធៀបលទ្ធផលម៉ូដែលរបស់អ្នកជាមួយនឹងម៉ូដែលដែលបានហ្វឹកហាត់រួចជាមុន (Pre-trained Models) ដូចជា ResNet50 និង EfficientNet ដោយប្រើ Keras Applications ដើម្បីយល់ពីភាពខុសគ្នានៃប្រសិទ្ធភាព និងការប្រើប្រាស់ធនធានកុំព្យូទ័រ។
  5. សិក្សាពី Explainable AI និងការដាក់ឱ្យដំណើរការបឋម: អនុវត្តបច្ចេកទេស Grad-CAM ដើម្បីមើលថាតើម៉ូដែលផ្តោតលើចំណុចណាខ្លះនៃរូបភាពស្បែកក្នុងការធ្វើរោគវិនិច្ឆ័យ។ បន្ទាប់មក សាកល្បងវេចខ្ចប់ម៉ូដែលនេះជា Web API ប្រើប្រាស់ FastAPIFlask ដើម្បីអាចសាកល្បងវាជាមួយកម្មវិធីទូរស័ព្ទដៃបាន។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Convolutional Neural Network (CNN) ជាប្រភេទបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតដែលត្រូវបានរចនាឡើងយ៉ាងពិសេស ដើម្បីវិភាគ និងទាញយកលក្ខណៈពិសេសពីរូបភាព (ដូចជារូបរាង ពណ៌ ឬលំនាំនៃដំបៅស្បែក) តាមរយៈការប្រើប្រាស់តម្រងកុំព្យូទ័រ (Filters) ជាច្រើនជាន់ ដើម្បីធ្វើចំណាត់ថ្នាក់រូបភាពនោះ។ ដូចជាភ្នែករបស់មនុស្សដែលប្រើកញ្ចក់ពង្រីកសម្លឹងមើលកាត់ម្តងមួយផ្នែកៗនៃរូបភាព ដើម្បីផ្តុំជារូបរាងរួម និងកាត់ក្តីថាជារូបអ្វីពិតប្រាកដ។
Class Imbalance ជាស្ថានភាពអតុល្យភាពនៅក្នុងសំណុំទិន្នន័យដែលចំនួនឧទាហរណ៍នៃប្រភេទនីមួយៗមិនស្មើគ្នាខ្លាំង។ ឧទាហរណ៍៖ មានរូបភាពមហារីកស្បែកធម្មតាច្រើនលើសលប់ ប៉ុន្តែមានរូបភាពមហារីកប្រភេទកម្រតែបន្តិចបន្តួច ដែលធ្វើឱ្យម៉ូដែល AI រៀនលម្អៀងទៅរកតែប្រភេទដែលមានច្រើន។ ដូចជាសិស្សដែលអានតែសៀវភៅប្រវត្តិសាស្ត្រ ១០០ក្បាល តែអានសៀវភៅគណិតវិទ្យាបានតែ ១ក្បាល ពេលប្រឡងគាត់ច្បាស់ជាពូកែប្រវត្តិ តែទាយខុសរហូតចំពោះមុខវិជ្ជាគណិតវិទ្យា។
Data Augmentation ជាបច្ចេកទេសបង្កើតទិន្នន័យសិប្បនិម្មិតថ្មីៗបន្ថែមពីទិន្នន័យចាស់ដែលមានស្រាប់ តាមរយៈការបង្វិលរូបភាព ការត្រឡប់ចុះឡើង ការបង្រួមពង្រីក ឬប្តូរពន្លឺ ដើម្បីបង្រៀនម៉ូដែលឱ្យស្គាល់រូបភាពក្នុងជ្រុងខុសៗគ្នា និងជួយដោះស្រាយបញ្ហាខ្វះទិន្នន័យ។ ដូចជាការថតរូបមនុស្សម្នាក់ពីប្លង់ផ្សេងៗគ្នា (មុខ ចំហៀង ងើប អោន) ដើម្បីឱ្យយើងនៅតែអាចចំណាំគាត់បាន ទោះគាត់ឈរក្នុងទម្រង់ណាក៏ដោយ។
Transfer Learning ជាវិធីសាស្ត្រយកម៉ូដែលបញ្ញាសិប្បនិម្មិតខ្នាតធំ (ដូចជា ResNet ឬ EfficientNet) ដែលត្រូវបានគេហ្វឹកហាត់រួចហើយលើទិន្នន័យរូបភាពទូទៅរាប់លានសន្លឹក មកបង្វឹកបន្តបន្តិចបន្តួចលើទិន្នន័យថ្មី (រូបភាពស្បែក) ដើម្បីសន្សំពេលវេលា និងបង្កើនភាពត្រឹមត្រូវ។ ដូចជាការយកចុងភៅដែលពូកែធ្វើម្ហូបបរទេសរួចជាស្រេច មកបង្រៀនបន្ថែមពីរបៀបធ្វើម្ហូបខ្មែរ គឺលឿនជាងការបង្រៀនអ្នកដែលមិនធ្លាប់កាន់កាំបិតសោះ។
Adam Optimizer ជាក្បួនដោះស្រាយ (Algorithm) ដែលជួយកែតម្រូវកម្រិតទម្ងន់ (Weights) នៃបណ្តាញសរសៃប្រសាទដោយស្វ័យប្រវត្តិក្នុងអំឡុងពេលហ្វឹកហាត់ ដើម្បីឱ្យម៉ូដែលរៀនបានលឿន និងទាយបានកាន់តែត្រឹមត្រូវ ដោយកាត់បន្ថយកំហុសឱ្យនៅទាបបំផុត។ ដូចជាអ្នកបើកបរឆ្លាតវៃដែលចេះសារ៉េចង្កូតបត់បែន និងបន្ថយល្បឿនដោយស្វ័យប្រវត្តិ ពេលផ្លូវមានកន្លែងកោងខ្លាំង ដើម្បីទៅដល់គោលដៅដោយសុវត្ថិភាពនិងលឿនបំផុត។
Batch Normalization ជាដំណើរការកែតម្រូវទិន្នន័យដែលឆ្លងកាត់ចន្លោះស្រទាប់នីមួយៗនៃបណ្តាញសរសៃប្រសាទ ឱ្យស្ថិតក្នុងទំហំកម្រិតស្តង់ដារមួយរួម (មានមធ្យមភាគ ០ និងរំលាតស្តង់ដារ ១) ដើម្បីជួយឱ្យការហ្វឹកហាត់ម៉ូដែលដំណើរការទៅមុខមានស្ថិរភាព និងលឿនជាងមុន។ ដូចជាការប្តូររូបិយប័ណ្ណចម្រុះ (រៀល ដុល្លារ បាត) ទៅជារូបិយប័ណ្ណតែមួយជាមុនសិនមុននឹងបូកសរុប ដើម្បីកុំឱ្យច្របូកច្របល់តួលេខធំពេកឬតូចពេក។
Confusion Matrix ជាតារាងម៉ាទ្រីសដែលបង្ហាញយ៉ាងច្បាស់ពីការប្រៀបធៀបរវាងការទស្សន៍ទាយរបស់ម៉ូដែល AI និងលទ្ធផលពិតប្រាកដ (Labels) ដើម្បីឱ្យគេដឹងថាម៉ូដែលទាយត្រូវកម្រិតណា ហើយមានការភាន់ច្រឡំគ្នារវាងប្រភេទថ្នាក់នីមួយៗចំនួនប៉ុន្មានដង។ ដូចជាតារាងផ្ទៀងផ្ទាត់បញ្ជីវត្តមាន ដែលបង្ហាញថាសិស្សណាខ្លះមកមែន សិស្សណាខ្លះអវត្តមានមែន និងសិស្សណាខ្លះដែលគ្រូកត់ច្រឡំថាអវត្តមាន តែតាមពិតគាត់មក។
Explainable AI (Grad-CAM) ជាបច្ចេកទេសដែលជួយបកស្រាយពីមូលហេតុដែលម៉ូដែល AI សម្រេចចិត្តធ្វើរោគវិនិច្ឆ័យ ដោយវាគូសចំណាំពណ៌ (Heatmap) លើតំបន់នៃរូបភាពដែលម៉ូដែលនោះបានផ្តោតការយកចិត្តទុកដាក់ខ្លាំងជាងគេ ជួយឱ្យគ្រូពេទ្យអាចជឿទុកចិត្តបាន។ ដូចជាគ្រូបង្រៀនដែលតម្រូវឱ្យសិស្សមិនត្រឹមតែប្រាប់ចម្លើយគណិតវិទ្យាប៉ុណ្ណោះទេ តែត្រូវបង្ហាញក្រដាសព្រាងនៃការគណនា ដើម្បីឱ្យដឹងថាគេគិតតាមរបៀបណាទើបចេញចម្លើយនោះ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖