Original Title: A Deep Learning Framework for Multi-Class Skin Cancer Diagnosis: Addressing Class Imbalance and Performance Optimization Through Convolutional Neural Network Architectures
Source: doi.org/10.37745/ejcsit.2013/vol13n16371
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ក្របខណ្ឌរៀនស៊ីជម្រៅសម្រាប់ការធ្វើរោគវិនិច្ឆ័យជំងឺមហារីកស្បែកពហុថ្នាក់៖ ការដោះស្រាយអតុល្យភាពថ្នាក់ និងការបង្កើនប្រសិទ្ធភាពតាមរយៈស្ថាបត្យកម្មបណ្តាញសរសៃប្រសាទខនវ៉ូលូសិន

ចំណងជើងដើម៖ A Deep Learning Framework for Multi-Class Skin Cancer Diagnosis: Addressing Class Imbalance and Performance Optimization Through Convolutional Neural Network Architectures

អ្នកនិពន្ធ៖ Md Imamul Haque (Nanjing University of Information Science & Technology), Karima Khatun (Nanjing University of Information Science & Technology), Golam Rohman (Nanjing University of Information Science & Technology), Abdullah Al Rakib (Nanjing University of Information Science & Technology), Muhammad Maruf Billah (Nanjing University of Information Science & Technology)

ឆ្នាំបោះពុម្ព៖ 2025 European Journal of Computer Science and Information Technology

វិស័យសិក្សា៖ Artificial Intelligence in Medicine

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហានៃការធ្វើរោគវិនិច្ឆ័យជំងឺមហារីកស្បែក និងបញ្ហាអតុល្យភាពថ្នាក់ (Class Imbalance) នៅក្នុងសំណុំទិន្នន័យវេជ្ជសាស្ត្រ ដែលធ្វើឱ្យម៉ូដែល AI ពិបាកក្នុងការកំណត់អត្តសញ្ញាណប្រភេទមហារីកកម្រឱ្យបានត្រឹមត្រូវ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានប្រើប្រាស់ស្ថាបត្យកម្មបណ្តាញសរសៃប្រសាទខនវ៉ូលូសិន (CNN) ដែលបានកែសម្រួលផ្ទាល់ខ្លួន ដោយរួមបញ្ចូលជាមួយបច្ចេកទេសបង្កើនទិន្នន័យ ដើម្បីធ្វើចំណាត់ថ្នាក់ជំងឺមហារីកស្បែកជា ៧ ប្រភេទ។

ការប្រើប្រាស់សំណុំទិន្នន័យរូបភាពស្បែក HAM10000 ចំនួនជាង 10,000 រូបភាព (HAM10000 Dataset)
ការរៀបចំទិន្នន័យជាមុន ការប្ដូរទំហំរូបភាពទៅ 224x224 និងការធ្វើឱ្យមានលក្ខណៈស្តង់ដារ (Data Preprocessing & Normalization)
បច្ចេកទេសបង្កើនទិន្នន័យ ដើម្បីដោះស្រាយបញ្ហាអតុល្យភាព (Data Augmentation)
ការរចនាស្ថាបត្យកម្មបណ្តាញសរសៃប្រសាទខនវ៉ូលូសិន (Custom CNN Architecture) និងការប្រៀបធៀបជាមួយ ResNet50 និង EfficientNet

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ម៉ូដែល CNN ផ្ទាល់ខ្លួននេះទទួលបានភាពត្រឹមត្រូវក្នុងការហ្វឹកហាត់កម្រិត 98.17% និងភាពត្រឹមត្រូវក្នុងការផ្ទៀងផ្ទាត់ 99.60% ក្រោយការហ្វឹកហាត់ចំនួន 10 Epochs។
ម៉ូដែលនេះបង្ហាញប្រសិទ្ធភាពខ្ពស់ និងភាពត្រឹមត្រូវខ្លាំងក្នុងការកំណត់អត្តសញ្ញាណក្រុមមហារីកទូទៅ (Dominant classes) ដូចជា Melanocytic Nevi ប៉ុន្តែនៅមានការលំបាកលើក្រុមដែលកម្រ (Rare classes) ដូចជា Vascular Lesions។
បើប្រៀបធៀបជាមួយម៉ូដែលកម្រិតខ្ពស់ដែលបានហ្វឹកហាត់រួច (Pre-trained models) ដូចជា ResNet50 និង EfficientNet ម៉ូដែលដែលបានស្នើឡើងនេះមានដំណើរការល្អប្រសើរ ដោយប្រើប្រាស់ធនធានកុំព្យូទ័រតិចជាង។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Custom CNN បណ្តាញសរសៃប្រសាទខនវ៉ូលូសិនដែលបានកែសម្រួលផ្ទាល់ខ្លួន (Custom CNN)	មានភាពត្រឹមត្រូវខ្ពស់ ចំណាយពេលហ្វឹកហាត់មធ្យម និងប្រើប្រាស់ធនធានកុំព្យូទ័រតិច (Low Computational Cost) បើធៀបនឹងម៉ូដែលធំៗ។	នៅមានកម្រិតក្នុងការធ្វើចំណាត់ថ្នាក់ប្រភេទមហារីកកម្រ (Class Imbalance) ទោះបីជាបានប្រើប្រាស់បច្ចេកទេសបង្កើនទិន្នន័យ (Data Augmentation) ក៏ដោយ។	ទទួលបានភាពត្រឹមត្រូវ 98.17% និងចំណាយធនធានកុំព្យូទ័រតិចបំផុត។
ResNet50 ស្ថាបត្យកម្មបណ្តាញ ResNet50 (Pre-trained Model)	ជាម៉ូដែលស្តង់ដារដែលមានសមត្ថភាពខ្ពស់ និងអាចទាញយកលក្ខណៈពិសេសនៃរូបភាពវេជ្ជសាស្ត្របានយ៉ាងល្អតាមរយៈបច្ចេកទេសផ្ទេរការរៀនសូត្រ (Transfer Learning)។	ទាមទារពេលវេលាហ្វឹកហាត់យូរ និងប្រើប្រាស់ធនធានកុំព្យូទ័រខ្ពស់ (High Computational Cost)។	ទទួលបានភាពត្រឹមត្រូវ 94.59% ជាមួយការប្រើប្រាស់ធនធានគណនាខ្ពស់។
EfficientNet ស្ថាបត្យកម្មបណ្តាញ EfficientNet	មានប្រសិទ្ធភាពល្អបង្គួរក្នុងការធ្វើចំណាត់ថ្នាក់ដោយផ្តល់នូវតុល្យភាពរវាងភាពត្រឹមត្រូវ និងទំហំនៃម៉ូដែល។	ទោះបីជាត្រូវបានរចនាឡើងដើម្បីសន្សំសំចៃធនធាន វានៅតែប្រើប្រាស់ធនធានច្រើនជាងម៉ូដែល Custom CNN ដែលបានស្នើឡើង។	ទទួលបានភាពត្រឹមត្រូវ 96.78% ជាមួយការចំណាយធនធានកុំព្យូទ័រកម្រិតមធ្យម។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះបង្ហាញពីតម្រូវការធនធានកុំព្យូទ័រកម្រិតមធ្យមទៅខ្ពស់ ក្នុងការហ្វឹកហាត់ម៉ូដែល Deep Learning លើទិន្នន័យរូបភាពវេជ្ជសាស្ត្រជាង ១ម៉ឺនរូបភាព។

Dataset: សំណុំទិន្នន័យរូបភាពស្បែក HAM10000 ដែលមានរូបភាពសរុបចំនួន 10,015 រូបភាពបែងចែកជា ៧ ប្រភេទ។
Hardware: ទាមទារម៉ាស៊ីនកុំព្យូទ័រដែលមានអង្គគណនាក្រាហ្វិក (GPU) កម្រិតមធ្យមទៅខ្ពស់ ដើម្បីដំណើរការការហ្វឹកហាត់ម៉ូដែល Custom CNN, ResNet50 និង EfficientNet ដោយរលូន។
Software: ឧបករណ៍សរសេរកូដសម្រាប់បញ្ញាសិប្បនិម្មិត ដូចជា Python ព្រមទាំងបណ្ណាល័យ Deep Learning ដូចជា TensorFlow ឬ PyTorch សម្រាប់បង្កើតម៉ូដែល និងប្រើប្រាស់ Adam Optimizer។
Expertise: ទាមទារអ្នកជំនាញដែលមានចំណេះដឹងផ្នែករៀនស៊ីជម្រៅ (Deep Learning) ការរៀបចំទិន្នន័យរូបភាពជាមុន (Image Preprocessing/Augmentation) និងមានការសហការពីគ្រូពេទ្យរោគសើស្បែក។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យ HAM10000 ដែលប្រមូលបានពីអ្នកជំងឺនៅបរទេស ដែលអាចមានលក្ខណៈជីវសាស្ត្រ និងទម្រង់ពណ៌ស្បែកខុសពីប្រជាជនអាស៊ី ឬកម្ពុជា។ លើសពីនេះ បញ្ហាអតុល្យភាពទិន្នន័យ (Class Imbalance) ដែលខ្វះខាតរូបភាពមហារីកស្បែកប្រភេទកម្រ អាចធ្វើឱ្យម៉ូដែលដំណើរការមិនសូវល្អនៅពេលអនុវត្តផ្ទាល់នៅកម្ពុជា ប្រសិនបើមិនមានការបន្ថែមទិន្នន័យក្នុងស្រុកដើម្បីយកទៅហ្វឹកហាត់ឡើងវិញ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្តានុពលខ្លាំងក្នុងការជួយសម្រួលដល់ការធ្វើរោគវិនិច្ឆ័យជំងឺមហារីកស្បែកនៅកម្ពុជា ជាពិសេសនៅតំបន់ដែលខ្វះខាតគ្រូពេទ្យឯកទេស។

មន្ទីរពេទ្យថ្នាក់ជាតិ (ឧទាហរណ៍៖ មន្ទីរពេទ្យកាល់ម៉ែត, មន្ទីរពេទ្យមិត្តភាពខ្មែរ-សូវៀត): អាចប្រើប្រាស់ម៉ូដែលនេះជាឧបករណ៍ជំនួយ (Diagnostic Tool) សម្រាប់គ្រូពេទ្យរោគសើស្បែកក្នុងការពិនិត្យជំងឺបឋមឱ្យបានលឿន និងកាត់បន្ថយការធ្វើកោសល្យវិច័យ (Biopsy) ដែលមិនចាំបាច់ ឬបង្កការឈឺចាប់ដល់អ្នកជំងឺ។
គ្លីនិកចល័តនៅតាមបណ្តាខេត្តឆ្ងាយៗ (ឧទាហរណ៍៖ ព្រះវិហារ, មណ្ឌលគិរី): អាចប្រើប្រាស់ប្រព័ន្ធនេះរួមបញ្ចូលជាមួយកម្មវិធីទូរស័ព្ទដៃ ឬឧបករណ៍ថតរូបស្បែកខ្នាតតូច (Dermatoscope) ដើម្បីវិភាគរូបភាពស្បែកភ្លាមៗ និងផ្តល់ការប្រឹក្សាពីចម្ងាយ (Telemedicine) សម្រាប់ប្រជាជននៅតំបន់ដាច់ស្រយាល។

ជារួម បច្ចេកវិទ្យានេះអាចជួយលើកកម្ពស់គុណភាពសេវាថែទាំសុខភាពស្បែកនៅកម្ពុជា ប៉ុន្តែទាមទារឱ្យមានការប្រមូលទិន្នន័យរូបភាពស្បែកក្នុងស្រុកបន្ថែមដើម្បីកែសម្រួលម៉ូដែល (Fine-tuning) ឱ្យស្របតាមស្ថានភាពជាក់ស្តែង។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាពីមូលដ្ឋានគ្រឹះនៃ Computer Vision និងឧបករណ៍: ចាប់ផ្តើមរៀនភាសា Python និងបណ្ណាល័យ TensorFlow ឬ PyTorch ដោយផ្តោតលើការកសាង Convolutional Neural Networks (CNN) សាមញ្ញសម្រាប់ការធ្វើចំណាត់ថ្នាក់រូបភាព។
ទាញយក និងរៀបចំសំណុំទិន្នន័យវេជ្ជសាស្ត្រ: ចូលទៅកាន់ Kaggle ដើម្បីទាញយកសំណុំទិន្នន័យ HAM10000។ អនុវត្តបច្ចេកទេស Data Preprocessing ដូចជាការប្ដូរទំហំរូបភាពទៅ 224x224 និងការធ្វើ Data Augmentation (ដូចជាការបង្វិល និងផ្លាស់ប្តូរពន្លឺ) ដើម្បីដោះស្រាយបញ្ហា Class Imbalance។
អភិវឌ្ឍ និងហ្វឹកហាត់ម៉ូដែលផ្ទាល់ខ្លួន: សាកល្បងសរសេរកូដបង្កើត Custom CNN Architecture ដែលមានស្រទាប់ Convolutional Layer, Batch Normalization, និង ReLU រួចហ្វឹកហាត់វាដោយប្រើប្រាស់ Adam Optimizer (Learning rate: 0.0001) ដូចដែលបានរៀបរាប់ក្នុងឯកសារស្រាវជ្រាវនេះ។
អនុវត្តការផ្ទេរការរៀនសូត្រ (Transfer Learning): ប្រៀបធៀបលទ្ធផលម៉ូដែលរបស់អ្នកជាមួយនឹងម៉ូដែលដែលបានហ្វឹកហាត់រួចជាមុន (Pre-trained Models) ដូចជា ResNet50 និង EfficientNet ដោយប្រើ Keras Applications ដើម្បីយល់ពីភាពខុសគ្នានៃប្រសិទ្ធភាព និងការប្រើប្រាស់ធនធានកុំព្យូទ័រ។
សិក្សាពី Explainable AI និងការដាក់ឱ្យដំណើរការបឋម: អនុវត្តបច្ចេកទេស Grad-CAM ដើម្បីមើលថាតើម៉ូដែលផ្តោតលើចំណុចណាខ្លះនៃរូបភាពស្បែកក្នុងការធ្វើរោគវិនិច្ឆ័យ។ បន្ទាប់មក សាកល្បងវេចខ្ចប់ម៉ូដែលនេះជា Web API ប្រើប្រាស់ FastAPI ឬ Flask ដើម្បីអាចសាកល្បងវាជាមួយកម្មវិធីទូរស័ព្ទដៃបាន។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Convolutional Neural Network (CNN)	ជាប្រភេទបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតដែលត្រូវបានរចនាឡើងយ៉ាងពិសេស ដើម្បីវិភាគ និងទាញយកលក្ខណៈពិសេសពីរូបភាព (ដូចជារូបរាង ពណ៌ ឬលំនាំនៃដំបៅស្បែក) តាមរយៈការប្រើប្រាស់តម្រងកុំព្យូទ័រ (Filters) ជាច្រើនជាន់ ដើម្បីធ្វើចំណាត់ថ្នាក់រូបភាពនោះ។	ដូចជាភ្នែករបស់មនុស្សដែលប្រើកញ្ចក់ពង្រីកសម្លឹងមើលកាត់ម្តងមួយផ្នែកៗនៃរូបភាព ដើម្បីផ្តុំជារូបរាងរួម និងកាត់ក្តីថាជារូបអ្វីពិតប្រាកដ។
Class Imbalance	ជាស្ថានភាពអតុល្យភាពនៅក្នុងសំណុំទិន្នន័យដែលចំនួនឧទាហរណ៍នៃប្រភេទនីមួយៗមិនស្មើគ្នាខ្លាំង។ ឧទាហរណ៍៖ មានរូបភាពមហារីកស្បែកធម្មតាច្រើនលើសលប់ ប៉ុន្តែមានរូបភាពមហារីកប្រភេទកម្រតែបន្តិចបន្តួច ដែលធ្វើឱ្យម៉ូដែល AI រៀនលម្អៀងទៅរកតែប្រភេទដែលមានច្រើន។	ដូចជាសិស្សដែលអានតែសៀវភៅប្រវត្តិសាស្ត្រ ១០០ក្បាល តែអានសៀវភៅគណិតវិទ្យាបានតែ ១ក្បាល ពេលប្រឡងគាត់ច្បាស់ជាពូកែប្រវត្តិ តែទាយខុសរហូតចំពោះមុខវិជ្ជាគណិតវិទ្យា។
Data Augmentation	ជាបច្ចេកទេសបង្កើតទិន្នន័យសិប្បនិម្មិតថ្មីៗបន្ថែមពីទិន្នន័យចាស់ដែលមានស្រាប់ តាមរយៈការបង្វិលរូបភាព ការត្រឡប់ចុះឡើង ការបង្រួមពង្រីក ឬប្តូរពន្លឺ ដើម្បីបង្រៀនម៉ូដែលឱ្យស្គាល់រូបភាពក្នុងជ្រុងខុសៗគ្នា និងជួយដោះស្រាយបញ្ហាខ្វះទិន្នន័យ។	ដូចជាការថតរូបមនុស្សម្នាក់ពីប្លង់ផ្សេងៗគ្នា (មុខ ចំហៀង ងើប អោន) ដើម្បីឱ្យយើងនៅតែអាចចំណាំគាត់បាន ទោះគាត់ឈរក្នុងទម្រង់ណាក៏ដោយ។
Transfer Learning	ជាវិធីសាស្ត្រយកម៉ូដែលបញ្ញាសិប្បនិម្មិតខ្នាតធំ (ដូចជា ResNet ឬ EfficientNet) ដែលត្រូវបានគេហ្វឹកហាត់រួចហើយលើទិន្នន័យរូបភាពទូទៅរាប់លានសន្លឹក មកបង្វឹកបន្តបន្តិចបន្តួចលើទិន្នន័យថ្មី (រូបភាពស្បែក) ដើម្បីសន្សំពេលវេលា និងបង្កើនភាពត្រឹមត្រូវ។	ដូចជាការយកចុងភៅដែលពូកែធ្វើម្ហូបបរទេសរួចជាស្រេច មកបង្រៀនបន្ថែមពីរបៀបធ្វើម្ហូបខ្មែរ គឺលឿនជាងការបង្រៀនអ្នកដែលមិនធ្លាប់កាន់កាំបិតសោះ។
Adam Optimizer	ជាក្បួនដោះស្រាយ (Algorithm) ដែលជួយកែតម្រូវកម្រិតទម្ងន់ (Weights) នៃបណ្តាញសរសៃប្រសាទដោយស្វ័យប្រវត្តិក្នុងអំឡុងពេលហ្វឹកហាត់ ដើម្បីឱ្យម៉ូដែលរៀនបានលឿន និងទាយបានកាន់តែត្រឹមត្រូវ ដោយកាត់បន្ថយកំហុសឱ្យនៅទាបបំផុត។	ដូចជាអ្នកបើកបរឆ្លាតវៃដែលចេះសារ៉េចង្កូតបត់បែន និងបន្ថយល្បឿនដោយស្វ័យប្រវត្តិ ពេលផ្លូវមានកន្លែងកោងខ្លាំង ដើម្បីទៅដល់គោលដៅដោយសុវត្ថិភាពនិងលឿនបំផុត។
Batch Normalization	ជាដំណើរការកែតម្រូវទិន្នន័យដែលឆ្លងកាត់ចន្លោះស្រទាប់នីមួយៗនៃបណ្តាញសរសៃប្រសាទ ឱ្យស្ថិតក្នុងទំហំកម្រិតស្តង់ដារមួយរួម (មានមធ្យមភាគ ០ និងរំលាតស្តង់ដារ ១) ដើម្បីជួយឱ្យការហ្វឹកហាត់ម៉ូដែលដំណើរការទៅមុខមានស្ថិរភាព និងលឿនជាងមុន។	ដូចជាការប្តូររូបិយប័ណ្ណចម្រុះ (រៀល ដុល្លារ បាត) ទៅជារូបិយប័ណ្ណតែមួយជាមុនសិនមុននឹងបូកសរុប ដើម្បីកុំឱ្យច្របូកច្របល់តួលេខធំពេកឬតូចពេក។
Confusion Matrix	ជាតារាងម៉ាទ្រីសដែលបង្ហាញយ៉ាងច្បាស់ពីការប្រៀបធៀបរវាងការទស្សន៍ទាយរបស់ម៉ូដែល AI និងលទ្ធផលពិតប្រាកដ (Labels) ដើម្បីឱ្យគេដឹងថាម៉ូដែលទាយត្រូវកម្រិតណា ហើយមានការភាន់ច្រឡំគ្នារវាងប្រភេទថ្នាក់នីមួយៗចំនួនប៉ុន្មានដង។	ដូចជាតារាងផ្ទៀងផ្ទាត់បញ្ជីវត្តមាន ដែលបង្ហាញថាសិស្សណាខ្លះមកមែន សិស្សណាខ្លះអវត្តមានមែន និងសិស្សណាខ្លះដែលគ្រូកត់ច្រឡំថាអវត្តមាន តែតាមពិតគាត់មក។
Explainable AI (Grad-CAM)	ជាបច្ចេកទេសដែលជួយបកស្រាយពីមូលហេតុដែលម៉ូដែល AI សម្រេចចិត្តធ្វើរោគវិនិច្ឆ័យ ដោយវាគូសចំណាំពណ៌ (Heatmap) លើតំបន់នៃរូបភាពដែលម៉ូដែលនោះបានផ្តោតការយកចិត្តទុកដាក់ខ្លាំងជាងគេ ជួយឱ្យគ្រូពេទ្យអាចជឿទុកចិត្តបាន។	ដូចជាគ្រូបង្រៀនដែលតម្រូវឱ្យសិស្សមិនត្រឹមតែប្រាប់ចម្លើយគណិតវិទ្យាប៉ុណ្ណោះទេ តែត្រូវបង្ហាញក្រដាសព្រាងនៃការគណនា ដើម្បីឱ្យដឹងថាគេគិតតាមរបៀបណាទើបចេញចម្លើយនោះ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖