Original Title: DRGNet: Diabetic Retinopathy Grading Network Using Data Balancing Integrated Transfer Learning with Graph-based KNN Classification
Source: doi.org/10.22266/ijies2023.1231.34
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

DRGNet៖ បណ្តាញចាត់ថ្នាក់កម្រិតជំងឺទឹកនោមផ្អែមឡើងភ្នែក ដោយប្រើប្រាស់ការធ្វើតុល្យភាពទិន្នន័យរួមបញ្ចូលជាមួយ Transfer Learning និងចំណាត់ថ្នាក់ Graph-based KNN

ចំណងជើងដើម៖ DRGNet: Diabetic Retinopathy Grading Network Using Data Balancing Integrated Transfer Learning with Graph-based KNN Classification

អ្នកនិពន្ធ៖ Swetha Pesaru (Jawaharlal Nehru Technological University Hyderabad), Naresh K Mallenahalli (National Remote Sensing Center), B. Vishnu Vardhan (Jawaharlal Nehru Technological University Hyderabad)

ឆ្នាំបោះពុម្ព៖ 2023, International Journal of Intelligent Engineering and Systems

វិស័យសិក្សា៖ Machine Learning in Healthcare

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការធ្វើរោគវិនិច្ឆ័យជំងឺទឹកនោមផ្អែមឡើងភ្នែក (Diabetic Retinopathy - DR) តាមបែបប្រពៃណីគឺចំណាយពេលយូរ មានភាពស្មុគស្មាញ និងមានបញ្ហាអតុល្យភាពទិន្នន័យ ដែលទាមទារឱ្យមានប្រព័ន្ធស្វ័យប្រវត្តិដែលមានភាពត្រឹមត្រូវខ្ពស់។

វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះបានស្នើឡើងនូវម៉ូដែល DRG-Net ដែលរួមបញ្ចូលបច្ចេកទេស Deep Learning និង Graph-based ជឿនលឿន ដើម្បីដោះស្រាយបញ្ហាអតុល្យភាពទិន្នន័យ និងបង្កើនភាពត្រឹមត្រូវក្នុងការចាត់ថ្នាក់កម្រិតជំងឺ។

បច្ចេកទេសបង្កើតទិន្នន័យបន្ថែមដើម្បីធ្វើតុល្យភាពសំណាក (SMOTE Data Balancing)
ការទាញយកលក្ខណៈពិសេសពីរូបភាពដោយប្រើប្រាស់បណ្តាញ (ResNet50 Feature Extraction)
ក្បួនដោះស្រាយចំណាត់ថ្នាក់ផ្អែកលើក្រាហ្វ (Graph-based KNN Classification - GKNN)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ម៉ូដែល DRG-Net សម្រេចបាននូវភាពត្រឹមត្រូវរហូតដល់ 99.93% និងពិន្ទុ F1-score 99.85% លើសំណុំទិន្នន័យ IDRiD។
ការប្រើប្រាស់បច្ចេកទេស SMOTE ជួយដោះស្រាយបញ្ហាអតុល្យភាពថ្នាក់ទិន្នន័យដោយជោគជ័យ ដែលធ្វើឱ្យម៉ូដែលរៀនបានកាន់តែច្បាស់ និងមិនលម្អៀង។
ប្រព័ន្ធនេះបង្ហាញពីសមត្ថភាពល្អប្រសើរដាច់ខាត បើប្រៀបធៀបទៅនឹងវិធីសាស្ត្រមុនៗ (ដូចជា MSA-ResNetGB និង OHGCNet) ក្នុងការចាត់ថ្នាក់កម្រិតជំងឺបានលឿននិងត្រឹមត្រូវ។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Proposed DRG-Net ម៉ូដែលដែលបានស្នើឡើង (DRG-Net ប្រើប្រាស់ SMOTE, ResNet50 និង GKNN)	មានភាពត្រឹមត្រូវខ្ពស់បំផុត និងដោះស្រាយបញ្ហាអតុល្យភាពទិន្នន័យបានយ៉ាងល្អតាមរយៈបច្ចេកទេស SMOTE។ វាក៏អាចចាប់យកទំនាក់ទំនងនៃរូបភាពបានច្បាស់លាស់តាមរយៈ GKNN។	ការគណនាក្រាហ្វសម្រាប់ GKNN អាចទាមទារថាមពលកុំព្យូទ័រច្រើន និងពេលវេលាយូរ ប្រសិនបើអនុវត្តលើសំណុំទិន្នន័យធំមហិមា។	សម្រេចបានភាពត្រឹមត្រូវ 99.93% និង F1-Score 99.85% លើសំណុំទិន្នន័យ IDRiD។
DLCNN-MGWO-VW បណ្តាញសរសៃប្រសាទវិលជុំជ្រៅ (DLCNN) ជាមួយក្បួន Grey-Wolf Optimizer	មានសមត្ថភាពទាញយកលក្ខណៈពិសេស និងចាត់ថ្នាក់ជំងឺ DR និង DME ក្នុងពេលតែមួយបានល្អ។	ដំណើរការរបស់វាពឹងផ្អែកខ្លាំងលើការជ្រើសរើស Optimizer និងការកំណត់ទម្ងន់ (Weights) ដែលប្រើពេលយូរ និងពិបាកក្នុងការកំណត់រចនាសម្ព័ន្ធឱ្យល្អបំផុត។	សម្រេចបានភាពត្រឹមត្រូវត្រឹមតែ 92.23% និង F1-Score 94.63% (ទាបជាង DRG-Net)។
OHGCNet បណ្តាញ Hybrid Graph Convolutional (OHGCNet)	មានភាពត្រឹមត្រូវខ្ពស់គួរសម ដោយប្រើប្រាស់រចនាសម្ព័ន្ធក្រាហ្វ (Graph) និងការជ្រើសរើសលក្ខណៈពិសេសល្អបំផុត។	ការកសាង និងដំណើរការរចនាសម្ព័ន្ធក្រាហ្វ មានភាពស្មុគស្មាញ និងចំណាយថាមពលកុំព្យូទ័រខ្ពស់ (Computationally expensive) សម្រាប់សំណុំទិន្នន័យធំៗ។	សម្រេចបានភាពត្រឹមត្រូវ 98.67% និង F1-Score 98.88% (ចាញ់ DRG-Net បន្តិចបន្តួច)។

ការចំណាយលើធនធាន (Resource Cost)៖ ថ្វីត្បិតតែឯកសារមិនបានបញ្ជាក់តួលេខច្បាស់លាស់ពីផ្នែករឹងក៏ដោយ ប៉ុន្តែដោយសារការប្រើប្រាស់ Deep Learning (ResNet50) និង Graph-based algorithms វាទាមទារធនធានកុំព្យូទ័រកម្រិតខ្ពស់សម្រាប់ការហ្វឹកហាត់។

Hardware: ត្រូវការម៉ាស៊ីនដែលមានអង្គគណនាដាច់ដោយឡែកល្បឿនលឿន (GPU) ដើម្បីដំណើរការបណ្តាញសរសៃប្រសាទ ResNet50 និងរចនាសម្ព័ន្ធក្រាហ្វ (Graph Construction) របស់ GKNN ឱ្យបានរហ័ស។
Software: ត្រូវការបណ្ណាល័យ Deep Learning (ឧ. TensorFlow ឬ PyTorch) និងបណ្ណាល័យសម្រាប់ធ្វើតុល្យភាពទិន្នន័យ (ឧ. imbalanced-learn សម្រាប់ SMOTE)។
Dataset: ទាមទារសំណុំទិន្នន័យរូបភាពបាតភ្នែកដែលថតក្នុងកម្រិតច្បាស់ (High-resolution fundus images) ដូចជា IDRiD ឬ Messidor ដែលមានការដាក់ស្លាកកម្រិតជំងឺយ៉ាងត្រឹមត្រូវពីអ្នកជំនាញ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងដោយប្រើប្រាស់សំណុំទិន្នន័យ IDRiD (របស់ប្រទេសឥណ្ឌា) និង Messidor។ ការប្រើប្រាស់ទិន្នន័យពីប្រទេសឥណ្ឌាអាចមានលក្ខណៈជីវសាស្ត្រមួយចំនួនស្រដៀងនឹងប្រជាជនកម្ពុជា ប៉ុន្តែការខ្វះខាតការធ្វើតេស្តលើទិន្នន័យរូបភាពបាតភ្នែករបស់ប្រជាជនកម្ពុជាផ្ទាល់ អាចធ្វើឱ្យម៉ូដែលដំណើរការខុសប្រក្រតីនៅពេលអនុវត្តជាក់ស្តែងក្នុងបរិបទមន្ទីរពេទ្យក្នុងស្រុក។ ការប្រមូលទិន្នន័យអ្នកជំងឺកម្ពុជាគឺជារឿងចាំបាច់។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់ខ្លាំងក្នុងការជួយប្រព័ន្ធសុខាភិបាលកម្ពុជា ជាពិសេសក្នុងការកាត់បន្ថយបន្ទុកគ្រូពេទ្យភ្នែកដែលកំពុងខ្វះខាត និងជួយរាវរកជំងឺឱ្យបានទាន់ពេលវេលា។

មន្ទីរពេទ្យជាតិ និងមជ្ឈមណ្ឌលទឹកនោមផ្អែម (National Hospitals & Diabetes Centers): ម៉ូដែលនេះអាចត្រូវបានដាក់ឱ្យប្រើប្រាស់នៅមន្ទីរពេទ្យកាល់ម៉ែត មន្ទីរពេទ្យព្រះកុសុមៈ ឬគ្លីនិកឯកទេស ដើម្បីជួយវេជ្ជបណ្ឌិតវិភាគរូបភាពភ្នែកអ្នកជំងឺទឹកនោមផ្អែមបានរហ័ស និងបែងចែកកម្រិតធ្ងន់ធ្ងរដោយស្វ័យប្រវត្តិ។
សេវាសុខភាពផ្លូវឆ្ងាយសម្រាប់តំបន់ដាច់ស្រយាល (Telemedicine & IoMT in Remote Provinces): តាមរយៈការរួមបញ្ចូលប្រព័ន្ធ IoMT ដូចមានបញ្ជាក់ក្នុងឯកសារ មណ្ឌលសុខភាពនៅខេត្តឆ្ងាយៗ (ឧ. រតនគិរី ព្រះវិហារ) អាចថតរូបភាពបាតភ្នែក រួចបញ្ជូនតាមអ៊ីនធឺណិតមកឱ្យប្រព័ន្ធ AI នៅភ្នំពេញធ្វើការវិភាគភ្លាមៗ ដោយមិនចាំបាច់មានគ្រូពេទ្យឯកទេសនៅទីនោះផ្ទាល់ឡើយ។

ជារួម ការអនុវត្តម៉ូដែល DRG-Net អាចធ្វើបដិវត្តន៍ការពិនិត្យជំងឺទឹកនោមផ្អែមឡើងភ្នែកនៅកម្ពុជា ប្រសិនបើក្រសួងសុខាភិបាល និងដៃគូអភិវឌ្ឍន៍វិនិយោគលើឧបករណ៍ថតរូបភាពភ្នែកឌីជីថល (Fundus cameras) និងប្រព័ន្ធពពក (Cloud Infrastructure)។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

ជំហានទី១៖ សិក្សាពីការធ្វើតុល្យភាពទិន្នន័យ (Data Balancing): ស្វែងយល់ពីបញ្ហាអតុល្យភាពទិន្នន័យ (Class Imbalance) នៅក្នុងសំណុំទិន្នន័យវេជ្ជសាស្ត្រ និងអនុវត្តបច្ចេកទេស SMOTE ដោយប្រើប្រាស់បណ្ណាល័យ imbalanced-learn ក្នុងភាសា Python ដើម្បីបង្កើតទិន្នន័យបន្ថែមសម្រាប់ក្រុមអ្នកជំងឺដែលមានចំនួនតិចតួច។
ជំហានទី២៖ អនុវត្ត Transfer Learning ជាមួយ ResNet50: សិក្សាពីរបៀបប្រើប្រាស់ម៉ូដែលដែលបានហ្វឹកហាត់រួច (Pre-trained models) ដូចជា ResNet50 តាមរយៈ Keras/TensorFlow ឬ PyTorch។ អនុវត្តការកាត់ស្រទាប់ខាងចុង (Fully Connected Layers) ចេញ ដើម្បីប្រើវាជាអ្នកទាញយកលក្ខណៈពិសេស (Feature Extractor) ពីរូបភាពបាតភ្នែក។
ជំហានទី៣៖ អនុវត្តចំណាត់ថ្នាក់ផ្អែកលើក្រាហ្វ (Graph-based KNN): ស្រាវជ្រាវពីរបៀបបង្កើតក្រាហ្វដើម្បីតំណាងឱ្យទំនាក់ទំនងរវាងលក្ខណៈពិសេសនៃរូបភាព (Graph Representation)។ សាកល្បងសរសេរកូដសម្រាប់ក្បួនដោះស្រាយ GKNN ដើម្បីជំនួសឱ្យចំណាត់ថ្នាក់ Softmax ឬ SVM ធម្មតា សម្រាប់ការធ្វើសេចក្តីសម្រេចចិត្តដែលផ្អែកលើភាពស្រដៀងគ្នានៃទិន្នន័យ។
ជំហានទី៤៖ សាកល្បងហ្វឹកហាត់ម៉ូដែលលើទិន្នន័យជាក់ស្តែង: ចូលទៅកាន់គេហទំព័រ IEEE Dataport ឬ Kaggle ដើម្បីទាញយកសំណុំទិន្នន័យ IDRiD ឬ Messidor រួចសាកល្បងដំណើរការម៉ូដែល DRG-Net ទាំងមូលដោយប្រើប្រាស់ Google Colab Pro ដើម្បីទទួលបាន GPU សម្រាប់គណនា។
ជំហានទី៥៖ វាយតម្លៃសមត្ថភាព និងវិភាគលទ្ធផល: ប្រើប្រាស់រង្វាស់ (Metrics) ដូចជា Accuracy, Precision, Recall, និង F1-Score ដើម្បីវាស់ស្ទង់ប្រសិទ្ធភាពម៉ូដែល។ បង្កើត និងវិភាគលើ Confusion Matrix ដើម្បីយល់ពីចំណុចខ្សោយរបស់ម៉ូដែលថាតើវាតែងតែទាយខុសនៅកម្រិតជំងឺមួយណា ដើម្បីស្វែងរកដំណោះស្រាយកែលម្អបន្ត។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Diabetic retinopathy	ជាផលវិបាកមួយនៃជំងឺទឹកនោមផ្អែមដែលបំផ្លាញសរសៃឈាមនៅក្នុងរន្ធភ្នែក (retina) ដែលអាចបណ្តាលឱ្យងងឹតភ្នែកប្រសិនបើមិនបានធ្វើការកត់សម្គាល់និងព្យាបាលទាន់ពេល។ នៅក្នុងការសិក្សានេះ គេព្យាយាមប្រើ AI ដើម្បីចាត់ថ្នាក់កម្រិតធ្ងន់ធ្ងររបស់វាដោយស្វ័យប្រវត្តិ។	ដូចជាទុយោទឹកចាស់ៗនៅក្នុងកាមេរ៉ាភ្នែករបស់យើងដែលធ្លាយដោយសារជាតិស្ករខ្ពស់ ធ្វើឱ្យខូចរូបភាពដែលយើងកំពុងមើលឃើញ។
SMOTE	ជាបច្ចេកទេសបង្កើតទិន្នន័យថ្មីៗដោយស្វ័យប្រវត្តិ (សិប្បនិម្មិត) សម្រាប់ក្រុមទិន្នន័យដែលមានចំនួនតិចតួច ដើម្បីធ្វើឱ្យសំណុំទិន្នន័យទាំងមូលមានតុល្យភាព។ ការធ្វើបែបនេះជួយឱ្យម៉ូដែល AI រៀនបានស្មើភាពគ្នា និងមិនលម្អៀងទៅរកតែក្រុមដែលមានទិន្នន័យច្រើននោះទេ។	ដូចជាការថតចម្លងនិងកែច្នៃរូបភាពសត្វកម្របន្តិចបន្តួចឱ្យមានច្រើនសន្លឹក ដើម្បីឱ្យកូនក្មេងរៀនចំណាំវាបានស្មើនឹងសត្វដែលសំបូរ។
ResNet50	ជាបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតជ្រៅ (Deep Learning) ដែលមាន 50 ស្រទាប់។ វាប្រើបច្ចេកទេសតភ្ជាប់រំលង (skip connections) ដើម្បីជួយដោះស្រាយបញ្ហាបាត់បង់ព័ត៌មានពេលកំពុងហ្វឹកហាត់ ដែលធ្វើឱ្យវាពូកែខ្លាំងក្នុងការទាញយកលក្ខណៈពិសេសពីរូបភាពស្មុគស្មាញ។	ដូចជារោងចក្រកែច្នៃទិន្នន័យដែលមាន 50 ជាន់ ហើយមានជណ្តើរយន្តពិសេសអាចរំលងជាន់ខ្លះ ដើម្បីបញ្ជូនព័ត៌មានឱ្យបានលឿននិងមិនបាត់បង់តាមផ្លូវ។
Transfer learning	ជាបច្ចេកទេសយកម៉ូដែល AI ដែលត្រូវបានគេហ្វឹកហាត់រួចជាស្រេចលើទិន្នន័យរាប់លានរូបភាព មកបន្តហ្វឹកហាត់បន្ថែមបន្តិចបន្តួចដើម្បីធ្វើកិច្ចការថ្មីមួយទៀត (ឧទាហរណ៍៖ ការពិនិត្យជំងឺភ្នែក) ដែលជួយសន្សំពេលវេលា កម្លាំងម៉ាស៊ីន និងទិន្នន័យ។	ដូចជាការយកចុងភៅដែលពូកែធ្វើម្ហូបអឺរ៉ុបរួចហើយ មកបង្រៀនបន្ថែមបន្តិចបន្តួចឱ្យចេះធ្វើម្ហូបខ្មែរ ដោយមិនបាច់បង្រៀនពីរបៀបកាន់កាំបិតសារជាថ្មី។
GKNN	ជាក្បួនដោះស្រាយសម្រាប់ចាត់ថ្នាក់ទិន្នន័យ ដោយវាបង្កើតជាបណ្តាញក្រាហ្វភ្ជាប់ទិន្នន័យដែលស្រដៀងគ្នា ហើយធ្វើការវាយតម្លៃថារូបភាពថ្មីមួយជារបស់កម្រិតជំងឺណា ដោយផ្អែកលើភាពស្រដៀងគ្នាទៅនឹងអ្នកជិតខាង (ទិន្នន័យចាស់ៗ) របស់វាដែលនៅក្បែរបំផុត។	ដូចជាការវាយតម្លៃអត្តចរិតរបស់សិស្សថ្មីម្នាក់ ដោយមើលទៅលើក្រុមមិត្តភក្តិជិតស្និទ្ធបំផុតរបស់គេ (បើមិត្តគេរៀនពូកែ គេក៏ប្រហែលជារៀនពូកែដែរ)។
IoMT	ការតភ្ជាប់ឧបករណ៍វេជ្ជសាស្ត្រ (ដូចជាម៉ាស៊ីនថតភ្នែក ឬឧបករណ៍វាស់សុខភាព) ទៅកាន់ប្រព័ន្ធអ៊ីនធឺណិត ដើម្បីអាចប្រមូល បញ្ជូន និងវិភាគទិន្នន័យអ្នកជំងឺពីចម្ងាយបានភ្លាមៗ (Real-time) តាមរយៈ Cloud។	ដូចជាការបំពាក់ Wi-Fi ទៅឱ្យឧបករណ៍ពេទ្យ ដើម្បីឱ្យវាអាចផ្ញើលទ្ធផលពិនិត្យទៅកាន់កុំព្យូទ័ររបស់គ្រូពេទ្យដោយស្វ័យប្រវត្តិទោះនៅឆ្ងាយគ្នាក៏ដោយ។
feature extraction	ជាដំណើរការកាត់បន្ថយទំហំទិន្នន័យរូបភាពដ៏ធំ ដោយចាប់យកនិងរក្សាទុកតែចំណុចសំខាន់ៗបំផុត (ដូចជាស្នាមអុច ស្នាមដាច់សរសៃឈាម) ដើម្បីឱ្យកុំព្យូទ័រងាយស្រួលយកទៅធ្វើការវិភាគនិងចាត់ថ្នាក់បន្ត។	ដូចជាការគូររូបគំនូសព្រាងដែលចាប់យកតែទម្រង់មុខនិងភ្នែករបស់ជនសង្ស័យ ជាជាងការពិពណ៌នាពីរាល់សរសៃសក់ទាំងអស់រាប់ម៉ឺនសរសៃ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖