Original Title: DRGNet: Diabetic Retinopathy Grading Network Using Data Balancing Integrated Transfer Learning with Graph-based KNN Classification
Source: doi.org/10.22266/ijies2023.1231.34
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

DRGNet៖ បណ្តាញចាត់ថ្នាក់កម្រិតជំងឺទឹកនោមផ្អែមឡើងភ្នែក ដោយប្រើប្រាស់ការធ្វើតុល្យភាពទិន្នន័យរួមបញ្ចូលជាមួយ Transfer Learning និងចំណាត់ថ្នាក់ Graph-based KNN

ចំណងជើងដើម៖ DRGNet: Diabetic Retinopathy Grading Network Using Data Balancing Integrated Transfer Learning with Graph-based KNN Classification

អ្នកនិពន្ធ៖ Swetha Pesaru (Jawaharlal Nehru Technological University Hyderabad), Naresh K Mallenahalli (National Remote Sensing Center), B. Vishnu Vardhan (Jawaharlal Nehru Technological University Hyderabad)

ឆ្នាំបោះពុម្ព៖ 2023, International Journal of Intelligent Engineering and Systems

វិស័យសិក្សា៖ Machine Learning in Healthcare

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការធ្វើរោគវិនិច្ឆ័យជំងឺទឹកនោមផ្អែមឡើងភ្នែក (Diabetic Retinopathy - DR) តាមបែបប្រពៃណីគឺចំណាយពេលយូរ មានភាពស្មុគស្មាញ និងមានបញ្ហាអតុល្យភាពទិន្នន័យ ដែលទាមទារឱ្យមានប្រព័ន្ធស្វ័យប្រវត្តិដែលមានភាពត្រឹមត្រូវខ្ពស់។

វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះបានស្នើឡើងនូវម៉ូដែល DRG-Net ដែលរួមបញ្ចូលបច្ចេកទេស Deep Learning និង Graph-based ជឿនលឿន ដើម្បីដោះស្រាយបញ្ហាអតុល្យភាពទិន្នន័យ និងបង្កើនភាពត្រឹមត្រូវក្នុងការចាត់ថ្នាក់កម្រិតជំងឺ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Proposed DRG-Net
ម៉ូដែលដែលបានស្នើឡើង (DRG-Net ប្រើប្រាស់ SMOTE, ResNet50 និង GKNN)
មានភាពត្រឹមត្រូវខ្ពស់បំផុត និងដោះស្រាយបញ្ហាអតុល្យភាពទិន្នន័យបានយ៉ាងល្អតាមរយៈបច្ចេកទេស SMOTE។ វាក៏អាចចាប់យកទំនាក់ទំនងនៃរូបភាពបានច្បាស់លាស់តាមរយៈ GKNN។ ការគណនាក្រាហ្វសម្រាប់ GKNN អាចទាមទារថាមពលកុំព្យូទ័រច្រើន និងពេលវេលាយូរ ប្រសិនបើអនុវត្តលើសំណុំទិន្នន័យធំមហិមា។ សម្រេចបានភាពត្រឹមត្រូវ 99.93% និង F1-Score 99.85% លើសំណុំទិន្នន័យ IDRiD។
DLCNN-MGWO-VW
បណ្តាញសរសៃប្រសាទវិលជុំជ្រៅ (DLCNN) ជាមួយក្បួន Grey-Wolf Optimizer
មានសមត្ថភាពទាញយកលក្ខណៈពិសេស និងចាត់ថ្នាក់ជំងឺ DR និង DME ក្នុងពេលតែមួយបានល្អ។ ដំណើរការរបស់វាពឹងផ្អែកខ្លាំងលើការជ្រើសរើស Optimizer និងការកំណត់ទម្ងន់ (Weights) ដែលប្រើពេលយូរ និងពិបាកក្នុងការកំណត់រចនាសម្ព័ន្ធឱ្យល្អបំផុត។ សម្រេចបានភាពត្រឹមត្រូវត្រឹមតែ 92.23% និង F1-Score 94.63% (ទាបជាង DRG-Net)។
OHGCNet
បណ្តាញ Hybrid Graph Convolutional (OHGCNet)
មានភាពត្រឹមត្រូវខ្ពស់គួរសម ដោយប្រើប្រាស់រចនាសម្ព័ន្ធក្រាហ្វ (Graph) និងការជ្រើសរើសលក្ខណៈពិសេសល្អបំផុត។ ការកសាង និងដំណើរការរចនាសម្ព័ន្ធក្រាហ្វ មានភាពស្មុគស្មាញ និងចំណាយថាមពលកុំព្យូទ័រខ្ពស់ (Computationally expensive) សម្រាប់សំណុំទិន្នន័យធំៗ។ សម្រេចបានភាពត្រឹមត្រូវ 98.67% និង F1-Score 98.88% (ចាញ់ DRG-Net បន្តិចបន្តួច)។

ការចំណាយលើធនធាន (Resource Cost)៖ ថ្វីត្បិតតែឯកសារមិនបានបញ្ជាក់តួលេខច្បាស់លាស់ពីផ្នែករឹងក៏ដោយ ប៉ុន្តែដោយសារការប្រើប្រាស់ Deep Learning (ResNet50) និង Graph-based algorithms វាទាមទារធនធានកុំព្យូទ័រកម្រិតខ្ពស់សម្រាប់ការហ្វឹកហាត់។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងដោយប្រើប្រាស់សំណុំទិន្នន័យ IDRiD (របស់ប្រទេសឥណ្ឌា) និង Messidor។ ការប្រើប្រាស់ទិន្នន័យពីប្រទេសឥណ្ឌាអាចមានលក្ខណៈជីវសាស្ត្រមួយចំនួនស្រដៀងនឹងប្រជាជនកម្ពុជា ប៉ុន្តែការខ្វះខាតការធ្វើតេស្តលើទិន្នន័យរូបភាពបាតភ្នែករបស់ប្រជាជនកម្ពុជាផ្ទាល់ អាចធ្វើឱ្យម៉ូដែលដំណើរការខុសប្រក្រតីនៅពេលអនុវត្តជាក់ស្តែងក្នុងបរិបទមន្ទីរពេទ្យក្នុងស្រុក។ ការប្រមូលទិន្នន័យអ្នកជំងឺកម្ពុជាគឺជារឿងចាំបាច់។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់ខ្លាំងក្នុងការជួយប្រព័ន្ធសុខាភិបាលកម្ពុជា ជាពិសេសក្នុងការកាត់បន្ថយបន្ទុកគ្រូពេទ្យភ្នែកដែលកំពុងខ្វះខាត និងជួយរាវរកជំងឺឱ្យបានទាន់ពេលវេលា។

ជារួម ការអនុវត្តម៉ូដែល DRG-Net អាចធ្វើបដិវត្តន៍ការពិនិត្យជំងឺទឹកនោមផ្អែមឡើងភ្នែកនៅកម្ពុជា ប្រសិនបើក្រសួងសុខាភិបាល និងដៃគូអភិវឌ្ឍន៍វិនិយោគលើឧបករណ៍ថតរូបភាពភ្នែកឌីជីថល (Fundus cameras) និងប្រព័ន្ធពពក (Cloud Infrastructure)។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ជំហានទី១៖ សិក្សាពីការធ្វើតុល្យភាពទិន្នន័យ (Data Balancing): ស្វែងយល់ពីបញ្ហាអតុល្យភាពទិន្នន័យ (Class Imbalance) នៅក្នុងសំណុំទិន្នន័យវេជ្ជសាស្ត្រ និងអនុវត្តបច្ចេកទេស SMOTE ដោយប្រើប្រាស់បណ្ណាល័យ imbalanced-learn ក្នុងភាសា Python ដើម្បីបង្កើតទិន្នន័យបន្ថែមសម្រាប់ក្រុមអ្នកជំងឺដែលមានចំនួនតិចតួច។
  2. ជំហានទី២៖ អនុវត្ត Transfer Learning ជាមួយ ResNet50: សិក្សាពីរបៀបប្រើប្រាស់ម៉ូដែលដែលបានហ្វឹកហាត់រួច (Pre-trained models) ដូចជា ResNet50 តាមរយៈ Keras/TensorFlowPyTorch។ អនុវត្តការកាត់ស្រទាប់ខាងចុង (Fully Connected Layers) ចេញ ដើម្បីប្រើវាជាអ្នកទាញយកលក្ខណៈពិសេស (Feature Extractor) ពីរូបភាពបាតភ្នែក។
  3. ជំហានទី៣៖ អនុវត្តចំណាត់ថ្នាក់ផ្អែកលើក្រាហ្វ (Graph-based KNN): ស្រាវជ្រាវពីរបៀបបង្កើតក្រាហ្វដើម្បីតំណាងឱ្យទំនាក់ទំនងរវាងលក្ខណៈពិសេសនៃរូបភាព (Graph Representation)។ សាកល្បងសរសេរកូដសម្រាប់ក្បួនដោះស្រាយ GKNN ដើម្បីជំនួសឱ្យចំណាត់ថ្នាក់ SoftmaxSVM ធម្មតា សម្រាប់ការធ្វើសេចក្តីសម្រេចចិត្តដែលផ្អែកលើភាពស្រដៀងគ្នានៃទិន្នន័យ។
  4. ជំហានទី៤៖ សាកល្បងហ្វឹកហាត់ម៉ូដែលលើទិន្នន័យជាក់ស្តែង: ចូលទៅកាន់គេហទំព័រ IEEE Dataport ឬ Kaggle ដើម្បីទាញយកសំណុំទិន្នន័យ IDRiDMessidor រួចសាកល្បងដំណើរការម៉ូដែល DRG-Net ទាំងមូលដោយប្រើប្រាស់ Google Colab Pro ដើម្បីទទួលបាន GPU សម្រាប់គណនា។
  5. ជំហានទី៥៖ វាយតម្លៃសមត្ថភាព និងវិភាគលទ្ធផល: ប្រើប្រាស់រង្វាស់ (Metrics) ដូចជា Accuracy, Precision, Recall, និង F1-Score ដើម្បីវាស់ស្ទង់ប្រសិទ្ធភាពម៉ូដែល។ បង្កើត និងវិភាគលើ Confusion Matrix ដើម្បីយល់ពីចំណុចខ្សោយរបស់ម៉ូដែលថាតើវាតែងតែទាយខុសនៅកម្រិតជំងឺមួយណា ដើម្បីស្វែងរកដំណោះស្រាយកែលម្អបន្ត។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Diabetic retinopathy ជាផលវិបាកមួយនៃជំងឺទឹកនោមផ្អែមដែលបំផ្លាញសរសៃឈាមនៅក្នុងរន្ធភ្នែក (retina) ដែលអាចបណ្តាលឱ្យងងឹតភ្នែកប្រសិនបើមិនបានធ្វើការកត់សម្គាល់និងព្យាបាលទាន់ពេល។ នៅក្នុងការសិក្សានេះ គេព្យាយាមប្រើ AI ដើម្បីចាត់ថ្នាក់កម្រិតធ្ងន់ធ្ងររបស់វាដោយស្វ័យប្រវត្តិ។ ដូចជាទុយោទឹកចាស់ៗនៅក្នុងកាមេរ៉ាភ្នែករបស់យើងដែលធ្លាយដោយសារជាតិស្ករខ្ពស់ ធ្វើឱ្យខូចរូបភាពដែលយើងកំពុងមើលឃើញ។
SMOTE ជាបច្ចេកទេសបង្កើតទិន្នន័យថ្មីៗដោយស្វ័យប្រវត្តិ (សិប្បនិម្មិត) សម្រាប់ក្រុមទិន្នន័យដែលមានចំនួនតិចតួច ដើម្បីធ្វើឱ្យសំណុំទិន្នន័យទាំងមូលមានតុល្យភាព។ ការធ្វើបែបនេះជួយឱ្យម៉ូដែល AI រៀនបានស្មើភាពគ្នា និងមិនលម្អៀងទៅរកតែក្រុមដែលមានទិន្នន័យច្រើននោះទេ។ ដូចជាការថតចម្លងនិងកែច្នៃរូបភាពសត្វកម្របន្តិចបន្តួចឱ្យមានច្រើនសន្លឹក ដើម្បីឱ្យកូនក្មេងរៀនចំណាំវាបានស្មើនឹងសត្វដែលសំបូរ។
ResNet50 ជាបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតជ្រៅ (Deep Learning) ដែលមាន 50 ស្រទាប់។ វាប្រើបច្ចេកទេសតភ្ជាប់រំលង (skip connections) ដើម្បីជួយដោះស្រាយបញ្ហាបាត់បង់ព័ត៌មានពេលកំពុងហ្វឹកហាត់ ដែលធ្វើឱ្យវាពូកែខ្លាំងក្នុងការទាញយកលក្ខណៈពិសេសពីរូបភាពស្មុគស្មាញ។ ដូចជារោងចក្រកែច្នៃទិន្នន័យដែលមាន 50 ជាន់ ហើយមានជណ្តើរយន្តពិសេសអាចរំលងជាន់ខ្លះ ដើម្បីបញ្ជូនព័ត៌មានឱ្យបានលឿននិងមិនបាត់បង់តាមផ្លូវ។
Transfer learning ជាបច្ចេកទេសយកម៉ូដែល AI ដែលត្រូវបានគេហ្វឹកហាត់រួចជាស្រេចលើទិន្នន័យរាប់លានរូបភាព មកបន្តហ្វឹកហាត់បន្ថែមបន្តិចបន្តួចដើម្បីធ្វើកិច្ចការថ្មីមួយទៀត (ឧទាហរណ៍៖ ការពិនិត្យជំងឺភ្នែក) ដែលជួយសន្សំពេលវេលា កម្លាំងម៉ាស៊ីន និងទិន្នន័យ។ ដូចជាការយកចុងភៅដែលពូកែធ្វើម្ហូបអឺរ៉ុបរួចហើយ មកបង្រៀនបន្ថែមបន្តិចបន្តួចឱ្យចេះធ្វើម្ហូបខ្មែរ ដោយមិនបាច់បង្រៀនពីរបៀបកាន់កាំបិតសារជាថ្មី។
GKNN ជាក្បួនដោះស្រាយសម្រាប់ចាត់ថ្នាក់ទិន្នន័យ ដោយវាបង្កើតជាបណ្តាញក្រាហ្វភ្ជាប់ទិន្នន័យដែលស្រដៀងគ្នា ហើយធ្វើការវាយតម្លៃថារូបភាពថ្មីមួយជារបស់កម្រិតជំងឺណា ដោយផ្អែកលើភាពស្រដៀងគ្នាទៅនឹងអ្នកជិតខាង (ទិន្នន័យចាស់ៗ) របស់វាដែលនៅក្បែរបំផុត។ ដូចជាការវាយតម្លៃអត្តចរិតរបស់សិស្សថ្មីម្នាក់ ដោយមើលទៅលើក្រុមមិត្តភក្តិជិតស្និទ្ធបំផុតរបស់គេ (បើមិត្តគេរៀនពូកែ គេក៏ប្រហែលជារៀនពូកែដែរ)។
IoMT ការតភ្ជាប់ឧបករណ៍វេជ្ជសាស្ត្រ (ដូចជាម៉ាស៊ីនថតភ្នែក ឬឧបករណ៍វាស់សុខភាព) ទៅកាន់ប្រព័ន្ធអ៊ីនធឺណិត ដើម្បីអាចប្រមូល បញ្ជូន និងវិភាគទិន្នន័យអ្នកជំងឺពីចម្ងាយបានភ្លាមៗ (Real-time) តាមរយៈ Cloud។ ដូចជាការបំពាក់ Wi-Fi ទៅឱ្យឧបករណ៍ពេទ្យ ដើម្បីឱ្យវាអាចផ្ញើលទ្ធផលពិនិត្យទៅកាន់កុំព្យូទ័ររបស់គ្រូពេទ្យដោយស្វ័យប្រវត្តិទោះនៅឆ្ងាយគ្នាក៏ដោយ។
feature extraction ជាដំណើរការកាត់បន្ថយទំហំទិន្នន័យរូបភាពដ៏ធំ ដោយចាប់យកនិងរក្សាទុកតែចំណុចសំខាន់ៗបំផុត (ដូចជាស្នាមអុច ស្នាមដាច់សរសៃឈាម) ដើម្បីឱ្យកុំព្យូទ័រងាយស្រួលយកទៅធ្វើការវិភាគនិងចាត់ថ្នាក់បន្ត។ ដូចជាការគូររូបគំនូសព្រាងដែលចាប់យកតែទម្រង់មុខនិងភ្នែករបស់ជនសង្ស័យ ជាជាងការពិពណ៌នាពីរាល់សរសៃសក់ទាំងអស់រាប់ម៉ឺនសរសៃ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖