Original Title: Generative Adversarial Networks in Dermatology: A Narrative Review of Current Applications, Challenges, and Future Perspectives
Source: doi.org/10.3390/bioengineering12101113
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

បណ្ដាញ Generative Adversarial (GANs) ក្នុងរោគសើស្បែក៖ ការត្រួតពិនិត្យអត្ថបទនិទានកថាអំពីការអនុវត្តបច្ចុប្បន្ន បញ្ហាប្រឈម និងទស្សនវិស័យនាពេលអនាគត

ចំណងជើងដើម៖ Generative Adversarial Networks in Dermatology: A Narrative Review of Current Applications, Challenges, and Future Perspectives

អ្នកនិពន្ធ៖ Rosa Maria Izu-Belloso (Medicine Faculty, Hospital Universitario Basurto, Bilbao, Spain), Rafael Ibarrola-Altuna (Hospital Universitario Galdakao, Bizkaia, Spain), Alex Rodriguez-Alonso (Facultad de Medicina, Universidad del Pais Vasco/EHU, Leioa, Spain)

ឆ្នាំបោះពុម្ព៖ 2025 Bioengineering

វិស័យសិក្សា៖ Artificial Intelligence in Dermatology

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការស្រាវជ្រាវនេះដោះស្រាយបញ្ហាកង្វះខាតទិន្នន័យរូបភាពរោគសើស្បែកចម្រុះ (ជាពិសេសកង្វះតំណាងពណ៌ស្បែកងងឹត) ភាពអតុល្យភាពនៃទិន្នន័យ និងតម្រូវការក្នុងការបង្កើតរូបភាពសិប្បនិម្មិតដើម្បីបណ្តុះបណ្តាលម៉ូដែល AI វិនិច្ឆ័យជំងឺ ដោយមិនធ្វើឱ្យប៉ះពាល់ដល់ឯកជនភាពរបស់អ្នកជំងឺ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានធ្វើការត្រួតពិនិត្យលក្ខណៈនិទានកថា (Narrative Review) ដោយអនុវត្តតាមវិធីសាស្ត្រ PRISMA ដើម្បីស្វែងរក និងវិភាគលើការសិក្សាសំខាន់ៗចំនួន ២៧ ទាក់ទងនឹងការប្រើប្រាស់ GANs ក្នុងរោគសើស្បែក។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
DCGAN (Deep Convolutional GAN)
បណ្ដាញ GAN ដែលប្រើប្រាស់ Convolution ជ្រៅសម្រាប់ការបង្កើតរូបភាព
ធ្វើឱ្យការបណ្តុះបណ្តាលម៉ូដែល (Training) មានស្ថិរភាពតាមរយៈ Batch Normalization និងជួយបង្កើតទិន្នន័យបន្ថែមសម្រាប់បង្វឹកម៉ូដែលចំណាត់ថ្នាក់។ មិនសូវមានភាពបត់បែនក្នុងការគ្រប់គ្រងលម្អិតលើលក្ខណៈរូបភាព បើប្រៀបធៀបទៅនឹងម៉ូដែលជំនាន់ក្រោយ។ បង្កើតរូបភាពទំហំ 1024x1024 pixels ដែលមានប្រយោជន៍សម្រាប់ការវិភាគទម្រង់ជំងឺមហារីកស្បែក (Melanoma) និងបង្កើនភាពត្រឹមត្រូវនៃម៉ូដែល។
CycleGAN
បណ្ដាញ GAN សម្រាប់ការបំប្លែងរូបភាពពីដែនមួយទៅដែនមួយទៀត (Domain Transfer)
អាចបំប្លែងរូបភាពពីកាមេរ៉ាគ្លីនិកធម្មតាទៅជារូបភាពកែវពង្រីកសើស្បែក (Dermoscopic) ដោយមិនចាំបាច់មានរូបភាពផ្គូផ្គងជាគូ (Unpaired images) ទុកជាមុន។ អាចបង្កើតកំហុសឆ្គង (Artifacts) នៅក្នុងរូបភាព ប្រសិនបើទិន្នន័យមិនមានភាពចម្រុះគ្រប់គ្រាន់។ សម្រេចបានសន្ទស្សន៍ភាពស្រដៀងគ្នានៃរចនាសម្ព័ន្ធ (SSIM) កម្រិត 0.89 ក្នុងការបំប្លែងរូបភាពគ្លីនិកទៅជា Dermoscopic។
StyleGAN (StyleGAN2 / StyleGAN3)
បណ្ដាញ GAN ដែលមានសមត្ថភាពខ្ពស់ក្នុងការគ្រប់គ្រងរចនាបថរូបភាព
ផ្តល់នូវការគ្រប់គ្រងយ៉ាងលម្អិតលើលក្ខណៈទម្រង់នៃរូបភាព និងអាចបង្កើតរូបភាពមានគុណភាពបង្ហាញខ្ពស់ (High-resolution) យ៉ាងច្បាស់ល្អ។ ទាមទារធនធានកុំព្យូទ័រ (GPU) និងថាមពលខ្លាំងមែនទែនសម្រាប់ការបណ្តុះបណ្តាល។ បង្កើតរូបភាពមហារីកស្បែក Amelanotic Melanoma ដែលមានភាពប្រាកដនិយមរហូតដល់ 92% និងជួយបង្កើនភាពប្រែប្រួលនៃការវិនិច្ឆ័យ (Diagnostic Sensitivity) ចំនួន 15%។
cGAN (Conditional GAN)
បណ្ដាញ GAN ដែលមានភ្ជាប់លក្ខខណ្ឌសម្រាប់ការបង្កើតរូបភាព
អាចបង្កើតរូបភាពដំបៅស្បែកដោយកំណត់ទីតាំង និងទម្រង់តាមរយៈម៉ាស់ (Segmentation Masks) ដែលជួយឱ្យរចនាសម្ព័ន្ធរូបភាពកាន់តែសុក្រឹត។ ទាមទារឱ្យមានទិន្នន័យដែលបានបិទស្លាកលម្អិត (Labeled data) និង Segmentation mask ជាមុន ទើបអាចដំណើរការបាន។ កែលម្អរចនាសម្ព័ន្ធនៃដំបៅស្បែកនៅក្នុងរូបភាពសិប្បនិម្មិត ជួយដល់ការហ្វឹកហាត់ម៉ូដែលស្វែងរកមហារីកស្បែក (Melanoma)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអភិវឌ្ឍ និងបណ្តុះបណ្តាលបណ្ដាញ GANs ទាមទារការប្រើប្រាស់ធនធានកុំព្យូទ័រ និងទិន្នន័យយ៉ាងច្រើនសន្ធឹកសន្ធាប់ ដែលជាដំណើរការស៊ីធនធានខ្លាំង និងចំណាយខ្ពស់បំផុត។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ភាគច្រើននៃទិន្នន័យដែលប្រើប្រាស់សម្រាប់ការស្រាវជ្រាវ (ដូចជា HAM10000) មានការខ្វះខាតតំណាងពូជសាសន៍ ដោយមានតែ ១២% ប៉ុណ្ណោះដែលជារូបភាពអ្នកជំងឺមានប្រភេទស្បែក IV-VI (ស្បែកងងឹត)។ បញ្ហានេះពិតជាសំខាន់ណាស់សម្រាប់ប្រទេសកម្ពុជា ព្រោះប្រជាជនកម្ពុជាភាគច្រើនមានប្រភេទស្បែក (Fitzpatrick Phototypes III-V)។ ការប្រើប្រាស់ម៉ូដែលដែលខ្វះទិន្នន័យស្បែកងងឹត អាចបណ្តាលឱ្យមានកំហុសក្នុងការធ្វើរោគវិនិច្ឆ័យនៅពេលយកមកអនុវត្តជាក់ស្តែងនៅក្នុងស្រុក។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកវិទ្យា Generative AI នេះមានសក្តានុពលធំធេងសម្រាប់ប្រទេសកម្ពុជា ជាពិសេសក្នុងការដោះស្រាយបញ្ហាកង្វះខាតទិន្នន័យវេជ្ជសាស្ត្រ និងការគាំទ្រសេវាសុខាភិបាល។

ការអភិវឌ្ឍនិងអនុវត្តបច្ចេកវិទ្យា GANs ដោយមានការកែតម្រូវឱ្យស្របនឹងបរិបទប្រជាជនក្នុងស្រុក នឹងជួយលើកកម្ពស់សមធម៌និងគុណភាពនៃការថែទាំសុខភាពសើស្បែកនៅកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃ Computer Vision ក្នុងវេជ្ជសាស្ត្រ: និស្សិតគួរសិក្សាស្វែងយល់ពីរបៀបដំណើរការរបស់បណ្ដាញ Convolutional Neural Networks (CNNs) និង GANs តាមរយៈការរៀនវគ្គខ្លីៗនៅលើ Coursera ដោយប្រើប្រាស់ TensorFlowPyTorch ជាមូលដ្ឋានសម្រាប់ការអភិវឌ្ឍ។
  2. ប្រមូល និងរៀបចំទិន្នន័យរូបភាពសើស្បែក: ចូលទៅកាន់ ISIC Archive (isic-archive.com) ដើម្បីទាញយកទិន្នន័យរូបភាពរោគសើស្បែកបើកទូលាយមកសិក្សា និងស្វែងរកឱកាសសហការជាមួយមន្ទីរពេទ្យក្នុងស្រុកដើម្បីបង្កើតមូលដ្ឋានទិន្នន័យរូបភាពស្បែកប្រភេទ Fitzpatrick IV-VI។
  3. សាកល្បងអនុវត្តម៉ូដែល GANs: ប្រើប្រាស់កូដប្រភេទ Open-source របស់ម៉ូដែលដូចជា StyleGAN2CycleGAN ដើម្បីអនុវត្តគម្រោងខ្នាតតូច ដូចជាការបំប្លែងគុណភាពរូបភាព ឬការធ្វើស្តង់ដារពន្លឺនិងពណ៌រូបភាព (Color Standardization)។
  4. វាយតម្លៃប្រសិទ្ធភាពម៉ូដែលដោយប្រើរង្វាស់ស្តង់ដារ: អនុវត្តការវាស់វែងប្រសិទ្ធភាពរូបភាពដែលបង្កើតបាន ដោយប្រើប្រាស់ Metrics ដូចជា Fréchet Inception Distance (FID) និង Structural Similarity Index (SSIM) ដើម្បីពិនិត្យភាពប្រាកដនិយមនិងរចនាសម្ព័ន្ធរូបភាព។
  5. សហការវាយតម្លៃជាមួយអ្នកជំនាញ (Clinical Validation): យកលទ្ធផលដែលទទួលបានទៅបង្ហាញ និងពិភាក្សាជាមួយគ្រូពេទ្យឯកទេសសើស្បែកពិតប្រាកដ ដើម្បីប្រៀបធៀបរូបភាពសិប្បនិម្មិតជាមួយនឹងរូបភាពពិត និងស្វែងយល់ពីកម្រិតលទ្ធភាពប្រើប្រាស់បាននៅក្នុងគ្លីនិក (Clinical Utility)។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Generative Adversarial Networks (GANs) ជាប្រព័ន្ធបញ្ញាសិប្បនិម្មិត (AI) ដែលផ្សំឡើងពីបណ្ដាញសរសៃប្រសាទពីរប្រកួតប្រជែងគ្នា៖ មួយមានតួនាទីបង្កើតរូបភាពក្លែងក្លាយ (Generator) និងមួយទៀតមានតួនាទីពិនិត្យចាប់កំហុសថាតើរូបភាពនោះពិតឬក្លែងក្លាយ (Discriminator) រហូតទាល់តែរូបភាពដែលបង្កើតមកមើលទៅដូចរបស់ពិតបេះបិទ។ ដូចជាការលេងលាក់ពួនរវាងអ្នកក្លែងបន្លំក្រដាសប្រាក់ និងប៉ូលិស ដោយអ្នកក្លែងបន្លំចេះតែធ្វើឱ្យកាន់តែដូចពិត រហូតប៉ូលិសលែងចំណាំបាន។
Convolutional Neural Networks (CNNs) ជាប្រភេទបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតដែលត្រូវបានរចនាឡើងយ៉ាងពិសេសសម្រាប់វិភាគទិន្នន័យជារូបភាព ដោយវាប្រើប្រាស់តម្រង (Filters) គណិតវិទ្យាដើម្បីទាញយកលក្ខណៈសម្បត្តិសំខាន់ៗពីរូបភាពម្ដងមួយស្រទាប់ៗ ដូចជា គែម ទម្រង់ និងវាយនភាពនៃដំបៅស្បែក។ ដូចជាភ្នែកកែវពង្រីករបស់គ្រូពេទ្យ ដែលសម្លឹងមើលកាត់តម្រងពន្លឺម្ដងមួយស្រទាប់ៗ ដើម្បីស្វែងរកកោសិកាខុសប្រក្រតីនៅលើស្បែក។
Fréchet Inception Distance (FID) ជារង្វាស់គណិតវិទ្យាសម្រាប់វាយតម្លៃគុណភាពរូបភាពសិប្បនិម្មិត ដោយប្រៀបធៀបលក្ខណៈពិសេសស៊ីជម្រៅរវាងរូបភាពដែលបង្កើតដោយ AI និងរូបភាពពិត។ ពិន្ទុ FID កាន់តែទាប មានន័យថារូបភាពសិប្បនិម្មិតនោះកាន់តែមានភាពប្រាកដនិយម និងប្រហាក់ប្រហែលរូបភាពដើម។ ដូចជាការដាក់ពិន្ទុប្រលងប្រជែងការគូរគំនូរចម្លង ប្រសិនបើគំនូរចម្លងមានលក្ខណៈខុសពីគំនូរដើមតិចបំផុត នោះសិស្សនឹងទទួលបានចំណាត់ថ្នាក់លេខ១ (ពិន្ទុទាបបំផុត)។
Data augmentation ជាដំណើរការនៃការបង្កើនបរិមាណ និងភាពចម្រុះនៃទិន្នន័យសម្រាប់ហ្វឹកហាត់ម៉ូដែល AI តាមរយៈការបង្កើតរូបភាពថ្មីៗបន្ថែម (ដូចជាការបង្វិល ការកែពណ៌ ឬការប្រើ GANs ដើម្បីបង្កើតរូបភាពជំងឺកម្រ) ដើម្បីជួយឱ្យ AI រៀនបានកាន់តែឆ្លាត និងកាត់បន្ថយភាពលម្អៀង។ ដូចជាការថតរូបវត្ថុមួយពីជ្រុងផ្សេងៗគ្នា និងប្តូរពន្លឺខុសៗគ្នា ដើម្បីឱ្យក្មេងម្នាក់អាចចំណាំវត្ថុនោះបាន ទោះជាស្ថិតក្នុងស្ថានភាពណាក៏ដោយ។
Mode collapse ជាបញ្ហាបច្ចេកទេសមួយក្នុងពេលហ្វឹកហាត់ម៉ូដែល GANs ដែលក្នុងនោះប្រព័ន្ធ AI ផលិតបានតែរូបភាពដដែលៗ ឬមានទម្រង់តែមួយប្រភេទ ដោយខកខានមិនបានបង្កើតរូបភាពដែលមានភាពចម្រុះដូចទិន្នន័យហ្វឹកហាត់ដើមឡើយ។ ដូចជាចុងភៅដែលរៀនចេះធ្វើម្ហូបតែមួយមុខ ហើយធ្វើតែម្ហូបមួយមុខនោះដដែលៗ ទោះបីជាមានគ្រឿងផ្សំច្រើនមុខនៅក្នុងផ្ទះបាយក៏ដោយ។
Structural Similarity Index (SSIM) ជារង្វាស់សម្រាប់វាយតម្លៃកម្រិតភាពស្រដៀងគ្នានៃរចនាសម្ព័ន្ធរវាងរូបភាពពីរ ដោយពិនិត្យទៅលើពន្លឺ កម្រិតភាពច្បាស់ (Contrast) និងទម្រង់។ ពិន្ទុកាន់តែកៀកលេខ ១ បង្ហាញថារូបភាពទាំងពីរមានភាពដូចគ្នាខ្លាំងទាំងរចនាសម្ព័ន្ធនិងសោភ័ណភាព។ ដូចជាការប្រៀបធៀបមុខកូនភ្លោះ ដោយមើលទៅលើទម្រង់មុខ ទំហំភ្នែក និងពណ៌សម្បុរ ដើម្បីរកមើលថាតើពួកគេមានមុខមាត់ស្រដៀងគ្នាប៉ុនណា។
Overfitting ជាបាតុភូតដែលម៉ូដែល AI ចងចាំទិន្នន័យហ្វឹកហាត់ច្បាស់ហួសហេតុពេក (រួមទាំងកំហុសឆ្គងតូចតាចក្នុងទិន្នន័យ) ដែលធ្វើឱ្យវាមិនអាចបត់បែន ទស្សន៍ទាយ ឬវិភាគរូបភាពថ្មីៗដែលវាមិនធ្លាប់ឃើញពីមុនបានត្រឹមត្រូវឡើយ។ ដូចជាសិស្សដែលទន្ទេញចាំមាត់នូវចម្លើយវិញ្ញាសាចាស់គ្រប់ពាក្យ ប៉ុន្តែប្រលងធ្លាក់នៅពេលគ្រូចេញលំហាត់ថ្មីដែលគ្រាន់តែដូរលេខបន្តិចបន្តួច។
Latent space ជាលំហគណិតវិទ្យាពហុវិមាត្រលាក់កំបាំង ដែល AI ប្រើដើម្បីរក្សាទុកនិងរៀបចំតំណាងលក្ខណៈពិសេសនៃទិន្នន័យ។ នៅក្នុងម៉ូដែល GANs គេទាញយកវ៉ិចទ័រកូដពីលំហនេះដើម្បីយកទៅបំប្លែងបង្កើតជារូបភាពថ្មីៗដែលមានលក្ខណៈប្រែប្រួលរលូន។ ដូចជាខួរក្បាលអ្នកច្នៃម៉ូដសម្លៀកបំពាក់ ដែលមានគំនិតរាប់ពាន់លាយឡំគ្នា ហើយអាចទាញយកគំនិតទាំងនោះមកផ្គុំចូលគ្នាបង្កើតជារ៉ូបម៉ូដថ្មីមួយ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖