បញ្ហា (The Problem)៖ ការស្រាវជ្រាវនេះដោះស្រាយបញ្ហាកង្វះខាតទិន្នន័យរូបភាពរោគសើស្បែកចម្រុះ (ជាពិសេសកង្វះតំណាងពណ៌ស្បែកងងឹត) ភាពអតុល្យភាពនៃទិន្នន័យ និងតម្រូវការក្នុងការបង្កើតរូបភាពសិប្បនិម្មិតដើម្បីបណ្តុះបណ្តាលម៉ូដែល AI វិនិច្ឆ័យជំងឺ ដោយមិនធ្វើឱ្យប៉ះពាល់ដល់ឯកជនភាពរបស់អ្នកជំងឺ។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានធ្វើការត្រួតពិនិត្យលក្ខណៈនិទានកថា (Narrative Review) ដោយអនុវត្តតាមវិធីសាស្ត្រ PRISMA ដើម្បីស្វែងរក និងវិភាគលើការសិក្សាសំខាន់ៗចំនួន ២៧ ទាក់ទងនឹងការប្រើប្រាស់ GANs ក្នុងរោគសើស្បែក។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| DCGAN (Deep Convolutional GAN) បណ្ដាញ GAN ដែលប្រើប្រាស់ Convolution ជ្រៅសម្រាប់ការបង្កើតរូបភាព |
ធ្វើឱ្យការបណ្តុះបណ្តាលម៉ូដែល (Training) មានស្ថិរភាពតាមរយៈ Batch Normalization និងជួយបង្កើតទិន្នន័យបន្ថែមសម្រាប់បង្វឹកម៉ូដែលចំណាត់ថ្នាក់។ | មិនសូវមានភាពបត់បែនក្នុងការគ្រប់គ្រងលម្អិតលើលក្ខណៈរូបភាព បើប្រៀបធៀបទៅនឹងម៉ូដែលជំនាន់ក្រោយ។ | បង្កើតរូបភាពទំហំ 1024x1024 pixels ដែលមានប្រយោជន៍សម្រាប់ការវិភាគទម្រង់ជំងឺមហារីកស្បែក (Melanoma) និងបង្កើនភាពត្រឹមត្រូវនៃម៉ូដែល។ |
| CycleGAN បណ្ដាញ GAN សម្រាប់ការបំប្លែងរូបភាពពីដែនមួយទៅដែនមួយទៀត (Domain Transfer) |
អាចបំប្លែងរូបភាពពីកាមេរ៉ាគ្លីនិកធម្មតាទៅជារូបភាពកែវពង្រីកសើស្បែក (Dermoscopic) ដោយមិនចាំបាច់មានរូបភាពផ្គូផ្គងជាគូ (Unpaired images) ទុកជាមុន។ | អាចបង្កើតកំហុសឆ្គង (Artifacts) នៅក្នុងរូបភាព ប្រសិនបើទិន្នន័យមិនមានភាពចម្រុះគ្រប់គ្រាន់។ | សម្រេចបានសន្ទស្សន៍ភាពស្រដៀងគ្នានៃរចនាសម្ព័ន្ធ (SSIM) កម្រិត 0.89 ក្នុងការបំប្លែងរូបភាពគ្លីនិកទៅជា Dermoscopic។ |
| StyleGAN (StyleGAN2 / StyleGAN3) បណ្ដាញ GAN ដែលមានសមត្ថភាពខ្ពស់ក្នុងការគ្រប់គ្រងរចនាបថរូបភាព |
ផ្តល់នូវការគ្រប់គ្រងយ៉ាងលម្អិតលើលក្ខណៈទម្រង់នៃរូបភាព និងអាចបង្កើតរូបភាពមានគុណភាពបង្ហាញខ្ពស់ (High-resolution) យ៉ាងច្បាស់ល្អ។ | ទាមទារធនធានកុំព្យូទ័រ (GPU) និងថាមពលខ្លាំងមែនទែនសម្រាប់ការបណ្តុះបណ្តាល។ | បង្កើតរូបភាពមហារីកស្បែក Amelanotic Melanoma ដែលមានភាពប្រាកដនិយមរហូតដល់ 92% និងជួយបង្កើនភាពប្រែប្រួលនៃការវិនិច្ឆ័យ (Diagnostic Sensitivity) ចំនួន 15%។ |
| cGAN (Conditional GAN) បណ្ដាញ GAN ដែលមានភ្ជាប់លក្ខខណ្ឌសម្រាប់ការបង្កើតរូបភាព |
អាចបង្កើតរូបភាពដំបៅស្បែកដោយកំណត់ទីតាំង និងទម្រង់តាមរយៈម៉ាស់ (Segmentation Masks) ដែលជួយឱ្យរចនាសម្ព័ន្ធរូបភាពកាន់តែសុក្រឹត។ | ទាមទារឱ្យមានទិន្នន័យដែលបានបិទស្លាកលម្អិត (Labeled data) និង Segmentation mask ជាមុន ទើបអាចដំណើរការបាន។ | កែលម្អរចនាសម្ព័ន្ធនៃដំបៅស្បែកនៅក្នុងរូបភាពសិប្បនិម្មិត ជួយដល់ការហ្វឹកហាត់ម៉ូដែលស្វែងរកមហារីកស្បែក (Melanoma)។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការអភិវឌ្ឍ និងបណ្តុះបណ្តាលបណ្ដាញ GANs ទាមទារការប្រើប្រាស់ធនធានកុំព្យូទ័រ និងទិន្នន័យយ៉ាងច្រើនសន្ធឹកសន្ធាប់ ដែលជាដំណើរការស៊ីធនធានខ្លាំង និងចំណាយខ្ពស់បំផុត។
ភាគច្រើននៃទិន្នន័យដែលប្រើប្រាស់សម្រាប់ការស្រាវជ្រាវ (ដូចជា HAM10000) មានការខ្វះខាតតំណាងពូជសាសន៍ ដោយមានតែ ១២% ប៉ុណ្ណោះដែលជារូបភាពអ្នកជំងឺមានប្រភេទស្បែក IV-VI (ស្បែកងងឹត)។ បញ្ហានេះពិតជាសំខាន់ណាស់សម្រាប់ប្រទេសកម្ពុជា ព្រោះប្រជាជនកម្ពុជាភាគច្រើនមានប្រភេទស្បែក (Fitzpatrick Phototypes III-V)។ ការប្រើប្រាស់ម៉ូដែលដែលខ្វះទិន្នន័យស្បែកងងឹត អាចបណ្តាលឱ្យមានកំហុសក្នុងការធ្វើរោគវិនិច្ឆ័យនៅពេលយកមកអនុវត្តជាក់ស្តែងនៅក្នុងស្រុក។
បច្ចេកវិទ្យា Generative AI នេះមានសក្តានុពលធំធេងសម្រាប់ប្រទេសកម្ពុជា ជាពិសេសក្នុងការដោះស្រាយបញ្ហាកង្វះខាតទិន្នន័យវេជ្ជសាស្ត្រ និងការគាំទ្រសេវាសុខាភិបាល។
ការអភិវឌ្ឍនិងអនុវត្តបច្ចេកវិទ្យា GANs ដោយមានការកែតម្រូវឱ្យស្របនឹងបរិបទប្រជាជនក្នុងស្រុក នឹងជួយលើកកម្ពស់សមធម៌និងគុណភាពនៃការថែទាំសុខភាពសើស្បែកនៅកម្ពុជា។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Generative Adversarial Networks (GANs) | ជាប្រព័ន្ធបញ្ញាសិប្បនិម្មិត (AI) ដែលផ្សំឡើងពីបណ្ដាញសរសៃប្រសាទពីរប្រកួតប្រជែងគ្នា៖ មួយមានតួនាទីបង្កើតរូបភាពក្លែងក្លាយ (Generator) និងមួយទៀតមានតួនាទីពិនិត្យចាប់កំហុសថាតើរូបភាពនោះពិតឬក្លែងក្លាយ (Discriminator) រហូតទាល់តែរូបភាពដែលបង្កើតមកមើលទៅដូចរបស់ពិតបេះបិទ។ | ដូចជាការលេងលាក់ពួនរវាងអ្នកក្លែងបន្លំក្រដាសប្រាក់ និងប៉ូលិស ដោយអ្នកក្លែងបន្លំចេះតែធ្វើឱ្យកាន់តែដូចពិត រហូតប៉ូលិសលែងចំណាំបាន។ |
| Convolutional Neural Networks (CNNs) | ជាប្រភេទបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតដែលត្រូវបានរចនាឡើងយ៉ាងពិសេសសម្រាប់វិភាគទិន្នន័យជារូបភាព ដោយវាប្រើប្រាស់តម្រង (Filters) គណិតវិទ្យាដើម្បីទាញយកលក្ខណៈសម្បត្តិសំខាន់ៗពីរូបភាពម្ដងមួយស្រទាប់ៗ ដូចជា គែម ទម្រង់ និងវាយនភាពនៃដំបៅស្បែក។ | ដូចជាភ្នែកកែវពង្រីករបស់គ្រូពេទ្យ ដែលសម្លឹងមើលកាត់តម្រងពន្លឺម្ដងមួយស្រទាប់ៗ ដើម្បីស្វែងរកកោសិកាខុសប្រក្រតីនៅលើស្បែក។ |
| Fréchet Inception Distance (FID) | ជារង្វាស់គណិតវិទ្យាសម្រាប់វាយតម្លៃគុណភាពរូបភាពសិប្បនិម្មិត ដោយប្រៀបធៀបលក្ខណៈពិសេសស៊ីជម្រៅរវាងរូបភាពដែលបង្កើតដោយ AI និងរូបភាពពិត។ ពិន្ទុ FID កាន់តែទាប មានន័យថារូបភាពសិប្បនិម្មិតនោះកាន់តែមានភាពប្រាកដនិយម និងប្រហាក់ប្រហែលរូបភាពដើម។ | ដូចជាការដាក់ពិន្ទុប្រលងប្រជែងការគូរគំនូរចម្លង ប្រសិនបើគំនូរចម្លងមានលក្ខណៈខុសពីគំនូរដើមតិចបំផុត នោះសិស្សនឹងទទួលបានចំណាត់ថ្នាក់លេខ១ (ពិន្ទុទាបបំផុត)។ |
| Data augmentation | ជាដំណើរការនៃការបង្កើនបរិមាណ និងភាពចម្រុះនៃទិន្នន័យសម្រាប់ហ្វឹកហាត់ម៉ូដែល AI តាមរយៈការបង្កើតរូបភាពថ្មីៗបន្ថែម (ដូចជាការបង្វិល ការកែពណ៌ ឬការប្រើ GANs ដើម្បីបង្កើតរូបភាពជំងឺកម្រ) ដើម្បីជួយឱ្យ AI រៀនបានកាន់តែឆ្លាត និងកាត់បន្ថយភាពលម្អៀង។ | ដូចជាការថតរូបវត្ថុមួយពីជ្រុងផ្សេងៗគ្នា និងប្តូរពន្លឺខុសៗគ្នា ដើម្បីឱ្យក្មេងម្នាក់អាចចំណាំវត្ថុនោះបាន ទោះជាស្ថិតក្នុងស្ថានភាពណាក៏ដោយ។ |
| Mode collapse | ជាបញ្ហាបច្ចេកទេសមួយក្នុងពេលហ្វឹកហាត់ម៉ូដែល GANs ដែលក្នុងនោះប្រព័ន្ធ AI ផលិតបានតែរូបភាពដដែលៗ ឬមានទម្រង់តែមួយប្រភេទ ដោយខកខានមិនបានបង្កើតរូបភាពដែលមានភាពចម្រុះដូចទិន្នន័យហ្វឹកហាត់ដើមឡើយ។ | ដូចជាចុងភៅដែលរៀនចេះធ្វើម្ហូបតែមួយមុខ ហើយធ្វើតែម្ហូបមួយមុខនោះដដែលៗ ទោះបីជាមានគ្រឿងផ្សំច្រើនមុខនៅក្នុងផ្ទះបាយក៏ដោយ។ |
| Structural Similarity Index (SSIM) | ជារង្វាស់សម្រាប់វាយតម្លៃកម្រិតភាពស្រដៀងគ្នានៃរចនាសម្ព័ន្ធរវាងរូបភាពពីរ ដោយពិនិត្យទៅលើពន្លឺ កម្រិតភាពច្បាស់ (Contrast) និងទម្រង់។ ពិន្ទុកាន់តែកៀកលេខ ១ បង្ហាញថារូបភាពទាំងពីរមានភាពដូចគ្នាខ្លាំងទាំងរចនាសម្ព័ន្ធនិងសោភ័ណភាព។ | ដូចជាការប្រៀបធៀបមុខកូនភ្លោះ ដោយមើលទៅលើទម្រង់មុខ ទំហំភ្នែក និងពណ៌សម្បុរ ដើម្បីរកមើលថាតើពួកគេមានមុខមាត់ស្រដៀងគ្នាប៉ុនណា។ |
| Overfitting | ជាបាតុភូតដែលម៉ូដែល AI ចងចាំទិន្នន័យហ្វឹកហាត់ច្បាស់ហួសហេតុពេក (រួមទាំងកំហុសឆ្គងតូចតាចក្នុងទិន្នន័យ) ដែលធ្វើឱ្យវាមិនអាចបត់បែន ទស្សន៍ទាយ ឬវិភាគរូបភាពថ្មីៗដែលវាមិនធ្លាប់ឃើញពីមុនបានត្រឹមត្រូវឡើយ។ | ដូចជាសិស្សដែលទន្ទេញចាំមាត់នូវចម្លើយវិញ្ញាសាចាស់គ្រប់ពាក្យ ប៉ុន្តែប្រលងធ្លាក់នៅពេលគ្រូចេញលំហាត់ថ្មីដែលគ្រាន់តែដូរលេខបន្តិចបន្តួច។ |
| Latent space | ជាលំហគណិតវិទ្យាពហុវិមាត្រលាក់កំបាំង ដែល AI ប្រើដើម្បីរក្សាទុកនិងរៀបចំតំណាងលក្ខណៈពិសេសនៃទិន្នន័យ។ នៅក្នុងម៉ូដែល GANs គេទាញយកវ៉ិចទ័រកូដពីលំហនេះដើម្បីយកទៅបំប្លែងបង្កើតជារូបភាពថ្មីៗដែលមានលក្ខណៈប្រែប្រួលរលូន។ | ដូចជាខួរក្បាលអ្នកច្នៃម៉ូដសម្លៀកបំពាក់ ដែលមានគំនិតរាប់ពាន់លាយឡំគ្នា ហើយអាចទាញយកគំនិតទាំងនោះមកផ្គុំចូលគ្នាបង្កើតជារ៉ូបម៉ូដថ្មីមួយ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖