Original Title: Research on the Strategy of MedKGGPT Model in Improving the Interpretability and Security of Large Language Models in the Medical Field
Source: doi.org/10.25236/AJMHS.2024.050907
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការស្រាវជ្រាវលើយុទ្ធសាស្រ្តនៃម៉ូដែល MedKGGPT ក្នុងការកែលម្អភាពអាចបកស្រាយបាន និងសន្តិសុខនៃម៉ូដែលភាសាខ្នាតធំក្នុងវិស័យវេជ្ជសាស្ត្រ

ចំណងជើងដើម៖ Research on the Strategy of MedKGGPT Model in Improving the Interpretability and Security of Large Language Models in the Medical Field

អ្នកនិពន្ធ៖ Jinzhu Yang (AI Research, Dyania Health Inc, Jersey City, New Jersey, United States)

ឆ្នាំបោះពុម្ព៖ 2024, Academic Journal of Medicine & Health Sciences

វិស័យសិក្សា៖ Artificial Intelligence in Medicine

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហានៃកង្វះតម្លាភាព និងភាពអាចបកស្រាយបាននៃម៉ូដែលភាសាខ្នាតធំ (Large Language Models) នៅក្នុងការធ្វើរោគវិនិច្ឆ័យវេជ្ជសាស្រ្ត ដែលធ្វើឱ្យគ្រូពេទ្យនិងអ្នកជំងឺពិបាកទុកចិត្តលើលទ្ធផលរបស់វា។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានស្នើឡើងនូវម៉ូដែល MedKGGPT ដោយរួមបញ្ចូលការរៀនដោយម៉ាស៊ីន (Machine Learning) និងការវែកញែកចំណេះដឹង (Knowledge Reasoning) ដើម្បីធ្វើតេស្តនិងវិភាគលើទិន្នន័យរូបភាពវេជ្ជសាស្ត្រ។

ការបង្កើតបណ្ណាល័យចំណេះដឹង និងវិធានការវេជ្ជសាស្ត្រ (Domain Ontology and Rule Library)
ការទាញយកលក្ខណៈពិសេសតាមរយៈម៉ូដែលរៀនដោយម៉ាស៊ីន (Machine Learning Feature Extraction)
ការធ្វើតេស្តវាយតម្លៃលើសំណុំទិន្នន័យរូបភាពកោសិកាមហារីកមាត់ស្បូនចំនួន ៤០០ សន្លឹក (Validation on 400 annotated images of cervical cells)
ការវាយតម្លៃភាពគួរឱ្យទុកចិត្ត និងការរួមបញ្ចូលលទ្ធផល (Credibility Assessment and Fusion Method)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ម៉ូដែល MedKGGPT អាចបង្កើនភាពត្រឹមត្រូវនៃការចាត់ថ្នាក់បានខ្ពស់ជាងការប្រើប្រាស់ឧបករណ៍ចាត់ថ្នាក់តែមួយ (Single classifier) យ៉ាងច្បាស់លាស់។
ម៉ូដែលនេះមានសមត្ថភាពខ្ពស់ក្នុងការបកស្រាយ ដោយអាចបំប្លែងលទ្ធផលនៃរូបភាពកោសិកាទៅជាការពន្យល់រោគសាស្ត្រដែលងាយយល់សម្រាប់គ្រូពេទ្យតាមរយៈម៉ាស៊ីនវែកញែក Drools។
ការវិវត្តនៃម៉ូដែលតាមរយៈការវាយតម្លៃភាពគួរឱ្យទុកចិត្ត បានជួយកែលម្អសុវត្ថិភាព តម្លាភាព និងភាពត្រឹមត្រូវនៃការសម្រេចចិត្តផ្នែកវេជ្ជសាស្រ្តជាបន្តបន្ទាប់។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Single Classifier (e.g., VGGNet alone) ឧបករណ៍ចាត់ថ្នាក់តែមួយ (ឧទាហរណ៍ VGGNet តែឯង)	មានសមត្ថភាពក្នុងការទាញយកលក្ខណៈពិសេស (Features) ពីរូបភាពទិន្នន័យបានល្អ និងមានភាពរហ័សក្នុងការដំណើរការ។	ជាប្រព័ន្ធប្រភេទប្រអប់ខ្មៅ (Black box) ដែលខ្វះភាពអាចបកស្រាយបាន ធ្វើឱ្យពិបាកក្នុងការទាញយកទំនុកចិត្តពីគ្រូពេទ្យ និងមានភាពត្រឹមត្រូវទាបជាងម៉ូដែលរួមបញ្ចូល។	មានភាពត្រឹមត្រូវនៃការចាត់ថ្នាក់សរុបទាបជាងការប្រើប្រាស់ម៉ូដែល MedKGGPT ដែលបានវិវត្ត។
MedKGGPT Model (Machine Learning + Knowledge Reasoning) ម៉ូដែល MedKGGPT (ការរៀនដោយម៉ាស៊ីន + ការវែកញែកចំណេះដឹង)	រួមបញ្ចូលការរៀនដោយម៉ាស៊ីន និងចំណេះដឹងអ្នកជំនាញ ដែលផ្តល់នូវភាពត្រឹមត្រូវខ្ពស់ និងអាចពន្យល់ពីមូលហេតុនៃការសម្រេចចិត្តបានយ៉ាងច្បាស់លាស់។	ទាមទារការខិតខំប្រឹងប្រែងខ្ពស់ក្នុងការកសាងបណ្ណាល័យចំណេះដឹង (Ontology library) និងច្បាប់វែកញែក (Rule library) ពីអ្នកជំនាញវេជ្ជសាស្ត្រ។	ទទួលបានភាពត្រឹមត្រូវនៃការចាត់ថ្នាក់ខ្ពស់ និងអាចបង្កើតការពន្យល់រោគសាស្ត្រដែលអាចយល់បានយ៉ាងងាយស្រួលនៅលើសំណុំទិន្នន័យរូបភាពកោសិកាចំនួន ៤០០។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអភិវឌ្ឍ និងដំណើរការម៉ូដែលនេះតម្រូវឱ្យមានធនធានកុំព្យូទ័រកម្រិតខ្ពស់ និងអ្នកជំនាញវេជ្ជសាស្ត្រដើម្បីកសាងមូលដ្ឋានទិន្នន័យចំណេះដឹង។

Software: ទាមទារភាសា OWL, វេទិកា Protégé សម្រាប់ការកសាង Ontology និងម៉ាស៊ីនវែកញែក Drools (Drools inference engine) សម្រាប់ដំណើរការច្បាប់វេជ្ជសាស្ត្រ។
Hardware: ត្រូវការម៉ាស៊ីនកុំព្យូទ័រដែលមានអង្គគណនាត្រាប់ក្រាហ្វិក (GPU) ខ្ពស់ ដើម្បីដំណើរការបណ្តាញសរសៃប្រសាទ Convolutional Neural Networks (ដូចជា VGGNet) លើរូបភាពវេជ្ជសាស្ត្រ។
Dataset: សំណុំទិន្នន័យសាកល្បងដែលផ្ទុករូបភាពកោសិកាមហារីកមាត់ស្បូន (TCT slices) ចំនួន ៤០០ សន្លឹក ដែលត្រូវបានកត់ចំណាំ (Annotated) រួចរាល់។
Expertise: ត្រូវការវត្តមានរបស់គ្រូពេទ្យឯកទេសផ្នែករោគសាស្ត្រ ដើម្បីជួយបង្កើតវិធានអាជីវកម្ម (Business rule library) និងការកត់ចំណាំទិន្នន័យឱ្យបានត្រឹមត្រូវ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះពឹងផ្អែកលើទិន្នន័យរូបភាពកោសិកាមហារីកមាត់ស្បូនតែ ៤០០ សន្លឹកប៉ុណ្ណោះ ដែលប្រមូលបានពីមន្ទីរពេទ្យ (មិនបានបញ្ជាក់ទីតាំងភូមិសាស្ត្រច្បាស់លាស់)។ សម្រាប់ប្រទេសកម្ពុជា ការអនុវត្តម៉ូដែលនេះតម្រូវឱ្យមានការបង្វឹកឡើងវិញ (Retrain) ជាមួយសំណុំទិន្នន័យអ្នកជំងឺក្នុងស្រុក ដើម្បីជៀសវាងភាពលំអៀងនៃកាយវិភាគវិទ្យា និងធានាបាននូវភាពត្រឹមត្រូវខ្ពស់ស្របតាមលក្ខណៈប្រជាសាស្រ្តរបស់ប្រជាជនខ្មែរ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនៅក្នុងឯកសារនេះមានសក្តានុពលខ្ពស់ និងស័ក្តិសមបំផុតក្នុងការយកមកអនុវត្តនៅក្នុងប្រព័ន្ធថែទាំសុខភាពកម្ពុជា ដោយសារវាដោះស្រាយបញ្ហាកង្វះទំនុកចិត្តលើ AI តាមរយៈភាពអាចបកស្រាយបាន។

មន្ទីរពេទ្យជាតិកម្រិតខ្ពស់ (ឧទាហរណ៍ មន្ទីរពេទ្យកាល់ម៉ែត): អាចប្រើប្រាស់ម៉ូដែលនេះជាប្រព័ន្ធជំនួយគាំទ្រដល់គ្រូពេទ្យឯកទេសរោគសាស្ត្រ (Pathologists) ដើម្បីពន្លឿនការពិនិត្យរូបភាពកោសិកាមហារីកមាត់ស្បូន និងកាត់បន្ថយកំហុសអចេតនា។
មណ្ឌលសុខភាព ឬមន្ទីរពេទ្យបង្អែកតាមខេត្ត: អាចប្រើប្រាស់ប្រព័ន្ធនេះដើម្បីជួយវិភាគបឋម ក្នុងករណីដែលមន្ទីរពេទ្យខេត្តខ្វះខាតគ្រូពេទ្យឯកទេស ដោយប្រព័ន្ធអាចផ្តល់ទាំងលទ្ធផល និងការពន្យល់លម្អិតសម្រាប់ការបញ្ជូនបន្ត (Referral) ទៅកាន់រាជធានី។
សាកលវិទ្យាល័យវិទ្យាសាស្រ្តសុខាភិបាល (UHS): និស្សិតពេទ្យអាចប្រើប្រាស់ប្រព័ន្ធនេះជាឧបករណ៍សិក្សា ដើម្បីស្វែងយល់ពីរបៀបវែកញែករោគសញ្ញា និងការធ្វើរោគវិនិច្ឆ័យផ្អែកលើចំណេះដឹង (Knowledge Graph Reasoning)។

ការរួមបញ្ចូលគ្នារវាងការរៀនដោយម៉ាស៊ីន និងការពន្យល់វេជ្ជសាស្រ្តច្បាស់លាស់នេះ នឹងជួយជំរុញការទទួលយកបច្ចេកវិទ្យា AI កាន់តែទូលំទូលាយពីសំណាក់គ្រូពេទ្យ និងអ្នកជំងឺនៅកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាពីមូលដ្ឋានគ្រឹះនៃចំណេះដឹងក្រាហ្វិក (Knowledge Graphs): ចាប់ផ្តើមដោយការរៀនពីរបៀបបង្កើតបណ្ណាល័យចំណេះដឹងតាមវិស័យ (Domain Ontology) ដោយប្រើប្រាស់ឧបករណ៍ Protégé និងរៀនសរសេរកូដវែកញែកតាមរយៈភាសា OWL (Web Ontology Language) និង SWRL។
ប្រមូល និងរៀបចំទិន្នន័យវេជ្ជសាស្ត្រក្នុងស្រុក: បង្កើតកិច្ចសហការជាមួយមន្ទីរពេទ្យជាតិនៅកម្ពុជា (ឧទាហរណ៍ មន្ទីរពេទ្យមិត្តភាពខ្មែរ-សូវៀត) ដើម្បីប្រមូលទិន្នន័យរូបភាព TCT នៃកោសិកាមហារីកមាត់ស្បូន រួចធ្វើការកត់ចំណាំ (Annotate) ដោយអ្នកជំនាញ។
អភិវឌ្ឍម៉ូដែលកាត់យករូបភាព (Image Feature Extraction): ប្រើប្រាស់ Frameworks ដូចជា PyTorch ឬ TensorFlow ដើម្បីបង្ហាត់បណ្តាញ VGGNet ឬ ResNet ក្នុងការចាប់យកលក្ខណៈពិសេសរបស់កោសិកាខុសប្រក្រតីពីរូបភាពវេជ្ជសាស្ត្រដែលបានប្រមូល។
រួមបញ្ចូលម៉ូដែលម៉ាស៊ីន និងម៉ាស៊ីនវែកញែកវិធាន: តភ្ជាប់លទ្ធផលពីម៉ូដែលកាត់យករូបភាព ទៅកាន់ម៉ាស៊ីនវែកញែកចំណេះដឹងដូចជា Drools Inference Engine ដើម្បីប្រៀបធៀបលក្ខណៈពិសេសទិន្នន័យជាមួយវិធានពេទ្យ និងបង្កើតជាខ្សែសង្វាក់ភស្តុតាង (Evidence Chain)។
វាយតម្លៃភាពអាចបកស្រាយបាន និងដាក់ឱ្យប្រើប្រាស់: ធ្វើការតេស្តសាកល្បងម៉ូដែលជាមួយគ្រូពេទ្យនៅកម្ពុជា ដើម្បីវាយតម្លៃថាការពន្យល់ដែលបង្កើតដោយម៉ូដែល (Explanatory paths) ងាយយល់និងអាចទុកចិត្តបានកម្រិតណា មុននឹងដាក់បញ្ចូលទៅក្នុងប្រព័ន្ធមន្ទីរពេទ្យពិតប្រាកដ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Large Language Models (LLMs)	ម៉ូដែលបញ្ញាសិប្បនិម្មិតដែលត្រូវបានបង្ហាត់លើទិន្នន័យអត្ថបទដ៏ធំសម្បើម ដើម្បីយល់ បង្កើត និងឆ្លើយតបជាភាសាធម្មជាតិ ប៉ុន្តែជារឿយៗវាខ្វះតម្លាភាពក្នុងការសម្រេចចិត្តនៅក្នុងវិស័យវេជ្ជសាស្ត្រ (លក្ខណៈប្រអប់ខ្មៅ)។	ដូចជាមនុស្សដែលបានអានសៀវភៅរាប់លានក្បាល ហើយអាចឆ្លើយសំណួរបានយ៉ាងរលូន ប៉ុន្តែមិនអាចប្រាប់បានថាចម្លើយនោះដកស្រង់ចេញពីសៀវភៅទំព័រណានោះទេ។
Knowledge Graph	វិធីសាស្ត្ររៀបចំទិន្នន័យក្នុងទម្រង់ជាបណ្ដាញក្រាហ្វិក ដែលបង្ហាញពីទំនាក់ទំនងរវាងពាក្យ ឬគោលគំនិតផ្សេងៗ ជួយឱ្យប្រព័ន្ធកុំព្យូទ័រយល់ពីបរិបទ និងហេតុផលនៃព័ត៌មានជំនួសឱ្យការទន្ទេញចាំ។	ដូចជាផែនទីគំនិត (Mind Map) ដ៏ធំមួយដែលភ្ជាប់រោគសញ្ញា ជំងឺ និងវិធីព្យាបាលចូលគ្នា ដើម្បីឱ្យប្រព័ន្ធអាចទាញរកហេតុផលបាន។
Interpretability	សមត្ថភាពនៃប្រព័ន្ធបញ្ញាសិប្បនិម្មិត (AI) ក្នុងការបង្ហាញ និងពន្យល់ពីដំណើរការនៃការសម្រេចចិត្ត ឬលទ្ធផលរបស់វា ទៅកាន់មនុស្សឱ្យយល់បានច្បាស់លាស់ ដែលជួយបង្កើនទំនុកចិត្តពីគ្រូពេទ្យនិងអ្នកជំងឺ។	ដូចជាសិស្សដែលមិនត្រឹមតែសរសេរចម្លើយត្រូវលើក្រដាសប្រឡងប៉ុណ្ណោះទេ ថែមទាំងអាចសរសេរពន្យល់ពីរូបមន្ត និងជំហាននៃការគណនាបានយ៉ាងលម្អិតទៀតផង។
Ontology Knowledge	ការរៀបចំ និងកំណត់រចនាសម្ព័ន្ធយ៉ាងច្បាស់លាស់នូវពាក្យបច្ចេកទេស និងទំនាក់ទំនងរបស់ពួកវានៅក្នុងវិស័យណាមួយ (ដូចជាការធ្វើរោគវិនិច្ឆ័យវេជ្ជសាស្ត្រ) ដើម្បីឱ្យកុំព្យូទ័រអាចប្រើប្រាស់វាសម្រាប់ធ្វើការវែកញែកបាន។	ដូចជាវចនានុក្រមវេជ្ជសាស្ត្រដ៏វៃឆ្លាតមួយ ដែលមិនត្រឹមតែប្រាប់អត្ថន័យពាក្យ ប៉ុន្តែប្រាប់ពីរបៀបដែលពាក្យនិងជំងឺទាំងនោះទាក់ទងគ្នា។
Result Evidence Chain	ខ្សែសង្វាក់នៃភស្តុតាងដែលកត់ត្រាទុកនូវរាល់ប៉ារ៉ាម៉ែត្រ ច្បាប់ និងទិន្នន័យដែលម៉ូដែល AI ប្រើប្រាស់ដើម្បីទាញយកសេចក្តីសន្និដ្ឋានមួយ ដែលជួយឱ្យអ្នកប្រើប្រាស់អាចតាមដានរកប្រភពដើមបាននៅពេលមានកំហុស។	ដូចជាវិក័យប័ត្រទិញទំនិញដែលរាយបញ្ជីរាល់មុខទំនិញ និងតម្លៃលម្អិត ធ្វើឱ្យយើងដឹងច្បាស់ថាប្រាក់សរុបបានមកពីការបូកបញ្ចូលអ្វីខ្លះ។
Credibility Assessment	ការវាយតម្លៃកម្រិតនៃភាពជឿជាក់លើលទ្ធផលរបស់ម៉ូដែល ដោយផ្អែកលើកត្តាជាច្រើនដូចជាគុណភាពទិន្នន័យ និងភាពត្រឹមត្រូវនៃច្បាប់វេជ្ជសាស្ត្រ ដើម្បីសម្រេចថាតើគួរទទួលយកលទ្ធផលនោះ ឬត្រូវវិភាគម្តងទៀត។	ដូចជាការផ្ទៀងផ្ទាត់ប្រភពព័ត៌មានមុននឹងជឿថាវាជាការពិត ដោយមើលថាតើអ្នកនិយាយជានរណា និងមានភស្តុតាងរឹងមាំអ្វីខ្លះ។
Semantic Web Rule Language (SWRL)	ភាសាកូដស្តង់ដារដែលប្រើសម្រាប់សរសេរច្បាប់និងលក្ខខណ្ឌ (Rules) ដើម្បីជួយឱ្យកុំព្យូទ័រអាចធ្វើការវែកញែករកចំណេះដឹង ឬសេចក្តីសន្និដ្ឋានថ្មីៗបានដោយស្វ័យប្រវត្តិ។	ដូចជារូបមន្តតក្កវិទ្យា "បើសិន... នោះ..." (If... Then...) ដែលបង្រៀនកុំព្យូទ័រឱ្យចេះទាញសេចក្តីសន្និដ្ឋានដោយខ្លួនឯង។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖