Original Title: Machine learning for extracellular vesicles enables diagnostic and therapeutic nanobiotechnology
Source: doi.org/10.1186/s12951-025-03952-4
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការរៀនម៉ាស៊ីនសម្រាប់ថង់ក្រៅកោសិកា ដើម្បីជំរុញបច្ចេកវិទ្យាណាណូជីវសាស្ត្រផ្នែករោគវិនិច្ឆ័យ និងការព្យាបាល

ចំណងជើងដើម៖ Machine learning for extracellular vesicles enables diagnostic and therapeutic nanobiotechnology

អ្នកនិពន្ធ៖ Ashutosh Tiwari (Taipei Medical University), Widodo (Institut Teknologi AI-Mahrusiyah), Dyah Ika Krisnawati (Universitas Nahdlatul Ulama Surabaya), Kai-Yi Tzou (Taipei Medical University), Tsung-Rong Kuo (Taipei Medical University)

ឆ្នាំបោះពុម្ព៖ 2026 (Journal of Nanobiotechnology)

វិស័យសិក្សា៖ Nanobiotechnology, Artificial Intelligence, Biomedical Engineering

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការស្រាវជ្រាវអំពីថង់ក្រៅកោសិកា (Extracellular Vesicles - EVs) ជួបប្រទះបញ្ហាប្រឈមដោយសារភាពស្មុគស្មាញ និងទិន្នន័យដែលមានវិមាត្រខ្ពស់ ដែលវិធីសាស្ត្រស្ថិតិបែបបុរាណមិនអាចដោះស្រាយបានមានប្រសិទ្ធភាពសម្រាប់ការប្រើប្រាស់ក្នុងគ្លីនិក ជាពិសេសក្នុងការធ្វើរោគវិនិច្ឆ័យជំងឺមហារីក។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះគឺជាការពិនិត្យឡើងវិញ (Review) ដែលវិភាគលើការអនុវត្តបច្ចេកទេសការរៀនម៉ាស៊ីន (Machine Learning) លើប្រភេទទិន្នន័យផ្សេងៗរបស់ EV ដើម្បីបង្កើនប្រសិទ្ធភាពនៃការកំណត់លក្ខណៈ និងការព្យាបាល។

ការប្រើប្រាស់បណ្តាញប្រសាទខុនវ៉ូលុយស្យុង (Convolutional Neural Networks - CNNs) សម្រាប់វិភាគរូបភាពមីក្រូទស្សន៍ (Imaging Data)
ការប្រើប្រាស់ក្បួនដោះស្រាយ Ensemble Learning (ដូចជា Random Forests និង XGBoost) សម្រាប់វិភាគទិន្នន័យអូមិក (Omics Data)
ការប្រើប្រាស់បច្ចេកទេសកាត់បន្ថយវិមាត្រ (Dimensionality Reduction) ដូចជា t-SNE និង UMAP សម្រាប់ការធ្វើចំណាត់ថ្នាក់កោសិកា (Flow Cytometry)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ការរៀនម៉ាស៊ីន (ML) ជួយបង្កើនភាពត្រឹមត្រូវនៃការធ្វើកោសល្យវិច័យរាវ (Liquid Biopsy) ផ្អែកលើ EV សម្រាប់ការរកឃើញជំងឺមហារីកដំណាក់កាលដំបូង បានល្អប្រសើរជាងសញ្ញាសម្គាល់ដុំសាច់បែបបុរាណ។
ក្បួនដោះស្រាយកម្រិតខ្ពស់ជួយបកស្រាយភាពមិនដូចគ្នានៃ EV (Heterogeneity) និងមុខងារជីវសាស្ត្រតាមរយៈការរួមបញ្ចូលទិន្នន័យពហុអូមិក (Multi-omics integration)។
ភាពជោគជ័យនាពេលអនាគតទាមទារឱ្យមានការដោះស្រាយបញ្ហាស្តង់ដារនៃការញែក EV និងការធានាថាគំរូ AI អាចបកស្រាយបាន (Explainable AI) សម្រាប់ការប្រើប្រាស់ជាក់ស្តែងក្នុងវិស័យសុខាភិបាល។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Convolutional Neural Networks (CNNs) បណ្តាញប្រសាទខុនវ៉ូលុយស្យុង (ប្រើសម្រាប់វិភាគរូបភាពមីក្រូទស្សន៍ TEM)	មានសមត្ថភាពខ្ពស់ក្នុងការកំណត់អត្តសញ្ញាណ និងធ្វើចំណាត់ថ្នាក់រូបភាពដោយស្វ័យប្រវត្តិ កាត់បន្ថយពេលវេលានិងកំហុសរបស់មនុស្ស។	ត្រូវការទិន្នន័យរូបភាពដែលមានស្លាក (Labeled data) ច្រើន និងទាមទារកុំព្យូទ័រដែលមានសមត្ថភាពខ្ពស់។	សម្រេចបានភាពត្រឹមត្រូវនៃការកំណត់ចំណែក (Segmentation accuracy) លើសពី ៩០% លើសំណុំទិន្នន័យ TEM (ម៉ូដែល ScanEV)។
Ensemble Learning (Random Forest / XGBoost) ការរៀនបែបបណ្តុំ (ប្រើសម្រាប់វិភាគទិន្នន័យអូមិក និងលំហូរកោសិកា)	មានប្រសិទ្ធភាពខ្ពស់លើទិន្នន័យដែលមានវិមាត្រច្រើន ផ្តល់នូវតម្លាភាពក្នុងការកំណត់លក្ខណៈសំខាន់ៗ (Feature importance) និងធន់នឹងការ Overfitting។	អាចជួបប្រទះការលំបាកប្រសិនបើទិន្នន័យមានអតុល្យភាពខ្លាំង (Class imbalance) ឬចំនួនសំណាកតិចពេក។	សម្រេចបាន AUC ០.៩៦ ក្នុងការរកឃើញមហារីកពោះវៀនធំដំណាក់កាលដំបូង ល្អជាងសញ្ញាសម្គាល់ដុំសាច់ CEA និង CA19-9។
Traditional Biomarkers (CEA, PSA) សញ្ញាសម្គាល់ជីវសាស្ត្របុរាណ (ប្រើក្នុងការធ្វើរោគវិនិច្ឆ័យទូទៅ)	មានតម្លៃសមរម្យ និងត្រូវបានប្រើប្រាស់យ៉ាងទូលំទូលាយនៅក្នុងមន្ទីរពេទ្យបច្ចុប្បន្ន។	មានកម្រិតភាពជាក់លាក់ (Specificity) និងកម្រិតរសើប (Sensitivity) ទាប ដែលអាចនាំឱ្យមានការវិនិច្ឆ័យខុស។	មានកម្រិតភាពត្រឹមត្រូវទាបជាងគួរឱ្យកត់សម្គាល់បើធៀបនឹងវិធីសាស្ត្ររៀនម៉ាស៊ីនដែលប្រើទិន្នន័យ EV (ឧ. PSA សម្រាប់មហារីកក្រពេញប្រូស្តាត)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តបច្ចេកវិទ្យានេះទាមទារនូវការវិនិយោគខ្ពស់លើឧបករណ៍ពិសោធន៍ទំនើប និងធនធានកុំព្យូទ័រសម្រាប់ការវិភាគទិន្នន័យ។

Lab Equipment: ត្រូវការឧបករណ៍ដូចជា Transmission Electron Microscopy (TEM), Mass Spectrometry និង Nanoparticle Tracking Analysis (NTA) ដែលមានតម្លៃខ្ពស់។
Computing Hardware: ត្រូវការ GPU ដែលមានអនុភាពខ្លាំង (ឧទាហរណ៍ NVIDIA A100) ដើម្បីដំណើរការម៉ូដែល Deep Learning ។
Dataset: ត្រូវការសំណុំទិន្នន័យអូមិក (Omics) និងរូបភាពដែលមានគុណភាពខ្ពស់ និងត្រូវបានកំណត់ចំណាំ (Annotated) ត្រឹមត្រូវ។
Expertise: ទាមទារអ្នកជំនាញដែលមានចំណេះដឹងទាំងផ្នែកជីវវិទ្យាម៉ូលេគុល (Molecular Biology) និងវិទ្យាសាស្ត្រទិន្នន័យ (Data Science)។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សាភាគច្រើនពឹងផ្អែកលើសំណុំទិន្នន័យដែលមានទំហំតូច (ក្រោម ២០០ សំណាក) និងប្រមូលពីប្រជាជននៅប្រទេសអភិវឌ្ឍន៍។ នេះអាចជាបញ្ហាសំខាន់សម្រាប់កម្ពុជា ព្រោះលក្ខណៈហ្សែន និងកត្តាបរិស្ថាននៅកម្ពុជាអាចខុសគ្នា ដែលតម្រូវឱ្យមានការផ្ទៀងផ្ទាត់សុពលភាព (Validation) លើប្រជាជនក្នុងស្រុក។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកទេសនេះមានសក្តានុពលខ្ពស់សម្រាប់ប្រព័ន្ធសុខាភិបាលកម្ពុជានាពេលអនាគត ប៉ុន្តែជួបប្រទះឧបសគ្គផ្នែកហេដ្ឋារចនាសម្ព័ន្ធបច្ចុប្បន្ន។

មន្ទីរពេទ្យកាល់ម៉ែត ឬ មន្ទីរពេទ្យមិត្តភាពខ្មែរ-សូវៀត: អាចចាប់ផ្តើមសាកល្បងប្រើប្រាស់បច្ចេកទេស Liquid Biopsy ផ្អែកលើ EV សម្រាប់ការរកឃើញជំងឺមហារីក (ដូចជាមហារីកថ្លើម ឬសួត) ជំនួសឱ្យការច្រឹបសាច់ (Tissue biopsy) ដែលមានការឈឺចាប់។
វិទ្យាស្ថានបច្ចេកវិទ្យាកម្ពុជា (ITC) ឬ សាកលវិទ្យាល័យភូមិន្ទភ្នំពេញ (RUPP): អាចបង្កើតក្រុមស្រាវជ្រាវផ្នែក Bioinformatics ដើម្បីវិភាគទិន្នន័យ EV ដែលមានស្រាប់ជាសាធារណៈ (Public datasets) ដោយប្រើប្រាស់ Machine Learning មុននឹងឈានទៅដល់ការពិសោធន៍ក្នុងមន្ទីរពិសោធន៍។

ទោះបីជាការអនុវត្តពេញលេញត្រូវការពេលក៏ដោយ ការចាប់ផ្តើមពីការវិភាគទិន្នន័យ និងការស្រាវជ្រាវផ្នែកកុំព្យូទ័រអាចជួយកម្ពុជាត្រៀមខ្លួនសម្រាប់វេជ្ជសាស្ត្របច្ចេកវិទ្យាខ្ពស់នេះ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

ការពង្រឹងចំណេះដឹងមូលដ្ឋាន (Foundational Knowledge): និស្សិតគួរចាប់ផ្តើមសិក្សាអំពីជីវវិទ្យានៃថង់ក្រៅកោសិកា (EV Biology) និងមូលដ្ឋានគ្រឹះនៃ Machine Learning ដោយប្រើប្រាស់ភាសា Python និងបណ្ណាល័យដូចជា (Scikit-learn) ឬ (TensorFlow)។
ការវិភាគទិន្នន័យសាធារណៈ (Public Data Analysis): ទាញយកសំណុំទិន្នន័យពីឃ្លាំងទិន្នន័យអន្តរជាតិដូចជា (EVpedia) ឬ (Vesiclepedia) ដើម្បីអនុវត្តការបង្កើតម៉ូដែលចំណាត់ថ្នាក់ជំងឺ ដោយមិនចាំបាច់ចំណាយលើការពិសោធន៍ផ្ទាល់។
ការអនុវត្តស្តង់ដារ MISEV (Standardization): សិក្សា និងអនុវត្តតាមគោលការណ៍ណែនាំ (MISEV2023) ក្នុងការរាយការណ៍ទិន្នន័យ ដើម្បីធានាថាការស្រាវជ្រាវមានគុណភាពស្តង់ដារអន្តរជាតិ និងអាចទទួលស្គាល់បាន។
ការបង្កើតកិច្ចសហប្រតិបត្តិការ (Collaboration): បង្កើតទំនាក់ទំនងរវាងដេប៉ាតឺម៉ង់វិស្វកម្មជីវសាស្ត្រ និងមន្ទីរពេទ្យជាតិ ដើម្បីប្រមូលទិន្នន័យអ្នកជំងឺជាក់ស្តែង (Clinical Data) សម្រាប់ការបង្វឹកម៉ូដែល AI ឱ្យត្រូវនឹងបរិបទកម្ពុជា។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Extracellular Vesicles (EVs)	ជាភាគល្អិតតូចៗដែលមានស្រទាប់ភ្នាសពីខាងក្រៅ ដែលកោសិកាបញ្ចេញមកដើម្បីដឹកជញ្ជូនសារធាតុសំខាន់ៗដូចជា ប្រូតេអ៊ីន ខ្លាញ់ និងហ្សែន (DNA/RNA) ទៅកាន់កោសិកាផ្សេងទៀតសម្រាប់ការទំនាក់ទំនង។	ដូចជាស្រោមសំបុត្រតូចៗដែលកោសិកាប្រើដើម្បីផ្ញើសារ ឬកញ្ចប់ទំនិញទៅឱ្យកោសិកាជិតខាង។
Liquid Biopsy	ជាបច្ចេកទេសវិភាគរកជំងឺ (ជាពិសេសមហារីក) ដោយការពិនិត្យសំណាកវត្ថុរាវពីរាងកាយ ដូចជាឈាម ឬទឹកនោម ដើម្បីស្វែងរក EVs ឬ DNA ជំនួសឱ្យការវះកាត់យកសាច់ច្រឹប។	ដូចជាការពិនិត្យគុណភាពទឹកទន្លេដើម្បីដឹងពីប្រភពបំពុលនៅដើមទី ដោយមិនចាំបាច់ទៅជីកកកាយបំពង់បង្ហូរនៅទីនោះផ្ទាល់។
Multi-omics	ជាការធ្វើសមាហរណកម្មទិន្នន័យជីវសាស្ត្រជាច្រើនប្រភេទបញ្ចូលគ្នា (ដូចជា ហ្សែន ប្រូតេអ៊ីន និងសារធាតុបំប្លែង) ដើម្បីបង្កើតជាគំរូវិភាគដ៏ទូលំទូលាយអំពីដំណើរការរបស់កោសិកា ឬជំងឺ។	ដូចជាការប្រើប្រាស់ទាំងកាមេរ៉ា សំឡេង និងស្នាមម្រាមដៃព្រមគ្នា ដើម្បីស៊ើបអង្កេតបទល្មើស ជាជាងការពឹងផ្អែកលើភស្តុតាងតែមួយមុខ។
Convolutional Neural Networks (CNNs)	ជាប្រភេទបច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិត (Deep Learning) ដែលមានសមត្ថភាពខ្ពស់ក្នុងការវិភាគរូបភាព ដោយវាអាចរៀនសម្គាល់លំនាំ និងរូបរាងរបស់ EVs នៅក្នុងរូបភាពមីក្រូទស្សន៍ដោយស្វ័យប្រវត្តិ។	ដូចជាក្មេងដែលរៀនសម្គាល់មុខមនុស្សដោយមើលទៅលើ ទម្រង់មុខ ភ្នែក និងច្រមុះ រហូតដល់ចេះបែងចែកថាជាអ្នកណា។
Nanoparticle Tracking Analysis (NTA)	ជាវិធីសាស្ត្រដែលប្រើពន្លឺឡាស៊ែរដើម្បីតាមដានចលនារបស់ភាគល្អិតតូចៗក្នុងសូលុយស្យុង ដើម្បីវាស់ទំហំ និងរាប់ចំនួនរបស់ EVs ឱ្យបានច្បាស់លាស់។	ដូចជាការប៉ាន់ស្មានទំហំកូនទូកក្នុងអ័ព្ទ ដោយសង្កេតមើលល្បឿន និងរបៀបដែលពួកវារង្គើនៅលើផ្ទៃទឹក។
Federated Learning	ជាវិធីសាស្ត្របង្រៀន AI ឱ្យរៀនពីទិន្នន័យនៅតាមមន្ទីរពេទ្យច្រើនកន្លែងផ្សេងគ្នា ដោយមិនតម្រូវឱ្យបញ្ជូនទិន្នន័យអ្នកជំងឺចេញពីប្រព័ន្ធដើមឡើយ ដើម្បីការពារសុវត្ថិភាពទិន្នន័យ។	ដូចជាសិស្សរៀនពីសៀវភៅនៅផ្ទះរៀងៗខ្លួន ហើយគ្រាន់តែផ្ញើចម្លើយសង្ខេបទៅគ្រូ ដោយមិនចាំបាច់យកសៀវភៅផ្ទាល់ខ្លួនទៅបង្ហាញអ្នកដទៃ។
Graph Neural Networks (GNNs)	ជាគំរូ AI ដែលត្រូវបានរចនាឡើងដើម្បីវិភាគទិន្នន័យដែលមានទំនាក់ទំនងគ្នារញ៉េរញ៉ៃ (ដូចជាបណ្តាញទំនាក់ទំនងរវាងម៉ូលេគុលក្នុង EVs) ដើម្បីយល់ពីរបៀបដែលពួកវាធ្វើការជាមួយគ្នា។	ដូចជាការវិភាគផែនទីបណ្តាញមិត្តភក្តិក្នុងហ្វេសប៊ុក ដើម្បីទស្សន៍ទាយថាព័ត៌មាននឹងសាយភាយទៅដល់អ្នកណាខ្លះ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖