Original Title: Machine learning for extracellular vesicles enables diagnostic and therapeutic nanobiotechnology
Source: doi.org/10.1186/s12951-025-03952-4
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការរៀនម៉ាស៊ីនសម្រាប់ថង់ក្រៅកោសិកា ដើម្បីជំរុញបច្ចេកវិទ្យាណាណូជីវសាស្ត្រផ្នែករោគវិនិច្ឆ័យ និងការព្យាបាល

ចំណងជើងដើម៖ Machine learning for extracellular vesicles enables diagnostic and therapeutic nanobiotechnology

អ្នកនិពន្ធ៖ Ashutosh Tiwari (Taipei Medical University), Widodo (Institut Teknologi AI-Mahrusiyah), Dyah Ika Krisnawati (Universitas Nahdlatul Ulama Surabaya), Kai-Yi Tzou (Taipei Medical University), Tsung-Rong Kuo (Taipei Medical University)

ឆ្នាំបោះពុម្ព៖ 2026 (Journal of Nanobiotechnology)

វិស័យសិក្សា៖ Nanobiotechnology, Artificial Intelligence, Biomedical Engineering

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការស្រាវជ្រាវអំពីថង់ក្រៅកោសិកា (Extracellular Vesicles - EVs) ជួបប្រទះបញ្ហាប្រឈមដោយសារភាពស្មុគស្មាញ និងទិន្នន័យដែលមានវិមាត្រខ្ពស់ ដែលវិធីសាស្ត្រស្ថិតិបែបបុរាណមិនអាចដោះស្រាយបានមានប្រសិទ្ធភាពសម្រាប់ការប្រើប្រាស់ក្នុងគ្លីនិក ជាពិសេសក្នុងការធ្វើរោគវិនិច្ឆ័យជំងឺមហារីក។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះគឺជាការពិនិត្យឡើងវិញ (Review) ដែលវិភាគលើការអនុវត្តបច្ចេកទេសការរៀនម៉ាស៊ីន (Machine Learning) លើប្រភេទទិន្នន័យផ្សេងៗរបស់ EV ដើម្បីបង្កើនប្រសិទ្ធភាពនៃការកំណត់លក្ខណៈ និងការព្យាបាល។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Convolutional Neural Networks (CNNs)
បណ្តាញប្រសាទខុនវ៉ូលុយស្យុង (ប្រើសម្រាប់វិភាគរូបភាពមីក្រូទស្សន៍ TEM)
មានសមត្ថភាពខ្ពស់ក្នុងការកំណត់អត្តសញ្ញាណ និងធ្វើចំណាត់ថ្នាក់រូបភាពដោយស្វ័យប្រវត្តិ កាត់បន្ថយពេលវេលានិងកំហុសរបស់មនុស្ស។ ត្រូវការទិន្នន័យរូបភាពដែលមានស្លាក (Labeled data) ច្រើន និងទាមទារកុំព្យូទ័រដែលមានសមត្ថភាពខ្ពស់។ សម្រេចបានភាពត្រឹមត្រូវនៃការកំណត់ចំណែក (Segmentation accuracy) លើសពី ៩០% លើសំណុំទិន្នន័យ TEM (ម៉ូដែល ScanEV)។
Ensemble Learning (Random Forest / XGBoost)
ការរៀនបែបបណ្តុំ (ប្រើសម្រាប់វិភាគទិន្នន័យអូមិក និងលំហូរកោសិកា)
មានប្រសិទ្ធភាពខ្ពស់លើទិន្នន័យដែលមានវិមាត្រច្រើន ផ្តល់នូវតម្លាភាពក្នុងការកំណត់លក្ខណៈសំខាន់ៗ (Feature importance) និងធន់នឹងការ Overfitting។ អាចជួបប្រទះការលំបាកប្រសិនបើទិន្នន័យមានអតុល្យភាពខ្លាំង (Class imbalance) ឬចំនួនសំណាកតិចពេក។ សម្រេចបាន AUC ០.៩៦ ក្នុងការរកឃើញមហារីកពោះវៀនធំដំណាក់កាលដំបូង ល្អជាងសញ្ញាសម្គាល់ដុំសាច់ CEA និង CA19-9។
Traditional Biomarkers (CEA, PSA)
សញ្ញាសម្គាល់ជីវសាស្ត្របុរាណ (ប្រើក្នុងការធ្វើរោគវិនិច្ឆ័យទូទៅ)
មានតម្លៃសមរម្យ និងត្រូវបានប្រើប្រាស់យ៉ាងទូលំទូលាយនៅក្នុងមន្ទីរពេទ្យបច្ចុប្បន្ន។ មានកម្រិតភាពជាក់លាក់ (Specificity) និងកម្រិតរសើប (Sensitivity) ទាប ដែលអាចនាំឱ្យមានការវិនិច្ឆ័យខុស។ មានកម្រិតភាពត្រឹមត្រូវទាបជាងគួរឱ្យកត់សម្គាល់បើធៀបនឹងវិធីសាស្ត្ររៀនម៉ាស៊ីនដែលប្រើទិន្នន័យ EV (ឧ. PSA សម្រាប់មហារីកក្រពេញប្រូស្តាត)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តបច្ចេកវិទ្យានេះទាមទារនូវការវិនិយោគខ្ពស់លើឧបករណ៍ពិសោធន៍ទំនើប និងធនធានកុំព្យូទ័រសម្រាប់ការវិភាគទិន្នន័យ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សាភាគច្រើនពឹងផ្អែកលើសំណុំទិន្នន័យដែលមានទំហំតូច (ក្រោម ២០០ សំណាក) និងប្រមូលពីប្រជាជននៅប្រទេសអភិវឌ្ឍន៍។ នេះអាចជាបញ្ហាសំខាន់សម្រាប់កម្ពុជា ព្រោះលក្ខណៈហ្សែន និងកត្តាបរិស្ថាននៅកម្ពុជាអាចខុសគ្នា ដែលតម្រូវឱ្យមានការផ្ទៀងផ្ទាត់សុពលភាព (Validation) លើប្រជាជនក្នុងស្រុក។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកទេសនេះមានសក្តានុពលខ្ពស់សម្រាប់ប្រព័ន្ធសុខាភិបាលកម្ពុជានាពេលអនាគត ប៉ុន្តែជួបប្រទះឧបសគ្គផ្នែកហេដ្ឋារចនាសម្ព័ន្ធបច្ចុប្បន្ន។

ទោះបីជាការអនុវត្តពេញលេញត្រូវការពេលក៏ដោយ ការចាប់ផ្តើមពីការវិភាគទិន្នន័យ និងការស្រាវជ្រាវផ្នែកកុំព្យូទ័រអាចជួយកម្ពុជាត្រៀមខ្លួនសម្រាប់វេជ្ជសាស្ត្របច្ចេកវិទ្យាខ្ពស់នេះ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ការពង្រឹងចំណេះដឹងមូលដ្ឋាន (Foundational Knowledge): និស្សិតគួរចាប់ផ្តើមសិក្សាអំពីជីវវិទ្យានៃថង់ក្រៅកោសិកា (EV Biology) និងមូលដ្ឋានគ្រឹះនៃ Machine Learning ដោយប្រើប្រាស់ភាសា Python និងបណ្ណាល័យដូចជា (Scikit-learn) ឬ (TensorFlow)។
  2. ការវិភាគទិន្នន័យសាធារណៈ (Public Data Analysis): ទាញយកសំណុំទិន្នន័យពីឃ្លាំងទិន្នន័យអន្តរជាតិដូចជា (EVpedia) ឬ (Vesiclepedia) ដើម្បីអនុវត្តការបង្កើតម៉ូដែលចំណាត់ថ្នាក់ជំងឺ ដោយមិនចាំបាច់ចំណាយលើការពិសោធន៍ផ្ទាល់។
  3. ការអនុវត្តស្តង់ដារ MISEV (Standardization): សិក្សា និងអនុវត្តតាមគោលការណ៍ណែនាំ (MISEV2023) ក្នុងការរាយការណ៍ទិន្នន័យ ដើម្បីធានាថាការស្រាវជ្រាវមានគុណភាពស្តង់ដារអន្តរជាតិ និងអាចទទួលស្គាល់បាន។
  4. ការបង្កើតកិច្ចសហប្រតិបត្តិការ (Collaboration): បង្កើតទំនាក់ទំនងរវាងដេប៉ាតឺម៉ង់វិស្វកម្មជីវសាស្ត្រ និងមន្ទីរពេទ្យជាតិ ដើម្បីប្រមូលទិន្នន័យអ្នកជំងឺជាក់ស្តែង (Clinical Data) សម្រាប់ការបង្វឹកម៉ូដែល AI ឱ្យត្រូវនឹងបរិបទកម្ពុជា។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Extracellular Vesicles (EVs) ជាភាគល្អិតតូចៗដែលមានស្រទាប់ភ្នាសពីខាងក្រៅ ដែលកោសិកាបញ្ចេញមកដើម្បីដឹកជញ្ជូនសារធាតុសំខាន់ៗដូចជា ប្រូតេអ៊ីន ខ្លាញ់ និងហ្សែន (DNA/RNA) ទៅកាន់កោសិកាផ្សេងទៀតសម្រាប់ការទំនាក់ទំនង។ ដូចជាស្រោមសំបុត្រតូចៗដែលកោសិកាប្រើដើម្បីផ្ញើសារ ឬកញ្ចប់ទំនិញទៅឱ្យកោសិកាជិតខាង។
Liquid Biopsy ជាបច្ចេកទេសវិភាគរកជំងឺ (ជាពិសេសមហារីក) ដោយការពិនិត្យសំណាកវត្ថុរាវពីរាងកាយ ដូចជាឈាម ឬទឹកនោម ដើម្បីស្វែងរក EVs ឬ DNA ជំនួសឱ្យការវះកាត់យកសាច់ច្រឹប។ ដូចជាការពិនិត្យគុណភាពទឹកទន្លេដើម្បីដឹងពីប្រភពបំពុលនៅដើមទី ដោយមិនចាំបាច់ទៅជីកកកាយបំពង់បង្ហូរនៅទីនោះផ្ទាល់។
Multi-omics ជាការធ្វើសមាហរណកម្មទិន្នន័យជីវសាស្ត្រជាច្រើនប្រភេទបញ្ចូលគ្នា (ដូចជា ហ្សែន ប្រូតេអ៊ីន និងសារធាតុបំប្លែង) ដើម្បីបង្កើតជាគំរូវិភាគដ៏ទូលំទូលាយអំពីដំណើរការរបស់កោសិកា ឬជំងឺ។ ដូចជាការប្រើប្រាស់ទាំងកាមេរ៉ា សំឡេង និងស្នាមម្រាមដៃព្រមគ្នា ដើម្បីស៊ើបអង្កេតបទល្មើស ជាជាងការពឹងផ្អែកលើភស្តុតាងតែមួយមុខ។
Convolutional Neural Networks (CNNs) ជាប្រភេទបច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិត (Deep Learning) ដែលមានសមត្ថភាពខ្ពស់ក្នុងការវិភាគរូបភាព ដោយវាអាចរៀនសម្គាល់លំនាំ និងរូបរាងរបស់ EVs នៅក្នុងរូបភាពមីក្រូទស្សន៍ដោយស្វ័យប្រវត្តិ។ ដូចជាក្មេងដែលរៀនសម្គាល់មុខមនុស្សដោយមើលទៅលើ ទម្រង់មុខ ភ្នែក និងច្រមុះ រហូតដល់ចេះបែងចែកថាជាអ្នកណា។
Nanoparticle Tracking Analysis (NTA) ជាវិធីសាស្ត្រដែលប្រើពន្លឺឡាស៊ែរដើម្បីតាមដានចលនារបស់ភាគល្អិតតូចៗក្នុងសូលុយស្យុង ដើម្បីវាស់ទំហំ និងរាប់ចំនួនរបស់ EVs ឱ្យបានច្បាស់លាស់។ ដូចជាការប៉ាន់ស្មានទំហំកូនទូកក្នុងអ័ព្ទ ដោយសង្កេតមើលល្បឿន និងរបៀបដែលពួកវារង្គើនៅលើផ្ទៃទឹក។
Federated Learning ជាវិធីសាស្ត្របង្រៀន AI ឱ្យរៀនពីទិន្នន័យនៅតាមមន្ទីរពេទ្យច្រើនកន្លែងផ្សេងគ្នា ដោយមិនតម្រូវឱ្យបញ្ជូនទិន្នន័យអ្នកជំងឺចេញពីប្រព័ន្ធដើមឡើយ ដើម្បីការពារសុវត្ថិភាពទិន្នន័យ។ ដូចជាសិស្សរៀនពីសៀវភៅនៅផ្ទះរៀងៗខ្លួន ហើយគ្រាន់តែផ្ញើចម្លើយសង្ខេបទៅគ្រូ ដោយមិនចាំបាច់យកសៀវភៅផ្ទាល់ខ្លួនទៅបង្ហាញអ្នកដទៃ។
Graph Neural Networks (GNNs) ជាគំរូ AI ដែលត្រូវបានរចនាឡើងដើម្បីវិភាគទិន្នន័យដែលមានទំនាក់ទំនងគ្នារញ៉េរញ៉ៃ (ដូចជាបណ្តាញទំនាក់ទំនងរវាងម៉ូលេគុលក្នុង EVs) ដើម្បីយល់ពីរបៀបដែលពួកវាធ្វើការជាមួយគ្នា។ ដូចជាការវិភាគផែនទីបណ្តាញមិត្តភក្តិក្នុងហ្វេសប៊ុក ដើម្បីទស្សន៍ទាយថាព័ត៌មាននឹងសាយភាយទៅដល់អ្នកណាខ្លះ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖