Original Title: Advanced Feature Selection Techniques in Medical Imaging—A Systematic Literature Review
Source: doi.org/10.32604/cmc.2025.066932
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

បច្ចេកទេសជ្រើសរើសលក្ខណៈពិសេសកម្រិតខ្ពស់នៅក្នុងរូបភាពវេជ្ជសាស្ត្រ—ការពិនិត្យឡើងវិញនូវអក្សរសិល្ប៍ជាប្រព័ន្ធ

ចំណងជើងដើម៖ Advanced Feature Selection Techniques in Medical Imaging—A Systematic Literature Review

អ្នកនិពន្ធ៖ Sunawar Khan (National College of Business Administration and Economics), Tehseen Mazhar, Naila Sammar Naz, Fahed Ahmed, Tariq Shahzad, Atif Ali, Muhammad Adnan Khan, Habib Hamam

ឆ្នាំបោះពុម្ព៖ 2025 Computers, Materials & Continua

វិស័យសិក្សា៖ Artificial Intelligence in Medicine

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហាប្រឈមនៃទិន្នន័យរូបភាពវេជ្ជសាស្ត្រដែលមានវិមាត្រខ្ពស់ និងស្មុគស្មាញ ដោយពិនិត្យមើលភាពជឿនលឿននៃវិធីសាស្ត្រជ្រើសរើសលក្ខណៈពិសេស (Feature Selection) ដើម្បីកែលម្អភាពត្រឹមត្រូវនៃការវិនិច្ឆ័យរោគនិងកាត់បន្ថយបន្ទុកនៃការគណនា។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់វិធីសាស្ត្រពិនិត្យអក្សរសិល្ប៍ជាប្រព័ន្ធ (Systematic Literature Review) ផ្អែកលើគោលការណ៍ PRISMA ដើម្បីវិភាគអត្ថបទស្រាវជ្រាវចំនួន ១៧៤ ដែលពាក់ព័ន្ធ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Classical Feature Selection (Filter, Wrapper, Embedded)
វិធីសាស្ត្រជ្រើសរើសលក្ខណៈពិសេសបែបបុរាណ (Filter, Wrapper, Embedded)
ដំណើរការលឿន ស៊ីធនធានកុំព្យូទ័រតិច និងងាយស្រួលបកស្រាយលទ្ធផលសម្រាប់គ្រូពេទ្យ។ មិនសូវមានប្រសិទ្ធភាពសម្រាប់ទិន្នន័យរូបភាពវេជ្ជសាស្ត្រស្មុគស្មាញ និងទំហំធំ (High-dimensional data)។ ស័ក្តិសមបំផុតសម្រាប់ការវិភាគរោគវិនិច្ឆ័យសាមញ្ញ ប៉ុន្តែខ្វះភាពជាក់លាក់លើទិន្នន័យពហុទម្រង់។
Deep Learning Feature Selection (CNN, Autoencoders, Transformers)
វិធីសាស្ត្រជ្រើសរើសតាមរយៈ Deep Learning (CNN, Autoencoders, ViT)
មានភាពត្រឹមត្រូវខ្ពស់ និងមានសមត្ថភាពទាញយកលក្ខណៈពិសេសដោយស្វ័យប្រវត្តិពីរូបភាពស្មុគស្មាញដោយមិនបាច់កំណត់ដោយដៃ។ ទាមទារថាមពលកុំព្យូទ័រខ្ពស់ (ចំណាយច្រើន) និងពិបាកក្នុងការបកស្រាយលទ្ធផលឱ្យបានច្បាស់លាស់ (Black-box)។ មានប្រសិទ្ធភាពខ្ពស់ក្នុងការរកឃើញដុំសាច់ខួរក្បាល និងជំងឺអាល់ហ្សៃមឺរ (Alzheimer's) ទោះបីជាខ្វះតម្លាភាពក៏ដោយ។
Hybrid Feature Selection (Classical + Deep Learning)
វិធីសាស្ត្រជ្រើសរើសកូនកាត់ (ការបញ្ចូលគ្នារវាងវិធីសាស្ត្របុរាណ និង Deep Learning)
ផ្តល់តុល្យភាពដ៏ល្អរវាងភាពត្រឹមត្រូវនៃការទស្សន៍ទាយ និងភាពងាយស្រួលក្នុងការបកស្រាយលទ្ធផល (Interpretability)។ ប្រឈមនឹងបញ្ហានៃការធ្វើមាត្រដ្ឋាន (Scalability) នៅពេលអនុវត្តលើសំណុំទិន្នន័យពហុទម្រង់ទំហំធំ។ អាចរក្សាបាននូវភាពត្រឹមត្រូវខ្ពស់ ព្រមទាំងផ្តល់ទំនុកចិត្តដល់គ្លីនិកបានច្រើនជាង Deep Learning សុទ្ធ។
Quantum Feature Selection (QFS)
វិធីសាស្ត្រជ្រើសរើសដោយប្រើកុំព្យូទ័រកង់ទិច (Quantum Computing)
មានសក្តានុពលក្នុងការពន្លឿនការគណនាជាអិចស្ប៉ូណង់ស្យែលសម្រាប់ទិន្នន័យទំហំធំមហិមា ដែលវិធីសាស្ត្រធម្មតាមិនអាចធ្វើបាន។ បច្ចុប្បន្នស្ថិតក្នុងដំណាក់កាលពិសោធន៍នៅឡើយ ដោយផ្នែករឹង (Hardware) និងក្បួនដោះស្រាយមិនទាន់មានភាពចាស់ទុំពេញលេញ។ ទោះបីជាផ្តល់ល្បឿនលឿនក្នុងទ្រឹស្តី ប៉ុន្តែលទ្ធភាពនៃការអនុវត្តក្នុងគ្លីនិកបច្ចុប្បន្ននៅមានកម្រិតទាបនៅឡើយ (Currently low applicability)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការប្រើប្រាស់វិធីសាស្ត្រជ្រើសរើសលក្ខណៈពិសេសកម្រិតខ្ពស់ ជាពិសេស Deep Learning ទាមទារឱ្យមានធនធានកុំព្យូទ័រ និងទិន្នន័យយ៉ាងច្រើន ប៉ុន្តែម៉ូដែលប្រភេទ Lightweight អាចជួយកាត់បន្ថយបន្ទុកនេះបានខ្លះសម្រាប់ការប្រើប្រាស់ទូទៅ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ឯកសារនេះបានសង្កត់ធ្ងន់ថា ប្រសិនបើម៉ូដែល AI ត្រូវបានបង្វឹកលើទិន្នន័យដែលខ្វះភាពចម្រុះ (Demographic bias) វានឹងបង្កើតឱ្យមានភាពលម្អៀង និងកំហុសក្នុងការវិនិច្ឆ័យ។ សម្រាប់ប្រទេសកម្ពុជា ចំណុចនេះមានសារៈសំខាន់ខ្លាំងណាស់ ព្រោះយើងទាមទារឱ្យមានការប្រមូលសំណុំទិន្នន័យរូបភាពវេជ្ជសាស្ត្ររបស់អ្នកជំងឺក្នុងស្រុកផ្ទាល់ ដើម្បីធានាថាម៉ូដែលទាំងនេះមិនរើសអើង និងផ្តល់លទ្ធផលត្រឹមត្រូវសម្រាប់លក្ខណៈជីវសាស្ត្ររបស់ប្រជាជនខ្មែរ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រកម្រិតខ្ពស់ទាំងនេះពិតជាមានសក្តានុពលក្នុងការផ្លាស់ប្តូរ និងធ្វើទំនើបកម្មប្រព័ន្ធថែទាំសុខភាពនៅកម្ពុជាតាមរយៈការធ្វើរោគវិនិច្ឆ័យជំងឺកាន់តែច្បាស់លាស់។

ជារួម បច្ចេកវិទ្យាទាំងនេះអាចជួយលើកកម្ពស់គុណភាពវិស័យសុខាភិបាលកម្ពុជាឱ្យឈានដល់កម្រិតអន្តរជាតិ ប៉ុន្តែត្រូវចាប់ផ្តើមពីការវិនិយោគលើហេដ្ឋារចនាសម្ព័ន្ធទិន្នន័យ និងការបណ្តុះបណ្តាលធនធានមនុស្សជាមុនសិន។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាពីមូលដ្ឋានគ្រឹះនៃទិន្នន័យរូបភាពវេជ្ជសាស្ត្រ (Medical Imaging Data): ស្វែងយល់ពីទម្រង់ទិន្នន័យវេជ្ជសាស្ត្រស្តង់ដារដូចជា DICOM និងអនុវត្តការសម្អាតទិន្នន័យ (Preprocessing) លើរូបភាព MRI ឬ CT ដោយប្រើប្រាស់បណ្ណាល័យ Pydicom និង OpenCV
  2. អនុវត្តវិធីសាស្ត្រជ្រើសរើសលក្ខណៈពិសេសបែបបុរាណ (Classical FS): ចាប់ផ្តើមជាមួយសំណុំទិន្នន័យតូចៗសិន ដោយប្រើប្រាស់ Scikit-learn នៅក្នុង Python ដើម្បីអនុវត្តវិធីសាស្ត្រកាត់បន្ថយវិមាត្រទិន្នន័យដូចជា PCA, Recursive Feature Elimination (RFE), និង LASSO Regression។
  3. អភិវឌ្ឍម៉ូដែល Deep Learning និង Explainable AI (XAI): ប្រើប្រាស់ PyTorchTensorFlow ដើម្បីបង្កើតម៉ូដែល CNNs ទាញយកលក្ខណៈពិសេសដោយស្វ័យប្រវត្តិ ព្រមទាំងបញ្ចូលបណ្ណាល័យ SHAPGrad-CAM ដើម្បីធ្វើឱ្យលទ្ធផលដែលបញ្ចេញដោយ AI ងាយស្រួលយល់សម្រាប់គ្រូពេទ្យគ្លីនិក។
  4. ស្រាវជ្រាវលើបច្ចេកទេស Lightweight និង Federated Learning: សាកល្បងប្រើម៉ូដែលដែលស៊ីថាមពលតិចដូចជា MobileNetV3 សម្រាប់ការដាក់ឱ្យប្រើប្រាស់លើឧបករណ៍ចល័ត (Edge devices) និងសិក្សាពី Frameworks ដូចជា PySyft ដើម្បីយល់ពីរបៀបរៀបចំប្រព័ន្ធ Federated Learning ដែលរក្សាការសម្ងាត់ទិន្នន័យអ្នកជំងឺ។
  5. តាមដានបច្ចេកវិទ្យាកុំព្យូទ័រកង់ទិច (Quantum Computing): ត្រៀមខ្លួនសម្រាប់បច្ចេកវិទ្យានាពេលអនាគតដោយស្វែងយល់ពីមូលដ្ឋានគ្រឹះនៃ Quantum Machine Learning តាមរយៈការសាកល្បងប្រើប្រាស់ Qiskit របស់ក្រុមហ៊ុន IBM លើការដោះស្រាយបញ្ហា Optimization សម្រាប់សំណុំទិន្នន័យធំៗ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Feature selection ដំណើរការត្រងយកតែទិន្នន័យ ឬលក្ខណៈសំខាន់ៗបំផុតពីសំណុំទិន្នន័យដ៏ធំមួយ ដើម្បីយកមកឱ្យកុំព្យូទ័រវិភាគ ដែលជួយកាត់បន្ថយទិន្នន័យស្ទួន និងធ្វើឱ្យប្រព័ន្ធដំណើរការបានលឿនជាងមុន។ ដូចជាការរើសយកតែគ្រឿងផ្សំសំខាន់ៗបំផុតសម្រាប់ធ្វើម្ហូបមួយមុខ ដោយបោះចោលគ្រឿងផ្សំដែលមិនចាំបាច់ដើម្បីសន្សំពេលវេលា និងថវិកា។
Curse of dimensionality បញ្ហាដែលកើតឡើងនៅពេលសំណុំទិន្នន័យមានចំនួនអថេរ (Features) ច្រើនជ្រុលពេក ដែលធ្វើឱ្យម៉ូដែល AI ពិបាករៀន ស៊ីធនធានកុំព្យូទ័រខ្លាំង និងងាយផ្តល់លទ្ធផលខុស។ ដូចជាការស្វែងរកសៀវភៅមួយក្បាលក្នុងបណ្ណាល័យដែលធំពេក និងមានសៀវភៅច្រើនប្រភេទលាយឡំគ្នាពេក ធ្វើឱ្យយើងកាន់តែពិបាក និងចំណាយពេលយូរក្នុងការស្វែងរក។
Explainable AI (XAI) បច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិតដែលត្រូវបានរចនាឡើងដើម្បីពន្យល់ពីហេតុផល ឬដំណើរការនៃការសម្រេចចិត្តរបស់វាទៅកាន់មនុស្សវិញបាន ដើម្បីលុបបំបាត់ភាពលាក់កំបាំង (Black-box) និងបង្កើនទំនុកចិត្តពីគ្រូពេទ្យ។ ដូចជាសិស្សពូកែដែលមិនត្រឹមតែប្រាប់ចម្លើយគណិតវិទ្យា ប៉ុន្តែថែមទាំងបង្ហាញពីរបៀបគណនាជាជំហានៗ ដើម្បីឱ្យគ្រូជឿជាក់លើចម្លើយនោះ។
Quantum Feature Selection ការប្រើប្រាស់គោលការណ៍កុំព្យូទ័រកង់ទិច (Quantum Computing) ដូចជា Superposition ដើម្បីទាញយក និងជ្រើសរើសលក្ខណៈពិសេសពីសំណុំទិន្នន័យដ៏ធំមហិមាក្នុងល្បឿនលឿនជាអិចស្ប៉ូណង់ស្យែល ដែលកុំព្យូទ័រធម្មតាមិនអាចធ្វើបាន។ ដូចជាសមត្ថភាពក្នុងការអានសៀវភៅគ្រប់ទំព័រទាំងអស់ក្នុងពេលតែមួយ ខណៈដែលវិធីធម្មតាត្រូវអានម្តងមួយទំព័រ។
Convolutional Neural Networks (CNNs) ប្រភេទនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (Deep Learning) ដែលពូកែខាងវិភាគរូបភាព ដោយវាអាចស្វែងរកទម្រង់ និងលក្ខណៈលម្អិត (ដូចជាគែម រូបរាង ឬពណ៌) នៃរូបភាពវេជ្ជសាស្ត្រដោយស្វ័យប្រវត្តិ។ ដូចជាកែវពង្រីកដែលស្កេនមើលរូបភាពម្តងមួយកន្លែងៗ ដើម្បីរកមើលចំណុចខុសប្រក្រតីតូចៗដែលភ្នែកមនុស្សអាចមើលរំលង។
Federated learning វិធីសាស្ត្របង្វឹកម៉ូដែល AI តាមរយៈកុំព្យូទ័រឬមន្ទីរពេទ្យជាច្រើនដាច់ដោយឡែកពីគ្នា ដោយមិនចាំបាច់ប្រមូលទិន្នន័យឯកជនរបស់អ្នកជំងឺមកដាក់កណ្តាលរួមគ្នានោះទេ ដែលជួយរក្សាសុវត្ថិភាពនិងឯកជនភាពទិន្នន័យបានយ៉ាងល្អ។ ដូចជាមេចុងភៅរៀនរូបមន្តធ្វើម្ហូបពីភោជនីយដ្ឋានជាច្រើន ដោយមិនចាំបាច់យកគ្រឿងផ្សំផ្ទាល់របស់ភោជនីយដ្ឋានទាំងនោះមកផ្ទះនោះឡើយ។
Multi-modal data fusion ការបញ្ចូលគ្នានូវទិន្នន័យដែលបានមកពីប្រភពផ្សេងៗគ្នា (ឧទាហរណ៍ រូបភាព MRI, CT scan និងព័ត៌មានប្រវត្តិជំងឺ) ដើម្បីបញ្ជូនទៅឱ្យ AI វិភាគយកលទ្ធផលមួយដែលច្បាស់លាស់ និងពេញលេញជាងមុន។ ដូចជាការស្តាប់សាក្សីជាច្រើននាក់និយាយពីមុំផ្សេងៗគ្នានៃព្រឹត្តិការណ៍មួយ ដើម្បីវាយតម្លៃរកការពិតឱ្យបានច្បាស់លាស់។
Feature disentanglement ការបំបែកលក្ខណៈពិសេសរបស់ទិន្នន័យទៅជាផ្នែកឯករាជ្យពីគ្នា ឧទាហរណ៍ បំបែកទម្រង់រចនាសម្ព័ន្ធសរីរាង្គចេញពីពន្លឺ ឬសំឡេងរំខានរបស់ម៉ាស៊ីនថត ដើម្បីឱ្យម៉ូដែល AI ងាយស្រួលធ្វើរោគវិនិច្ឆ័យដោយមិនភាន់ច្រឡំ។ ដូចជាការប្រើប្រាស់ម៉ាស៊ីនដើម្បីច្រោះយកតែសម្លេងច្រៀងរបស់អ្នកចម្រៀង ចេញពីសម្លេងឧបករណ៍តន្ត្រី និងសម្លេងរំខានខាងក្រៅ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖