Original Title: Hierarchical Swin Transformer Ensemble with Explainable AI for Robust and Decentralized Breast Cancer Diagnosis
Source: doi.org/10.3390/bioengineering12060651
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

បណ្តុំម៉ូដែល Swin Transformer តាមឋានានុក្រមជាមួយបញ្ញាសិប្បនិម្មិតដែលអាចបកស្រាយបាន សម្រាប់ការធ្វើរោគវិនិច្ឆ័យជំងឺមហារីកសុដន់ប្រកបដោយភាពរឹងមាំ និងវិមជ្ឈការ

ចំណងជើងដើម៖ Hierarchical Swin Transformer Ensemble with Explainable AI for Robust and Decentralized Breast Cancer Diagnosis

អ្នកនិពន្ធ៖ Md. Redwan Ahmed (East West University), Hamdadur Rahman (International American University), Zishad Hossain Limon (Westcliff University), Md Ismail Hossain Siddiqui (Westcliff University), Mahbub Alam Khan (Pacific State University), Al Shahriar Uddin Khondakar Pranta (Wright State University), Rezaul Haque (East West University), S M Masfequier Rahman Swapno (Bangladesh University of Business and Technology), Young-Im Cho (Gachon University), Mohamed S. Abdallah (Gachon University / Electronics Research Institute)

ឆ្នាំបោះពុម្ព៖ 2025, Bioengineering

វិស័យសិក្សា៖ Health Informatics / Machine Learning

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហាប្រឈមនៃម៉ូដែលរៀនស៊ីជម្រៅ (Deep Learning) ក្នុងវិស័យសុខាភិបាល ជាពិសេសទាក់ទងនឹងឯកជនភាពទិន្នន័យ ការរៀនលើសចំណុះកម្រិតដែន (Domain-specific overfitting) និងកង្វះលទ្ធភាពបកស្រាយពីដំណើរការសម្រេចចិត្ត សម្រាប់ការធ្វើរោគវិនិច្ឆ័យជំងឺមហារីកសុដន់។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានស្នើឡើងនូវប្រព័ន្ធ BreastSwinFedNetX ដែលរួមបញ្ចូលបច្ចេកវិទ្យារៀនបែបវិមជ្ឈការ (Federated Learning) ជាមួយបណ្តុំម៉ូដែល Swin Transformer និងបច្ចេកទេសបញ្ញាសិប្បនិម្មិតដែលអាចពន្យល់បាន (Explainable AI)។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
BreastSwinFedNetX (Proposed Method)
បណ្តុំម៉ូដែល Swin Transformer និង Federated Learning (វិធីសាស្ត្រស្នើឡើង)
មានភាពជាក់លាក់ខ្ពស់ក្នុងការធ្វើរោគវិនិច្ឆ័យ រក្សាការសម្ងាត់ទិន្នន័យបានល្អ (Federated Learning) និងមានសមត្ថភាពពន្យល់លទ្ធផល (Grad-CAM)។ អាចចាប់យកលក្ខណៈរូបភាពទាំងកម្រិតតូចនិងធំបានល្អប្រសើរ។ ទាមទារធនធានកុំព្យូទ័រ (GPU) កម្រិតខ្ពស់ និងប្រើប្រាស់ពេលវេលាយូរក្នុងការហ្វឹកហាត់ដោយសារមានការផ្លាស់ប្តូរទិន្នន័យទម្ងន់ម៉ូដែលរវាងស្ថាប័នជាច្រើន (Communication overhead)។ ទទួលបានពិន្ទុ F1 Score ៩៩.៣៤% លើទិន្នន័យ BreakHis និង ៩៨.៨៩% លើទិន្នន័យ INbreast។
Standalone Swin-Large Transformer
ម៉ូដែល Swin-Large Transformer ទោល
ងាយស្រួលក្នុងការរៀបចំនិងដាក់ឱ្យដំណើរការជាងការប្រើប្រាស់ម៉ូដែលបណ្តុំ (Ensemble) ច្រើនបញ្ចូលគ្នា។ ងាយនឹងជួបប្រទះបញ្ហា Overfitting នៅពេលទិន្នន័យមានចំនួនតិច និងខ្វះស្ថិរភាពក្នុងការទាញយកលក្ខណៈពិសេសបើប្រៀបធៀបនឹងម៉ូដែលបណ្តុំ។ ទទួលបានពិន្ទុ F1 Score ត្រឹមតែ ៩៧.៨៨% លើសំណុំទិន្នន័យចម្រុះ (Combined dataset) បើធៀបនឹងម៉ូដែលស្នើឡើងដែលទទួលបាន ៩៨.៣៥%។
Centralized CNN Models (e.g., ResCNN, Inception-V3)
ម៉ូដែល CNN បែបមជ្ឈការ (ប្រមូលផ្តុំទិន្នន័យកន្លែងតែមួយ)
ចំណាយពេលវេលាហ្វឹកហាត់លឿនជាង និងមិនមានភាពស្មុគស្មាញក្នុងការតភ្ជាប់បណ្តាញរវាងស្ថាប័ន។ បំពានលើឯកជនភាពទិន្នន័យអ្នកជំងឺព្រោះត្រូវប្រមូលទិន្នន័យឆៅមកកន្លែងតែមួយ ហើយមិនសូវមានប្រសិទ្ធភាពក្នុងការធ្វើអន្តរកម្មជាមួយទិន្នន័យដែលមកពីប្រភពឬម៉ាស៊ីនថតផ្សេងៗគ្នាឡើយ។ ម៉ូដែល Inception-V3 ទទួលបានភាពត្រឹមត្រូវតែ ៩២.០០% លើទិន្នន័យ BreakHis ខណៈម៉ូដែល FL-L2CNN-BCDet ខ្វះលទ្ធភាពក្នុងការពន្យល់បកស្រាយ (Explainability)។

ការចំណាយលើធនធាន (Resource Cost)៖ ឯកសារនេះបានបញ្ជាក់យ៉ាងច្បាស់អំពីតម្រូវការធនធានកុំព្យូទ័រកម្រិតខ្ពស់បំផុត (High-performance computing) សម្រាប់ការបណ្តុះបណ្តាលម៉ូដែល ជាពិសេសដោយសារការប្រើប្រាស់បច្ចេកវិទ្យា Federated Learning និង Ensemble Transformers។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យសាធារណៈដែលប្រមូលបានពីប្រទេសមួយចំនួនដូចជា ប្រេស៊ីល អេហ្ស៊ីប និងសហរដ្ឋអាមេរិក ដែលមិនមានទិន្នន័យប្រជាជនអាស៊ីអាគ្នេយ៍នោះទេ។ សម្រាប់ប្រទេសកម្ពុជា នេះគឺជាបញ្ហាប្រឈមមួយ ព្រោះស្ត្រីខ្មែរអាចមានលក្ខណៈដង់ស៊ីតេសុដន់ ឬហ្សែនខុសពីទិន្នន័យដើម ដែលតម្រូវឱ្យមានការសាកល្បងនិងកែសម្រួលម៉ូដែលជាមួយទិន្នន័យក្នុងស្រុកជាមុនសិនទើបអាចធានាបាននូវភាពត្រឹមត្រូវខ្ពស់។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់ខ្លាំងសម្រាប់ប្រព័ន្ធសុខាភិបាលកម្ពុជា ក្នុងការដោះស្រាយបញ្ហាកង្វះវេជ្ជបណ្ឌិតឯកទេសរោគមហារីក និងការរក្សាការសម្ងាត់ទិន្នន័យអ្នកជំងឺស្របតាមស្តង់ដារ។

សរុបមក ប្រព័ន្ធនេះមិនត្រឹមតែជួយពន្លឿនការវិនិច្ឆ័យជំងឺមហារីកសុដន់ប៉ុណ្ណោះទេ តែថែមទាំងផ្តល់នូវហេដ្ឋារចនាសម្ព័ន្ធសុវត្ថិភាពខ្ពស់សម្រាប់ការស្រាវជ្រាវវេជ្ជសាស្ត្រឆ្លងស្ថាប័ននៅក្នុងប្រទេសកម្ពុជាផងដែរ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ជំហានទី១៖ សិក្សាអំពីស្ថាបត្យកម្ម Vision Transformers: និស្សិតគួរចាប់ផ្តើមដោយការសិក្សាមូលដ្ឋានគ្រឹះនៃម៉ូដែល Swin Transformer និងការសរសេរកូដដោយប្រើប្រាស់បណ្ណាល័យ PyTorch សម្រាប់ការចាត់ថ្នាក់រូបភាពវេជ្ជសាស្ត្រកម្រិតមូលដ្ឋាន។
  2. ជំហានទី២៖ រៀបចំ និងកែច្នៃទិន្នន័យរូបភាព (Data Preprocessing): ទាញយកសំណុំទិន្នន័យសាធារណៈតូចៗដូចជា BUSI រួចអនុវត្តបច្ចេកទេសបន្សុទ្ធរូបភាព និង Data Augmentation (ឧ. CLAHE, Elastic Transform) ដោយប្រើប្រាស់ OpenCV និង scikit-image
  3. ជំហានទី៣៖ អភិវឌ្ឍប្រព័ន្ធហ្វឹកហាត់បែបវិមជ្ឈការ (Federated Learning): សាកល្បងបង្កើតបណ្តាញ Federated Learning ខ្នាតតូច (ឧ. ក្លែងធ្វើមន្ទីរពេទ្យចំនួន២ជា Clients) ដោយប្រើប្រាស់ Frameworks ដូចជា Flower (flwr) ដើម្បីយល់ពីដំណើរការ Federated Averaging (FedAvg) ក្នុងការបូកបញ្ចូលទម្ងន់ម៉ូដែល។
  4. ជំហានទី៤៖ បញ្ចូលបច្ចេកទេសបញ្ញាសិប្បនិម្មិតដែលអាចបកស្រាយបាន (Explainable AI): អនុវត្តកូដ Grad-CAM ទៅលើម៉ូដែលដែលបានហ្វឹកហាត់រួច ដើម្បីទាញយកផែនទីកម្តៅ (Heatmaps) ដែលបង្ហាញពីតំបន់សង្ស័យមហារីក ដើម្បីជួយដល់ការផ្ទៀងផ្ទាត់ដោយភ្នែក។
  5. ជំហានទី៥៖ បង្កើតកម្មវិធីប្រើប្រាស់ជាក់ស្តែង (Web Deployment): ប្រើប្រាស់ FastAPI សម្រាប់បង្កើត Backend API និង React.js សម្រាប់ Frontend រួចភ្ជាប់វាទៅនឹងម៉ូដែល AI ដើម្បីបង្កើតជាប្រព័ន្ធចំណុចប្រទាក់មួយដែលគ្រូពេទ្យអាចអាប់ឡូតរូបភាព និងទទួលបានលទ្ធផលភ្លាមៗ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Federated Learning (FL) បច្ចេកវិទ្យារៀនម៉ាស៊ីនបែបវិមជ្ឈការ ដែលអនុញ្ញាតឱ្យស្ថាប័ន ឬមន្ទីរពេទ្យជាច្រើនរួមគ្នាហ្វឹកហាត់ម៉ូដែល AI តែមួយ ដោយមិនចាំបាច់បញ្ជូនទិន្នន័យឯកជន (ដូចជារូបភាពអ្នកជំងឺ) ចេញពីកន្លែងរបស់ខ្លួនឡើយ។ ពួកគេគ្រាន់តែផ្ញើការរៀនសូត្រ (Model weights) ទៅកាន់ម៉ាស៊ីនកណ្តាលប៉ុណ្ណោះ។ ដូចជាសិស្សរៀនសូត្រនៅផ្ទះរៀងៗខ្លួន រួចយកតែចំណេះដឹងដែលទទួលបានទៅចែករំលែកប្រាប់គ្រូ ដោយមិនបាច់យកសៀវភៅកំណត់ត្រាផ្ទាល់ខ្លួនទៅបង្ហាញគ្រូនោះទេ។
Swin Transformer ប្រភេទនៃម៉ូដែលរៀនស៊ីជម្រៅ (Deep Learning) សម្រាប់វិភាគរូបភាព ដែលបែងចែករូបភាពជាផ្ទាំងតូចៗ (Patches) ហើយប្រើប្រាស់យន្តការយកចិត្តទុកដាក់ (Self-attention) តាមលំដាប់ថ្នាក់ ដើម្បីស្វែងយល់ពីទំនាក់ទំនងរវាងផ្នែកតូចៗនីមួយៗ និងរូបភាពទាំងមូលកម្រិតខ្ពស់។ ដូចជាការមើលផ្ទាំងគំនូរផ្គុំ (Jigsaw puzzle) ដោយដំបូងមើលបំណែកតូចៗនីមួយៗ រួចបន្តមើលបំណែកដែលផ្គុំចូលគ្នាបន្តិចម្តងៗរហូតឃើញរូបរាងទាំងមូលយ៉ាងច្បាស់។
Explainable AI (XAI) បច្ចេកទេសក្នុងបញ្ញាសិប្បនិម្មិតដែលជួយពន្យល់ និងបង្ហាញពីហេតុផលនៅពីក្រោយការសម្រេចចិត្តរបស់ម៉ូដែល ដូចជាការប្រើប្រាស់បច្ចេកទេស Grad-CAM ដើម្បីផាត់ពណ៌លើតំបន់រូបភាពដែលម៉ូដែលគិតថាជាកោសិកាមហារីក។ ដូចជាគ្រូពេទ្យវះកាត់ដែលមិនត្រឹមតែប្រាប់ថាអ្នកមានជំងឺទេ តែថែមទាំងចង្អុលបង្ហាញចំកន្លែងដែលឈឺនៅលើរូបថតសួត ឬកាំរស្មីអ៊ិច (X-ray) ដើម្បីឱ្យយើងជឿជាក់ងាយយល់។
Ensemble Learning វិធីសាស្ត្រក្នុងការបណ្តុះបណ្តាលម៉ូដែល AI ដោយការរួមបញ្ចូលគ្នានូវម៉ូដែលតូចៗជាច្រើន ដើម្បីធ្វើការទស្សន៍ទាយរួមគ្នា ដែលជួយបង្កើនភាពត្រឹមត្រូវ និងកាត់បន្ថយកំហុសឆ្គងបានល្អជាងការប្រើម៉ូដែលតែមួយឯកឯង។ ដូចជាការសួរសំណួរទៅកាន់ក្រុមអ្នកជំនាញ៥នាក់ រួចយកចម្លើយរបស់ពួកគេមកបូកសរុបបញ្ចូលគ្នា ដើម្បីទទួលបានចម្លើយមួយដែលត្រឹមត្រូវបំផុត ជាងការស្តាប់តាមការសម្រេចចិត្តរបស់មនុស្សតែម្នាក់។
Data Augmentation បច្ចេកទេសបង្កើតទិន្នន័យថ្មីៗបន្ថែមពីទិន្នន័យដើមដែលមានស្រាប់ តាមរយៈការបង្វិលរូបភាព ត្រឡប់រូបភាព ផ្លាស់ប្តូរពន្លឺ ឬបន្ថែមភាពស្រអាប់ ដើម្បីជួយម៉ូដែលឱ្យរៀនបានកាន់តែច្រើន លម្អិត និងកាត់បន្ថយបញ្ហា Overfitting (ទន្ទេញចាំតែទិន្នន័យចាស់)។ ដូចជាការបង្រៀនក្មេងឱ្យស្គាល់សត្វឆ្មា ដោយឱ្យគេមើលរូបឆ្មាពីមុខ ពីចំហៀង ពេលងងឹត និងពេលភ្លឺ ដើម្បីឱ្យគេអាចចំណាំឆ្មាបានគ្រប់កាលៈទេសៈ និងគ្រប់ទីកន្លែង។
Homomorphic Encryption ប្រព័ន្ធអ៊ិនគ្រីបទិន្នន័យកម្រិតខ្ពស់ដែលអនុញ្ញាតឱ្យកុំព្យូទ័រអាចគណនា និងដំណើរការលើទិន្នន័យដែលកំពុងជាប់សោរ (Encrypted) ដោយមិនចាំបាច់ដោះសោរជាមុន ដែលជួយការពារការលួចទិន្នន័យក្នុងពេលម៉ាស៊ីនធ្វើការហ្វឹកហាត់រួមគ្នា។ ដូចជាការដាក់មាសក្នុងប្រអប់ដែកបិទជិតមួយ រួចឱ្យជាងទងវាយធ្វើជាខ្សែកតាមរន្ធស្រោមដៃពីក្រៅ ដោយជាងមិនអាចលួចយកមាសចេញពីប្រអប់បានឡើយ តែមាសនៅតែអាចក្លាយជាខ្សែក។
Federated Averaging (FedAvg) ក្បួនដោះស្រាយ (Algorithm) ចម្បងនៅក្នុង Federated Learning ដែលមានតួនាទីប្រមូលយកការអាប់ដេតទម្ងន់នៃម៉ូដែលពីគ្រប់ស្ថាប័ន (Clients) មកបូកបញ្ចូលគ្នា រួចចែកជាមធ្យម ដើម្បីបង្កើតជាម៉ូដែលកណ្តាលមួយ (Global Model) ដែលឆ្លាតជាងមុន។ ដូចជាការប្រមូលយកគំនិតល្អៗពីសិស្សពូកែៗគ្រប់គ្នានៅក្នុងថ្នាក់ យកមកសរសេរចូលគ្នាក្នុងសៀវភៅមេរៀនរួមមួយ ដើម្បីឱ្យក្លាយជាសៀវភៅដ៏ល្អឥតខ្ចោះ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖