Original Title: Advancements in Medicinal Plant Identification Using Deep Learning Techniques: A Comprehensive Review
Source: doi.org/10.1142/S2196888825300017
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

វឌ្ឍនភាពក្នុងការកំណត់អត្តសញ្ញាណរុក្ខជាតិឱសថដោយប្រើប្រាស់បច្ចេកទេស Deep Learning៖ ការត្រួតពិនិត្យដ៏ទូលំទូលាយ

ចំណងជើងដើម៖ Advancements in Medicinal Plant Identification Using Deep Learning Techniques: A Comprehensive Review

អ្នកនិពន្ធ៖ Trien Phat Tran (University of New England), Fareed Ud Din (University of New England), Ljiljana Brankovic (University of New England), Cesar Sanin (University of New England), Susan M. Hester (University of New England)

ឆ្នាំបោះពុម្ព៖ 2025 Vietnam Journal of Computer Science

វិស័យសិក្សា៖ Computer Science & Artificial Intelligence

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការកំណត់អត្តសញ្ញាណរុក្ខជាតិឱសថប្រកបដោយភាពត្រឹមត្រូវគឺមានសារៈសំខាន់សម្រាប់ការប្រើប្រាស់ជាឱសថបុរាណនិងការអភិរក្សជីវចម្រុះ ប៉ុន្តែជួបប្រទះបញ្ហាប្រឈមដោយសារភាពខុសគ្នានៃរូបរាង និងលក្ខខណ្ឌបរិស្ថានដែលធ្វើឱ្យងាយនឹងមានការភាន់ច្រឡំ។ ការសិក្សានេះវាយតម្លៃលើប្រសិទ្ធភាពនិងបញ្ហាប្រឈមនៃការប្រើប្រាស់បច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិតដើម្បីដោះស្រាយបញ្ហានេះ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះគឺជាការពិនិត្យឡើងវិញជាប្រព័ន្ធ (Systematic Literature Review) នៃឯកសារស្រាវជ្រាវចំនួន ៣០ ទាក់ទងនឹងការប្រើប្រាស់ Deep Learning សម្រាប់ការចាត់ថ្នាក់រូបភាពរុក្ខជាតិឱសថ។

ការចម្រាញ់និងវិភាគអត្ថបទស្រាវជ្រាវ (Systematic Literature Review) ចំនួន ៣០ អត្ថបទ
ការវិភាគវិធីសាស្ត្រប្រមូលទិន្នន័យ (Data Collection Methods) ដូចជាការចុះប្រមូលដោយផ្ទាល់ ការប្រើប្រាស់ដ្រូន និងប្រព័ន្ធអ៊ីនធឺណិត
ការវាយតម្លៃលើម៉ូដែលកុំព្យូទ័រ (Deep Learning Architectures) ជាពិសេស Convolutional Neural Networks (CNNs) និង Transfer Learning
ការវាយតម្លៃផ្អែកលើលក្ខណៈសរីរាង្គរុក្ខជាតិ (Organ-based Classification) ដូចជា ស្លឹក ផ្កា និងដើមទាំងមូល

លទ្ធផលសំខាន់ៗ (The Verdict)៖

បណ្តាញ Convolutional Neural Networks (CNNs) ទទួលបានភាពត្រឹមត្រូវខ្ពស់រហូតដល់ជាង ៩០% ជាពិសេសសម្រាប់ការកំណត់អត្តសញ្ញាណតាមរយៈស្លឹកនៅក្នុងលក្ខខណ្ឌគ្រប់គ្រងបាន។
ការប្រមូលទិន្នន័យដោយផ្ទាល់នៅទីវាល (Manual Fieldwork) ត្រូវបានប្រើប្រាស់ច្រើនជាងគេ (៧៣.៣៣%) ខណៈដែលការប្រមូលទិន្នន័យតាមប្រព័ន្ធមហាជន (Crowdsourcing) និងដ្រូននៅមានកម្រិតនៅឡើយ។
ការរួមបញ្ចូលម៉ូដែល Deep Learning ទៅក្នុងកម្មវិធីទូរស័ព្ទដៃមានសក្តានុពលខ្ពស់ ប៉ុន្តែការសិក្សាភាគច្រើននៅខ្វះប្រព័ន្ធតាមដានព័ត៌មានត្រឡប់ពីអ្នកប្រើប្រាស់ (User Feedback Mechanisms) ដើម្បីធ្វើបច្ចុប្បន្នភាពម៉ូដែលជាបន្តបន្ទាប់នៅក្នុងពិភពជាក់ស្តែង។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Manual/Lab-based Data Collection + CNNs ការប្រមូលទិន្នន័យដោយផ្ទាល់ និងការប្រើប្រាស់បណ្តាញ CNNs	ទិន្នន័យមានគុណភាពខ្ពស់ ងាយស្រួលគ្រប់គ្រងពន្លឺ និងផ្ទៃខាងក្រោយ ដែលជួយឱ្យម៉ូដែលទទួលបានភាពត្រឹមត្រូវខ្ពស់។	ចំណាយពេលវេលានិងធនធានច្រើនក្នុងការប្រមូល ព្រមទាំងពិបាកក្នុងការពង្រីកទំហំទិន្នន័យសម្រាប់ប្រភេទរុក្ខជាតិច្រើនប្រភេទនៅក្នុងពិភពជាក់ស្តែង។	ទទួលបានភាពត្រឹមត្រូវខ្ពស់ ចន្លោះពី ៧៥% ទៅ ១០០% (ភាគច្រើនលើសពី ៩០%) ផ្អែកលើទិន្នន័យពិសោធន៍ដែលបានគ្រប់គ្រងល្អ។
Crowdsourced/Online Data + Deep Learning ការប្រមូលទិន្នន័យតាមប្រព័ន្ធមហាជន/អនឡាញ និង Deep Learning	មានភាពងាយស្រួលក្នុងការពង្រីកទំហំទិន្នន័យ (Scalability) ទូលំទូលាយ និងទទួលបានភាពចម្រុះនៃរូបភាពពីរូបភាពជាក់ស្តែង។	រូបភាពមានគុណភាពមិនស្មើគ្នា ពន្លឺខុសៗគ្នា និងមានភាពរំខាន (Noise) ច្រើនដែលទាមទារការពង្រីកទិន្នន័យ (Data Augmentation) ដើម្បីកែលម្អភាពត្រឹមត្រូវ។	ភាពត្រឹមត្រូវជាទូទៅចន្លោះពី ៧១% ទៅ ៩៣% អាស្រ័យលើការកែលម្អទិន្នន័យ និងវិធីសាស្ត្របង្វឹកម៉ូដែល។
Leaf-based vs. Multi-organ Classification ការចាត់ថ្នាក់ផ្អែកលើស្លឹក ធៀបនឹងសរីរាង្គចម្រុះ	ការប្រើស្លឹកតែមួយមុខផ្តល់ភាពងាយស្រួលក្នុងការទាញយកលក្ខណៈសម្គាល់ ចំណែកការប្រើសរីរាង្គចម្រុះជួយរំលេចលក្ខណៈរុក្ខជាតិទាំងមូល។	សរីរាង្គចម្រុះ (ផ្កា ដើម ឫស) មានភាពស្មុគស្មាញខ្ពស់ក្នុងការវិភាគ ខណៈស្លឹកអាចទទួលរងផលប៉ះពាល់ពីរដូវកាលនិងភាពចាស់ខ្ចី។	ការប្រើស្លឹកទទួលបានភាពត្រឹមត្រូវរហូតដល់ ៩៩.៨% ចំណែកការប្រើសរីរាង្គចម្រុះនិងដើមទាំងមូលមានភាពត្រឹមត្រូវប្រែប្រួលខ្ពស់ (៨៥%-៩៥%)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះមិនបានបញ្ជាក់លម្អិតអំពីទំហំទឹកប្រាក់នោះទេ ប៉ុន្តែការអភិវឌ្ឍប្រព័ន្ធកំណត់អត្តសញ្ញាណរុក្ខជាតិទាមទារនូវធនធានបច្ចេកវិទ្យា កម្លាំងកុំព្យូទ័រ និងអ្នកជំនាញច្បាស់លាស់។

Hardware: តម្រូវឱ្យមានកុំព្យូទ័រដែលមានអង្គគណនាក្រាហ្វិក (GPU) ខ្ពស់សម្រាប់ការបង្ហាត់ម៉ូដែល និងទូរស័ព្ទឆ្លាតវៃ (Smartphones) សម្រាប់ការប្រើប្រាស់នៅទីវាល។
Software: ក្របខណ្ឌ Deep Learning សម្រាប់អភិវឌ្ឍម៉ូដែល និងឧបករណ៍ឬកម្មវិធីសម្រាប់បង្កើត Mobile Apps ក៏ដូចជាប្រព័ន្ធផ្ទុកទិន្នន័យ (Cloud Data Storage)។
Dataset: ការប្រមូលទិន្នន័យរូបភាពរុក្ខជាតិឱសថដែលសម្បូរបែប និងមានគុណភាពខ្ពស់ (ទាំងស្រស់ និងក្រៀម) ដែលបានរៀបចំនិងចាត់ថ្នាក់ត្រឹមត្រូវ។
Expertise: អ្នកជំនាញផ្នែកបញ្ញាសិប្បនិម្មិត (AI/Deep Learning) អ្នកជំនាញរុក្ខសាស្ត្រ និងអ្នកជំនាញឱសថបុរាណដើម្បីផ្តល់ការផ្ទៀងផ្ទាត់ (Ground Truth)។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សាភាគច្រើន (ជិត៦០%) ត្រូវបានធ្វើឡើងនៅប្រទេសឥណ្ឌា ចិន ម៉ាឡេស៊ី និងវៀតណាម ដោយប្រើប្រាស់ប្រភេទរុក្ខជាតិឱសថប្រចាំតំបន់ទាំងនោះ។ ការខ្វះខាតទិន្នន័យរុក្ខជាតិឱសថពីប្រទេសកម្ពុជាមានន័យថាម៉ូដែលដែលមានស្រាប់ទាំងនេះអាចនឹងមិនស្គាល់រុក្ខជាតិឱសថបុរាណខ្មែរ (Kru Khmer Medicine) បានត្រឹមត្រូវនោះទេ ដោយសារភាពខុសគ្នានៃរូបរាង និងបរិស្ថានដាំដុះនៅក្នុងតំបន់។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកវិទ្យានេះមានសក្តានុពល និងអត្ថប្រយោជន៍យ៉ាងធំធេងសម្រាប់ប្រទេសកម្ពុជា ដែលជាប្រទេសសម្បូរទៅដោយរុក្ខជាតិឱសថនិងប្រវត្តិប្រើប្រាស់ឱសថបុរាណ។

មជ្ឈមណ្ឌលជាតិស្រាវជ្រាវវេជ្ជសាស្ត្របូរាណ (NTCMP): អាចប្រើប្រាស់ប្រព័ន្ធនេះដើម្បីចងក្រងនិងផ្ទៀងផ្ទាត់ប្រភេទរុក្ខជាតិឱសថខ្មែរឱ្យបានត្រឹមត្រូវ ជៀសវាងការប្រើប្រាស់ខុសដែលនាំឱ្យប៉ះពាល់ដល់សុខភាពប្រជាជន។
សហគមន៍ជនជាតិដើមភាគតិច (ឧ. រតនគិរី និងមណ្ឌលគិរី): ជួយកត់ត្រា និងអភិរក្សចំណេះដឹងរុក្ខជាតិឱសថដែលកំពុងប្រឈមនឹងការបាត់បង់ដោយសារការកាប់បំផ្លាញព្រៃឈើ និងការពង្រីកវិស័យកសិកម្ម។
វិស័យអប់រំ និងកសិកម្ម-រុក្ខាប្រមាញ់: និស្សិតកសិកម្ម និងភ្នាក់ងារបរិស្ថានអាចប្រើប្រាស់កម្មវិធីទូរស័ព្ទដៃ (Mobile App) ដោយមិនបាច់មានអ៊ីនធឺណិត ដើម្បីកំណត់អត្តសញ្ញាណរុក្ខជាតិកម្រនៅតំបន់ដាច់ស្រយាល។

ការបង្កើតប្រព័ន្ធ AI កំណត់អត្តសញ្ញាណរុក្ខជាតិឱសថក្នុងស្រុកនឹងជួយអភិរក្សចំណេះដឹងឱសថបុរាណខ្មែរ ការពារជីវចម្រុះ និងពង្រឹងសុវត្ថិភាពផ្នែកសុខាភិបាលសាធារណៈនៅកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះនៃ Computer Vision: និស្សិតគប្បីចាប់ផ្តើមរៀនអំពី Convolutional Neural Networks (CNNs) តាមរយៈវគ្គសិក្សាតាមអនឡាញ (ឧទាហរណ៍ Coursera ឬ Fast.ai) និងអនុវត្តការសរសេរកូដដោយប្រើប្រាស់ PyTorch ឬ TensorFlow។
ប្រមូលនិងចងក្រងទិន្នន័យរុក្ខជាតិឱសថខ្មែរ: សហការជាមួយគ្រូឱសថបុរាណ ឬមន្ទីរពិសោធន៍ ដើម្បីថតរូបភាពរុក្ខជាតិឱសថខ្មែរ (ផ្តោតសំខាន់លើផ្នែកស្លឹក) ដោយរៀបចំជា Dataset ស្ដង់ដារមួយដែលថតក្នុងលក្ខខណ្ឌពន្លឺនិងផ្ទៃខាងក្រោយផ្សេងៗគ្នា។
អភិវឌ្ឍម៉ូដែលដោយប្រើប្រាស់ Transfer Learning: យកម៉ូដែលដែលមានស្រាប់ដូចជា ResNet50, EfficientNet ឬ MobileNet-V2 មកបង្ហាត់បន្ត (Fine-tune) លើទិន្នន័យរុក្ខជាតិឱសថក្នុងស្រុក ដែលជួយសន្សំសំចៃពេលវេលា និងធនធានគណនា។
បង្កើតកម្មវិធីទូរស័ព្ទដៃ (Mobile Application): ប្រើប្រាស់ Flutter ឬ React Native រួមជាមួយ TensorFlow Lite ដើម្បីដាក់បញ្ចូលម៉ូដែល AI ទៅក្នុងកម្មវិធីទូរស័ព្ទដៃ ដែលអាចឱ្យអ្នកប្រើប្រាស់ស្កេនមើលរុក្ខជាតិបានភ្លាមៗ ទោះបីគ្មានសេវាអ៊ីនធឺណិត (Offline Inference)។
ដាក់បញ្ចូលប្រព័ន្ធទទួលព័ត៌មានត្រឡប់ (User Feedback Loop): បង្កើតមុខងារ (Feature) នៅក្នុងកម្មវិធីដែលអនុញ្ញាតឱ្យអ្នកប្រើប្រាស់កែតម្រូវលទ្ធផលទាយខុស និងបញ្ជូនរូបភាពថ្មីៗទៅកាន់ Cloud Database ដើម្បីឱ្យអ្នកស្រាវជ្រាវអាចអាប់ដេត (Retrain) ម៉ូដែលឱ្យកាន់តែសុក្រឹតជាប្រចាំ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Convolutional Neural Networks (CNNs)	ជាប្រភេទបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតដែលរចនាឡើងយ៉ាងពិសេសសម្រាប់វិភាគ ទាញយកលក្ខណៈ និងសម្គាល់ទម្រង់នៅក្នុងរូបភាព ដូចជារូបរាង ពណ៌ ឬសរសៃស្លឹករុក្ខជាតិ ដើម្បីធ្វើចំណាត់ថ្នាក់ប្រភេទរុក្ខជាតិ។	ប្រៀបដូចជាភ្នែកនិងខួរក្បាលរបស់កុំព្យូទ័រ ដែលរៀនចំណាំទម្រង់វត្ថុផ្សេងៗតាមរយៈការមើលរូបភាពរាប់ពាន់សន្លឹក។
Data augmentation	ជាបច្ចេកទេសក្នុងការបង្កើតទិន្នន័យថ្មីៗបន្ថែមពីលើទិន្នន័យចាស់ដែលមានស្រាប់ (ដូចជាការបង្វិល បង្រួម ពង្រីក ឬប្តូរពណ៌រូបភាពដើម) ដើម្បីជួយឱ្យម៉ូដែលស៊ាំនឹងការប្រែប្រួល និងមានភាពសុក្រឹតខ្ពស់នៅពេលជួបរូបភាពពិតដែលមិនធ្លាប់ឃើញ។	ដូចជាការថតរូបវត្ថុមួយពីជ្រុងខុសៗគ្នា ឬក្នុងពន្លឺខុសៗគ្នា ដើម្បីឱ្យកុំព្យូទ័រអាចចំណាំវត្ថុនោះបានទោះបីវានៅក្នុងស្ថានភាពណាក៏ដោយ។
Crowdsourcing	ជាវិធីសាស្ត្រប្រមូលទិន្នន័យ (ដូចជារូបភាពរុក្ខជាតិ) ដោយពឹងផ្អែកលើការចូលរួមពីមហាជនទូទៅ ឬអ្នកប្រើប្រាស់កម្មវិធីទូរស័ព្ទជាច្រើននាក់ ជាជាងការពឹងផ្អែកតែលើអ្នកស្រាវជ្រាវចុះប្រមូលទិន្នន័យដោយផ្ទាល់ ដែលជួយសន្សំពេលវេលា និងបង្កើនភាពចម្រុះនៃទិន្នន័យ។	ប្រៀបដូចជាការកេណ្ឌប្រជាជនទូទាំងប្រទេសឱ្យជួយថតរូបរុក្ខជាតិឱសថផ្ញើមកកាន់ប្រព័ន្ធកណ្តាលរួមមួយ ដើម្បីយកទៅបង្រៀនកុំព្យូទ័រ។
Transfer learning	ជាវិធីសាស្ត្រនៃការយកទម្ងន់ទិន្នន័យ (Weights) ពីម៉ូដែល AI ដែលធ្លាប់បានបង្ហាត់រួចរាល់លើកិច្ចការធំមួយ មកប្រើប្រាស់ជាមូលដ្ឋានសម្រាប់បង្ហាត់បន្តលើកិច្ចការថ្មីមួយទៀតដែលមានទិន្នន័យតិច ដើម្បីជួយឱ្យវាឆាប់រៀនចេះនិងមានភាពត្រឹមត្រូវខ្ពស់ជាងការចាប់ផ្តើមពីសូន្យ។	ប្រៀបដូចជាមនុស្សដែលចេះជិះកង់រួចហើយ ពេលមកហាត់ជិះម៉ូតូគឺឆាប់ចេះជាងអ្នកដែលមិនធ្លាប់ចេះជិះអ្វីសោះ។
Ensemble models	ជាការរួមបញ្ចូលគ្នានូវម៉ូដែល Deep Learning ច្រើនផ្សេងៗគ្នា ដើម្បីធ្វើការទស្សន៍ទាយឬវិភាគរូបភាពរួមគ្នា ដែលវិធីនេះជួយកាត់បន្ថយភាពលម្អៀង និងផ្តល់លទ្ធផលត្រឹមត្រូវនិងអាចទុកចិត្តបានជាងការប្រើប្រាស់ម៉ូដែលតែមួយ។	ដូចជាការពិគ្រោះយោបល់ជាមួយគ្រូពេទ្យជំនាញ៣នាក់ ដើម្បីធ្វើការវិនិច្ឆ័យជំងឺមួយជាជាងជឿលើគ្រូពេទ្យតែម្នាក់ឯង។
Zero-shot learning	ជាសមត្ថភាពដ៏ទំនើបរបស់ម៉ូដែលកុំព្យូទ័រក្នុងការទស្សន៍ទាយ ឬចំណាត់ថ្នាក់ប្រភេទវត្ថុថ្មីៗដែលវាមិនធ្លាប់បានឃើញទាល់តែសោះក្នុងអំឡុងពេលបង្ហាត់ (Training) ដោយវាពឹងផ្អែកលើការស្វែងយល់ពីទំនាក់ទំនងនៃលក្ខណៈពិពណ៌នាជំនួសវិញ។	ប្រៀបដូចជាការប្រាប់ក្មេងម្នាក់ថា 'សេះបង្កង់គឺដូចសេះធម្មតា តែមានឆ្នូតសនិងខ្មៅ' ហើយក្មេងនោះអាចស្គាល់សេះបង្កង់បានភ្លាមពេលឃើញវាលើកដំបូង ទោះមិនធ្លាប់ឃើញពីមុនមកក៏ដោយ។
Incremental learning	ជាដំណើរការបន្តបន្ទាប់ដែលម៉ូដែល AI ទាញយកទិន្នន័យថ្មីៗពីអ្នកប្រើប្រាស់មកកែសម្រួលនិងអភិវឌ្ឍខ្លួនឯងជាប្រចាំ ដោយមិនចាំបាច់លុបចោលចំណេះដឹងចាស់ ឬបង្ហាត់សារជាថ្មីពីចំណុចសូន្យឡើងវិញឡើយ។	ប្រៀបដូចជាសិស្សដែលរៀនមេរៀនថ្មីៗជារៀងរាល់ថ្ងៃ ដើម្បីពង្រីកចំណេះដឹងដោយនៅតែចងចាំមេរៀនចាស់ៗដែលបានរៀនពីថ្ងៃមុន។
Feature extraction	គឺជាដំណើរការកាត់បំបែកនិងទាញយកលក្ខណៈសំខាន់ៗ និងពិសេសៗពីរូបភាពឆៅ (ដូចជារូបរាង ពណ៌ ទំហំ វាយនភាព ឬរន្ធខ្យល់ស្លឹក) បំប្លែងទៅជាទិន្នន័យលេខដើម្បីឱ្យកុំព្យូទ័រងាយស្រួលប្រៀបធៀបនិងធ្វើចំណាត់ថ្នាក់។	ដូចជាការប្រាប់ប៉ូលីសពីភិនភាគជនសង្ស័យ (មានស្លាកស្នាម កម្ពស់ខ្ពស់ សក់រួញ) ដើម្បីឱ្យប៉ូលីសងាយស្រួលចំណាំមុខសញ្ញាក្នុងចំណោមមនុស្សរាប់ពាន់នាក់។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖