បញ្ហា (The Problem)៖ ការកំណត់អត្តសញ្ញាណរុក្ខជាតិឱសថប្រកបដោយភាពត្រឹមត្រូវគឺមានសារៈសំខាន់សម្រាប់ការប្រើប្រាស់ជាឱសថបុរាណនិងការអភិរក្សជីវចម្រុះ ប៉ុន្តែជួបប្រទះបញ្ហាប្រឈមដោយសារភាពខុសគ្នានៃរូបរាង និងលក្ខខណ្ឌបរិស្ថានដែលធ្វើឱ្យងាយនឹងមានការភាន់ច្រឡំ។ ការសិក្សានេះវាយតម្លៃលើប្រសិទ្ធភាពនិងបញ្ហាប្រឈមនៃការប្រើប្រាស់បច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិតដើម្បីដោះស្រាយបញ្ហានេះ។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះគឺជាការពិនិត្យឡើងវិញជាប្រព័ន្ធ (Systematic Literature Review) នៃឯកសារស្រាវជ្រាវចំនួន ៣០ ទាក់ទងនឹងការប្រើប្រាស់ Deep Learning សម្រាប់ការចាត់ថ្នាក់រូបភាពរុក្ខជាតិឱសថ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Manual/Lab-based Data Collection + CNNs ការប្រមូលទិន្នន័យដោយផ្ទាល់ និងការប្រើប្រាស់បណ្តាញ CNNs |
ទិន្នន័យមានគុណភាពខ្ពស់ ងាយស្រួលគ្រប់គ្រងពន្លឺ និងផ្ទៃខាងក្រោយ ដែលជួយឱ្យម៉ូដែលទទួលបានភាពត្រឹមត្រូវខ្ពស់។ | ចំណាយពេលវេលានិងធនធានច្រើនក្នុងការប្រមូល ព្រមទាំងពិបាកក្នុងការពង្រីកទំហំទិន្នន័យសម្រាប់ប្រភេទរុក្ខជាតិច្រើនប្រភេទនៅក្នុងពិភពជាក់ស្តែង។ | ទទួលបានភាពត្រឹមត្រូវខ្ពស់ ចន្លោះពី ៧៥% ទៅ ១០០% (ភាគច្រើនលើសពី ៩០%) ផ្អែកលើទិន្នន័យពិសោធន៍ដែលបានគ្រប់គ្រងល្អ។ |
| Crowdsourced/Online Data + Deep Learning ការប្រមូលទិន្នន័យតាមប្រព័ន្ធមហាជន/អនឡាញ និង Deep Learning |
មានភាពងាយស្រួលក្នុងការពង្រីកទំហំទិន្នន័យ (Scalability) ទូលំទូលាយ និងទទួលបានភាពចម្រុះនៃរូបភាពពីរូបភាពជាក់ស្តែង។ | រូបភាពមានគុណភាពមិនស្មើគ្នា ពន្លឺខុសៗគ្នា និងមានភាពរំខាន (Noise) ច្រើនដែលទាមទារការពង្រីកទិន្នន័យ (Data Augmentation) ដើម្បីកែលម្អភាពត្រឹមត្រូវ។ | ភាពត្រឹមត្រូវជាទូទៅចន្លោះពី ៧១% ទៅ ៩៣% អាស្រ័យលើការកែលម្អទិន្នន័យ និងវិធីសាស្ត្របង្វឹកម៉ូដែល។ |
| Leaf-based vs. Multi-organ Classification ការចាត់ថ្នាក់ផ្អែកលើស្លឹក ធៀបនឹងសរីរាង្គចម្រុះ |
ការប្រើស្លឹកតែមួយមុខផ្តល់ភាពងាយស្រួលក្នុងការទាញយកលក្ខណៈសម្គាល់ ចំណែកការប្រើសរីរាង្គចម្រុះជួយរំលេចលក្ខណៈរុក្ខជាតិទាំងមូល។ | សរីរាង្គចម្រុះ (ផ្កា ដើម ឫស) មានភាពស្មុគស្មាញខ្ពស់ក្នុងការវិភាគ ខណៈស្លឹកអាចទទួលរងផលប៉ះពាល់ពីរដូវកាលនិងភាពចាស់ខ្ចី។ | ការប្រើស្លឹកទទួលបានភាពត្រឹមត្រូវរហូតដល់ ៩៩.៨% ចំណែកការប្រើសរីរាង្គចម្រុះនិងដើមទាំងមូលមានភាពត្រឹមត្រូវប្រែប្រួលខ្ពស់ (៨៥%-៩៥%)។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះមិនបានបញ្ជាក់លម្អិតអំពីទំហំទឹកប្រាក់នោះទេ ប៉ុន្តែការអភិវឌ្ឍប្រព័ន្ធកំណត់អត្តសញ្ញាណរុក្ខជាតិទាមទារនូវធនធានបច្ចេកវិទ្យា កម្លាំងកុំព្យូទ័រ និងអ្នកជំនាញច្បាស់លាស់។
ការសិក្សាភាគច្រើន (ជិត៦០%) ត្រូវបានធ្វើឡើងនៅប្រទេសឥណ្ឌា ចិន ម៉ាឡេស៊ី និងវៀតណាម ដោយប្រើប្រាស់ប្រភេទរុក្ខជាតិឱសថប្រចាំតំបន់ទាំងនោះ។ ការខ្វះខាតទិន្នន័យរុក្ខជាតិឱសថពីប្រទេសកម្ពុជាមានន័យថាម៉ូដែលដែលមានស្រាប់ទាំងនេះអាចនឹងមិនស្គាល់រុក្ខជាតិឱសថបុរាណខ្មែរ (Kru Khmer Medicine) បានត្រឹមត្រូវនោះទេ ដោយសារភាពខុសគ្នានៃរូបរាង និងបរិស្ថានដាំដុះនៅក្នុងតំបន់។
បច្ចេកវិទ្យានេះមានសក្តានុពល និងអត្ថប្រយោជន៍យ៉ាងធំធេងសម្រាប់ប្រទេសកម្ពុជា ដែលជាប្រទេសសម្បូរទៅដោយរុក្ខជាតិឱសថនិងប្រវត្តិប្រើប្រាស់ឱសថបុរាណ។
ការបង្កើតប្រព័ន្ធ AI កំណត់អត្តសញ្ញាណរុក្ខជាតិឱសថក្នុងស្រុកនឹងជួយអភិរក្សចំណេះដឹងឱសថបុរាណខ្មែរ ការពារជីវចម្រុះ និងពង្រឹងសុវត្ថិភាពផ្នែកសុខាភិបាលសាធារណៈនៅកម្ពុជា។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Convolutional Neural Networks (CNNs) | ជាប្រភេទបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតដែលរចនាឡើងយ៉ាងពិសេសសម្រាប់វិភាគ ទាញយកលក្ខណៈ និងសម្គាល់ទម្រង់នៅក្នុងរូបភាព ដូចជារូបរាង ពណ៌ ឬសរសៃស្លឹករុក្ខជាតិ ដើម្បីធ្វើចំណាត់ថ្នាក់ប្រភេទរុក្ខជាតិ។ | ប្រៀបដូចជាភ្នែកនិងខួរក្បាលរបស់កុំព្យូទ័រ ដែលរៀនចំណាំទម្រង់វត្ថុផ្សេងៗតាមរយៈការមើលរូបភាពរាប់ពាន់សន្លឹក។ |
| Data augmentation | ជាបច្ចេកទេសក្នុងការបង្កើតទិន្នន័យថ្មីៗបន្ថែមពីលើទិន្នន័យចាស់ដែលមានស្រាប់ (ដូចជាការបង្វិល បង្រួម ពង្រីក ឬប្តូរពណ៌រូបភាពដើម) ដើម្បីជួយឱ្យម៉ូដែលស៊ាំនឹងការប្រែប្រួល និងមានភាពសុក្រឹតខ្ពស់នៅពេលជួបរូបភាពពិតដែលមិនធ្លាប់ឃើញ។ | ដូចជាការថតរូបវត្ថុមួយពីជ្រុងខុសៗគ្នា ឬក្នុងពន្លឺខុសៗគ្នា ដើម្បីឱ្យកុំព្យូទ័រអាចចំណាំវត្ថុនោះបានទោះបីវានៅក្នុងស្ថានភាពណាក៏ដោយ។ |
| Crowdsourcing | ជាវិធីសាស្ត្រប្រមូលទិន្នន័យ (ដូចជារូបភាពរុក្ខជាតិ) ដោយពឹងផ្អែកលើការចូលរួមពីមហាជនទូទៅ ឬអ្នកប្រើប្រាស់កម្មវិធីទូរស័ព្ទជាច្រើននាក់ ជាជាងការពឹងផ្អែកតែលើអ្នកស្រាវជ្រាវចុះប្រមូលទិន្នន័យដោយផ្ទាល់ ដែលជួយសន្សំពេលវេលា និងបង្កើនភាពចម្រុះនៃទិន្នន័យ។ | ប្រៀបដូចជាការកេណ្ឌប្រជាជនទូទាំងប្រទេសឱ្យជួយថតរូបរុក្ខជាតិឱសថផ្ញើមកកាន់ប្រព័ន្ធកណ្តាលរួមមួយ ដើម្បីយកទៅបង្រៀនកុំព្យូទ័រ។ |
| Transfer learning | ជាវិធីសាស្ត្រនៃការយកទម្ងន់ទិន្នន័យ (Weights) ពីម៉ូដែល AI ដែលធ្លាប់បានបង្ហាត់រួចរាល់លើកិច្ចការធំមួយ មកប្រើប្រាស់ជាមូលដ្ឋានសម្រាប់បង្ហាត់បន្តលើកិច្ចការថ្មីមួយទៀតដែលមានទិន្នន័យតិច ដើម្បីជួយឱ្យវាឆាប់រៀនចេះនិងមានភាពត្រឹមត្រូវខ្ពស់ជាងការចាប់ផ្តើមពីសូន្យ។ | ប្រៀបដូចជាមនុស្សដែលចេះជិះកង់រួចហើយ ពេលមកហាត់ជិះម៉ូតូគឺឆាប់ចេះជាងអ្នកដែលមិនធ្លាប់ចេះជិះអ្វីសោះ។ |
| Ensemble models | ជាការរួមបញ្ចូលគ្នានូវម៉ូដែល Deep Learning ច្រើនផ្សេងៗគ្នា ដើម្បីធ្វើការទស្សន៍ទាយឬវិភាគរូបភាពរួមគ្នា ដែលវិធីនេះជួយកាត់បន្ថយភាពលម្អៀង និងផ្តល់លទ្ធផលត្រឹមត្រូវនិងអាចទុកចិត្តបានជាងការប្រើប្រាស់ម៉ូដែលតែមួយ។ | ដូចជាការពិគ្រោះយោបល់ជាមួយគ្រូពេទ្យជំនាញ៣នាក់ ដើម្បីធ្វើការវិនិច្ឆ័យជំងឺមួយជាជាងជឿលើគ្រូពេទ្យតែម្នាក់ឯង។ |
| Zero-shot learning | ជាសមត្ថភាពដ៏ទំនើបរបស់ម៉ូដែលកុំព្យូទ័រក្នុងការទស្សន៍ទាយ ឬចំណាត់ថ្នាក់ប្រភេទវត្ថុថ្មីៗដែលវាមិនធ្លាប់បានឃើញទាល់តែសោះក្នុងអំឡុងពេលបង្ហាត់ (Training) ដោយវាពឹងផ្អែកលើការស្វែងយល់ពីទំនាក់ទំនងនៃលក្ខណៈពិពណ៌នាជំនួសវិញ។ | ប្រៀបដូចជាការប្រាប់ក្មេងម្នាក់ថា 'សេះបង្កង់គឺដូចសេះធម្មតា តែមានឆ្នូតសនិងខ្មៅ' ហើយក្មេងនោះអាចស្គាល់សេះបង្កង់បានភ្លាមពេលឃើញវាលើកដំបូង ទោះមិនធ្លាប់ឃើញពីមុនមកក៏ដោយ។ |
| Incremental learning | ជាដំណើរការបន្តបន្ទាប់ដែលម៉ូដែល AI ទាញយកទិន្នន័យថ្មីៗពីអ្នកប្រើប្រាស់មកកែសម្រួលនិងអភិវឌ្ឍខ្លួនឯងជាប្រចាំ ដោយមិនចាំបាច់លុបចោលចំណេះដឹងចាស់ ឬបង្ហាត់សារជាថ្មីពីចំណុចសូន្យឡើងវិញឡើយ។ | ប្រៀបដូចជាសិស្សដែលរៀនមេរៀនថ្មីៗជារៀងរាល់ថ្ងៃ ដើម្បីពង្រីកចំណេះដឹងដោយនៅតែចងចាំមេរៀនចាស់ៗដែលបានរៀនពីថ្ងៃមុន។ |
| Feature extraction | គឺជាដំណើរការកាត់បំបែកនិងទាញយកលក្ខណៈសំខាន់ៗ និងពិសេសៗពីរូបភាពឆៅ (ដូចជារូបរាង ពណ៌ ទំហំ វាយនភាព ឬរន្ធខ្យល់ស្លឹក) បំប្លែងទៅជាទិន្នន័យលេខដើម្បីឱ្យកុំព្យូទ័រងាយស្រួលប្រៀបធៀបនិងធ្វើចំណាត់ថ្នាក់។ | ដូចជាការប្រាប់ប៉ូលីសពីភិនភាគជនសង្ស័យ (មានស្លាកស្នាម កម្ពស់ខ្ពស់ សក់រួញ) ដើម្បីឱ្យប៉ូលីសងាយស្រួលចំណាំមុខសញ្ញាក្នុងចំណោមមនុស្សរាប់ពាន់នាក់។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖