Original Title: MedicPlant: A mobile application for the recognition of medicinal plants from the Republic of Mauritius using deep learning in real-time
Source: doi.org/10.11591/ijai.v10.i4.pp938-947
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

MedicPlant៖ កម្មវិធីទូរស័ព្ទដៃសម្រាប់ការស្គាល់រុក្ខជាតិឱសថពីសាធារណរដ្ឋម៉ូរីស (Mauritius) ដោយប្រើប្រាស់ Deep Learning ក្នុងពេលជាក់ស្តែង

ចំណងជើងដើម៖ MedicPlant: A mobile application for the recognition of medicinal plants from the Republic of Mauritius using deep learning in real-time

អ្នកនិពន្ធ៖ Sameerchand Pudaruth (University of Mauritius), Mohamad Fawzi Mahomoodally (University of Mauritius), Noushreen Kissoon (University of Mauritius), Fadil Chady (University of Mauritius)

ឆ្នាំបោះពុម្ព៖ 2021 IAES International Journal of Artificial Intelligence (IJ-AI)

វិស័យសិក្សា៖ Artificial Intelligence

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការកំណត់អត្តសញ្ញាណរុក្ខជាតិឱសថឱ្យបានត្រឹមត្រូវគឺជាការលំបាកសម្រាប់មនុស្សទូទៅ ចំណែកឯវិធីសាស្ត្រមន្ទីរពិសោធន៍គឺមានតម្លៃថ្លៃ និងមិនងាយស្រួលក្នុងការអនុវត្តផ្ទាល់នៅតាមទីវាល។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានប្រមូលទិន្នន័យរូបភាពរុក្ខជាតិនៅបរិស្ថានធម្មជាតិ និងអភិវឌ្ឍកម្មវិធីទូរស័ព្ទដោយប្រើប្រាស់បច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិត។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Deep Learning (Inception-v3 CNN) via Transfer Learning
ការប្រើប្រាស់បណ្តាញសរសៃប្រសាទកុំព្យូទ័រ (Inception-v3 CNN) ជាមួយបច្ចេកទេស Transfer Learning
ដំណើរការបានលឿនក្នុងពេលជាក់ស្តែង (Real-time) និងមិនត្រូវការកែច្នៃរូបភាពជាមុន (No pre-processing)។ អាចធ្វើការកំណត់អត្តសញ្ញាណបានដោយមិនចាំបាច់មានអ៊ីនធឺណិត (Offline) និងមានភាពរឹងមាំចំពោះបំរែបំរួលបរិស្ថាន។ ត្រូវការទិន្នន័យរូបភាពច្រើន និងតម្រូវឱ្យមានកុំព្យូទ័រដែលមានកម្លាំងខ្លាំង (High computational power) សម្រាប់ការហ្វឹកហាត់ម៉ូដែលនៅដំណាក់កាលដំបូង។ សម្រេចបានភាពត្រឹមត្រូវប្រមាណ ៩៥% លើការធ្វើតេស្តរុក្ខជាតិឱសថចំនួន ៧០ ប្រភេទ។
Traditional Machine Learning with Hand-crafted Features
ការប្រើប្រាស់ Machine Learning បែបប្រពៃណីដោយទាញយកលក្ខណៈដោយដៃ (Shape, Color, Texture)
មិនសូវទាមទារកម្លាំងកុំព្យូទ័រខ្លាំងក្នុងការហ្វឹកហាត់ និងអាចដំណើរការបានជាមួយសំណុំទិន្នន័យតូចៗជាង។ ភាគច្រើនតម្រូវឱ្យថតរូបស្លឹករុក្ខជាតិលើផ្ទៃខាងក្រោយពណ៌ស (White background) និងត្រូវធ្វើការកែច្នៃរូបភាពជាមុនច្រើន។ ភាពត្រឹមត្រូវធ្លាក់ចុះយ៉ាងខ្លាំងនៅពេលមានរុក្ខជាតិច្រើនប្រភេទ។ មានភាពត្រឹមត្រូវទាប និងមិនសូវមានស្ថិរភាពនៅពេលប្រើប្រាស់ផ្ទាល់នៅទីវាល (Natural environment)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអភិវឌ្ឍប្រព័ន្ធនេះតម្រូវឱ្យមានការប្រមូលទិន្នន័យរូបភាពផ្ទាល់ពីទីវាល និងការប្រើប្រាស់កុំព្យូទ័រដែលមានសមត្ថភាពខ្ពស់សម្រាប់ការហ្វឹកហាត់ម៉ូដែល AI មុននឹងបញ្ចូលវាទៅក្នុងកម្មវិធីទូរស័ព្ទដៃ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានអនុវត្តនៅក្នុងប្រទេសម៉ូរីស (Mauritius) ដោយប្រើប្រាស់ទិន្នន័យរូបភាពរុក្ខជាតិឱសថក្នុងស្រុករបស់ពួកគេចំនួន ៧០ ប្រភេទ។ ទោះបីជាម៉ូរីសមានអាកាសធាតុត្រូពិកស្រដៀងកម្ពុជាក៏ដោយ ក៏ប្រភេទរុក្ខជាតិ និងរូបរាងស្លឹកខ្លះអាចមានភាពខុសគ្នា។ ហេតុនេះ ដើម្បីធានាបាននូវភាពត្រឹមត្រូវនៅកម្ពុជា យើងត្រូវប្រមូលសំណុំទិន្នន័យរូបភាពរុក្ខជាតិឱសថក្នុងស្រុករបស់យើងដោយឡែក ដើម្បីហ្វឹកហាត់ម៉ូដែលនេះឡើងវិញ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកវិទ្យានេះមានសក្តានុពលខ្ពស់ និងអាចយកមកអនុវត្តប្រកបដោយប្រសិទ្ធភាពនៅក្នុងប្រទេសកម្ពុជា ដើម្បីជួយអភិរក្ស និងលើកកម្ពស់វិស័យឱសថបុរាណ។

ជារួម ការអភិវឌ្ឍកម្មវិធីទូរស័ព្ទនេះនៅកម្ពុជានឹងជួយការពារចំណេះដឹងឱសថបុរាណខ្មែរដែលកំពុងបាត់បង់ និងគាំទ្រដល់ការសិក្សាស្រាវជ្រាវបែបវិទ្យាសាស្ត្រយ៉ាងទូលំទូលាយ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ១. សិក្សាមូលដ្ឋានគ្រឹះនៃ Computer Vision: និស្សិតត្រូវចាប់ផ្តើមសិក្សាពីបណ្ណាល័យកូដ AI ដូចជា TensorFlowKeras និងស្វែងយល់ពីបច្ចេកទេស Transfer Learning លើម៉ូដែលដែលមានស្រាប់ដូចជា Inception-v3MobileNet សម្រាប់ Image Classification។
  2. ២. ប្រមូលទិន្នន័យរូបភាពរុក្ខជាតិឱសថខ្មែរ: សហការជាមួយគ្រូឱសថបុរាណដើម្បីថតរូបរុក្ខជាតិ (យ៉ាងតិច ១០០រូបភាពក្នុងមួយប្រភេទ) ដោយប្រើស្មាតហ្វូន។ ត្រូវថតក្នុងបរិស្ថានធម្មជាតិ និងប្រើបច្ចេកទេស Data Augmentation ដូចជា ការបង្វិល (Rotation) ដើម្បីពង្រីកទិន្នន័យ។
  3. ៣. ហ្វឹកហាត់ម៉ូដែលដោយមិនប្រើការកែច្នៃរូបភាពមុន (No Pre-processing): ប្ដូរទំហំរូបភាពទៅ 299x299 ភីកសែល និងបែងចែកទិន្នន័យជា Training (80%), Validation (10%) និង Testing (10%) រួចដំណើរការហ្វឹកហាត់ម៉ូដែលនៅលើកុំព្យូទ័រដែលមាន GPU។
  4. ៤. អភិវឌ្ឍកម្មវិធីទូរស័ព្ទដៃ Android សម្រាប់ប្រើប្រាស់ Offline: សរសេរកូដកម្មវិធីដោយប្រើ JavaKotlin នៅក្នុង Android Studio។ នាំចេញម៉ូដែលដែលហ្វឹកហាត់រួច (ជាឯកសារ .tflite ឬ .pb) ហើយបញ្ចូលវាទៅក្នុងកម្មវិធីតាមរយៈ TensorFlow Lite ដើម្បីឱ្យវាដំណើរការដោយមិនបាច់មានសេវាអ៊ីនធឺណិត។
  5. ៥. បន្ថែមមុខងារវចនានុក្រមព័ត៌មានរុក្ខជាតិ: ភ្ជាប់ទិន្នន័យឈ្មោះវិទ្យាសាស្ត្រ ឈ្មោះទូទៅជាភាសាខ្មែរ និងអត្ថប្រយោជន៍នៃការព្យាបាលចូលទៅក្នុងកម្មវិធី ដើម្បីបង្ហាញភ្លាមៗក្រោយពេលប្រព័ន្ធស្កេនស្គាល់រុក្ខជាតិ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Convolutional neural network (CNN) ជាប្រភេទបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតដែលត្រូវបានរចនាឡើងយ៉ាងពិសេសសម្រាប់វិភាគទិន្នន័យរូបភាព ដើម្បីសម្គាល់ទម្រង់ ពណ៌ ទំហំ និងលក្ខណៈពិសេសផ្សេងៗរបស់រូបភាពនោះ។ ដូចជាភ្នែកកុំព្យូទ័រដែលអាចមើល និងសម្គាល់ភាពខុសគ្នារវាងរូបភាពឆ្មា និងឆ្កែ ដោយផ្អែកលើទម្រង់មុខរបស់វា។
Transfer learning ជាបច្ចេកទេសក្នុង Deep Learning ដែលគេយកម៉ូដែល AI ដែលបានហ្វឹកហាត់រួចជាស្រេចពីកិច្ចការមួយ មកកែច្នៃបន្តិចបន្តួចដើម្បីប្រើប្រាស់សម្រាប់កិច្ចការថ្មីមួយទៀត ដើម្បីចំណេញពេលវេលា និងថាមពលកុំព្យូទ័រ។ ដូចជាការយកអ្នកដែលចេះជិះកង់ស្រាប់ មកបង្រៀនឱ្យចេះជិះម៉ូតូ គឺវាលឿនជាងការបង្រៀនអ្នកដែលមិនចេះជិះអ្វីសោះ។
Inception-v3 ជាម៉ូដែលបណ្តាញសរសៃប្រសាទកុំព្យូទ័រ (CNN) ដ៏មានឥទ្ធិពលមួយរបស់ក្រុមហ៊ុន Google ដែលត្រូវបានបង្វឹកជាមុនលើរូបភាពរាប់លាន ដើម្បីចំណាំវត្ថុផ្សេងៗក្នុងកម្រិតភាពត្រឹមត្រូវខ្ពស់បំផុត។ ដូចជាខួរក្បាលដែលបានរៀនសូត្រពីសៀវភៅរូបភាពរាប់លានក្បាលរួចមកហើយ ធ្វើឱ្យវាងាយស្រួលក្នុងការប្រាប់ថារូបថ្មីមួយទៀតជារបស់អ្វី។
Hand-crafted features ជានីតិវិធីបែបប្រពៃណីក្នុង Machine Learning ដែលអ្នកសរសេរកូដត្រូវកំណត់ដោយផ្ទាល់ដៃនូវលក្ខណៈដែលកុំព្យូទ័រត្រូវសម្គាល់ (ឧទាហរណ៍៖ ទំហំ ពណ៌ ឬរូបរាងស្លឹក) មុននឹងឱ្យកុំព្យូទ័ររៀនចំណាំ។ ដូចជាការប្រាប់ប៉ូលីសឱ្យតាមចាប់ចោរដោយប្រាប់ភិនភាគច្បាស់លាស់ (កម្ពស់ ទម្ងន់ សម្បុរ) ជំនួសឱ្យការឱ្យកុំព្យូទ័ររៀនចំណាំមុខចោរដោយខ្លួនឯងតាមរយៈរូបថត។
TensorFlow ជាបណ្ណាល័យកូដចំហ (Open-source library) បង្កើតដោយ Google ដែលផ្តល់នូវឧបករណ៍ និងក្របខណ្ឌ (Framework) សម្រាប់ការសាងសង់ និងហ្វឹកហាត់ម៉ូដែល Machine Learning និង Deep Learning។ ដូចជាប្រអប់ឧបករណ៍ជាង (Toolbox) ដ៏ធំមួយដែលមានញញួរ កន្ត្រៃ និងទួណឺវីសគ្រប់ប្រភេទ សម្រាប់ជួយវិស្វករសាងសង់ខួរក្បាលសិប្បនិម្មិត។
Pre-processing ជាជំហានរៀបចំទិន្នន័យ ឬកែច្នៃរូបភាពបឋម (ដូចជាការកាត់ត ការលុបផ្ទៃខាងក្រោយ ឬការតម្រឹមពណ៌) មុននឹងបញ្ជូនទិន្នន័យទាំងនោះទៅឱ្យម៉ូដែល AI វិភាគ។ ដូចជាការលាងសម្អាត និងហាន់បន្លែសាច់ជាមុន មុននឹងដាក់ចូលក្នុងឆ្នាំងដើម្បីចម្អិន។
Data augmentation ជាបច្ចេកទេសបង្កើតទិន្នន័យថ្មីបន្ថែមពីលើទិន្នន័យចាស់ដែលមានស្រាប់ ដោយធ្វើការផ្លាស់ប្តូររូបភាព (ដូចជា បង្វិល ពង្រីក ឬត្រឡប់) ដើម្បីឱ្យម៉ូដែល AI អាចរៀនបានកាន់តែច្រើនជ្រុងជ្រោយ កាត់បន្ថយការទន្ទេញចាំ។ ដូចជាការថតរូបសៀវភៅមួយក្បាលពីជ្រុងផ្សេងៗគ្នា (ពីលើ ពីចំហៀង បញ្ច្រាស) ដើម្បីឱ្យកុមារចំណាំសៀវភៅនោះបានទោះស្ថិតក្នុងស្ថានភាពណាក៏ដោយ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖