Original Title: Thai Herb Leaf Image Recognition System (THLIRS)
Source: li01.tci-thaijo.org
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ប្រព័ន្ធសម្គាល់រូបភាពស្លឹករុក្ខជាតិឱសថថៃ (THLIRS)

ចំណងជើងដើម៖ Thai Herb Leaf Image Recognition System (THLIRS)

អ្នកនិពន្ធ៖ Chomtip Pornpanomchai (Faculty of Information and Communication Technology, Mahidol University), Supolgaj Rimdusit, Piyawan Tanasap, Chutpong Chaiyod

ឆ្នាំបោះពុម្ព៖ 2011, Kasetsart J. (Nat. Sci.)

វិស័យសិក្សា៖ Computer Science / Image Processing

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ មានប្រភេទរុក្ខជាតិឱសថថៃជាច្រើនប្រភេទដែលមានលក្ខណៈប្រហាក់ប្រហែលគ្នា ដែលធ្វើឱ្យប្រជាជនទូទៅពិបាកក្នុងការសម្គាល់ពួកវាឱ្យបានត្រឹមត្រូវសម្រាប់ការចម្អិនអាហារ និងការប្រើប្រាស់ជាឱសថ។

វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះបានបង្កើតប្រព័ន្ធកុំព្យូទ័រមួយដោយប្រើប្រាស់បច្ចេកវិទ្យាដំណើរការរូបភាព និងការសម្គាល់លំនាំ ដើម្បីទាញយករូបរាងលក្ខណៈពិសេសពីស្លឹករុក្ខជាតិសម្រាប់ធ្វើការប្រៀបធៀប។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
K-Nearest Neighbor Classifier (THLIRS Proposed Method)
ក្បួនដោះស្រាយ K-Nearest Neighbor (ប្រព័ន្ធ THLIRS)
មានភាពសាមញ្ញក្នុងការអនុវត្ត និងប្រើប្រាស់លក្ខណៈពិសេសនៃរូបភាពច្រើន (១៣ចំណុច) ដើម្បីបង្កើនភាពសុក្រឹតនៃការផ្គូផ្គង។ មិនអាចសម្គាល់ប្រភេទរុក្ខជាតិដែលមិនធ្លាប់បានបង្វឹក (Untrained Dataset) បានទាល់តែសោះ ហើយអាចទាមទារពេលវេលាគណនាយូរប្រសិនបើទិន្នន័យមានទំហំធំ។ ទទួលបានអត្រាភាពសុក្រឹត ៩៣,២៩% លើការធ្វើតេស្តរុក្ខជាតិចំនួន ៣២ប្រភេទ (៣២៨ រូបភាព)។
Probabilistic Neural Networks (PNN) (Huang and Peng, 2008)
បណ្តាញសរសៃប្រសាទសិប្បនិម្មិតប្រូបាប៊ីលីតេ (PNN)
មានសមត្ថភាពខ្ពស់ក្នុងការរៀនលំនាំស្មុគស្មាញ និងផ្តល់អត្រាភាពសុក្រឹតខ្ពស់បំផុតក្នុងការស្រាវជ្រាវប្រៀបធៀប។ ទាមទារទិន្នន័យសម្រាប់បង្វឹកក្នុងបរិមាណច្រើនខ្លាំង (២១០០ រូបភាព) និងស៊ីធនធានកុំព្យូទ័រច្រើន។ ទទួលបានអត្រាភាពសុក្រឹតរហូតដល់ ៩៨,៣០% លើរុក្ខជាតិចំនួន ៣០ប្រភេទ។
Support Vector Machine (SVM) (Wu and Chengwei, 2006)
ម៉ាស៊ីនវ៉ិចទ័រគាំទ្រ (SVM)
ផ្តល់លទ្ធផលល្អប្រសើរ និងមានភាពរឹងមាំក្នុងការកាត់បន្ថយកំហុសចំណាត់ថ្នាក់ ទោះបីជាទិន្នន័យមានទំហំមធ្យមក៏ដោយ។ ការធ្វើតេស្តនៅក្នុងឯកសារយោងនេះធ្វើឡើងលើរុក្ខជាតិតែ ១ប្រភេទប៉ុណ្ណោះ ដែលមិនទាន់ឆ្លុះបញ្ចាំងពីប្រសិទ្ធភាពជារួមលើរុក្ខជាតិចម្រុះ។ ទទួលបានអត្រាភាពសុក្រឹត ៩៧,៤០% លើទិន្នន័យចំនួន ៣០០ សំណាក។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារធនធានកុំព្យូទ័រ និងកម្មវិធីកម្រិតមធ្យម ព្រមទាំងឧបករណ៍ថតរូបសាមញ្ញដើម្បីដំណើរការប្រព័ន្ធដោយជោគជ័យ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រមូលទិន្នន័យរូបភាពស្លឹករុក្ខជាតិឱសថពីប្រទេសថៃ ដែលមានលក្ខណៈស្រដៀងគ្នាខ្លាំងទៅនឹងរុក្ខជាតិនៅកម្ពុជា។ ទោះជាយ៉ាងណាក៏ដោយ ចំនួនប្រភេទរុក្ខជាតិដែលបានធ្វើតេស្ត (៣២ប្រភេទ) គឺនៅមានកម្រិតតិចតួចនៅឡើយបើធៀបនឹងរុក្ខជាតិឱសថរាប់ពាន់ប្រភេទក្នុងធម្មជាតិ ដែលតម្រូវឱ្យមានការប្រមូលទិន្នន័យរូបភាពរុក្ខជាតិក្នុងស្រុកបន្ថែមទៀតដើម្បីធានាបាននូវភាពសុក្រឹត និងប្រសិទ្ធភាពខ្ពស់នៅកម្ពុជា។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ប្រព័ន្ធនេះមានសក្តានុពលខ្ពស់ក្នុងការយកមកអនុវត្ត និងកែច្នៃបន្ថែមនៅប្រទេសកម្ពុជា ជាពិសេសក្នុងវិស័យកសិកម្ម វេជ្ជសាស្ត្របុរាណ និងការអប់រំ។

សរុបមក ការអនុវត្តបច្ចេកវិទ្យានេះនៅកម្ពុជាទាមទារឱ្យមានការសហការរវាងអ្នកជំនាញបច្ចេកវិទ្យាព័ត៌មាន និងអ្នករុក្ខសាស្ត្រ ដើម្បីបង្កើតមូលដ្ឋានទិន្នន័យរុក្ខជាតិឱសថខ្មែរដែលរឹងមាំ និងងាយស្រួលប្រើប្រាស់។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃការដំណើរការរូបភាព (Image Processing): និស្សិតគួរចាប់ផ្តើមសិក្សាពីបច្ចេកទេសបំប្លែងរូបភាពដូចជា ការបំប្លែងរូបភាពទៅជាស-ខ្មៅ ទម្រង់ Grayscale & Binarization, ការស្វែងរកគែម (Sobel Edge Detection) និងការចម្រាញ់លក្ខណៈពិសេស (Feature Extraction) ដោយប្រើប្រាស់ OpenCV ជាមួយភាសា Python ឬបន្តប្រើប្រាស់ MATLAB
  2. ប្រមូលនិងរៀបចំសំណុំទិន្នន័យស្លឹករុក្ខជាតិខ្មែរ: រៀបចំការថតរូបភាពស្លឹករុក្ខជាតិឱសថក្នុងស្រុក (ឧទាហរណ៍ដូចជាប្រភេទ Piper betel L.Clinacanthus nutans) ដោយប្រើផ្ទៃខាងក្រោយពណ៌ស និងមានវត្ថុសម្រាប់ធៀបទំហំ (ដូចជាកាក់ ៥០០រៀល) ដើម្បីធានាបាននូវស្តង់ដាររូបភាពសម្រាប់ដំណើរការ Preprocessing
  3. អភិវឌ្ឍក្បួនដោះស្រាយ Machine Learning ចម្រុះ: សរសេរកូដដើម្បីអនុវត្តក្បួនដោះស្រាយ K-Nearest Neighbor (k-NN) ដោយកំណត់តម្លៃ K ប្រែប្រួល ឬសាកល្បងក្បួនទំនើបជាងនេះដូចជា Support Vector Machine (SVM)Convolutional Neural Network (CNN) ដោយប្រើប្រាស់បណ្ណាល័យ Scikit-learnTensorFlow ដើម្បីប្រៀបធៀបកម្រិតភាពសុក្រឹត។
  4. សាងសង់ចំណុចប្រទាក់អ្នកប្រើប្រាស់ (User Interface): បង្កើតកម្មវិធីលើកុំព្យូទ័រ (Desktop Application) ឬកម្មវិធីទូរស័ព្ទ (Mobile Application) ដោយប្រើប្រាស់ PyQt, TkinterFlutter ដើម្បីឱ្យសាធារណជន ឬអ្នកស្រាវជ្រាវអាចបញ្ចូលរូបភាពថត និងទទួលបានលទ្ធផលនៃការសម្គាល់រុក្ខជាតិបានយ៉ាងងាយស្រួល។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Image preprocessing (ការរៀបចំរូបភាពជាមុន) ដំណើរការកែសម្រួលរូបភាពដើមឱ្យមានគុណភាពល្អជាងមុន ដូចជាការប្តូរទំហំ បំប្លែងទៅជាសខ្មៅ ឬបំបាត់ភាពស្រអាប់ ដើម្បីឱ្យកុំព្យូទ័រងាយស្រួល និងដំណើរការលឿនក្នុងការវិភាគនៅជំហានបន្ទាប់។ ដូចជាការជូតសម្អាតវ៉ែនតាឱ្យភ្លឺច្បាស់ មុនពេលយើងសម្លឹងមើលវត្ថុអ្វីមួយយ៉ាងលម្អិត។
Features extraction (ការទាញយកលក្ខណៈពិសេស) ដំណើរការទាញយកព័ត៌មាន ឬទិន្នន័យសំខាន់ៗពីរូបភាព (ដូចជារាង ទំហំ ពណ៌ និងទម្រង់សរសៃស្លឹក) មកបំប្លែងជាលេខកូដដើម្បីតំណាងឱ្យរូបភាពនោះក្នុងការប្រៀបធៀប។ ដូចជាការកត់ត្រាតែចំណុចសម្គាល់ពិសេសៗរបស់ជនសង្ស័យ (ដូចជាមានប្រជ្រុយ ស្នាមសម្លាក) ជំនួសឱ្យការចងចាំគ្រប់ចំណុចទាំងអស់នៃផ្ទៃមុខទាំងមូល។
K-nearest neighbor algorithm (ក្បួនដោះស្រាយ K-Nearest Neighbor / អ្នកជិតខាងក្បែរបំផុត) ជាក្បួនដោះស្រាយផ្នែក Machine Learning សម្រាប់ធ្វើចំណាត់ថ្នាក់ទិន្នន័យ ដោយពឹងផ្អែកលើការប្រៀបធៀបទិន្នន័យថ្មីទៅនឹងទិន្នន័យចាស់ដែលនៅជិតវាជាងគេបំផុតចំនួន K។ បើវាស្រដៀងទៅនឹងក្រុមណាជាងគេ វាត្រូវបានចាត់ចូលទៅក្រុមនោះ។ ដូចជាការសន្និដ្ឋានថាបុគ្គលម្នាក់ជាសិស្សរៀនពូកែ ប្រសិនបើមិត្តភក្តិជិតស្និទ្ធរបស់គេភាគច្រើនសុទ្ធតែជាសិស្សពូកែ (សេពគប់អ្នកណា ទៅជាអ្នកនោះ)។
Binarization (ការបំប្លែងជារូបភាពស-ខ្មៅទ្វេភាគ) ជាបច្ចេកទេសបំប្លែងរូបភាពពណ៌ ឬរូបភាពប្រផេះ (Grayscale) ទៅជារូបភាពដែលមានតែតម្លៃភីកសែល (Pixel) ពីរពណ៌ប៉ុណ្ណោះគឺ ស និងខ្មៅ (1 និង 0) ដើម្បីងាយស្រួលបែងចែកវត្ថុ (ស្លឹកឈើ) ចេញពីផ្ទៃខាងក្រោយ។ ដូចជាការគូសស្រមោលខ្មៅលើក្រដាសស ដែលបង្ហាញត្រឹមតែរូបរាងខាងក្រៅនៃវត្ថុដោយមិនខ្វល់ពីពណ៌ ឬពន្លឺ។
Morphological operations (ប្រតិបត្តិការរូបសណ្ឋាន) ជាវិធីសាស្ត្រក្នុងដំណើរការរូបភាពដើម្បីកែប្រែរូបរាងរបស់វត្ថុក្នុងរូបភាពស-ខ្មៅ ដូចជាការលុបបំបាត់ចំណុចតូចៗ (Noise) ឬការបំពេញរន្ធប្រហោងក្នុងរូបភាពស្លឹកដើម្បីឱ្យវាមើលទៅពេញលេញ។ ដូចជាការប្រើជ័រលុបដើម្បីលុបស្នាមប្រឡាក់តូចៗនៅលើផ្ទាំងគំនូរ ដើម្បីឱ្យរូបភាពមើលទៅស្អាត និងរលោងល្អ។
Sobel edge detection (ការរកឃើញគែមដោយប្រើបច្ចេកទេស Sobel) គឺក្បួនគណិតវិទ្យាសម្រាប់ស្វែងរកបន្ទាត់ព្រំដែន ឬគែមនៃវត្ថុនៅក្នុងរូបភាព (ប្រើសម្រាប់ស្វែងរកសរសៃស្លឹក) ដោយរកមើលកន្លែងដែលមានការផ្លាស់ប្តូរពន្លឺភ្លាមៗរវាងភីកសែល។ ដូចជាការប្រើប៊ិចគូសបន្ទាត់តាមគែមរូបភាពក្នុងសៀវភៅផាត់ពណ៌ ដើម្បីឱ្យឃើញរូបរាងច្បាស់មុននឹងផាត់ពណ៌ពីលើ។
Euclidean distance (ចម្ងាយ Euclidean) ជារង្វាស់ប្រវែងចម្ងាយត្រង់រវាងចំណុចពីរនៅក្នុងលំហគណិតវិទ្យា ដែលប្រព័ន្ធកុំព្យូទ័រក្នុងអត្ថបទនេះប្រើដើម្បីវាស់ស្ទង់ភាពស្រដៀងគ្នារវាងលក្ខណៈពិសេសនៃស្លឹកថ្មី និងស្លឹកដែលមានស្រាប់ក្នុងប្រព័ន្ធ។ ដូចជាការវាស់ចម្ងាយផ្លូវកាត់ដោយត្រង់តាមបន្ទាត់ពីផ្ទះមួយទៅផ្ទះមួយទៀតដោយមិនខ្វល់ពីផ្លូវបត់បែន។
Lab* color space (លំហពណ៌ Lab*) ជាប្រព័ន្ធទម្រង់ពណ៌ដែលបំបែកពណ៌ជារបៀបផ្សេងពី RGB ដោយផ្តោតលើពន្លឺ (L*) និងអ័ក្សពណ៌ពីរផ្សេងទៀត (a* និង b*) ដែលជួយឱ្យការប្រៀបធៀបពណ៌ស្លឹកឈើកាន់តែសុក្រឹត ទោះបីជាថតក្រោមស្ថានភាពពន្លឺខុសគ្នាក៏ដោយ។ ដូចជាការប្រាប់ទីតាំងផ្ទះដោយប្រើទិសដៅច្បាស់លាស់ (ពន្លឺខ្លាំង-ខ្សោយ ពណ៌ក្រហម-បៃតង ពណ៌ខៀវ-លឿង) ជាជាងគ្រាន់តែនិយាយថាផ្ទះនោះពណ៌អ្វី។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖