បញ្ហា (The Problem)៖ មានប្រភេទរុក្ខជាតិឱសថថៃជាច្រើនប្រភេទដែលមានលក្ខណៈប្រហាក់ប្រហែលគ្នា ដែលធ្វើឱ្យប្រជាជនទូទៅពិបាកក្នុងការសម្គាល់ពួកវាឱ្យបានត្រឹមត្រូវសម្រាប់ការចម្អិនអាហារ និងការប្រើប្រាស់ជាឱសថ។
វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះបានបង្កើតប្រព័ន្ធកុំព្យូទ័រមួយដោយប្រើប្រាស់បច្ចេកវិទ្យាដំណើរការរូបភាព និងការសម្គាល់លំនាំ ដើម្បីទាញយករូបរាងលក្ខណៈពិសេសពីស្លឹករុក្ខជាតិសម្រាប់ធ្វើការប្រៀបធៀប។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| K-Nearest Neighbor Classifier (THLIRS Proposed Method) ក្បួនដោះស្រាយ K-Nearest Neighbor (ប្រព័ន្ធ THLIRS) |
មានភាពសាមញ្ញក្នុងការអនុវត្ត និងប្រើប្រាស់លក្ខណៈពិសេសនៃរូបភាពច្រើន (១៣ចំណុច) ដើម្បីបង្កើនភាពសុក្រឹតនៃការផ្គូផ្គង។ | មិនអាចសម្គាល់ប្រភេទរុក្ខជាតិដែលមិនធ្លាប់បានបង្វឹក (Untrained Dataset) បានទាល់តែសោះ ហើយអាចទាមទារពេលវេលាគណនាយូរប្រសិនបើទិន្នន័យមានទំហំធំ។ | ទទួលបានអត្រាភាពសុក្រឹត ៩៣,២៩% លើការធ្វើតេស្តរុក្ខជាតិចំនួន ៣២ប្រភេទ (៣២៨ រូបភាព)។ |
| Probabilistic Neural Networks (PNN) (Huang and Peng, 2008) បណ្តាញសរសៃប្រសាទសិប្បនិម្មិតប្រូបាប៊ីលីតេ (PNN) |
មានសមត្ថភាពខ្ពស់ក្នុងការរៀនលំនាំស្មុគស្មាញ និងផ្តល់អត្រាភាពសុក្រឹតខ្ពស់បំផុតក្នុងការស្រាវជ្រាវប្រៀបធៀប។ | ទាមទារទិន្នន័យសម្រាប់បង្វឹកក្នុងបរិមាណច្រើនខ្លាំង (២១០០ រូបភាព) និងស៊ីធនធានកុំព្យូទ័រច្រើន។ | ទទួលបានអត្រាភាពសុក្រឹតរហូតដល់ ៩៨,៣០% លើរុក្ខជាតិចំនួន ៣០ប្រភេទ។ |
| Support Vector Machine (SVM) (Wu and Chengwei, 2006) ម៉ាស៊ីនវ៉ិចទ័រគាំទ្រ (SVM) |
ផ្តល់លទ្ធផលល្អប្រសើរ និងមានភាពរឹងមាំក្នុងការកាត់បន្ថយកំហុសចំណាត់ថ្នាក់ ទោះបីជាទិន្នន័យមានទំហំមធ្យមក៏ដោយ។ | ការធ្វើតេស្តនៅក្នុងឯកសារយោងនេះធ្វើឡើងលើរុក្ខជាតិតែ ១ប្រភេទប៉ុណ្ណោះ ដែលមិនទាន់ឆ្លុះបញ្ចាំងពីប្រសិទ្ធភាពជារួមលើរុក្ខជាតិចម្រុះ។ | ទទួលបានអត្រាភាពសុក្រឹត ៩៧,៤០% លើទិន្នន័យចំនួន ៣០០ សំណាក។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារធនធានកុំព្យូទ័រ និងកម្មវិធីកម្រិតមធ្យម ព្រមទាំងឧបករណ៍ថតរូបសាមញ្ញដើម្បីដំណើរការប្រព័ន្ធដោយជោគជ័យ។
ការសិក្សានេះប្រមូលទិន្នន័យរូបភាពស្លឹករុក្ខជាតិឱសថពីប្រទេសថៃ ដែលមានលក្ខណៈស្រដៀងគ្នាខ្លាំងទៅនឹងរុក្ខជាតិនៅកម្ពុជា។ ទោះជាយ៉ាងណាក៏ដោយ ចំនួនប្រភេទរុក្ខជាតិដែលបានធ្វើតេស្ត (៣២ប្រភេទ) គឺនៅមានកម្រិតតិចតួចនៅឡើយបើធៀបនឹងរុក្ខជាតិឱសថរាប់ពាន់ប្រភេទក្នុងធម្មជាតិ ដែលតម្រូវឱ្យមានការប្រមូលទិន្នន័យរូបភាពរុក្ខជាតិក្នុងស្រុកបន្ថែមទៀតដើម្បីធានាបាននូវភាពសុក្រឹត និងប្រសិទ្ធភាពខ្ពស់នៅកម្ពុជា។
ប្រព័ន្ធនេះមានសក្តានុពលខ្ពស់ក្នុងការយកមកអនុវត្ត និងកែច្នៃបន្ថែមនៅប្រទេសកម្ពុជា ជាពិសេសក្នុងវិស័យកសិកម្ម វេជ្ជសាស្ត្របុរាណ និងការអប់រំ។
សរុបមក ការអនុវត្តបច្ចេកវិទ្យានេះនៅកម្ពុជាទាមទារឱ្យមានការសហការរវាងអ្នកជំនាញបច្ចេកវិទ្យាព័ត៌មាន និងអ្នករុក្ខសាស្ត្រ ដើម្បីបង្កើតមូលដ្ឋានទិន្នន័យរុក្ខជាតិឱសថខ្មែរដែលរឹងមាំ និងងាយស្រួលប្រើប្រាស់។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Image preprocessing (ការរៀបចំរូបភាពជាមុន) | ដំណើរការកែសម្រួលរូបភាពដើមឱ្យមានគុណភាពល្អជាងមុន ដូចជាការប្តូរទំហំ បំប្លែងទៅជាសខ្មៅ ឬបំបាត់ភាពស្រអាប់ ដើម្បីឱ្យកុំព្យូទ័រងាយស្រួល និងដំណើរការលឿនក្នុងការវិភាគនៅជំហានបន្ទាប់។ | ដូចជាការជូតសម្អាតវ៉ែនតាឱ្យភ្លឺច្បាស់ មុនពេលយើងសម្លឹងមើលវត្ថុអ្វីមួយយ៉ាងលម្អិត។ |
| Features extraction (ការទាញយកលក្ខណៈពិសេស) | ដំណើរការទាញយកព័ត៌មាន ឬទិន្នន័យសំខាន់ៗពីរូបភាព (ដូចជារាង ទំហំ ពណ៌ និងទម្រង់សរសៃស្លឹក) មកបំប្លែងជាលេខកូដដើម្បីតំណាងឱ្យរូបភាពនោះក្នុងការប្រៀបធៀប។ | ដូចជាការកត់ត្រាតែចំណុចសម្គាល់ពិសេសៗរបស់ជនសង្ស័យ (ដូចជាមានប្រជ្រុយ ស្នាមសម្លាក) ជំនួសឱ្យការចងចាំគ្រប់ចំណុចទាំងអស់នៃផ្ទៃមុខទាំងមូល។ |
| K-nearest neighbor algorithm (ក្បួនដោះស្រាយ K-Nearest Neighbor / អ្នកជិតខាងក្បែរបំផុត) | ជាក្បួនដោះស្រាយផ្នែក Machine Learning សម្រាប់ធ្វើចំណាត់ថ្នាក់ទិន្នន័យ ដោយពឹងផ្អែកលើការប្រៀបធៀបទិន្នន័យថ្មីទៅនឹងទិន្នន័យចាស់ដែលនៅជិតវាជាងគេបំផុតចំនួន K។ បើវាស្រដៀងទៅនឹងក្រុមណាជាងគេ វាត្រូវបានចាត់ចូលទៅក្រុមនោះ។ | ដូចជាការសន្និដ្ឋានថាបុគ្គលម្នាក់ជាសិស្សរៀនពូកែ ប្រសិនបើមិត្តភក្តិជិតស្និទ្ធរបស់គេភាគច្រើនសុទ្ធតែជាសិស្សពូកែ (សេពគប់អ្នកណា ទៅជាអ្នកនោះ)។ |
| Binarization (ការបំប្លែងជារូបភាពស-ខ្មៅទ្វេភាគ) | ជាបច្ចេកទេសបំប្លែងរូបភាពពណ៌ ឬរូបភាពប្រផេះ (Grayscale) ទៅជារូបភាពដែលមានតែតម្លៃភីកសែល (Pixel) ពីរពណ៌ប៉ុណ្ណោះគឺ ស និងខ្មៅ (1 និង 0) ដើម្បីងាយស្រួលបែងចែកវត្ថុ (ស្លឹកឈើ) ចេញពីផ្ទៃខាងក្រោយ។ | ដូចជាការគូសស្រមោលខ្មៅលើក្រដាសស ដែលបង្ហាញត្រឹមតែរូបរាងខាងក្រៅនៃវត្ថុដោយមិនខ្វល់ពីពណ៌ ឬពន្លឺ។ |
| Morphological operations (ប្រតិបត្តិការរូបសណ្ឋាន) | ជាវិធីសាស្ត្រក្នុងដំណើរការរូបភាពដើម្បីកែប្រែរូបរាងរបស់វត្ថុក្នុងរូបភាពស-ខ្មៅ ដូចជាការលុបបំបាត់ចំណុចតូចៗ (Noise) ឬការបំពេញរន្ធប្រហោងក្នុងរូបភាពស្លឹកដើម្បីឱ្យវាមើលទៅពេញលេញ។ | ដូចជាការប្រើជ័រលុបដើម្បីលុបស្នាមប្រឡាក់តូចៗនៅលើផ្ទាំងគំនូរ ដើម្បីឱ្យរូបភាពមើលទៅស្អាត និងរលោងល្អ។ |
| Sobel edge detection (ការរកឃើញគែមដោយប្រើបច្ចេកទេស Sobel) | គឺក្បួនគណិតវិទ្យាសម្រាប់ស្វែងរកបន្ទាត់ព្រំដែន ឬគែមនៃវត្ថុនៅក្នុងរូបភាព (ប្រើសម្រាប់ស្វែងរកសរសៃស្លឹក) ដោយរកមើលកន្លែងដែលមានការផ្លាស់ប្តូរពន្លឺភ្លាមៗរវាងភីកសែល។ | ដូចជាការប្រើប៊ិចគូសបន្ទាត់តាមគែមរូបភាពក្នុងសៀវភៅផាត់ពណ៌ ដើម្បីឱ្យឃើញរូបរាងច្បាស់មុននឹងផាត់ពណ៌ពីលើ។ |
| Euclidean distance (ចម្ងាយ Euclidean) | ជារង្វាស់ប្រវែងចម្ងាយត្រង់រវាងចំណុចពីរនៅក្នុងលំហគណិតវិទ្យា ដែលប្រព័ន្ធកុំព្យូទ័រក្នុងអត្ថបទនេះប្រើដើម្បីវាស់ស្ទង់ភាពស្រដៀងគ្នារវាងលក្ខណៈពិសេសនៃស្លឹកថ្មី និងស្លឹកដែលមានស្រាប់ក្នុងប្រព័ន្ធ។ | ដូចជាការវាស់ចម្ងាយផ្លូវកាត់ដោយត្រង់តាមបន្ទាត់ពីផ្ទះមួយទៅផ្ទះមួយទៀតដោយមិនខ្វល់ពីផ្លូវបត់បែន។ |
| Lab* color space (លំហពណ៌ Lab*) | ជាប្រព័ន្ធទម្រង់ពណ៌ដែលបំបែកពណ៌ជារបៀបផ្សេងពី RGB ដោយផ្តោតលើពន្លឺ (L*) និងអ័ក្សពណ៌ពីរផ្សេងទៀត (a* និង b*) ដែលជួយឱ្យការប្រៀបធៀបពណ៌ស្លឹកឈើកាន់តែសុក្រឹត ទោះបីជាថតក្រោមស្ថានភាពពន្លឺខុសគ្នាក៏ដោយ។ | ដូចជាការប្រាប់ទីតាំងផ្ទះដោយប្រើទិសដៅច្បាស់លាស់ (ពន្លឺខ្លាំង-ខ្សោយ ពណ៌ក្រហម-បៃតង ពណ៌ខៀវ-លឿង) ជាជាងគ្រាន់តែនិយាយថាផ្ទះនោះពណ៌អ្វី។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖