បញ្ហា (The Problem)៖ ការកំណត់អត្តសញ្ញាណប្រភេទផ្កាគឺមានភាពលំបាកដោយសារភាពស្រដៀងគ្នារវាងប្រភេទផ្កាផ្សេងៗគ្នា និងភាពស្មុគស្មាញនៃផ្ទៃខាងក្រោយនៃរូបភាព។ ការស្រាវជ្រាវនេះមានគោលបំណងដោះស្រាយបញ្ហានេះដោយបង្កើតប្រព័ន្ធស្គាល់ផ្កាដោយស្វ័យប្រវត្តិ។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់វិធីសាស្ត្រដំណើរការរូបភាពរួមបញ្ចូលគ្នាជាមួយបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត ដោយអនុវត្តតាម៤ដំណាក់កាលចម្បង។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Proposed Method (CVAC + GLCM/HSV/IM + ANN) វិធីសាស្ត្រដែលបានស្នើ (ការបែងចែក CVAC ទាញយកលក្ខណៈពណ៌/វាយនភាព/រូបរាង និងប្រើប្រាស់ ANN) |
រួមបញ្ចូលលក្ខណៈសម្បត្តិទាំង៣រួមគ្នា (ពណ៌ វាយនភាព រូបរាង) ធ្វើឲ្យការចាត់ថ្នាក់មានភាពសុក្រឹតខ្ពស់ និងកាត់បន្ថយការរំខានពីផ្ទៃខាងក្រោយបានយ៉ាងល្អដោយសារបច្ចេកទេសកាត់រូបភាពមុនពេលដំណើរការ។ | ទាមទារការកំណត់ប៉ារ៉ាម៉ែត្រដោយដៃ (ដូចជាទំហំកាត់រូបភាព និងចំនួនជុំអតិបរមានៃការបែងចែក CVAC) ដែលអាចចំណាយពេលយូរក្នុងការកំណត់។ | ទទួលបានភាពត្រឹមត្រូវ ៨១,១៩% លើសំណុំទិន្នន័យ Oxford 102។ |
| BiCoS-MT (Chai et al., 2011) វិធីសាស្ត្របែងចែករូបភាព BiCoS-MT រួមជាមួយនឹងការចាត់ថ្នាក់ SVM |
ប្រើប្រាស់វិធីសាស្ត្របែងចែក Co-segmentation និងលក្ខណៈ SIFT ដែលមានភាពរឹងមាំក្នុងការស្វែងរកចំណុចលេចធ្លោនៃរូបភាពដោយស្វ័យប្រវត្តិ។ | មិនបានប្រើប្រាស់លក្ខណៈវាយនភាព (Texture) និងមិនមានការកែលម្អរូបភាពជាមុន ដែលធ្វើឲ្យលទ្ធផលរួមទាបជាងវិធីសាស្ត្រដែលបានស្នើបន្តិច។ | ទទួលបានភាពត្រឹមត្រូវ ៨០,០០% លើសំណុំទិន្នន័យ Oxford 102។ |
| Nilsback et al., 2009 ការចាត់ថ្នាក់ផ្កាដោយប្រើប្រាស់ម៉ាស៊ីនវ៉ិចទ័រគាំទ្រ (SVM) |
ប្រើប្រាស់លក្ខណៈពណ៌ វាយនភាព និងរូបរាង រួមជាមួយនឹងបច្ចេកទេស SVM ដែលជាក្បួនដោះស្រាយមានស្ថិរភាពខ្ពស់ក្នុងការស្រាវជ្រាវម៉ាស៊ីនរៀន (Machine Learning)។ | ទទួលបានភាពត្រឹមត្រូវទាបជាងការប្រើប្រាស់បណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត (ANN) សម្រាប់សំណុំទិន្នន័យ និងកម្រិតនៃការទាញយកលក្ខណៈនេះ។ | ទទួលបានអត្រាភាពត្រឹមត្រូវ ៧៦,៣% លើសំណុំទិន្នន័យ Oxford 102។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះបានបញ្ជាក់យ៉ាងច្បាស់អំពីតម្រូវការផ្នែករឹង និងផ្នែកទន់សម្រាប់ការអនុវត្ត និងការសាកល្បងម៉ូដែលនេះ។
ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យផ្កា Oxford 102 ដែលផ្តោតជាចម្បងលើប្រភេទផ្កាដែលដាំដុះនៅក្នុងចក្រភពអង់គ្លេស។ ប្រសិនបើកម្ពុជាចង់អនុវត្តប្រព័ន្ធនេះ វាចាំបាច់ត្រូវប្រមូល និងបង្កើតសំណុំទិន្នន័យរុក្ខជាតិក្នុងស្រុកផ្ទាល់ខ្លួន ព្រោះរុក្ខជាតិនៅតំបន់អាស៊ីអាគ្នេយ៍មានលក្ខណៈ និងរូបរាងខុសប្លែកពីតំបន់អឺរ៉ុប។
ទោះបីជាទិន្នន័យផ្កាមានភាពខុសគ្នាក៏ដោយ ប៉ុន្តែវិធីសាស្ត្រដំណើរការរូបភាពនេះមានអត្ថប្រយោជន៍ខ្ពស់សម្រាប់ការស្រាវជ្រាវ និងការអភិវឌ្ឍនៅកម្ពុជា។
ជារួម បច្ចេកទេសនេះគឺជាមូលដ្ឋានគ្រឹះដ៏ល្អមួយសម្រាប់ស្ថាប័នស្រាវជ្រាវកម្ពុជាក្នុងការបង្កើតប្រព័ន្ធកុំព្យូទ័រដែលអាចយល់ដឹងពីរុក្ខជាតិក្នុងស្រុក ដើម្បីជំរុញទាំងការអភិរក្ស វិស័យកសិកម្ម និងអេកូទេសចរណ៍។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Chan-Vese Active Contour | វិធីសាស្ត្រក្នុងការបែងចែករូបភាពដែលប្រើប្រាស់ថាមពលគណិតវិទ្យាដើម្បីរាវរកព្រំដែននៃវត្ថុ (ដូចជាផ្កា) ដោយមិនពឹងផ្អែកតែលើគែម (edges) របស់វានោះទេ តែផ្អែកលើផ្ទៃពណ៌រួម។ នេះជួយបំបែកផ្កាចេញពីផ្ទៃខាងក្រោយបានយ៉ាងច្បាស់លាស់។ | ដូចជាការគូសរង្វង់ខ្សែយឺតមួយជុំវិញវត្ថុ រួចបន្តរួញឬរីករង្វង់នោះរហូតដល់វាអោបជាប់រាងរបស់វត្ថុនោះយ៉ាងជិតល្អ។ |
| Gray Level Co-occurrence Matrix (GLCM) | បច្ចេកទេសទាញយកលក្ខណៈវាយនភាព (Texture) នៃរូបភាព ដោយរាប់ចំនួនដងដែលគូនៃភីកសែល (pixels) មានកម្រិតពណ៌ប្រផេះជាក់លាក់ស្ថិតនៅក្បែរគ្នា។ វាជួយឲ្យកុំព្យូទ័រយល់ពីភាពគ្រើម ឬភាពរលោងនៃផ្ទៃរបស់ផ្កា។ | ដូចជាការពិនិត្យមើលសាច់ក្រណាត់ថាតើវាមានក្រឡាញឹក ឬរង្វើល ដោយរាប់ចំនួនសរសៃអំបោះដែលនៅក្បែរៗគ្នា។ |
| Invariant Moments | រូបមន្តគណិតវិទ្យាដែលប្រើដើម្បីទាញយកទម្រង់រាងរបស់វត្ថុ (Shape features) ក្នុងរូបភាព ដែលលក្ខណៈទាំងនេះមិនប្រែប្រួលទេទោះបីជារូបភាពនោះត្រូវបានបង្វិល បង្រួមពង្រីក ឬផ្លាស់ទីក៏ដោយ។ | ដូចជាការចងចាំទម្រង់មុខរបស់មនុស្សម្នាក់ ដែលទោះបីជាគាត់ងាកមុខ ឈរឆ្ងាយ ឬឈរជិត ក៏យើងនៅតែអាចចំណាំគាត់បានដោយមិនច្រឡំ។ |
| Back-Propagation Artificial Neural Network | ប្រភេទនៃបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត ដែលរៀនចំណាំទិន្នន័យតាមរយៈការកែតម្រូវកំហុស។ នៅពេលវាកំណត់អត្តសញ្ញាណខុស វាបញ្ជូនកំហុសនោះត្រឡប់ថយក្រោយវិញដើម្បីកែសម្រួលទម្ងន់ទិន្នន័យ (weights) ឲ្យការទាយលើកក្រោយមានភាពត្រឹមត្រូវជាងមុន។ | ដូចជាសិស្សដែលធ្វើលំហាត់ខុស ហើយគ្រូប្រាប់ពីកំហុសនោះ ដើម្បីឲ្យសិស្សកែតម្រូវនិងចងចាំកុំឲ្យខុសនៅពេលប្រឡងលើកក្រោយ។ |
| HSV Color Model | ប្រព័ន្ធតំណាងពណ៌ដែលបែងចែកពណ៌ជា៣ផ្នែកគឺ Hue (ប្រភេទពណ៌), Saturation (ភាពឆ្អែតនៃពណ៌ ឬកម្រិតប្រផេះ), និង Value (ពន្លឺ ឬភាពភ្លឺងងឹត)។ វាមានប្រសិទ្ធភាពជាង RGB ក្នុងការកាត់បន្ថយភាពរំខានដោយសារការប្រែប្រួលពន្លឺពេលថតរូប។ | ដូចជាការពណ៌នាអំពីថ្នាំលាបពណ៌ដោយនិយាយថាវាជាពណ៌ក្រហម (Hue) លាយទឹកច្រើនឬតិច (Saturation) ហើយស្ថិតក្រោមពន្លឺថ្ងៃឬក្នុងម្លប់ (Value)។ |
| Image Segmentation | ដំណើរការបែងចែករូបភាពឌីជីថលទៅជាផ្នែកៗ (ឬក្រុមភីកសែល) ដើម្បីសម្រួលដល់ការវិភាគ ដោយកាត់យកតែវត្ថុគោលដៅ (Foreground) និងកាត់ចោលផ្ទៃខាងក្រោយដែលមិនចាំបាច់ (Background)។ | ដូចជាការប្រើកន្ត្រៃកាត់យករូបផ្កាចេញពីសៀវភៅទស្សនាវដ្ដី រួចបោះចោលផ្ទៃក្រដាសដែលនៅសល់។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖