Original Title: A Flower Recognition System Based On Image Processing And Neural Networks
Source: www.ijstr.org
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ប្រព័ន្ធកំណត់អត្តសញ្ញាណផ្កាផ្អែកលើដំណើរការរូបភាពនិងបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត

ចំណងជើងដើម៖ A Flower Recognition System Based On Image Processing And Neural Networks

អ្នកនិពន្ធ៖ Huthaifa Almogdady, Dr. Saher Manaseer, Dr. Hazem Hiary

ឆ្នាំបោះពុម្ព៖ 2018 INTERNATIONAL JOURNAL OF SCIENTIFIC & TECHNOLOGY RESEARCH

វិស័យសិក្សា៖ Computer Vision

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការកំណត់អត្តសញ្ញាណប្រភេទផ្កាគឺមានភាពលំបាកដោយសារភាពស្រដៀងគ្នារវាងប្រភេទផ្កាផ្សេងៗគ្នា និងភាពស្មុគស្មាញនៃផ្ទៃខាងក្រោយនៃរូបភាព។ ការស្រាវជ្រាវនេះមានគោលបំណងដោះស្រាយបញ្ហានេះដោយបង្កើតប្រព័ន្ធស្គាល់ផ្កាដោយស្វ័យប្រវត្តិ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់វិធីសាស្ត្រដំណើរការរូបភាពរួមបញ្ចូលគ្នាជាមួយបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត ដោយអនុវត្តតាម៤ដំណាក់កាលចម្បង។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Proposed Method (CVAC + GLCM/HSV/IM + ANN)
វិធីសាស្ត្រដែលបានស្នើ (ការបែងចែក CVAC ទាញយកលក្ខណៈពណ៌/វាយនភាព/រូបរាង និងប្រើប្រាស់ ANN)
រួមបញ្ចូលលក្ខណៈសម្បត្តិទាំង៣រួមគ្នា (ពណ៌ វាយនភាព រូបរាង) ធ្វើឲ្យការចាត់ថ្នាក់មានភាពសុក្រឹតខ្ពស់ និងកាត់បន្ថយការរំខានពីផ្ទៃខាងក្រោយបានយ៉ាងល្អដោយសារបច្ចេកទេសកាត់រូបភាពមុនពេលដំណើរការ។ ទាមទារការកំណត់ប៉ារ៉ាម៉ែត្រដោយដៃ (ដូចជាទំហំកាត់រូបភាព និងចំនួនជុំអតិបរមានៃការបែងចែក CVAC) ដែលអាចចំណាយពេលយូរក្នុងការកំណត់។ ទទួលបានភាពត្រឹមត្រូវ ៨១,១៩% លើសំណុំទិន្នន័យ Oxford 102។
BiCoS-MT (Chai et al., 2011)
វិធីសាស្ត្របែងចែករូបភាព BiCoS-MT រួមជាមួយនឹងការចាត់ថ្នាក់ SVM
ប្រើប្រាស់វិធីសាស្ត្របែងចែក Co-segmentation និងលក្ខណៈ SIFT ដែលមានភាពរឹងមាំក្នុងការស្វែងរកចំណុចលេចធ្លោនៃរូបភាពដោយស្វ័យប្រវត្តិ។ មិនបានប្រើប្រាស់លក្ខណៈវាយនភាព (Texture) និងមិនមានការកែលម្អរូបភាពជាមុន ដែលធ្វើឲ្យលទ្ធផលរួមទាបជាងវិធីសាស្ត្រដែលបានស្នើបន្តិច។ ទទួលបានភាពត្រឹមត្រូវ ៨០,០០% លើសំណុំទិន្នន័យ Oxford 102។
Nilsback et al., 2009
ការចាត់ថ្នាក់ផ្កាដោយប្រើប្រាស់ម៉ាស៊ីនវ៉ិចទ័រគាំទ្រ (SVM)
ប្រើប្រាស់លក្ខណៈពណ៌ វាយនភាព និងរូបរាង រួមជាមួយនឹងបច្ចេកទេស SVM ដែលជាក្បួនដោះស្រាយមានស្ថិរភាពខ្ពស់ក្នុងការស្រាវជ្រាវម៉ាស៊ីនរៀន (Machine Learning)។ ទទួលបានភាពត្រឹមត្រូវទាបជាងការប្រើប្រាស់បណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត (ANN) សម្រាប់សំណុំទិន្នន័យ និងកម្រិតនៃការទាញយកលក្ខណៈនេះ។ ទទួលបានអត្រាភាពត្រឹមត្រូវ ៧៦,៣% លើសំណុំទិន្នន័យ Oxford 102។

ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះបានបញ្ជាក់យ៉ាងច្បាស់អំពីតម្រូវការផ្នែករឹង និងផ្នែកទន់សម្រាប់ការអនុវត្ត និងការសាកល្បងម៉ូដែលនេះ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យផ្កា Oxford 102 ដែលផ្តោតជាចម្បងលើប្រភេទផ្កាដែលដាំដុះនៅក្នុងចក្រភពអង់គ្លេស។ ប្រសិនបើកម្ពុជាចង់អនុវត្តប្រព័ន្ធនេះ វាចាំបាច់ត្រូវប្រមូល និងបង្កើតសំណុំទិន្នន័យរុក្ខជាតិក្នុងស្រុកផ្ទាល់ខ្លួន ព្រោះរុក្ខជាតិនៅតំបន់អាស៊ីអាគ្នេយ៍មានលក្ខណៈ និងរូបរាងខុសប្លែកពីតំបន់អឺរ៉ុប។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាទិន្នន័យផ្កាមានភាពខុសគ្នាក៏ដោយ ប៉ុន្តែវិធីសាស្ត្រដំណើរការរូបភាពនេះមានអត្ថប្រយោជន៍ខ្ពស់សម្រាប់ការស្រាវជ្រាវ និងការអភិវឌ្ឍនៅកម្ពុជា។

ជារួម បច្ចេកទេសនេះគឺជាមូលដ្ឋានគ្រឹះដ៏ល្អមួយសម្រាប់ស្ថាប័នស្រាវជ្រាវកម្ពុជាក្នុងការបង្កើតប្រព័ន្ធកុំព្យូទ័រដែលអាចយល់ដឹងពីរុក្ខជាតិក្នុងស្រុក ដើម្បីជំរុញទាំងការអភិរក្ស វិស័យកសិកម្ម និងអេកូទេសចរណ៍។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាពីមូលដ្ឋានគ្រឹះដំណើរការរូបភាព (Image Processing): ស្វែងយល់ពីបច្ចេកទេសកែលម្អរូបភាព និងការបែងចែករូបភាពដូចជាបច្ចេកទេស Chan-Vese Active Contour ដោយសាកល្បងអនុវត្តកូដជាក់ស្តែងជាមួយបណ្ណាល័យ OpenCV នៅក្នុងភាសា PythonMATLAB
  2. អនុវត្តការទាញយកលក្ខណៈសម្បត្តិ (Feature Extraction): រៀនសរសេរកូដដើម្បីទាញយកទិន្នន័យពណ៌តាមរយៈម៉ូដែល HSV Color Model ទិន្នន័យវាយនភាពដោយប្រើម៉ាទ្រីស GLCM និងទិន្នន័យទម្រង់រូបរាងដោយប្រើរូបមន្ត Hu Moments ពីរូបភាពជាក់ស្តែង។
  3. ប្រមូល និងរៀបចំសំណុំទិន្នន័យក្នុងស្រុក (Local Dataset Collection): ចាប់ផ្តើមប្រមូលរូបភាពផ្កា ឬស្លឹករុក្ខជាតិក្នុងស្រុកកម្ពុជា (ឧទាហរណ៍៖ ផ្ការំដួល ផ្កាឈូក ផ្កាម្លិះ) ហើយរៀបចំកាត់ផ្ទៃខាងក្រោយចេញឱ្យបានស្អាតដើម្បីប្រើជាទិន្នន័យសម្រាប់បង្វឹកម៉ូដែល។
  4. បង្កើត និងបង្វឹកបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត (ANN): ប្រើប្រាស់ឧបករណ៍ដូចជា TensorFlow, KerasMATLAB Neural Network Toolbox ដើម្បីបង្កើតម៉ូដែល Back-Propagation ANN និងចាប់ផ្តើមបង្វឹកវាជាមួយទិន្នន័យលក្ខណៈសម្បត្តិ (Features) ដែលបានរៀបចំ។
  5. វាយតម្លៃ និងធ្វើឱ្យម៉ូដែលកាន់តែប្រសើរឡើង (Evaluation & Optimization): ធ្វើតេស្តម៉ូដែលរបស់អ្នកជាមួយរូបភាពផ្កាថ្មីៗដែលម៉ូដែលមិនធ្លាប់បានឃើញ វាស់ស្ទង់ភាពត្រឹមត្រូវ និងសាកល្បងផ្លាស់ប្តូរចំនួន NeuronsHidden Layers ដើម្បីទទួលបានលទ្ធផលចាត់ថ្នាក់ដែលមានភាពត្រឹមត្រូវខ្ពស់ជាងមុន។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Chan-Vese Active Contour វិធីសាស្ត្រក្នុងការបែងចែករូបភាពដែលប្រើប្រាស់ថាមពលគណិតវិទ្យាដើម្បីរាវរកព្រំដែននៃវត្ថុ (ដូចជាផ្កា) ដោយមិនពឹងផ្អែកតែលើគែម (edges) របស់វានោះទេ តែផ្អែកលើផ្ទៃពណ៌រួម។ នេះជួយបំបែកផ្កាចេញពីផ្ទៃខាងក្រោយបានយ៉ាងច្បាស់លាស់។ ដូចជាការគូសរង្វង់ខ្សែយឺតមួយជុំវិញវត្ថុ រួចបន្តរួញឬរីករង្វង់នោះរហូតដល់វាអោបជាប់រាងរបស់វត្ថុនោះយ៉ាងជិតល្អ។
Gray Level Co-occurrence Matrix (GLCM) បច្ចេកទេសទាញយកលក្ខណៈវាយនភាព (Texture) នៃរូបភាព ដោយរាប់ចំនួនដងដែលគូនៃភីកសែល (pixels) មានកម្រិតពណ៌ប្រផេះជាក់លាក់ស្ថិតនៅក្បែរគ្នា។ វាជួយឲ្យកុំព្យូទ័រយល់ពីភាពគ្រើម ឬភាពរលោងនៃផ្ទៃរបស់ផ្កា។ ដូចជាការពិនិត្យមើលសាច់ក្រណាត់ថាតើវាមានក្រឡាញឹក ឬរង្វើល ដោយរាប់ចំនួនសរសៃអំបោះដែលនៅក្បែរៗគ្នា។
Invariant Moments រូបមន្តគណិតវិទ្យាដែលប្រើដើម្បីទាញយកទម្រង់រាងរបស់វត្ថុ (Shape features) ក្នុងរូបភាព ដែលលក្ខណៈទាំងនេះមិនប្រែប្រួលទេទោះបីជារូបភាពនោះត្រូវបានបង្វិល បង្រួមពង្រីក ឬផ្លាស់ទីក៏ដោយ។ ដូចជាការចងចាំទម្រង់មុខរបស់មនុស្សម្នាក់ ដែលទោះបីជាគាត់ងាកមុខ ឈរឆ្ងាយ ឬឈរជិត ក៏យើងនៅតែអាចចំណាំគាត់បានដោយមិនច្រឡំ។
Back-Propagation Artificial Neural Network ប្រភេទនៃបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត ដែលរៀនចំណាំទិន្នន័យតាមរយៈការកែតម្រូវកំហុស។ នៅពេលវាកំណត់អត្តសញ្ញាណខុស វាបញ្ជូនកំហុសនោះត្រឡប់ថយក្រោយវិញដើម្បីកែសម្រួលទម្ងន់ទិន្នន័យ (weights) ឲ្យការទាយលើកក្រោយមានភាពត្រឹមត្រូវជាងមុន។ ដូចជាសិស្សដែលធ្វើលំហាត់ខុស ហើយគ្រូប្រាប់ពីកំហុសនោះ ដើម្បីឲ្យសិស្សកែតម្រូវនិងចងចាំកុំឲ្យខុសនៅពេលប្រឡងលើកក្រោយ។
HSV Color Model ប្រព័ន្ធតំណាងពណ៌ដែលបែងចែកពណ៌ជា៣ផ្នែកគឺ Hue (ប្រភេទពណ៌), Saturation (ភាពឆ្អែតនៃពណ៌ ឬកម្រិតប្រផេះ), និង Value (ពន្លឺ ឬភាពភ្លឺងងឹត)។ វាមានប្រសិទ្ធភាពជាង RGB ក្នុងការកាត់បន្ថយភាពរំខានដោយសារការប្រែប្រួលពន្លឺពេលថតរូប។ ដូចជាការពណ៌នាអំពីថ្នាំលាបពណ៌ដោយនិយាយថាវាជាពណ៌ក្រហម (Hue) លាយទឹកច្រើនឬតិច (Saturation) ហើយស្ថិតក្រោមពន្លឺថ្ងៃឬក្នុងម្លប់ (Value)។
Image Segmentation ដំណើរការបែងចែករូបភាពឌីជីថលទៅជាផ្នែកៗ (ឬក្រុមភីកសែល) ដើម្បីសម្រួលដល់ការវិភាគ ដោយកាត់យកតែវត្ថុគោលដៅ (Foreground) និងកាត់ចោលផ្ទៃខាងក្រោយដែលមិនចាំបាច់ (Background)។ ដូចជាការប្រើកន្ត្រៃកាត់យករូបផ្កាចេញពីសៀវភៅទស្សនាវដ្ដី រួចបោះចោលផ្ទៃក្រដាសដែលនៅសល់។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖