Original Title: A Flower Recognition System Based On Image Processing And Neural Networks
Source: www.ijstr.org
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ប្រព័ន្ធកំណត់អត្តសញ្ញាណផ្កាផ្អែកលើដំណើរការរូបភាពនិងបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត

ចំណងជើងដើម៖ A Flower Recognition System Based On Image Processing And Neural Networks

អ្នកនិពន្ធ៖ Huthaifa Almogdady, Dr. Saher Manaseer, Dr. Hazem Hiary

ឆ្នាំបោះពុម្ព៖ 2018 INTERNATIONAL JOURNAL OF SCIENTIFIC & TECHNOLOGY RESEARCH

វិស័យសិក្សា៖ Computer Vision

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការកំណត់អត្តសញ្ញាណប្រភេទផ្កាគឺមានភាពលំបាកដោយសារភាពស្រដៀងគ្នារវាងប្រភេទផ្កាផ្សេងៗគ្នា និងភាពស្មុគស្មាញនៃផ្ទៃខាងក្រោយនៃរូបភាព។ ការស្រាវជ្រាវនេះមានគោលបំណងដោះស្រាយបញ្ហានេះដោយបង្កើតប្រព័ន្ធស្គាល់ផ្កាដោយស្វ័យប្រវត្តិ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់វិធីសាស្ត្រដំណើរការរូបភាពរួមបញ្ចូលគ្នាជាមួយបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត ដោយអនុវត្តតាម៤ដំណាក់កាលចម្បង។

ការកែលម្អរូបភាពដោយការកាត់ (Image Enhancement and Cropping)
ការបែងចែករូបភាពផ្កាចេញពីផ្ទៃខាងក្រោយដោយប្រើ (Chan-Vese Active Contour)
ការទាញយកលក្ខណៈសម្បត្តិពណ៌ វាយនភាព និងរូបរាង (Feature Extraction: HSV, GLCM, Invariant Moments)
ការចាត់ថ្នាក់ប្រភេទផ្កាដោយប្រើបណ្ដាញសរសៃប្រសាទ (Classification: Back-Propagation Artificial Neural Network)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ការរួមបញ្ចូលគ្នានៃលក្ខណៈពណ៌ រូបរាង និងវាយនភាព ផ្តល់លទ្ធផលចាត់ថ្នាក់បានល្អជាងការប្រើប្រាស់លក្ខណៈនីមួយៗដាច់ដោយឡែក។
ប្រព័ន្ធដែលបានស្នើឡើងនេះទទួលបានអត្រាភាពត្រឹមត្រូវសរុប ៨១,១៩% ក្នុងការចាត់ថ្នាក់រូបភាពផ្កា។
លទ្ធផលនេះបង្ហាញពីដំណើរការល្អប្រសើរជាងវិធីសាស្ត្រប្រៀបធៀបមួយចំនួន (ដូចជា BiCoS-MT ដែលទទួលបាន ៨០,០%) លើសំណុំទិន្នន័យ Oxford 102 ដូចគ្នា។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Proposed Method (CVAC + GLCM/HSV/IM + ANN) វិធីសាស្ត្រដែលបានស្នើ (ការបែងចែក CVAC ទាញយកលក្ខណៈពណ៌/វាយនភាព/រូបរាង និងប្រើប្រាស់ ANN)	រួមបញ្ចូលលក្ខណៈសម្បត្តិទាំង៣រួមគ្នា (ពណ៌ វាយនភាព រូបរាង) ធ្វើឲ្យការចាត់ថ្នាក់មានភាពសុក្រឹតខ្ពស់ និងកាត់បន្ថយការរំខានពីផ្ទៃខាងក្រោយបានយ៉ាងល្អដោយសារបច្ចេកទេសកាត់រូបភាពមុនពេលដំណើរការ។	ទាមទារការកំណត់ប៉ារ៉ាម៉ែត្រដោយដៃ (ដូចជាទំហំកាត់រូបភាព និងចំនួនជុំអតិបរមានៃការបែងចែក CVAC) ដែលអាចចំណាយពេលយូរក្នុងការកំណត់។	ទទួលបានភាពត្រឹមត្រូវ ៨១,១៩% លើសំណុំទិន្នន័យ Oxford 102។
BiCoS-MT (Chai et al., 2011) វិធីសាស្ត្របែងចែករូបភាព BiCoS-MT រួមជាមួយនឹងការចាត់ថ្នាក់ SVM	ប្រើប្រាស់វិធីសាស្ត្របែងចែក Co-segmentation និងលក្ខណៈ SIFT ដែលមានភាពរឹងមាំក្នុងការស្វែងរកចំណុចលេចធ្លោនៃរូបភាពដោយស្វ័យប្រវត្តិ។	មិនបានប្រើប្រាស់លក្ខណៈវាយនភាព (Texture) និងមិនមានការកែលម្អរូបភាពជាមុន ដែលធ្វើឲ្យលទ្ធផលរួមទាបជាងវិធីសាស្ត្រដែលបានស្នើបន្តិច។	ទទួលបានភាពត្រឹមត្រូវ ៨០,០០% លើសំណុំទិន្នន័យ Oxford 102។
Nilsback et al., 2009 ការចាត់ថ្នាក់ផ្កាដោយប្រើប្រាស់ម៉ាស៊ីនវ៉ិចទ័រគាំទ្រ (SVM)	ប្រើប្រាស់លក្ខណៈពណ៌ វាយនភាព និងរូបរាង រួមជាមួយនឹងបច្ចេកទេស SVM ដែលជាក្បួនដោះស្រាយមានស្ថិរភាពខ្ពស់ក្នុងការស្រាវជ្រាវម៉ាស៊ីនរៀន (Machine Learning)។	ទទួលបានភាពត្រឹមត្រូវទាបជាងការប្រើប្រាស់បណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត (ANN) សម្រាប់សំណុំទិន្នន័យ និងកម្រិតនៃការទាញយកលក្ខណៈនេះ។	ទទួលបានអត្រាភាពត្រឹមត្រូវ ៧៦,៣% លើសំណុំទិន្នន័យ Oxford 102។

ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះបានបញ្ជាក់យ៉ាងច្បាស់អំពីតម្រូវការផ្នែករឹង និងផ្នែកទន់សម្រាប់ការអនុវត្ត និងការសាកល្បងម៉ូដែលនេះ។

Hardware: កុំព្យូទ័រ HP Core i7 ជាមួយនឹងអង្គចងចាំ RAM ទំហំ 8 GB សម្រាប់ការដំណើរការនិងបង្វឹកទិន្នន័យ។
Software: កម្មវិធី MATLAB ជំនាន់ 2013 ដោយប្រើប្រាស់ឧបករណ៍ Neural Network Tools សម្រាប់បង្វឹកម៉ូដែល ANN និងប្រើឧបករណ៍ដំណើរការរូបភាព (Image Processing Tool)។
Dataset: សំណុំទិន្នន័យផ្កា Oxford 102 ដែលមានរូបភាពផ្កាចំនួន ៨១៨៩ សន្លឹក ចែកជា ១០២ ប្រភេទផ្សេងៗគ្នា។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យផ្កា Oxford 102 ដែលផ្តោតជាចម្បងលើប្រភេទផ្កាដែលដាំដុះនៅក្នុងចក្រភពអង់គ្លេស។ ប្រសិនបើកម្ពុជាចង់អនុវត្តប្រព័ន្ធនេះ វាចាំបាច់ត្រូវប្រមូល និងបង្កើតសំណុំទិន្នន័យរុក្ខជាតិក្នុងស្រុកផ្ទាល់ខ្លួន ព្រោះរុក្ខជាតិនៅតំបន់អាស៊ីអាគ្នេយ៍មានលក្ខណៈ និងរូបរាងខុសប្លែកពីតំបន់អឺរ៉ុប។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាទិន្នន័យផ្កាមានភាពខុសគ្នាក៏ដោយ ប៉ុន្តែវិធីសាស្ត្រដំណើរការរូបភាពនេះមានអត្ថប្រយោជន៍ខ្ពស់សម្រាប់ការស្រាវជ្រាវ និងការអភិវឌ្ឍនៅកម្ពុជា។

ក្រសួងបរិស្ថាន និងការអភិរក្សជីវចម្រុះ: អាចប្រើប្រាស់ប្រព័ន្ធនេះដើម្បីចងក្រងឯកសារ និងស្គាល់អត្តសញ្ញាណប្រភេទរុក្ខជាតិកម្រ ឬផ្កាព្រៃនៅក្នុងតំបន់ការពារនានា ដូចជាឧទ្យានជាតិព្រះមុនីវង្សបូកគោ ឬជួរភ្នំក្រវាញ។
វិស័យកសិកម្ម និងការស្រាវជ្រាវរុក្ខសាស្ត្រ: អ្នកស្រាវជ្រាវនៅសាកលវិទ្យាល័យភូមិន្ទកសិកម្ម (RUA) អាចប្រើបច្ចេកទេសស្រដៀងគ្នានេះដើម្បីវាយតម្លៃ ឬកំណត់អត្តសញ្ញាណជំងឺលើស្លឹករុក្ខជាតិ ដោយវិភាគលើការប្រែប្រួលពណ៌ និងវាយនភាព។
វិស័យអេកូទេសចរណ៍ (Ecotourism): គាំទ្រដល់ការអភិវឌ្ឍកម្មវិធីទូរស័ព្ទ (Mobile App) សម្រាប់ភ្ញៀវទេសចរដើម្បីថតរូប និងស្គាល់ឈ្មោះរុក្ខជាតិភ្លាមៗនៅតាមតំបន់រមណីយដ្ឋានធម្មជាតិកម្ពុជា ដែលជួយលើកកម្ពស់ចំណេះដឹងផ្នែកបរិស្ថាន។

ជារួម បច្ចេកទេសនេះគឺជាមូលដ្ឋានគ្រឹះដ៏ល្អមួយសម្រាប់ស្ថាប័នស្រាវជ្រាវកម្ពុជាក្នុងការបង្កើតប្រព័ន្ធកុំព្យូទ័រដែលអាចយល់ដឹងពីរុក្ខជាតិក្នុងស្រុក ដើម្បីជំរុញទាំងការអភិរក្ស វិស័យកសិកម្ម និងអេកូទេសចរណ៍។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាពីមូលដ្ឋានគ្រឹះដំណើរការរូបភាព (Image Processing): ស្វែងយល់ពីបច្ចេកទេសកែលម្អរូបភាព និងការបែងចែករូបភាពដូចជាបច្ចេកទេស Chan-Vese Active Contour ដោយសាកល្បងអនុវត្តកូដជាក់ស្តែងជាមួយបណ្ណាល័យ OpenCV នៅក្នុងភាសា Python ឬ MATLAB។
អនុវត្តការទាញយកលក្ខណៈសម្បត្តិ (Feature Extraction): រៀនសរសេរកូដដើម្បីទាញយកទិន្នន័យពណ៌តាមរយៈម៉ូដែល HSV Color Model ទិន្នន័យវាយនភាពដោយប្រើម៉ាទ្រីស GLCM និងទិន្នន័យទម្រង់រូបរាងដោយប្រើរូបមន្ត Hu Moments ពីរូបភាពជាក់ស្តែង។
ប្រមូល និងរៀបចំសំណុំទិន្នន័យក្នុងស្រុក (Local Dataset Collection): ចាប់ផ្តើមប្រមូលរូបភាពផ្កា ឬស្លឹករុក្ខជាតិក្នុងស្រុកកម្ពុជា (ឧទាហរណ៍៖ ផ្ការំដួល ផ្កាឈូក ផ្កាម្លិះ) ហើយរៀបចំកាត់ផ្ទៃខាងក្រោយចេញឱ្យបានស្អាតដើម្បីប្រើជាទិន្នន័យសម្រាប់បង្វឹកម៉ូដែល។
បង្កើត និងបង្វឹកបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត (ANN): ប្រើប្រាស់ឧបករណ៍ដូចជា TensorFlow, Keras ឬ MATLAB Neural Network Toolbox ដើម្បីបង្កើតម៉ូដែល Back-Propagation ANN និងចាប់ផ្តើមបង្វឹកវាជាមួយទិន្នន័យលក្ខណៈសម្បត្តិ (Features) ដែលបានរៀបចំ។
វាយតម្លៃ និងធ្វើឱ្យម៉ូដែលកាន់តែប្រសើរឡើង (Evaluation & Optimization): ធ្វើតេស្តម៉ូដែលរបស់អ្នកជាមួយរូបភាពផ្កាថ្មីៗដែលម៉ូដែលមិនធ្លាប់បានឃើញ វាស់ស្ទង់ភាពត្រឹមត្រូវ និងសាកល្បងផ្លាស់ប្តូរចំនួន Neurons ឬ Hidden Layers ដើម្បីទទួលបានលទ្ធផលចាត់ថ្នាក់ដែលមានភាពត្រឹមត្រូវខ្ពស់ជាងមុន។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Chan-Vese Active Contour	វិធីសាស្ត្រក្នុងការបែងចែករូបភាពដែលប្រើប្រាស់ថាមពលគណិតវិទ្យាដើម្បីរាវរកព្រំដែននៃវត្ថុ (ដូចជាផ្កា) ដោយមិនពឹងផ្អែកតែលើគែម (edges) របស់វានោះទេ តែផ្អែកលើផ្ទៃពណ៌រួម។ នេះជួយបំបែកផ្កាចេញពីផ្ទៃខាងក្រោយបានយ៉ាងច្បាស់លាស់។	ដូចជាការគូសរង្វង់ខ្សែយឺតមួយជុំវិញវត្ថុ រួចបន្តរួញឬរីករង្វង់នោះរហូតដល់វាអោបជាប់រាងរបស់វត្ថុនោះយ៉ាងជិតល្អ។
Gray Level Co-occurrence Matrix (GLCM)	បច្ចេកទេសទាញយកលក្ខណៈវាយនភាព (Texture) នៃរូបភាព ដោយរាប់ចំនួនដងដែលគូនៃភីកសែល (pixels) មានកម្រិតពណ៌ប្រផេះជាក់លាក់ស្ថិតនៅក្បែរគ្នា។ វាជួយឲ្យកុំព្យូទ័រយល់ពីភាពគ្រើម ឬភាពរលោងនៃផ្ទៃរបស់ផ្កា។	ដូចជាការពិនិត្យមើលសាច់ក្រណាត់ថាតើវាមានក្រឡាញឹក ឬរង្វើល ដោយរាប់ចំនួនសរសៃអំបោះដែលនៅក្បែរៗគ្នា។
Invariant Moments	រូបមន្តគណិតវិទ្យាដែលប្រើដើម្បីទាញយកទម្រង់រាងរបស់វត្ថុ (Shape features) ក្នុងរូបភាព ដែលលក្ខណៈទាំងនេះមិនប្រែប្រួលទេទោះបីជារូបភាពនោះត្រូវបានបង្វិល បង្រួមពង្រីក ឬផ្លាស់ទីក៏ដោយ។	ដូចជាការចងចាំទម្រង់មុខរបស់មនុស្សម្នាក់ ដែលទោះបីជាគាត់ងាកមុខ ឈរឆ្ងាយ ឬឈរជិត ក៏យើងនៅតែអាចចំណាំគាត់បានដោយមិនច្រឡំ។
Back-Propagation Artificial Neural Network	ប្រភេទនៃបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត ដែលរៀនចំណាំទិន្នន័យតាមរយៈការកែតម្រូវកំហុស។ នៅពេលវាកំណត់អត្តសញ្ញាណខុស វាបញ្ជូនកំហុសនោះត្រឡប់ថយក្រោយវិញដើម្បីកែសម្រួលទម្ងន់ទិន្នន័យ (weights) ឲ្យការទាយលើកក្រោយមានភាពត្រឹមត្រូវជាងមុន។	ដូចជាសិស្សដែលធ្វើលំហាត់ខុស ហើយគ្រូប្រាប់ពីកំហុសនោះ ដើម្បីឲ្យសិស្សកែតម្រូវនិងចងចាំកុំឲ្យខុសនៅពេលប្រឡងលើកក្រោយ។
HSV Color Model	ប្រព័ន្ធតំណាងពណ៌ដែលបែងចែកពណ៌ជា៣ផ្នែកគឺ Hue (ប្រភេទពណ៌), Saturation (ភាពឆ្អែតនៃពណ៌ ឬកម្រិតប្រផេះ), និង Value (ពន្លឺ ឬភាពភ្លឺងងឹត)។ វាមានប្រសិទ្ធភាពជាង RGB ក្នុងការកាត់បន្ថយភាពរំខានដោយសារការប្រែប្រួលពន្លឺពេលថតរូប។	ដូចជាការពណ៌នាអំពីថ្នាំលាបពណ៌ដោយនិយាយថាវាជាពណ៌ក្រហម (Hue) លាយទឹកច្រើនឬតិច (Saturation) ហើយស្ថិតក្រោមពន្លឺថ្ងៃឬក្នុងម្លប់ (Value)។
Image Segmentation	ដំណើរការបែងចែករូបភាពឌីជីថលទៅជាផ្នែកៗ (ឬក្រុមភីកសែល) ដើម្បីសម្រួលដល់ការវិភាគ ដោយកាត់យកតែវត្ថុគោលដៅ (Foreground) និងកាត់ចោលផ្ទៃខាងក្រោយដែលមិនចាំបាច់ (Background)។	ដូចជាការប្រើកន្ត្រៃកាត់យករូបផ្កាចេញពីសៀវភៅទស្សនាវដ្ដី រួចបោះចោលផ្ទៃក្រដាសដែលនៅសល់។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖