Original Title: An Application of Image Processing in Optical Mark Recognition
Source: doi.org/10.31817/vjas.2020.3.4.09
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការអនុវត្តដំណើរការរូបភាពក្នុងការសម្គាល់សញ្ញាអុបទិក (Optical Mark Recognition)

ចំណងជើងដើម៖ An Application of Image Processing in Optical Mark Recognition

អ្នកនិពន្ធ៖ Tran Vu Ha (Faculty of Information Technology, Vietnam National University of Agriculture), Nguyen Thi Thu (Faculty of Animal Science, Vietnam National University of Agriculture)

ឆ្នាំបោះពុម្ព៖ 2020, Vietnam Journal of Agricultural Sciences

វិស័យសិក្សា៖ Information Technology

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ សាកលវិទ្យាល័យនានាត្រូវការចំណាយថវិកាច្រើនលើម៉ាស៊ីន និងក្រដាសស្កេន OMR ពិសេស ដើម្បីដំណើរការទិន្នន័យពីកម្រងសំណួរ ដែលទាមទារឱ្យមានការស្វែងរកដំណោះស្រាយកម្មវិធីកុំព្យូទ័រដែលមានតម្លៃថោក និងងាយស្រួលជាងមុនសម្រាប់ការវាយតម្លៃការអប់រំ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានអភិវឌ្ឍកម្មវិធីកុំព្យូទ័រដោយប្រើប្រាស់ MATLAB ដើម្បីវិភាគលើរូបភាពកម្រងសំណួរដែលបានស្កេនចេញពីម៉ាស៊ីនស្កេនធម្មតា។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Proposed MATLAB-based OMR
កម្មវិធី OMR បង្កើតដោយ MATLAB (វិធីសាស្ត្រស្នើឡើង)
ប្រើម៉ាស៊ីនស្កេនធម្មតា និងក្រដាស A4 ទូទៅ ដែលជួយសន្សំសំចៃការចំណាយបានយ៉ាងច្រើន។ ងាយស្រួលប្រើប្រាស់ដោយមិនទាមទារការបណ្តុះបណ្តាលស្មុគស្មាញ។ នៅមានបញ្ហាក្នុងការចាប់យកចម្លើយប្រសិនបើរូបភាពស្កេនមានភាពវៀច (rotated) ការគូសសញ្ញាធីក ឬការគូសពណ៌ស្រាលពេក។ អាចកំណត់សំណួរដែលបានឆ្លើយ មិនបានឆ្លើយ និងឆ្លើយលើសពីមួយបានយ៉ាងត្រឹមត្រូវ ១០០% លើកម្រងសំណួរដែលគូសបានត្រឹមត្រូវទាំង ១៧៩ សន្លឹក។
Commercial OMR Solutions (e.g., SCANTRON)
ប្រព័ន្ធ OMR ពាណិជ្ជកម្ម (ឧទាហរណ៍ SCANTRON)
មានល្បឿនលឿន និងភាពត្រឹមត្រូវខ្ពស់ខ្លាំងសម្រាប់ការវាយតម្លៃទិន្នន័យខ្នាតធំ។ ទាមទារចំណាយថវិកាខ្ពស់ក្នុងការទិញម៉ាស៊ីនស្កេនពិសេស និងតម្រូវឱ្យប្រើប្រាស់ក្រដាសចម្លើយ (OMR sheets) ផ្តាច់មុខរបស់ក្រុមហ៊ុន។ មិនត្រូវបានធ្វើតេស្តដោយផ្ទាល់ក្នុងការសិក្សានេះទេ ប៉ុន្តែត្រូវបានលើកឡើងថាជារបាំងចំណាយសម្រាប់ស្ថាប័នអប់រំទូទៅ។
Template Matching & Key Point Detection (Belag et al.)
ការផ្ទៀងផ្ទាត់គំរូ និងការស្វែងរកចំណុចសំខាន់ (ដោយ Belag និងសហការី)
អាចដោះស្រាយបញ្ហារូបភាពវិល (rotated images) បានយ៉ាងល្អដោយប្រើប្រាស់សញ្ញាសម្គាល់ (checkmarks) នៅលើក្រដាស។ ត្រូវការរចនាក្រដាសចម្លើយដាច់ដោយឡែកដែលស័ក្តិសមសម្រាប់តែការប្រឡង តែមិនសូវមានភាពបត់បែនសម្រាប់កម្រងសំណួរស្ទង់មតិនោះទេ។ ត្រូវបានលើកឡើងក្នុងផ្នែករំលឹកទ្រឹស្តី (Literature Review) ថាជាជម្រើសមួយមានប្រសិទ្ធភាពតែកម្រិតការប្រើប្រាស់។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារធនធានកម្រិតទាបទៅមធ្យម ដែលស័ក្តិសមបំផុតសម្រាប់ស្ថាប័នដែលមានថវិកាមានកម្រិត ដោយពឹងផ្អែកលើឧបករណ៍ការិយាល័យដែលមានស្រាប់។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានអនុវត្តនៅសាកលវិទ្យាល័យជាតិកសិកម្មវៀតណាម ដោយប្រើប្រាស់ទិន្នន័យសំណួរស្ទង់មតិពីនិស្សិត និងបុគ្គលិក។ ដោយសារទម្រង់កម្រងសំណួរ និងទម្លាប់នៃការគូសចម្លើយនៅប្រទេសវៀតណាម និងកម្ពុជាមានលក្ខណៈស្រដៀងគ្នាច្រើន ម៉ូដែលនេះមានភាពពាក់ព័ន្ធខ្ពស់។ ទោះជាយ៉ាងណា វាចាំបាច់ត្រូវមានការធ្វើតេស្តបន្ថែមជាមួយនឹងទម្រង់ក្រដាសប្រឡងជាភាសាខ្មែរ ដើម្បីធានាប្រសិទ្ធភាពពេញលេញ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់ និងមានតម្លៃជាក់ស្តែងណាស់សម្រាប់ស្ថាប័នអប់រំ និងស្ថាប័នរដ្ឋនៅកម្ពុជា ក្នុងការធ្វើស្វ័យប្រវត្តិកម្មទិន្នន័យដោយចំណាយថវិកាតិចតួច។

ជារួម ការអភិវឌ្ឍប្រព័ន្ធ OMR កម្រិតស្រាលផ្ទាល់ខ្លួននេះ នឹងជួយសម្រួលដល់ប្រតិបត្តិការវាយតម្លៃអប់រំ និងការស្រាវជ្រាវនៅកម្ពុជា ឱ្យមានភាពឆាប់រហ័ស ត្រឹមត្រូវ និងចំណាយទាប។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាពីមូលដ្ឋានគ្រឹះនៃដំណើរការរូបភាព (Image Processing Fundamentals): ចាប់ផ្តើមរៀនពីការប្រើប្រាស់ MATLAB ឬភាសា Python (OpenCV) ជាពិសេសការប្រើប្រាស់អនុគមន៍បំប្លែងរូបភាពទៅជាប្រព័ន្ធគោលពីរ (im2bwThresholding) និងការរកតំបន់រាងជារង្វង់ (imfindcircles)។
  2. រចនាក្រដាសស្ទង់មតិ ឬសន្លឹកចម្លើយ (Survey/Answer Sheet Design): បង្កើតទម្រង់ក្រដាស A4 ស្តង់ដារដែលមានរង្វង់ចម្លើយច្បាស់លាស់។ ត្រូវប្រាកដថាបានបន្ថែមសញ្ញាសម្គាល់ពណ៌ខ្មៅ (Fiducial marks ឬ Checkmarks) នៅជ្រុងទាំងបួននៃក្រដាស ដើម្បីងាយស្រួលគណនាមុំ និងតម្រង់រូបភាពវិញពេលស្កេនវៀច។
  3. អភិវឌ្ឍកម្មវិធីកុំព្យូទ័រខ្នាតតូច (Develop Prototype Application): សរសេរកូដដើម្បីទាញយកតំបន់ចាប់អារម្មណ៍ (ROI Extraction) តាមរយៈការប្រើប្រាស់ Mask និងគណនាចំនួនភីកសែលខ្មៅ (Black pixel counting) ដើម្បីកំណត់ថាតើជម្រើសណាមួយត្រូវបានគូស។ អាចប្រើ App Designer ដើម្បីបង្កើតផ្ទាំងប្រើប្រាស់ងាយស្រួល។
  4. ធ្វើតេស្ត និងប្រមូលទិន្នន័យជាក់ស្តែង (Testing and Evaluation): បោះពុម្ពក្រដាស និងសាកល្បងឱ្យសិស្ស ឬអ្នកចូលរួមគូសចម្លើយ រួចស្កេនចូលកុំព្យូទ័រតាមរយៈម៉ាស៊ីនស្កេនធម្មតា។ វាយតម្លៃភាពត្រឹមត្រូវនៃប្រព័ន្ធ ព្រមទាំងកំណត់បញ្ហានានាដូចជា ការគូសស្រាលពេក ការគូសសញ្ញាធីក ឬក្រដាសប្រឡាក់។
  5. កែលម្អប្រព័ន្ធដោយប្រើបញ្ញាសិប្បនិម្មិត (System Enhancement with AI): ដើម្បីដោះស្រាយបញ្ហាគូសសញ្ញាខុសទម្រង់ ឬការសរសេរអក្សរដោយដៃនៅកន្លែងផ្តល់មតិ គួរសិក្សាបញ្ចូលបច្ចេកវិទ្យា Machine LearningDeep Learning ដើម្បីពង្រីកសមត្ថភាពកម្មវិធីឱ្យកាន់តែឆ្លាតវៃក្នុងការចំណាំទម្រង់ផ្សេងៗ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Optical Mark Recognition (ការសម្គាល់សញ្ញាអុបទិក) បច្ចេកវិទ្យាដែលប្រើសម្រាប់សម្គាល់ និងទាញយកទិន្នន័យពីសញ្ញា ឬជម្រើសដែលមនុស្សបានគូសនៅលើក្រដាសដោយស្វ័យប្រវត្តិ តាមរយៈការវិភាគលើរូបភាពដែលបានស្កេនរួច។ ដូចជាភ្នែករបស់រ៉ូបូតដែលអាចមើលឃើញចម្លើយដែលអ្នកគូសលើក្រដាសប្រឡង ហើយបំប្លែងវាទៅជាពិន្ទុក្នុងកុំព្យូទ័រដោយស្វ័យប្រវត្តិ ដោយមិនបាច់មនុស្សកែ។
Image Processing (ដំណើរការរូបភាព) ការប្រើប្រាស់ក្បួនគណិតវិទ្យា និងកម្មវិធីកុំព្យូទ័រ ដើម្បីកែប្រែ វិភាគ ឬទាញយកព័ត៌មានពីកម្រងរូបភាពឌីជីថល ដូចជាការបំប្លែងពណ៌ កាត់រូបភាព ឬរកមើលវត្ថុផ្សេងៗក្នុងរូបភាព។ ដូចជាការប្រើប្រាស់កម្មវិធីកែរូបភាពក្នុងទូរស័ព្ទដើម្បីធ្វើឱ្យរូបភាពច្បាស់ជាងមុន កាត់ផ្ទៃខាងក្រោយ ឬប្តូររូបភាពទៅជាសខ្មៅ។
Region of Interest (ROI) (តំបន់គោលដៅ) ផ្នែកមួយឬតំបន់ជាក់លាក់ណាមួយនៅលើរូបភាពទាំងមូល ដែលកម្មវិធីកុំព្យូទ័រត្រូវផ្តោតការយកចិត្តទុកដាក់ដើម្បីយកមកវិភាគ ដោយមិនខ្វល់ពីផ្ទៃផ្សេងៗទៀតដែលមិនពាក់ព័ន្ធ។ ដូចជាពេលយើងអានសៀវភៅ ភ្នែកយើងសម្លឹងមើលតែត្រង់អត្ថបទដែលយើងកំពុងអាន ដោយមិនចាប់អារម្មណ៍គែមសៀវភៅ ឬតុដែលនៅជុំវិញនោះទេ។
Binary Image (រូបភាពប្រព័ន្ធគោលពីរ) ប្រភេទទម្រង់រូបភាពដែលផ្ទុកតែតម្លៃពីរពណ៌ប៉ុណ្ណោះ គឺស និងខ្មៅទាំងស្រុង (មិនមានពណ៌ប្រផេះ ឬពណ៌ផ្សេងឡើយ) ដើម្បីជួយកុំព្យូទ័រឱ្យងាយស្រួលក្នុងការវិភាគ និងសន្សំសំចៃអង្គចងចាំ។ ដូចជាការគូរគំនូរដោយប្រើតែប៊ិចទឹកខ្មៅលើក្រដាសសសុទ្ធ ដោយគ្មានប្រើពណ៌អ្វីផ្សេងមកលាយឡំដើម្បីចៀសវាងភាពសាំញ៉ាំ។
Pixel counting (ការរាប់ភីកសែល) វិធីសាស្ត្រក្នុងការរាប់ចំនួនចំណុចពណ៌ (ជាពិសេសភីកសែលពណ៌ខ្មៅ) នៅក្នុងតំបន់រង្វង់ ឬប្រអប់នីមួយៗ ដើម្បីបញ្ជាក់ថាតើជម្រើសនោះត្រូវបានគេគូសជ្រើសរើស (បំពេញពណ៌) ដែរឬទេ។ ដូចជាការរាប់ចំនួនគ្រាប់សណ្តែកខ្មៅនៅក្នុងចានផ្សេងៗគ្នា ចានណាដែលមានគ្រាប់សណ្តែកច្រើនជាងគេ នោះមានន័យថាវាគឺជាជម្រើសដែលត្រូវបានគេរើសយក។
Mask (ម៉ាស ឬរូបភាពច្រោះ) រូបភាពពិសេសមួយដែលត្រូវបានប្រើដើម្បីត្រួតស៊ីគ្នាពីលើរូបភាពដើម ក្នុងគោលបំណងបិទបាំងផ្នែកដែលមិនត្រូវការ និងរក្សាទុកតែផ្នែកសំខាន់ៗ (ដូចជារង្វង់ចម្លើយ) ដែលកុំព្យូទ័រត្រូវស្វែងរក។ ដូចជាការប្រើពុម្ពក្រដាសដែលមានចោះប្រហោង យកទៅដាក់ពីលើសៀវភៅ ដើម្បីអាចអានឃើញតែពាក្យណាដែលនៅចំប្រហោងនោះប៉ុណ្ណោះ។
Graphical User Interface (GUI) (ចំណុចប្រទាក់ក្រាហ្វិកអ្នកប្រើប្រាស់) ផ្ទាំងកម្មវិធីដែលមានប៊ូតុង រូបតំណាង (Icons) និងម៉ឺនុយ ដែលអនុញ្ញាតឱ្យមនុស្សបញ្ជាកម្មវិធីកុំព្យូទ័របានយ៉ាងងាយស្រួលតាមរយៈការចុចកណ្តុរ ដោយមិនចាំបាច់សរសេរកូដបញ្ជាស្មុគស្មាញ។ ដូចជាអេក្រង់ទូរស័ព្ទស្មាតហ្វូនរបស់អ្នក ដែលអ្នកគ្រាន់តែយកដៃចុចលើរូបកម្មវិធី ឬប៊ូតុងផ្សេងៗ ដើម្បីបញ្ជាឱ្យវាធ្វើការ ជំនួសឱ្យការវាយអត្ថបទកូដបញ្ជាវាដោយផ្ទាល់។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖