Original Title: COHERENCE Volume 3 | September 2021
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ទស្សនាវដ្ដីស្រាវជ្រាវ COHERENCE ភាគទី៣ ខែកញ្ញា ឆ្នាំ២០២១

ចំណងជើងដើម៖ COHERENCE Volume 3 | September 2021

អ្នកនិពន្ធ៖ Samir Kanti Datta (The Bhawanipur Education Society College), Sanjib Halder (The Bhawanipur Education Society College)

ឆ្នាំបោះពុម្ព៖ 2021, The Bhawanipur Education Society College

វិស័យសិក្សា៖ Multidisciplinary Science

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះគឺជាកម្រងអត្ថបទស្រាវជ្រាវវិទ្យាសាស្ត្រចម្រុះ ដែលដោះស្រាយបញ្ហាប្រឈមជាច្រើនក្នុងវិស័យផ្សេងៗគ្នា ដូចជាបញ្ហាក្នុងការគណនាកង់ទិច (Quantum Computation) វិសមភាពសេដ្ឋកិច្ចតំបន់ (Spatial Inequality) ក៏ដូចជាការសម្គាល់ផ្ទៃមុខ (Face Recognition) និងការវិភាគម៉ូលេគុលថ្នាំគីមី។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានប្រើប្រាស់វិធីសាស្ត្រចម្រុះទៅតាមមុខជំនាញនីមួយៗរួមមាន ការវិភាគទិន្នន័យ ការប្រើប្រាស់ក្បួនដោះស្រាយ និងការធ្វើតេស្តសម្មតិកម្មសម្រាប់ការស្រាវជ្រាវនីមួយៗ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
PCA, LDA with Artificial Neural Network
ការប្រើប្រាស់ PCA និង LDA ជាមួយបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (ANN)
មានភាពសាមញ្ញក្នុងការទាញយកលក្ខណៈពិសេស (Feature Extraction) និងមានដំណើរការលឿនសម្រាប់ការប្រើប្រាស់ជាទូទៅ។ ភាពត្រឹមត្រូវមានកម្រិតបើធៀបនឹងបច្ចេកវិទ្យា Deep Learning ជាពិសេសនៅពេលមានការរំខានពីពន្លឺ។ ទទួលបានភាពត្រឹមត្រូវ ៩៥.៨០% លើសំណុំទិន្នន័យ Dataset of Faces។
DeepFace (Convolutional Neural Network)
បណ្តាញសរសៃប្រសាទកាឡៃស៊ីជម្រៅ (CNN) សម្រាប់ការសម្គាល់ផ្ទៃមុខ
មានសមត្ថភាពខ្ពស់ក្នុងការសម្គាល់មុខមនុស្សក្នុងកម្រិតជិតស្មើនឹងមនុស្សពិតប្រាកដ ដោយប្រើ 3D Alignment។ ទាមទារទិន្នន័យហ្វឹកហាត់ធំសម្បើម និងកម្លាំងម៉ាស៊ីន (Computational Power) ខ្ពស់ដើម្បីដំណើរការ។ ទទួលបានភាពត្រឹមត្រូវ ៩៧.៣៥% លើសំណុំទិន្នន័យ SFC, LFW និង YTF។
CG-Face
ម៉ូដែលបែងចែកផ្ទៃមុខពិត និងផ្ទៃមុខបង្កើតដោយកុំព្យូទ័រ
មានប្រសិទ្ធភាពខ្ពស់បំផុតក្នុងការស្វែងរក និងបែងចែករូបភាពពិត និងរូបភាពដែលបង្កើតដោយបញ្ញាសិប្បនិម្មិត (GANs)។ ត្រូវការបច្ចេកទេសថ្លឹងថ្លែងទិន្នន័យ (Data Balancing) ដើម្បីចៀសវាងភាពលម្អៀងក្នុងការទស្សន៍ទាយ។ ទទួលបានភាពត្រឹមត្រូវ ៩៨.០០% លើសំណុំទិន្នន័យ PCGAN និង BEGAN។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តវិធីសាស្ត្រ Machine Learning ជាពិសេស CNNs សម្រាប់សម្គាល់ផ្ទៃមុខ ទាមទារនូវធនធានកុំព្យូទ័រ និងសំណុំទិន្នន័យយ៉ាងច្រើនសន្ធឹកសន្ធាប់។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានៅក្នុងអត្ថបទនេះត្រូវបានធ្វើឡើងដោយប្រើប្រាស់សំណុំទិន្នន័យអន្តរជាតិ (ដូចជា LFW និង AT&T) ដែលភាគច្រើនជារូបភាពផ្ទៃមុខជនជាតិអឺរ៉ុប។ សម្រាប់ប្រទេសកម្ពុជា ការយកម៉ូដែលទាំងនេះមកប្រើប្រាស់ដោយផ្ទាល់អាចបណ្តាលឱ្យមានភាពលម្អៀង (Bias) ពោលគឺភាពត្រឹមត្រូវអាចធ្លាក់ចុះនៅពេលសម្គាល់ផ្ទៃមុខជនជាតិអាស៊ីអាគ្នេយ៍ ឬជនជាតិខ្មែរ ដោយសារលក្ខណៈទម្រង់មុខមានភាពខុសគ្នា។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកវិទ្យាសម្គាល់ផ្ទៃមុខ (Face Recognition) ដែលបានបង្ហាញក្នុងឯកសារនេះ មានសក្តានុពលខ្ពស់ក្នុងការយកមកអនុវត្តដើម្បីអភិវឌ្ឍវិស័យឌីជីថលនៅកម្ពុជា។

ការបណ្តុះបណ្តាលក្បួនដោះស្រាយទាំងនេះដោយប្រើប្រាស់ទិន្នន័យផ្ទៃមុខក្នុងស្រុក នឹងជួយជំរុញនវានុវត្តន៍ និងធានាសុវត្ថិភាពប្រព័ន្ធឌីជីថលនៅកម្ពុជាឱ្យកាន់តែមានប្រសិទ្ធភាព។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃបញ្ញាសិប្បនិម្មិត: ចាប់ផ្តើមរៀនភាសាកូដកម្មវិធី Python និងបណ្ណាល័យសំខាន់ៗដូចជា Scikit-Learn ព្រមទាំងស្វែងយល់ពីក្បួនដោះស្រាយមូលដ្ឋានដូចជា PCA និង SVM ដែលបានរៀបរាប់ក្នុងឯកសារ។
  2. អនុវត្តការស្រាវជ្រាវលើ Computer Vision: សាកល្បងប្រើប្រាស់បណ្ណាល័យ OpenCV ដើម្បីស្វែងយល់ពីរបៀបចាប់យកទម្រង់មុខ (Face Detection) និងការកែច្នៃរូបភាព (Image Pre-processing) ជាជំហានដំបូង។
  3. សិក្សា និងប្រើប្រាស់ Deep Learning Frameworks: បន្តរៀនសាងសង់ម៉ូដែល CNN ដោយប្រើប្រាស់ TensorFlowPyTorch ដើម្បីបង្កើតប្រព័ន្ធ Face Recognition ដែលមានភាពត្រឹមត្រូវខ្ពស់ដូចជា DeepFace ជាដើម។
  4. ប្រមូល និងបង្កើតសំណុំទិន្នន័យ (Dataset) ក្នុងស្រុក: ចាប់ផ្តើមប្រមូល និងរៀបចំទិន្នន័យរូបភាពផ្ទៃមុខជនជាតិខ្មែរ (ដោយគោរពតាមសិទ្ធិឯកជន) ដើម្បីហ្វឹកហាត់ម៉ូដែលឱ្យកាន់តែមានភាពសុក្រឹត និងកាត់បន្ថយភាពលម្អៀង (Data Bias) សម្រាប់បរិបទកម្ពុជា។
  5. អភិវឌ្ឍគម្រោងគំរូ (Prototype): សហការជាក្រុមដើម្បីបង្កើតប្រព័ន្ធស្កេនវត្តមានដោយផ្ទៃមុខសម្រាប់ប្រើប្រាស់ក្នុងសាកលវិទ្យាល័យ ដោយប្រើឧបករណ៍ដូចជា Raspberry Pi ភ្ជាប់ជាមួយកាមេរ៉ា និងបង្ហោះកូដនៅលើ GitHub ជាលទ្ធផលជាក់ស្តែង។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Convolutional Neural Network វាគឺជាប្រភេទនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (AI) ដែលត្រូវបានរចនាឡើងយ៉ាងពិសេសសម្រាប់ដំណើរការទិន្នន័យរូបភាព ដោយវាធ្វើការច្រោះ និងទាញយកលក្ខណៈពិសេសៗនៃរូបភាព (ដូចជាគែម ពណ៌ ទម្រង់) ដើម្បីកំណត់អត្តសញ្ញាណវត្ថុ ឬផ្ទៃមុខដោយស្វ័យប្រវត្តិ។ ដូចជាភ្នែក និងខួរក្បាលរបស់មនុស្សដែលចេះសង្កេតមើលលក្ខណៈពិសេសតូចៗនៃរូបភាព ដើម្បីដំឡើងជារូបភាពពេញលេញមួយហើយដឹងថាវត្ថុនោះជាអ្វី។
Dutch Disease ជាបាតុភូតសេដ្ឋកិច្ចអវិជ្ជមានមួយដែលកើតឡើងនៅពេលប្រទេសមួយរកឃើញ ឬពឹងផ្អែកខ្លាំងលើការនាំចេញធនធានធម្មជាតិ (ដូចជាប្រេង) ដែលធ្វើឱ្យរូបិយប័ណ្ណក្នុងស្រុកឡើងថ្លៃ និងបណ្តាលឱ្យវិស័យផលិតកម្មនិងកសិកម្មផ្សេងៗទៀតធ្លាក់ចុះការប្រកួតប្រជែងនិងរងការខូចខាតយ៉ាងធ្ងន់ធ្ងរ។ ដូចជាសិស្សម្នាក់ដែលពូកែមុខវិជ្ជាមួយខ្លាំងពេក រហូតដល់បោះបង់ចោលការសិក្សាមុខវិជ្ជាផ្សេងៗទៀតធ្វើឱ្យធ្លាក់ថ្នាក់។
Gravitational Waves ជារលកនៃរំញ័រនៅក្នុងលំហ-ពេលវេលា (Space-time) ដែលបង្កើតឡើងដោយវត្ថុមានម៉ាសធំៗដែលកំពុងផ្លាស់ទីក្នុងល្បឿនលឿន (ដូចជាការបុកទង្គិចគ្នារវាងប្រហោងខ្មៅ) ដែលនាំយកព័ត៌មានអំពីប្រភពដើមរបស់វាឆ្លងកាត់សកលលោក។ ដូចជារលកទឹកដែលសាយភាយចេញជារង្វង់ នៅពេលដែលយើងបោះដុំថ្មធំមួយចូលទៅក្នុងផ្ទៃទឹកដ៏ស្ងាត់ជ្រងំ។
Support Vector Machines (SVM) គឺជាក្បួនដោះស្រាយនៃម៉ាស៊ីនរៀន (Machine Learning Algorithm) ដែលមានតួនាទីវិភាគ និងចាត់ថ្នាក់ទិន្នន័យ ដោយស្វែងរកបន្ទាត់ ឬប្លង់ (Hyperplane) មួយដ៏ល្អបំផុតដើម្បីញែកក្រុមទិន្នន័យប្រភេទផ្សេងៗគ្នាឱ្យនៅដាច់ពីគ្នាយ៉ាងច្បាស់លាស់។ ដូចជាការគូសបន្ទាត់មួយនៅលើតុ ដើម្បីញែកផ្លែប៉ោម និងផ្លែក្រូចឱ្យនៅម្ខាងម្នាក់ដាច់ពីគ្នាយ៉ាងច្បាស់។
Gini Coefficient ជារង្វាស់ស្ថិតិដែលសេដ្ឋវិទូប្រើសម្រាប់វាស់ស្ទង់កម្រិតនៃវិសមភាពប្រាក់ចំណូល ឬទ្រព្យសម្បត្តិនៅក្នុងសង្គម ដោយតម្លៃ ០ មានន័យថាមនុស្សគ្រប់រូបមានចំណូលស្មើគ្នាទាំងស្រុង ហើយតម្លៃ ១ មានន័យថាមនុស្សម្នាក់ក្តោបក្តាប់ទ្រព្យសម្បត្តិទាំងអស់។ ដូចជាពិន្ទុសម្រាប់វាស់ថាតើនំខេកមួយដុំត្រូវបានកាត់ចែកឱ្យក្មេងៗស្មើគ្នា ឬមានក្មេងតែម្នាក់លួចយកនំខេកទាំងអស់តែឯង។
Quantum Superposition គឺជាគោលការណ៍នៃមេកានិចកង់ទិច (Quantum Mechanics) ដែលអនុញ្ញាតឱ្យភាគល្អិតកង់ទិច (ដូចជាទិន្នន័យ Qubit ក្នុងកុំព្យូទ័រ) អាចស្ថិតនៅក្នុងស្ថានភាពតម្លៃ 0 និង 1 ក្នុងពេលតែមួយ រហូតទាល់តែវាត្រូវបានគេវាស់វែងទើបវាបញ្ចេញលទ្ធផលណាមួយពិតប្រាកដ។ ដូចជាកាក់ដែលកំពុងវិលលើតុ ដែលយើងអាចចាត់ទុកថាវាចេញទាំងក្បាល និងកន្ទុយក្នុងពេលតែមួយ រហូតដល់វាឈប់ទើបយើងដឹងច្បាស់ថាវាចេញមួយណា។
Metalloproteins ជាប្រភេទប្រូតេអ៊ីនពិសេសនៅក្នុងសរីរាង្គដែលមានភ្ជាប់ជាមួយអ៊ីយ៉ុងលោហៈ (ដូចជាស័ង្កសី ដែក ឬទង់ដែង) ដើម្បីអាចដំណើរការតួនាទីរបស់វាក្នុងការដឹកជញ្ជូនអុកស៊ីសែន ឬជួយជំរុញប្រតិកម្មគីមីនៅក្នុងកោសិកា។ ដូចជារថយន្តដឹកជញ្ជូនតូចៗនៅក្នុងរាងកាយ ដែលត្រូវការសោរ ឬគ្រឿងបន្លាស់លោហៈតូចមួយដើម្បីអាចបញ្ឆេះម៉ាស៊ីនដំណើរការបាន។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖