Original Title: COHERENCE Volume 3 | September 2021
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ទស្សនាវដ្ដីស្រាវជ្រាវ COHERENCE ភាគទី៣ ខែកញ្ញា ឆ្នាំ២០២១

ចំណងជើងដើម៖ COHERENCE Volume 3 | September 2021

អ្នកនិពន្ធ៖ Samir Kanti Datta (The Bhawanipur Education Society College), Sanjib Halder (The Bhawanipur Education Society College)

ឆ្នាំបោះពុម្ព៖ 2021, The Bhawanipur Education Society College

វិស័យសិក្សា៖ Multidisciplinary Science

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះគឺជាកម្រងអត្ថបទស្រាវជ្រាវវិទ្យាសាស្ត្រចម្រុះ ដែលដោះស្រាយបញ្ហាប្រឈមជាច្រើនក្នុងវិស័យផ្សេងៗគ្នា ដូចជាបញ្ហាក្នុងការគណនាកង់ទិច (Quantum Computation) វិសមភាពសេដ្ឋកិច្ចតំបន់ (Spatial Inequality) ក៏ដូចជាការសម្គាល់ផ្ទៃមុខ (Face Recognition) និងការវិភាគម៉ូលេគុលថ្នាំគីមី។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានប្រើប្រាស់វិធីសាស្ត្រចម្រុះទៅតាមមុខជំនាញនីមួយៗរួមមាន ការវិភាគទិន្នន័យ ការប្រើប្រាស់ក្បួនដោះស្រាយ និងការធ្វើតេស្តសម្មតិកម្មសម្រាប់ការស្រាវជ្រាវនីមួយៗ។

ការវិភាគតម្រាថយ (Regression Analysis) និង ការធ្វើតេស្តសម្មតិកម្ម (Hypothesis Testing) សម្រាប់ការវិភាគសេដ្ឋកិច្ច
ក្បួនដោះស្រាយម៉ាស៊ីនរៀន (Machine Learning Algorithms) ដូចជា CNN សម្រាប់ការសម្គាល់ផ្ទៃមុខ
ការវិភាគគីមី (Chemical Analysis) និងបន្សំម៉ូលេគុល (Molecular Modeling) សម្រាប់គ្រឿងផ្ទុះគីមី និងការព្យាបាលវេជ្ជសាស្ត្រ
ការពិនិត្យអក្សរសាស្ត្រទ្រឹស្តី (Theoretical Literature Review) សម្រាប់រូបវិទ្យាដូចជារលកទំនាញ (Gravitational Waves) និងកុំព្យូទ័រកង់ទិច (Quantum Computation)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ការប្រើប្រាស់បច្ចេកវិទ្យា Deep Learning ដូចជាម៉ូដែល CG-Face ក្នុងការសម្គាល់ផ្ទៃមុខ ទទួលបានភាពត្រឹមត្រូវខ្ពស់រហូតដល់ ៩៨% ក្នុងការបែងចែករូបភាពពិត និងក្លែងក្លាយ។
ការវិភាគសេដ្ឋកិច្ចនៅឥណ្ឌាបានបង្ហាញពីទំនាក់ទំនងវិជ្ជមាន (០.៦១ សម្រាប់ធនធានរ៉ែ និង ០.៧៨ សម្រាប់ធនធានទឹក) រវាងធនធានធម្មជាតិ និងផលិតផលក្នុងស្រុកសរុប (GDP) របស់រដ្ឋនានា។
បច្ចេកវិទ្យាកុំព្យូទ័រកង់ទិច (Quantum Computing) ផ្តល់នូវល្បឿនគណនាខ្ពស់បំផុត ដែលមានសក្តានុពលធំធេងក្នុងការដោះស្រាយបញ្ហាស្មុគស្មាញសម្រាប់ការរកឃើញឱសថថ្មី និងសុវត្ថិភាពទិន្នន័យ។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
PCA, LDA with Artificial Neural Network ការប្រើប្រាស់ PCA និង LDA ជាមួយបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (ANN)	មានភាពសាមញ្ញក្នុងការទាញយកលក្ខណៈពិសេស (Feature Extraction) និងមានដំណើរការលឿនសម្រាប់ការប្រើប្រាស់ជាទូទៅ។	ភាពត្រឹមត្រូវមានកម្រិតបើធៀបនឹងបច្ចេកវិទ្យា Deep Learning ជាពិសេសនៅពេលមានការរំខានពីពន្លឺ។	ទទួលបានភាពត្រឹមត្រូវ ៩៥.៨០% លើសំណុំទិន្នន័យ Dataset of Faces។
DeepFace (Convolutional Neural Network) បណ្តាញសរសៃប្រសាទកាឡៃស៊ីជម្រៅ (CNN) សម្រាប់ការសម្គាល់ផ្ទៃមុខ	មានសមត្ថភាពខ្ពស់ក្នុងការសម្គាល់មុខមនុស្សក្នុងកម្រិតជិតស្មើនឹងមនុស្សពិតប្រាកដ ដោយប្រើ 3D Alignment។	ទាមទារទិន្នន័យហ្វឹកហាត់ធំសម្បើម និងកម្លាំងម៉ាស៊ីន (Computational Power) ខ្ពស់ដើម្បីដំណើរការ។	ទទួលបានភាពត្រឹមត្រូវ ៩៧.៣៥% លើសំណុំទិន្នន័យ SFC, LFW និង YTF។
CG-Face ម៉ូដែលបែងចែកផ្ទៃមុខពិត និងផ្ទៃមុខបង្កើតដោយកុំព្យូទ័រ	មានប្រសិទ្ធភាពខ្ពស់បំផុតក្នុងការស្វែងរក និងបែងចែករូបភាពពិត និងរូបភាពដែលបង្កើតដោយបញ្ញាសិប្បនិម្មិត (GANs)។	ត្រូវការបច្ចេកទេសថ្លឹងថ្លែងទិន្នន័យ (Data Balancing) ដើម្បីចៀសវាងភាពលម្អៀងក្នុងការទស្សន៍ទាយ។	ទទួលបានភាពត្រឹមត្រូវ ៩៨.០០% លើសំណុំទិន្នន័យ PCGAN និង BEGAN។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តវិធីសាស្ត្រ Machine Learning ជាពិសេស CNNs សម្រាប់សម្គាល់ផ្ទៃមុខ ទាមទារនូវធនធានកុំព្យូទ័រ និងសំណុំទិន្នន័យយ៉ាងច្រើនសន្ធឹកសន្ធាប់។

Hardware: ម៉ាស៊ីនដែលបំពាក់ដោយ GPU កម្រិតខ្ពស់ដើម្បីដំណើរការហ្វឹកហាត់ម៉ូដែល Deep Learning ដែលមានស្រទាប់ច្រើន (Deep Layers) ឱ្យបានលឿន។
Dataset: សំណុំទិន្នន័យរូបភាពរាប់ពាន់ ឬរាប់លានសន្លឹក (ដូចជា LFW ឬ CASIA-NIR) ដែលមានការរៀបចំត្រឹមត្រូវ ដើម្បីបង្កើនភាពច្បាស់លាស់។
Software: បរិស្ថានសម្រាប់សរសេរកូដ និងបណ្ណាល័យ Machine Learning (Machine Learning Frameworks) សម្រាប់កសាង និងសាកល្បងក្បួនដោះស្រាយ។
Expertise: អ្នកជំនាញផ្នែក Computer Vision និងប្រព័ន្ធប្រសៃប្រសាទសិប្បនិម្មិត ដែលអាចកែសម្រួលស្ថាបត្យកម្មប្រព័ន្ធ (Network Architecture) បានយ៉ាងប្រពៃ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានៅក្នុងអត្ថបទនេះត្រូវបានធ្វើឡើងដោយប្រើប្រាស់សំណុំទិន្នន័យអន្តរជាតិ (ដូចជា LFW និង AT&T) ដែលភាគច្រើនជារូបភាពផ្ទៃមុខជនជាតិអឺរ៉ុប។ សម្រាប់ប្រទេសកម្ពុជា ការយកម៉ូដែលទាំងនេះមកប្រើប្រាស់ដោយផ្ទាល់អាចបណ្តាលឱ្យមានភាពលម្អៀង (Bias) ពោលគឺភាពត្រឹមត្រូវអាចធ្លាក់ចុះនៅពេលសម្គាល់ផ្ទៃមុខជនជាតិអាស៊ីអាគ្នេយ៍ ឬជនជាតិខ្មែរ ដោយសារលក្ខណៈទម្រង់មុខមានភាពខុសគ្នា។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកវិទ្យាសម្គាល់ផ្ទៃមុខ (Face Recognition) ដែលបានបង្ហាញក្នុងឯកសារនេះ មានសក្តានុពលខ្ពស់ក្នុងការយកមកអនុវត្តដើម្បីអភិវឌ្ឍវិស័យឌីជីថលនៅកម្ពុជា។

ប្រព័ន្ធសន្តិសុខចំណតអាកាសយានដ្ឋានអន្តរជាតិ (Airport Security): អាចប្រើប្រាស់នៅតាមអាកាសយានដ្ឋានអន្តរជាតិភ្នំពេញ តារាសាគរ ឬសៀមរាប ដើម្បីកំណត់អត្តសញ្ញាណអ្នកដំណើរដោយស្វ័យប្រវត្តិ និងពង្រឹងសន្តិសុខជាតិកម្រិតខ្ពស់។
វិស័យធនាគារ និងហិរញ្ញវត្ថុជឿនលឿន (Fintech & Banking): អាចប្រើសម្រាប់ប្រព័ន្ធផ្ទៀងផ្ទាត់អត្តសញ្ញាណអតិថិជន (e-KYC) លើកម្មវិធីទូរស័ព្ទរបស់ធនាគារក្នុងស្រុក ដើម្បីបង្ការការក្លែងបន្លំ និងជួយឱ្យការបើកគណនីកាន់តែងាយស្រួល។
ការគ្រប់គ្រងវត្តមានបុគ្គលិកនៅតាមរោងចក្រ (Smart Attendance): អាចអនុវត្តនៅតាមតំបន់សេដ្ឋកិច្ចពិសេស ឬរោងចក្រកាត់ដេរ ដើម្បីគ្រប់គ្រងវត្តមានកម្មកររាប់ពាន់នាក់បានយ៉ាងរហ័ស ជៀសវាងការតម្រង់ជួរស្កេនម្រាមដៃ។

ការបណ្តុះបណ្តាលក្បួនដោះស្រាយទាំងនេះដោយប្រើប្រាស់ទិន្នន័យផ្ទៃមុខក្នុងស្រុក នឹងជួយជំរុញនវានុវត្តន៍ និងធានាសុវត្ថិភាពប្រព័ន្ធឌីជីថលនៅកម្ពុជាឱ្យកាន់តែមានប្រសិទ្ធភាព។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះនៃបញ្ញាសិប្បនិម្មិត: ចាប់ផ្តើមរៀនភាសាកូដកម្មវិធី Python និងបណ្ណាល័យសំខាន់ៗដូចជា Scikit-Learn ព្រមទាំងស្វែងយល់ពីក្បួនដោះស្រាយមូលដ្ឋានដូចជា PCA និង SVM ដែលបានរៀបរាប់ក្នុងឯកសារ។
អនុវត្តការស្រាវជ្រាវលើ Computer Vision: សាកល្បងប្រើប្រាស់បណ្ណាល័យ OpenCV ដើម្បីស្វែងយល់ពីរបៀបចាប់យកទម្រង់មុខ (Face Detection) និងការកែច្នៃរូបភាព (Image Pre-processing) ជាជំហានដំបូង។
សិក្សា និងប្រើប្រាស់ Deep Learning Frameworks: បន្តរៀនសាងសង់ម៉ូដែល CNN ដោយប្រើប្រាស់ TensorFlow ឬ PyTorch ដើម្បីបង្កើតប្រព័ន្ធ Face Recognition ដែលមានភាពត្រឹមត្រូវខ្ពស់ដូចជា DeepFace ជាដើម។
ប្រមូល និងបង្កើតសំណុំទិន្នន័យ (Dataset) ក្នុងស្រុក: ចាប់ផ្តើមប្រមូល និងរៀបចំទិន្នន័យរូបភាពផ្ទៃមុខជនជាតិខ្មែរ (ដោយគោរពតាមសិទ្ធិឯកជន) ដើម្បីហ្វឹកហាត់ម៉ូដែលឱ្យកាន់តែមានភាពសុក្រឹត និងកាត់បន្ថយភាពលម្អៀង (Data Bias) សម្រាប់បរិបទកម្ពុជា។
អភិវឌ្ឍគម្រោងគំរូ (Prototype): សហការជាក្រុមដើម្បីបង្កើតប្រព័ន្ធស្កេនវត្តមានដោយផ្ទៃមុខសម្រាប់ប្រើប្រាស់ក្នុងសាកលវិទ្យាល័យ ដោយប្រើឧបករណ៍ដូចជា Raspberry Pi ភ្ជាប់ជាមួយកាមេរ៉ា និងបង្ហោះកូដនៅលើ GitHub ជាលទ្ធផលជាក់ស្តែង។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Convolutional Neural Network	វាគឺជាប្រភេទនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (AI) ដែលត្រូវបានរចនាឡើងយ៉ាងពិសេសសម្រាប់ដំណើរការទិន្នន័យរូបភាព ដោយវាធ្វើការច្រោះ និងទាញយកលក្ខណៈពិសេសៗនៃរូបភាព (ដូចជាគែម ពណ៌ ទម្រង់) ដើម្បីកំណត់អត្តសញ្ញាណវត្ថុ ឬផ្ទៃមុខដោយស្វ័យប្រវត្តិ។	ដូចជាភ្នែក និងខួរក្បាលរបស់មនុស្សដែលចេះសង្កេតមើលលក្ខណៈពិសេសតូចៗនៃរូបភាព ដើម្បីដំឡើងជារូបភាពពេញលេញមួយហើយដឹងថាវត្ថុនោះជាអ្វី។
Dutch Disease	ជាបាតុភូតសេដ្ឋកិច្ចអវិជ្ជមានមួយដែលកើតឡើងនៅពេលប្រទេសមួយរកឃើញ ឬពឹងផ្អែកខ្លាំងលើការនាំចេញធនធានធម្មជាតិ (ដូចជាប្រេង) ដែលធ្វើឱ្យរូបិយប័ណ្ណក្នុងស្រុកឡើងថ្លៃ និងបណ្តាលឱ្យវិស័យផលិតកម្មនិងកសិកម្មផ្សេងៗទៀតធ្លាក់ចុះការប្រកួតប្រជែងនិងរងការខូចខាតយ៉ាងធ្ងន់ធ្ងរ។	ដូចជាសិស្សម្នាក់ដែលពូកែមុខវិជ្ជាមួយខ្លាំងពេក រហូតដល់បោះបង់ចោលការសិក្សាមុខវិជ្ជាផ្សេងៗទៀតធ្វើឱ្យធ្លាក់ថ្នាក់។
Gravitational Waves	ជារលកនៃរំញ័រនៅក្នុងលំហ-ពេលវេលា (Space-time) ដែលបង្កើតឡើងដោយវត្ថុមានម៉ាសធំៗដែលកំពុងផ្លាស់ទីក្នុងល្បឿនលឿន (ដូចជាការបុកទង្គិចគ្នារវាងប្រហោងខ្មៅ) ដែលនាំយកព័ត៌មានអំពីប្រភពដើមរបស់វាឆ្លងកាត់សកលលោក។	ដូចជារលកទឹកដែលសាយភាយចេញជារង្វង់ នៅពេលដែលយើងបោះដុំថ្មធំមួយចូលទៅក្នុងផ្ទៃទឹកដ៏ស្ងាត់ជ្រងំ។
Support Vector Machines (SVM)	គឺជាក្បួនដោះស្រាយនៃម៉ាស៊ីនរៀន (Machine Learning Algorithm) ដែលមានតួនាទីវិភាគ និងចាត់ថ្នាក់ទិន្នន័យ ដោយស្វែងរកបន្ទាត់ ឬប្លង់ (Hyperplane) មួយដ៏ល្អបំផុតដើម្បីញែកក្រុមទិន្នន័យប្រភេទផ្សេងៗគ្នាឱ្យនៅដាច់ពីគ្នាយ៉ាងច្បាស់លាស់។	ដូចជាការគូសបន្ទាត់មួយនៅលើតុ ដើម្បីញែកផ្លែប៉ោម និងផ្លែក្រូចឱ្យនៅម្ខាងម្នាក់ដាច់ពីគ្នាយ៉ាងច្បាស់។
Gini Coefficient	ជារង្វាស់ស្ថិតិដែលសេដ្ឋវិទូប្រើសម្រាប់វាស់ស្ទង់កម្រិតនៃវិសមភាពប្រាក់ចំណូល ឬទ្រព្យសម្បត្តិនៅក្នុងសង្គម ដោយតម្លៃ ០ មានន័យថាមនុស្សគ្រប់រូបមានចំណូលស្មើគ្នាទាំងស្រុង ហើយតម្លៃ ១ មានន័យថាមនុស្សម្នាក់ក្តោបក្តាប់ទ្រព្យសម្បត្តិទាំងអស់។	ដូចជាពិន្ទុសម្រាប់វាស់ថាតើនំខេកមួយដុំត្រូវបានកាត់ចែកឱ្យក្មេងៗស្មើគ្នា ឬមានក្មេងតែម្នាក់លួចយកនំខេកទាំងអស់តែឯង។
Quantum Superposition	គឺជាគោលការណ៍នៃមេកានិចកង់ទិច (Quantum Mechanics) ដែលអនុញ្ញាតឱ្យភាគល្អិតកង់ទិច (ដូចជាទិន្នន័យ Qubit ក្នុងកុំព្យូទ័រ) អាចស្ថិតនៅក្នុងស្ថានភាពតម្លៃ 0 និង 1 ក្នុងពេលតែមួយ រហូតទាល់តែវាត្រូវបានគេវាស់វែងទើបវាបញ្ចេញលទ្ធផលណាមួយពិតប្រាកដ។	ដូចជាកាក់ដែលកំពុងវិលលើតុ ដែលយើងអាចចាត់ទុកថាវាចេញទាំងក្បាល និងកន្ទុយក្នុងពេលតែមួយ រហូតដល់វាឈប់ទើបយើងដឹងច្បាស់ថាវាចេញមួយណា។
Metalloproteins	ជាប្រភេទប្រូតេអ៊ីនពិសេសនៅក្នុងសរីរាង្គដែលមានភ្ជាប់ជាមួយអ៊ីយ៉ុងលោហៈ (ដូចជាស័ង្កសី ដែក ឬទង់ដែង) ដើម្បីអាចដំណើរការតួនាទីរបស់វាក្នុងការដឹកជញ្ជូនអុកស៊ីសែន ឬជួយជំរុញប្រតិកម្មគីមីនៅក្នុងកោសិកា។	ដូចជារថយន្តដឹកជញ្ជូនតូចៗនៅក្នុងរាងកាយ ដែលត្រូវការសោរ ឬគ្រឿងបន្លាស់លោហៈតូចមួយដើម្បីអាចបញ្ឆេះម៉ាស៊ីនដំណើរការបាន។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖