បញ្ហា (The Problem)៖ ឯកសារនេះផ្តល់នូវការពិនិត្យជារួមអំពីវិធីសាស្ត្រសិក្សារបស់ម៉ាស៊ីន (Machine Learning paradigms) និងបច្ចេកវិទ្យាសិក្សាស៊ីជម្រៅ (Deep Learning) ដើម្បីដោះស្រាយបញ្ហាស្មុគស្មាញដែលពិបាកដោះស្រាយដោយសៀគ្វីកុំព្យូទ័រប្រពៃណី។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានធ្វើការត្រួតពិនិត្យ វិភាគ និងប្រៀបធៀបប្រភេទផ្សេងៗនៃបច្ចេកទេសរៀនរបស់ម៉ាស៊ីន រួមទាំងស្ថាបត្យកម្មបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតផ្សេងៗគ្នាក្នុងការអនុវត្តជាក់ស្តែង។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Deep Neural Networks (CNN & DBN) បណ្ដាញសរសៃប្រសាទស៊ីជម្រៅ (CNN និង DBN) |
មានប្រសិទ្ធភាពខ្ពស់ក្នុងការដោះស្រាយបញ្ហាស្មុគស្មាញ (ដូចជាចំណាត់ថ្នាក់រូបភាព និងការសម្គាល់សំឡេង)។ អាចទាញយកលក្ខណៈពិសេស (Feature Representation) បានយ៉ាងល្អដោយស្វ័យប្រវត្តិ។ | ត្រូវការទិន្នន័យធំសម្រាប់ការបណ្តុះបណ្តាល និងទាមទារកម្លាំងម៉ាស៊ីន (Hardware) ខ្ពស់។ ដំណើរការហ្វឹកហាត់អាចចំណាយពេលយូរប្រសិនបើប្រើឧបករណ៍ធម្មតា។ | ផ្តល់ភាពត្រឹមត្រូវខ្ពស់ជាងបណ្តាញសរសៃប្រសាទប្រពៃណី និងអាចដោះស្រាយបញ្ហាស្មុគស្មាញដូចជាការដាក់ពណ៌រូបភាព ដែលសៀគ្វីប៊ូលីនមិនអាចធ្វើបានប្រកបដោយប្រសិទ្ធភាព។ |
| Traditional Artificial Neural Networks (e.g., Perceptron/Feed-forward) បណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតប្រពៃណី (Artificial Neural Networks - ANN) |
ងាយស្រួលយល់ និងអនុវត្តសម្រាប់បញ្ហាសាមញ្ញៗ តម្រូវការកម្លាំងកុំព្យូទ័រ និងទិន្នន័យទាបជាង Deep Learning។ | មិនសូវមានប្រសិទ្ធភាពលើបញ្ហាស្មុគស្មាញ និងពឹងផ្អែកខ្លាំងលើការកែច្នៃលក្ខណៈទិន្នន័យដោយមនុស្ស (Hand-engineered features) ជាមុន។ | មានកម្រិតភាពត្រឹមត្រូវទាបជាងវិធីសាស្ត្រ Deep Learning នៅពេលអនុវត្តលើទិន្នន័យស្មុគស្មាញដូចជារូបភាព ឬការបកប្រែដោយស្វ័យប្រវត្តិ។ |
| Boolean Circuits សៀគ្វីប៊ូលីន (Boolean Circuits) |
ជាមូលដ្ឋានគ្រឹះនៃកុំព្យូទ័រ និងប្រព័ន្ធតក្កវិជ្ជាឌីជីថលទូទៅ ដែលមានដំណើរការលឿនសម្រាប់ប្រតិបត្តិការតក្កវិជ្ជាធម្មតា។ | ត្រូវការស្រទាប់ (layers) ច្រើនឥតគណនាដើម្បីដោះស្រាយបញ្ហាដែលបណ្ដាញសរសៃប្រសាទស៊ីជម្រៅ (DNN) អាចដោះស្រាយបានជាមួយស្រទាប់តិចតួច។ | មានផលិតភាព និងប្រសិទ្ធភាពទាបជាងយ៉ាងច្បាស់បើធៀបនឹង DNN ពីព្រោះសៀគ្វីប៊ូលីនមិនអាចធ្វើប្រតិបត្តិការតាមកម្រិតកំណត់ (threshold operation) ដូចកោសិកាសរសៃប្រសាទបានឡើយ។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ឯកសារនេះបានបញ្ជាក់ពីការថយចុះនៃតម្លៃឧបករណ៍កុំព្យូទ័រ និងការកើនឡើងយ៉ាងខ្លាំងនៃសមត្ថភាពដំណើរការបន្ទះឈីប ដែលជាកត្តាជំរុញឱ្យមានការពេញនិយមនៃការសិក្សាស៊ីជម្រៅ (Deep Learning)។
ឯកសារនេះគឺជាការសិក្សាស្រាវជ្រាវបែបពិនិត្យជារួម (Overview paper) ដោយមិនបានផ្ដោតលើសំណុំទិន្នន័យពីតំបន់ភូមិសាស្ត្រណាមួយជាក់លាក់ឡើយ ប៉ុន្តែបានលើកឡើងពីភាពជោគជ័យនៃការប្រើប្រាស់ទិន្នន័យធំដោយក្រុមហ៊ុនលោកខាងលិចដូចជា Google, Apple និង Facebook។ សម្រាប់កម្ពុជា ការយកម៉ូដែលបណ្តុះបណ្តាលស្រាប់ពីបរទេសមកប្រើប្រាស់ អាចបណ្តាលឱ្យមានគម្លាតអគតិ (Bias) និងភាពមិនសុក្រឹតនៅពេលអនុវត្តលើបរិបទភាសា សំឡេង ឬទិន្នន័យក្នុងស្រុក។
បច្ចេកទេសបណ្ដាញសរសៃប្រសាទស៊ីជម្រៅនេះ ពិតជាមានសារៈសំខាន់ និងអាចកែច្នៃយកមកអនុវត្តដើម្បីដោះស្រាយបញ្ហាស្មុគស្មាញនៅក្នុងស្ថាប័ននិងវិស័យអាទិភាពនានានៅកម្ពុជា។
ជារួម ការវិនិយោគលើធនធាន Hardware ទំហំផ្ទុកទិន្នន័យ និងការប្រមូលសំណុំទិន្នន័យក្នុងស្រុក គឺជាស្ពានចម្លងដ៏សំខាន់ដើម្បីទាញយកអត្ថប្រយោជន៍ពេញលេញពី Deep Learning សម្រាប់ប្រទេសកម្ពុជា។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Convolutional Neural Networks (CNNs) | ប្រភេទនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតដែលត្រូវបានរចនាឡើងយ៉ាងពិសេសសម្រាប់វិភាគទិន្នន័យដែលមានរចនាសម្ព័ន្ធជាក្រឡាចត្រង្គ ដូចជារូបភាព និងវីដេអូ ដោយប្រើប្រាស់តម្រង (filters) ដើម្បីទាញយកលក្ខណៈសម្គាល់ និងកាត់បន្ថយចំនួនប៉ារ៉ាម៉ែត្រដែលត្រូវគណនា។ | ដូចជាការប្រើកែវពង្រីកដើម្បីពិនិត្យមើលរូបភាពមួយចំណែកម្តងៗ រួចផ្ដុំព័ត៌មានទាំងនោះបញ្ចូលគ្នាដើម្បីដឹងថារូបនោះជាអ្វី។ |
| Deep Belief Networks (DBNs) | ម៉ូដែលសិក្សាស៊ីជម្រៅដែលផ្សំឡើងពីស្រទាប់ជាច្រើននៃម៉ាស៊ីន Restricted Boltzmann Machines (RBMs) ដែលវាអាចរៀនពីទិន្នន័យដោយគ្មានការណែនាំ (unsupervised pre-training) មុននឹងធ្វើការកែសម្រួលសម្រាប់ចំណាត់ថ្នាក់ចុងក្រោយដើម្បីបង្កើនភាពត្រឹមត្រូវ។ | ដូចជាការរៀនគូររូបដោយចាប់ផ្តើមពីការគូសបន្ទាត់ព្រាងៗជាមុន បន្ទាប់មកទើបបន្ថែមស្រមោល និងពណ៌បន្តិចម្តងៗរហូតដល់ចេញជារូបរាងច្បាស់លាស់។ |
| Generative Learning | វិធីសាស្ត្ររៀនរបស់ម៉ាស៊ីនដែលព្យាយាមយល់ពីរបៀបដែលទិន្នន័យត្រូវបានបង្កើតឡើង (គំរូនៃប្រូបាប៊ីលីតេរួមគ្នារវាងទិន្នន័យ និងស្លាកចំណាត់ថ្នាក់) ដើម្បីអាចទស្សន៍ទាយ ឬបង្កើតទិន្នន័យថ្មីៗបន្ថែមទៀតដែលមានលក្ខណៈស្រដៀងដើម។ | ដូចជាវិចិត្រករម្នាក់ដែលបានមើលរូបភាពសត្វឆ្មាជាច្រើនដង រហូតយល់ពីទម្រង់របស់វា ហើយអាចគូររូបសត្វឆ្មាថ្មីមួយដែលមិនធ្លាប់មានពីមុនមកដោយខ្លួនឯងបាន។ |
| Discriminative Learning | វិធីសាស្ត្ររៀនរបស់ម៉ាស៊ីនដែលផ្តោតតែទៅលើការស្វែងរកបន្ទាត់ព្រំដែនដើម្បីបែងចែកប្រភេទកាតេហ្គោរីផ្សេងៗគ្នានៃទិន្នន័យឱ្យដាច់ពីគ្នា ដោយមិនខ្វល់ពីរបៀបដែលទិន្នន័យនោះត្រូវបានបង្កើតឡើយ។ | ដូចជាអ្នកយាមទ្វារដែលគ្រាន់តែដឹងពីរបៀបសម្គាល់ចំណុចខុសគ្នារវាងសំបុត្រចូលរួមពិត និងក្លែងក្លាយ ដោយមិនចាំបាច់ដឹងពីរបៀបបោះពុម្ពសំបុត្រនោះទេ។ |
| Active Learning | ទម្រង់នៃការរៀនសូត្ររបស់ម៉ាស៊ីនដែលប្រព័ន្ធអាចដើរតួយ៉ាងសកម្មក្នុងការជ្រើសរើសទិន្នន័យដែលខ្លួនមិនសូវច្បាស់ ឬពិបាកយល់ រួចស្នើសុំឱ្យមនុស្សជួយដាក់ស្លាក (label) ឱ្យ ដើម្បីបង្កើនភាពត្រឹមត្រូវលឿនជាងមុន និងចំណាយទិន្នន័យតិច។ | ដូចជាសិស្សដែលរៀនពូកែ ដោយចេះសួរសំណួរទៅគ្រូបង្រៀនចំចំណុចដែលខ្លួនមិនយល់ ដើម្បីឆាប់ឆ្អិនមេរៀន ជាជាងការរៀនទន្ទេញគ្រប់ទំព័រសៀវភៅ។ |
| back-propagation | ក្បួនដោះស្រាយដ៏សំខាន់សម្រាប់បណ្តុះបណ្តាលបណ្តាញសរសៃប្រសាទ ដោយវាគណនាកំហុសពីលទ្ធផលចុងក្រោយ រួចបញ្ជូនព័ត៌មានកំហុសនោះត្រឡប់ក្រោយវិញគ្រប់ស្រទាប់ ដើម្បីកែតម្រូវទម្ងន់ (weights) របស់កោសិកាឱ្យទទួលបានលទ្ធផលកាន់តែសុក្រឹតនៅពេលក្រោយ។ | ដូចជាការបោះបាល់ចូលកន្ត្រក បើបោះខុសគោលដៅ យើងធ្វើការកែតម្រូវកម្លាំង និងទិសដៅដៃរបស់យើងបន្តិចម្តងៗសម្រាប់ការបោះលើកក្រោយរហូតដល់ចូលទី។ |
| Gibbs sampling | វិធីសាស្ត្រស្ថិតិដែលត្រូវបានប្រើប្រាស់នៅក្នុងម៉ូដែល Deep Belief Networks ដើម្បីប៉ាន់ស្មានការចែកចាយប្រូបាប៊ីលីតេស្មុគស្មាញ ដោយធ្វើបច្ចុប្បន្នភាពតម្លៃនៃអថេរម្តងមួយៗជាបន្តបន្ទាប់រហូតដល់វាស្ថិតស្ថេរ។ | ដូចជាការស្វែងរករូបមន្តចម្អិនម្ហូបដ៏ល្អឥតខ្ចោះមួយ ដោយសាកល្បងកែប្រែបរិមាណគ្រឿងផ្សំម្តងមួយមុខៗ ភ្លក់ហើយកែទៀត រហូតទទួលបានរសជាតិដែលឆ្ងាញ់បំផុត។ |
| Boolean circuits | ម៉ូដែលគណិតវិទ្យានៃការគណនាបែបឌីជីថលដែលប្រើប្រាស់ច្រកតក្កវិជ្ជា (AND, OR, NOT) ដើម្បីដំណើរការព័ត៌មាន។ នៅក្នុងឯកសារនេះ វាត្រូវបានប្រៀបធៀបថាមានប្រសិទ្ធភាពទាបជាងបណ្តាញសរសៃប្រសាទស៊ីជម្រៅក្នុងការដោះស្រាយបញ្ហាស្មុគស្មាញ។ | ដូចជាប្រព័ន្ធកុងតាក់ភ្លើងធម្មតាដែលស្គាល់តែលេខ ០ និង ១ ដែលត្រូវតភ្ជាប់គ្នាយ៉ាងស្មុគស្មាញទើបអាចដោះស្រាយបញ្ហាធំបាន។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖