បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហានៃការបង្កើតប្រព័ន្ធគ្រប់គ្រងការសន្ទនា (Dialogue Managers) ដែលជួបការលំបាកដោយសារកង្វះទិន្នន័យ តាមរយៈការស្នើឡើងនូវវិធីសាស្ត្រស្ថិតិដែលមិនត្រូវការទិន្នន័យពិតប្រាកដក្នុងការបណ្តុះបណ្តាល និងបង្កើនភាពធន់ទៅនឹងសំឡេងរំខាន។
វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះបានបង្កើតគំរូប្រព័ន្ធសន្ទនាដោយប្រើប្រាស់ទិន្នន័យនិម្មិត ដោយផ្អែកលើម៉ូដែលព័ត៌មានរដ្ឋកំបាំង និងក្បួនរៀនពង្រឹង (Reinforcement Learning) រួមជាមួយម៉ូដែលក្លែងធ្វើកំហុសសូរសព្ទ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Handcrafted Confusion Model ម៉ូដែលក្លែងធ្វើកំហុសដោយការបង្កើតដោយដៃ (Baseline) |
ងាយស្រួលក្នុងការបង្កើត និងដំណើរការលឿន ដោយមិនតម្រូវឱ្យមានការគណនាស្មុគស្មាញ។ | កំហុសដែលបង្កើតឡើងមិនសូវឆ្លុះបញ្ចាំងពីការពិតទេ ព្រោះវាមិនបានគិតពីកំហុសសូរសព្ទ ឬការច្រឡំសំឡេងពិតប្រាកដ។ | ដំណើរការបានល្អក្នុងបរិយាកាសស្ងាត់ ប៉ុន្តែប្រសិទ្ធភាពធ្លាក់ចុះលឿននៅពេលអត្រាសំឡេងរំខាន (Noise) កើនឡើង។ |
| Phoneme-based Confusion Model ម៉ូដែលក្លែងធ្វើកំហុសផ្អែកលើសូរសព្ទ (Proposed) |
បង្កើតកំហុសបានប្រាកដនិយមជាងមុន ដោយមិនទាមទារទិន្នន័យហ្វឹកហាត់ (Training data) ពិតប្រាកដ និងជួយឱ្យប្រព័ន្ធធន់នឹងសំឡេងរំខាន។ | ត្រូវការចំណាយពេលគណនាច្រើន (Computationally expensive) ជាពិសេសសម្រាប់ប្រយោគវែងៗ ដោយសារទំហំក្រាហ្វិកសូរសព្ទធំ។ | បង្កើនអត្រាជោគជ័យ ២% ទៅ ៣% បន្ថែម បើធៀបនឹង Handcrafted Model ក្នុងស្ថានភាពមានសំឡេងរំខាន ហើយរក្សាអត្រាជោគជ័យជាង ៦០% សូម្បីតែមានកំហុសដល់ទៅ ៥០% ក៏ដោយ។ |
| Monte Carlo vs k-nn Monte Carlo Policy Training ការបណ្តុះបណ្តាលគោលការណ៍ដោយប្រើ Monte Carlo និង k-nn |
Monte Carlo ជាវិធីសាស្ត្រស្តង់ដារដែលរឹងមាំ ចំណែក k-nn ជួយប៉ាន់ស្មានតម្លៃ (Value function) បានរលូនជាងមុនប្រសិនបើជ្រើសរើសតម្លៃ k បានត្រឹមត្រូវ។ | ការប្រើ k-nn ជាមួយនឹង k=1 បរាជ័យក្នុងការរៀន ហើយបើ k ធំពេក (លើសពី ៣) វានឹងធ្វើឱ្យប្រសិទ្ធភាពធ្លាក់ចុះ។ | ម៉ូដែល Monte Carlo ស្តង់ដារ និង k-nn (k=3) ទទួលបានអត្រាជោគជ័យប្រហែល ៩៥% នៅក្នុងស្ថានភាពដែលគ្មានសំឡេងរំខាន។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះមិនតម្រូវឱ្យមានទិន្នន័យសន្ទនាពិតប្រាកដរាប់ម៉ឺនប្រយោគសម្រាប់ការបណ្តុះបណ្តាលនោះទេ ប៉ុន្តែវាទាមទារធនធានកុំព្យូទ័រខ្ពស់ និងបណ្ណាល័យភាសាសម្រាប់ការគណនាម៉ូដែលសូរសព្ទ។
ការសិក្សានេះត្រូវបានធ្វើតេស្តទាំងស្រុងលើប្រព័ន្ធព័ត៌មានភោជនីយដ្ឋានជាភាសាអង់គ្លេស ដោយប្រើវចនានុក្រមសូរសព្ទអាមេរិកខាងជើង (CMU Dictionary និង ARPAbet)។ វាមិនមានទិន្នន័យ ឬការធ្វើតេស្តទាក់ទងនឹងភាសាដែលមានធនធានតិចតួចដូចជាភាសាខ្មែរនោះទេ។ នេះជាបញ្ហាប្រឈមមួយសម្រាប់កម្ពុជា ព្រោះបច្ចុប្បន្នយើងនៅខ្វះខាតវចនានុក្រមសូរសព្ទ (Phoneme dictionaries) និងឧបករណ៍ NLP ពេញលេញសម្រាប់ភាសាខ្មែរ។
ទោះបីជាមានឧបសគ្គផ្នែកភាសាក៏ដោយ វិធីសាស្ត្រនៃការបណ្តុះបណ្តាលប្រព័ន្ធសន្ទនាដោយមិនបាច់មានទិន្នន័យពិត (Zero-data bootstrapping) គឺជាដំណោះស្រាយដ៏អស្ចារ្យ និងមានតម្លៃបំផុតសម្រាប់បរិបទកម្ពុជា។
សរុបមក ឯកសារនេះផ្តល់នូវផែនទីបង្ហាញផ្លូវដ៏ល្អមួយសម្រាប់ការអភិវឌ្ឍប្រព័ន្ធសន្ទនាឆ្លាតវៃនៅកម្ពុជា ដោយដោះស្រាយបញ្ហាខ្វះខាតទិន្នន័យតាមរយៈការប្រើប្រាស់បច្ចេកវិទ្យាក្លែងធ្វើ (Simulation) និង Reinforcement Learning។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Reinforcement Learning | វិធីសាស្ត្រនៃបញ្ញាសិប្បនិម្មិត (AI) ដែលភ្នាក់ងារ (Agent) រៀនធ្វើការសម្រេចចិត្តតាមរយៈការអនុវត្តផ្ទាល់និងកំហុស។ ប្រព័ន្ធរៀនជ្រើសរើសសកម្មភាពណាដែលទទួលបានរង្វាន់ (Reward) ច្រើនបំផុត និងផ្លាស់ប្តូរទម្លាប់ដោយជៀសវាងសកម្មភាពដែលនាំឱ្យបរាជ័យ ឬត្រូវពិន័យ។ | ដូចជាការបង្ហាត់សត្វឆ្កែដោយផ្តល់ចំណីនៅពេលវាស្តាប់បង្គាប់ និងធ្វើការព្រមានតិចៗនៅពេលវាធ្វើខុស ដើម្បីឱ្យវារៀនប្រកាន់ខ្ជាប់នូវទម្លាប់ល្អ។ |
| Partially Observable Markov Decision Process (POMDP) | ជាក្របខ័ណ្ឌគណិតវិទ្យាសម្រាប់ឱ្យប្រព័ន្ធកុំព្យូទ័រធ្វើការសម្រេចចិត្តក្នុងស្ថានភាពដែលវាមិនដឹងច្បាស់ ១០០% ពីស្ថានភាពពិតប្រាកដ (ឧទាហរណ៍៖ ស្តាប់ការបញ្ជាពីអ្នកប្រើប្រាស់មិនច្បាស់ដោយសារសំឡេងរំខាន) ដោយវាប្រើប្រាស់ប្រូបាប៊ីលីតេ (Probability) ដើម្បីទាយពីស្ថានភាពបច្ចុប្បន្នមុននឹងឆ្លើយតប។ | ដូចជាគ្រូពេទ្យដែលព្យាយាមទាយពីជំងឺរបស់អ្នកជំងឺដោយផ្អែកលើរោគសញ្ញាខាងក្រៅ ដោយមិនអាចមើលឃើញច្បាស់ពីស្ថានភាពខាងក្នុងរាងកាយ។ |
| Hidden Information State (HIS) model | ជាម៉ូដែលសម្រាប់គ្រប់គ្រងការសន្ទនាដែលជួយបង្រួមទំហំទិន្នន័យដ៏ធំនៃការទាយគោលដៅអ្នកប្រើប្រាស់ ដោយរៀបចំគោលដៅដែលស្រដៀងគ្នាជាក្រុមៗ (Partitions) ដើម្បីឱ្យប្រព័ន្ធកុំព្យូទ័រអាចគណនា និងរៀនពីយុទ្ធសាស្ត្រសន្ទនាបានលឿនជាងមុន ដោយមិនស៊ីមេម៉ូរីកុំព្យូទ័រច្រើន។ | ដូចជាការចាត់ថ្នាក់ឯកសាររាប់ពាន់សន្លឹកទៅក្នុងថតទូធំៗតាមប្រធានបទ ដើម្បីងាយស្រួលទាញយកមកប្រើប្រាស់ដោយមិនចាំបាច់ចំណាយពេលអានគ្រប់សន្លឹកម្តងមួយៗ។ |
| User Simulator | កម្មវិធីកុំព្យូទ័រដែលត្រូវបានបង្កើតឡើងដើម្បីដើរតួជាមនុស្សក្នុងការនិយាយឆ្លើយឆ្លងជាមួយប្រព័ន្ធសន្ទនា។ វាត្រូវបានប្រើដើម្បីបង្កើតទិន្នន័យសន្ទនា (Dialogues) រាប់ម៉ឺនដងដោយស្វ័យប្រវត្តិ ដើម្បីបណ្តុះបណ្តាល AI ដោយមិនចាំបាច់ចំណាយពេលឱ្យមនុស្សពិតប្រាកដមកអង្គុយសាកល្បងនិយាយជាមួយប្រព័ន្ធ។ | ដូចជាការប្រើប្រាស់ម៉ាស៊ីនបាញ់បាល់វាយកូនបាល់ (Tennis Machine) ដើម្បីឱ្យកីឡាករអាចហ្វឹកហាត់វាយបាល់បានរាប់ពាន់ដងដោយមិនបាច់មានគូប្រកួតពិតប្រាកដ។ |
| Confusion Model | ម៉ូដែលដែលក្លែងធ្វើការស្តាប់ច្រឡំ ឬកំហុសដែលតែងតែកើតមាននៅក្នុងប្រព័ន្ធសម្គាល់សំឡេង (Speech Recognition)។ វាជួយបង្កើតកំហុសសិប្បនិម្មិតក្នុងពេលហ្វឹកហាត់ ដើម្បីឱ្យប្រព័ន្ធសន្ទនាអាចរៀនពីរបៀបសួរបញ្ជាក់ ឬដោះស្រាយនៅពេលដែលវាស្តាប់សម្តីអ្នកប្រើប្រាស់មិនច្បាស់។ | ដូចជាការហ្វឹកហាត់បើកបរក្នុងបរិយាកាសទីលានដែលមានភ្លៀង និងអ័ព្ទសិប្បនិម្មិត ដើម្បីឱ្យអ្នកបើកបរចេះដោះស្រាយនៅពេលជួបស្ថានភាពមើលផ្លូវមិនច្បាស់នៅខាងក្រៅ។ |
| Phoneme Graph | តំណាងក្រាហ្វិកនៃកម្រងសំឡេង (សូរសព្ទ) ដែលបង្ហាញពីផ្លូវបំបែកនៃរបៀបដែលពាក្យមួយអាចត្រូវបានបញ្ចេញសំឡេងខុស ឬស្តាប់ច្រឡំទៅជាពាក្យផ្សេងដោយសារតែការបញ្ចេញសំឡេងស្រដៀងគ្នា។ វាដើរតួនាទីក្នុងការគណនា និងបង្កើតជាការស្តាប់ច្រឡំ (Confusions) ដែលទំនងជានឹងកើតមាននៅក្នុងការពិត។ | ដូចជាការគូសផែនទីបណ្តាញផ្លូវទឹក ដែលបង្ហាញថាទឹកអាចហូរខុសគន្លងទៅផ្លូវណាខ្លះ ប្រសិនបើមានរលក ឬឧបសគ្គរំខានការហូរ។ |
| Natural Language Generation (NLG) | បច្ចេកវិទ្យាដែលបំប្លែងកូដទិន្នន័យ ឬតំណាងអត្ថន័យពីកុំព្យូទ័រ ទៅជាប្រយោគភាសាមនុស្ស (Natural Language) ដែលមានវេយ្យាករណ៍ត្រឹមត្រូវ និងអាចស្តាប់បានដោយរលូន ជំនួសឱ្យការប្រើប្រាស់ប្រយោគរឹងៗដែលបានសរសេរទុកជាមុន (Canned messages)។ | ដូចជាអ្នកបកប្រែដ៏ពូកែម្នាក់ ដែលយកកូដកុំព្យូទ័រដ៏ស្មុគស្មាញ មកនិយាយរៀបរាប់ប្រាប់យើងជាភាសាធម្មតាដែលស្តាប់ទៅរលូន និងយល់បានភ្លាមៗ។ |
| Monte Carlo Control algorithm | ក្បួនអាល់កូរីតក្នុងការរៀនពង្រឹង (RL) ដែលរៀនកំណត់តម្លៃនៃសកម្មភាពនីមួយៗ តាមរយៈការសាកល្បងដំណើរការ (Simulation) រហូតដល់ទីបញ្ចប់ (ឧទាហរណ៍៖ បញ្ចប់ការសន្ទនាមួយចប់) រួចទើបវាយតម្លៃ និងចែកចាយរង្វាន់ដែលទទួលបានមកកែតម្រូវយុទ្ធសាស្ត្រសម្រាប់ការសាកល្បងនៅពេលក្រោយ។ | ដូចជាការហ្វឹកហាត់លេងអុកដោយសាកល្បងលេងច្រើនក្តាររហូតដល់ចាញ់ឬឈ្នះសិន រួចទើបចាំកត់ចំណាំថាកំហុស ឬយុទ្ធសាស្ត្រល្អៗមួយណាដែលគួរយកទៅលេងសម្រាប់ការប្រកួតលើកក្រោយ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖