បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហានៃអត្រាកំហុសខ្ពស់ក្នុងការសម្គាល់សំឡេង (ASR) សម្រាប់ជនពិការភាពរាងកាយ ដែលធ្វើឱ្យពួកគេពិបាកប្រើប្រាស់ចំណុចប្រទាក់បញ្ជាដោយសំឡេងបែបប្រពៃណី។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានបង្កើតប្រព័ន្ធសន្ទនាដោយសំឡេងតាំងពីដើមដល់ចប់ ដោយប្រើប្រាស់ក្របខ័ណ្ឌដំណើរការសម្រេចចិត្តម៉ាកូវដែលអាចសង្កេតបានមួយផ្នែក (POMDP) ដើម្បីគ្រប់គ្រងភាពមិនប្រាកដប្រជា។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| SDS-POMDP (Spoken Dialogue System using POMDP) ប្រព័ន្ធគ្រប់គ្រងការសន្ទនាដោយផ្អែកលើ POMDP |
អាចដោះស្រាយភាពមិនច្បាស់លាស់នៃសំឡេងបានយ៉ាងល្អ និងទាញយកព័ត៌មានពីអ្នកប្រើប្រាស់បាន ទោះបីជាមានកំហុសក្នុងការសម្គាល់សំឡេងក៏ដោយ។ | ត្រូវការការគណនាស្មុគស្មាញក្នុងការបង្កើតគោលការណ៍ (Policy generation) ដោយតម្រូវឱ្យប្រើប្រាស់វិធីសាស្ត្រប៉ាន់ស្មាន QMDP។ | អ្នកប្រើប្រាស់គោលដៅអាចបញ្ចប់ការសន្ទនាដោយជោគជ័យជាមធ្យម ១៧.៤ លើ ២០ ក្នុងរយៈពេលខ្លី។ |
| Threshold-based dialogue manager (Baseline) ប្រព័ន្ធគ្រប់គ្រងការសន្ទនាដោយផ្អែកលើកម្រិតគោលចំណុច (Baseline) |
មានភាពសាមញ្ញ ងាយស្រួលក្នុងការអនុវត្ត និងមិនមានហានិភ័យនៃការប្រមូលផ្តុំកំហុសទិន្នន័យ (Memory-less)។ | មិនមានប្រសិទ្ធភាពទាល់តែសោះសម្រាប់អ្នកប្រើប្រាស់ដែលមានកំហុសសម្គាល់សំឡេងខ្ពស់ ដោយសារប្រព័ន្ធទាមទារឱ្យនិយាយឡើងវិញជារឿយៗ។ | អ្នកប្រើប្រាស់គោលដៅអាចបញ្ចប់ការសន្ទនាដោយជោគជ័យជាមធ្យមត្រឹមតែ ១៣.១ លើ ២០ ប៉ុណ្ណោះ។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការអភិវឌ្ឍប្រព័ន្ធនេះទាមទារការរួមបញ្ចូលគ្នានៃកម្មវិធីសម្គាល់សំឡេង ទិន្នន័យសំឡេងជាក់លាក់ និងក្បួនដោះស្រាយម៉ាស៊ីនរៀនដើម្បីវាយតម្លៃទំនុកចិត្ត។
ការសិក្សានេះត្រូវបានធ្វើឡើងនៅមណ្ឌលថែទាំ The Boston Home សហរដ្ឋអាមេរិក ដោយមានអ្នកចូលរួមគោលដៅត្រឹមតែ ៧ នាក់ដែលមានជំងឺ Multiple Sclerosis។ ទិន្នន័យនេះផ្តោតតែលើភាសាអង់គ្លេស និងតំណាងឱ្យក្រុមអ្នកជំងឺតូចចង្អៀត ដែលមានន័យថាសម្រាប់ប្រទេសកម្ពុជា យើងចាំបាច់ត្រូវប្រមូលទិន្នន័យសំឡេងភាសាខ្មែរពីជនពិការផ្ទាល់ទើបប្រព័ន្ធនេះអាចដំណើរការបានជាក់ស្តែង។
វិធីសាស្ត្រក្នុងការគ្រប់គ្រងភាពមិនច្បាស់លាស់នៃសំឡេងនេះ មានសក្តានុពលខ្ពស់ក្នុងការជួយសម្រួលដល់ជីវភាពរស់នៅរបស់ជនពិការនៅកម្ពុជា។
ទោះបីជាការបង្កើតប្រព័ន្ធសម្គាល់សំឡេង (ASR) ភាសាខ្មែរសម្រាប់អ្នកមានបញ្ហាសំឡេងជាបញ្ហាប្រឈមក៏ដោយ ការប្រើប្រាស់ម៉ូដែល POMDP អាចជួយកាត់បន្ថយសម្ពាធលើភាពត្រឹមត្រូវនៃ ASR ភាគរយខ្ពស់ ដែលធ្វើឱ្យបច្ចេកវិទ្យានេះអាចក្លាយជាការពិតនៅកម្ពុជា។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| POMDP (Partially Observable Markov Decision Process) | ជាក្របខ័ណ្ឌគណិតវិទ្យាសម្រាប់ធ្វើការសម្រេចចិត្តក្នុងស្ថានភាពដែលប្រព័ន្ធមិនមានព័ត៌មានពេញលេញ ឬច្បាស់លាស់អំពីបរិស្ថាន (ឧទាហរណ៍ ពេលស្តាប់មិនច្បាស់ពីអ្វីដែលអ្នកប្រើប្រាស់ចង់បាន) វានឹងប្រើប្រាស់ប្រូបាប៊ីលីតេដើម្បីទស្សន៍ទាយនិងជ្រើសរើសសកម្មភាពបន្ទាប់។ | ដូចជាវេជ្ជបណ្ឌិតដែលមិនអាចមើលឃើញមេរោគក្នុងខ្លួនអ្នកជំងឺផ្ទាល់ ប៉ុន្តែប្រើប្រាស់រោគសញ្ញាផ្សេងៗដើម្បីទាយរកជំងឺ និងសម្រេចចិត្តផ្តល់ថ្នាំព្យាបាល។ |
| Automatic Speech Recognition (ASR) | បច្ចេកវិទ្យាដែលបំប្លែងសំឡេងនិយាយរបស់មនុស្សទៅជាអត្ថបទ (Text) ឬពាក្យបញ្ជាដែលកុំព្យូទ័រអាចយល់បាន។ នៅក្នុងការសិក្សានេះ វាជួបបញ្ហាកំហុសខ្ពស់ពេលអ្នកប្រើប្រាស់មានបញ្ហាក្នុងការបញ្ចេញសំឡេងដោយសារជំងឺ។ | ដូចជាការមានលេខាធិការម្នាក់អង្គុយស្តាប់អ្នកនិយាយ ហើយសរសេរត្រឡប់មកវិញនូវអ្វីដែលអ្នកទើបតែនិយាយនៅលើក្រដាស។ |
| Dialogue Manager | ជាផ្នែកមួយនៃប្រព័ន្ធកុំព្យូទ័រដែលគ្រប់គ្រងលំហូរនៃការសន្ទនាជាមួយមនុស្ស ដោយវាមានតួនាទីសម្រេចចិត្តថាតើត្រូវឆ្លើយតបបែបណា ឬត្រូវសួរសំណួរបញ្ជាក់បន្ថែមដោយផ្អែកលើព័ត៌មានដែលទទួលបានពីការស្តាប់។ | ដូចជាអ្នកទទួលភ្ញៀវតាមទូរស័ព្ទ ដែលត្រូវដឹងថាពេលណាត្រូវតភ្ជាប់ខ្សែ ពេលណាត្រូវឆ្លើយតប និងពេលណាត្រូវសួរបញ្ជាក់ឈ្មោះម្តងទៀតបើស្ដាប់មិនច្បាស់។ |
| Belief Update | ជាដំណើរការនៅក្នុងម៉ូដែល POMDP ដែលធ្វើការកែតម្រូវកម្រិតប្រូបាប៊ីលីតេនៃការជឿជាក់របស់ប្រព័ន្ធទៅលើគោលបំណងពិតប្រាកដរបស់អ្នកប្រើប្រាស់ រាល់ពេលដែលវាទទួលបានព័ត៌មានឬចម្លើយថ្មី។ | ដូចជាអ្នកកំពុងលេងលាក់កន្សែង ពេលអ្នកឮសំឡេងជើងកាន់តែជិត អ្នកកាន់តែជឿជាក់ថាគេនៅក្បែរអ្នក ហើយអ្នកក៏កែប្រែការគិតរបស់អ្នកបន្តិចម្តងៗ។ |
| AdaBoost | ជាក្បួនដោះស្រាយម៉ាស៊ីនរៀន (Machine Learning) ដែលរួមបញ្ចូលម៉ូដែលវាយតម្លៃខ្សោយៗជាច្រើនបញ្ចូលគ្នា ដើម្បីបង្កើតជាម៉ូដែលវាយតម្លៃមួយដែលមានភាពត្រឹមត្រូវខ្ពស់។ ក្នុងឯកសារនេះ វាត្រូវបានប្រើដើម្បីវាយតម្លៃថាតើសំឡេងដែលប្រព័ន្ធចាប់បាននោះត្រឹមត្រូវឬអត់។ | ដូចជាការសួរយោបល់ពីក្មេងៗ១០នាក់ដែលម្នាក់ៗដឹងរឿងតែបន្តិចបន្តួច រួចយកចម្លើយពួកគេមកផ្គុំចូលគ្នាដើម្បីទទួលបានចម្លើយមួយដែលត្រឹមត្រូវនិងមានទំនុកចិត្តបំផុត។ |
| Confidence Score | តម្លៃលេខដែលតំណាងឱ្យកម្រិតនៃភាពជឿជាក់របស់ប្រព័ន្ធកុំព្យូទ័រទៅលើលទ្ធផលនៃការសម្គាល់សំឡេងថាតើវាត្រឹមត្រូវកម្រិតណា។ ពិន្ទុនេះជួយឱ្យប្រព័ន្ធដឹងថាគួរជឿលើចម្លើយនោះ ឬគួរសួរបញ្ជាក់ម្តងទៀត។ | ដូចជាការពិន្ទុដែលអ្នកឱ្យខ្លួនឯងពេលធ្វើតេស្ត ប្រសិនបើអ្នកច្បាស់១០០% អ្នកនឹងសរសេរចម្លើយភ្លាម តែបើអ្នកច្បាស់ត្រឹមតែ៤០% អ្នកប្រហែលជាត្រូវសួរគ្រូដើម្បីបញ្ជាក់សិន។ |
| QMDP Approximation | ជាវិធីសាស្ត្រគណនាប៉ាន់ស្មាននៅក្នុង POMDP ដើម្បីកាត់បន្ថយភាពស្មុគស្មាញ និងទំហំនៃការគណនា ដោយវាសន្មតថាភាពមិនប្រាកដប្រជានឹងរលាយបាត់នៅជំហានបន្ទាប់ ដែលធ្វើឱ្យប្រព័ន្ធអាចបង្កើតគោលការណ៍ (Policy) ដំណើរការបានលឿនជាងមុន។ | ដូចជាការទាយផ្លូវកាត់ពេលកំពុងវង្វេងក្នុងព្រៃ ដោយសន្មតថាឱ្យតែដើរផុតភ្នំនេះទៅ ផ្លូវខាងមុខនឹងស្រលះងាយស្រួលដើរហើយ ធ្វើឱ្យយើងឆាប់សម្រេចចិត្តដើរទៅមុខដោយមិនបាច់គិតច្រើន។ |
| Dysarthria | ជាជំងឺម្យ៉ាងដែលបណ្តាលមកពីការខូចខាតប្រព័ន្ធសរសៃប្រសាទ ឬខួរក្បាល ដែលធ្វើឱ្យសាច់ដុំដែលប្រើសម្រាប់និយាយចុះខ្សោយ ជាហេតុធ្វើឱ្យអ្នកជំងឺនិយាយមិនសូវច្បាស់ និយាយយឺត ខ្សោយ ឬដាច់ៗ។ | ដូចជាពេលដែលយើងចាក់ថ្នាំស្ពឹកនៅធ្មេញហើយព្យាយាមនិយាយ ធ្វើឱ្យសំឡេងស្តាប់មកមិនច្បាស់ និងពិបាកឱ្យអ្នកដទៃយល់។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖