បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហានៃការរចនាយន្តការបញ្ជាក់ (Confirmation Mechanisms) និងបច្ចេកទេសសង្គ្រោះកំហុស ដើម្បីធ្វើឲ្យប្រសើរឡើងនូវល្បឿន និងភាពងាយស្រួលនៃប្រព័ន្ធសន្ទនាដោយសំឡេងសម្រាប់ផ្តល់ព័ត៌មានផ្លូវដែកជាភាសាអេស្ប៉ាញ។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់អភិក្រមរចនាយុទ្ធសាស្ត្របញ្ជាក់ដែលផ្អែកលើការវាស់ស្ទង់កម្រិតទំនុកចិត្តពីការទទួលស្គាល់សំឡេង បូករួមនឹងបច្ចេកទេសវិភាគទម្រង់អ្នកប្រើប្រាស់។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Implicit Confirmation ការបញ្ជាក់ដោយប្រយោល |
ធ្វើឱ្យការសន្ទនាមានភាពរលូន លឿនជាងមុន និងមិនសូវរំខានដល់អ្នកប្រើប្រាស់ ព្រោះប្រព័ន្ធមិនទាមទារចម្លើយបញ្ជាក់លុះត្រាតែមានកំហុស។ | អាចមានហានិភ័យប្រសិនបើប្រព័ន្ធមានទំនុកចិត្តខ្ពស់ខុស (False high confidence) ដែលធ្វើឱ្យវារក្សាទុកទិន្នន័យខុសដោយមិនបានសួរអ្នកប្រើប្រាស់។ | ត្រូវបានប្រើប្រាស់ចំនួន ៦១,៣% នៃការបញ្ជាក់សរុប ជួយឱ្យរយៈពេលហៅទូរស័ព្ទជាមធ្យមត្រឹម ២០៤ វិនាទី។ |
| Explicit Confirmation ការបញ្ជាក់ដោយផ្ទាល់ |
ធានាបាននូវភាពត្រឹមត្រូវខ្ពស់បំផុត ដោយតម្រូវឱ្យអ្នកប្រើប្រាស់ឆ្លើយតបច្បាស់លាស់ (បាទ/ចាស ឬ ទេ) ទៅនឹងព័ត៌មានដែលប្រព័ន្ធទទួលបាន។ | ធ្វើឱ្យការសន្ទនាអូសបន្លាយពេលយូរ មានភាពស្មុគស្មាញ និងអាចធ្វើឱ្យអ្នកប្រើប្រាស់មានអារម្មណ៍ធុញថប់។ | ត្រូវបានប្រើប្រាស់ចំនួន ៣៨,៧% នៃការបញ្ជាក់សរុប ភាគច្រើននៅពេលប្រព័ន្ធមានទំនុកចិត្តទាបលើការស្គាល់សំឡេង។ |
| Error Recovery via CORRECT Command ការសង្គ្រោះកំហុសដោយពាក្យបញ្ជា CORRECT |
អនុញ្ញាតឱ្យអ្នកប្រើប្រាស់កែតម្រូវតែចំណុចដែលខុស ដោយមិនចាំបាច់ចាប់ផ្តើមការសន្ទនាពីដើមឡើងវិញ (Start Over) នោះទេ។ | ទាមទារឱ្យអ្នកប្រើប្រាស់យល់ដឹងពីរបៀបប្រើប្រាស់ពាក្យបញ្ជានេះ និងទាមទារការរចនាទម្រង់សួរនាំច្បាស់លាស់ពីប្រព័ន្ធ។ | អត្រាប្រើប្រាស់ពាក្យបញ្ជា CORRECT គឺ ០,៤៣ ដងក្នុងមួយការហៅ ខណៈការចាប់ផ្តើមពីដើម (START OVER) មានត្រឹមតែ ០,០៨ ដង។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ឯកសារមិនបានបញ្ជាក់លម្អិតអំពីតម្លៃធនធានហិរញ្ញវត្ថុនោះទេ ប៉ុន្តែវាទាមទារសំណុំទិន្នន័យ និងប្រព័ន្ធកុំព្យូទ័រសម្រាប់ដំណើរការបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត។
ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងប្រទេសអេស្ប៉ាញ ក្រោមគម្រោង ARISE ដោយប្រើប្រាស់ទិន្នន័យសំឡេង និងភាសាអេស្ប៉ាញ។ សម្រាប់ប្រទេសកម្ពុជា នេះជាបញ្ហាប្រឈមធំដោយសារភាសាខ្មែរមានសូរស័ព្ទស្មុគស្មាញ គ្រាមភាសាខុសៗគ្នា និងខ្វះខាតទិន្នន័យសំឡេង (Speech Corpus) ទំហំធំសម្រាប់ការហ្វឹកហាត់។
បច្ចេកទេសរចនាប្រព័ន្ធបញ្ជាក់ និងសង្គ្រោះកំហុសនេះ មានសក្តានុពលខ្ពស់ក្នុងការយកមកអនុវត្តសម្រាប់ប្រព័ន្ធសេវាកម្មអតិថិជនស្វ័យប្រវត្តិនៅកម្ពុជា។
សរុបមក ការអនុវត្តយន្តការទាំងនេះអាចជួយកាត់បន្ថយពេលវេលារង់ចាំរបស់អតិថិជន និងសន្សំសំចៃចំណាយលើការជួលបុគ្គលិកឆ្លើយទូរស័ព្ទបានយ៉ាងមានប្រសិទ្ធភាព។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Spoken Dialogue Systems | ប្រព័ន្ធកុំព្យូទ័រដែលអនុញ្ញាតឱ្យមនុស្សធ្វើការសន្ទនាផ្ទាល់ជាសំឡេងជាមួយម៉ាស៊ីន ដើម្បីទទួលបានព័ត៌មាន ឬបំពេញកិច្ចការណាមួយ (ដូចជាការកក់សំបុត្ររថភ្លើងជាដើម)។ | ដូចជាការនិយាយទូរស័ព្ទទៅកាន់ភ្នាក់ងារបម្រើអតិថិជន ប៉ុន្តែអ្នកកំពុងនិយាយជាមួយរ៉ូបូតឆ្លាតវៃជំនួសវិញ (ឧទាហរណ៍ Siri ឬ Google Assistant)។ |
| Confidence Measures | តម្លៃលេខដែលប្រព័ន្ធកុំព្យូទ័រគណនាដើម្បីវាយតម្លៃថា វាមានភាពជឿជាក់កម្រិតណាទៅលើពាក្យ ឬប្រយោគដែលវាទើបតែស្តាប់ឮពីអ្នកប្រើប្រាស់ ថាតើវាស្តាប់បានត្រឹមត្រូវប៉ុនណា។ | ដូចជាសិស្សម្នាក់ប្រាប់គ្រូវាថា "ខ្ញុំប្រាកដ ៩០% ថាចម្លើយនេះត្រឹមត្រូវ" បន្ទាប់ពីគិតរួច។ |
| Implicit confirmation | យុទ្ធសាស្ត្រដែលប្រព័ន្ធកុំព្យូទ័របន្តសួរនាំព័ត៌មានបន្ទាប់ ដោយគ្រាន់តែបញ្ចេញព័ត៌មានចាស់ដែលខ្លួនស្តាប់បានត្រឡប់មកវិញបន្តិចបន្តួច ដោយមិនទាមទារការឆ្លើយយល់ព្រមចំៗពីអ្នកប្រើប្រាស់នោះទេ។ | ដូចជាអ្នករត់តុនិយាយថា "សម្រាប់កាហ្វេទឹកដោះគោមួយកែវនេះ តើបងចង់ញ៉ាំជាមួយនំអ្វីដែរ?" (បញ្ជាក់ថាគាត់កត់ត្រាកាហ្វេបានហើយ ដោយសួរចូលរឿងនំបន្ត)។ |
| Explicit confirmation | ការសួររកការយល់ព្រមដោយផ្ទាល់ពីអ្នកប្រើប្រាស់ (បាទ/ទេ ឬ ត្រឹមត្រូវ/មិនត្រឹមត្រូវ) ដើម្បីបញ្ជាក់ថាប្រព័ន្ធពិតជាស្តាប់បានត្រឹមត្រូវមែន មុននឹងបន្តទៅសំនួរបន្ទាប់។ | ដូចជាអ្នករត់តុសួរថា "បងកម្ម៉ង់កាហ្វេទឹកដោះគោមួយកែវ តើត្រឹមត្រូវទេបាទ?"។ |
| Multi-Layer Perceptron | ប្រភេទនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (AI) ដែលមានច្រើនស្រទាប់ ត្រូវបានប្រើប្រាស់នៅក្នុងការសិក្សានេះដើម្បីបូកបញ្ចូលលក្ខណៈផ្សេងៗនៃសំឡេង សម្រាប់វាស់ស្ទង់ថាតើពាក្យដែលម៉ាស៊ីនស្តាប់ឮនោះជាពាក្យខុសឬត្រូវ។ | ដូចជាគណៈកម្មការចៅក្រមច្រើនជាន់ថ្នាក់ ដែលជួយគ្នារួមគិត និងសម្រេចចិត្តថាតើសំឡេងដែលទើបតែឮនោះជាពាក្យអ្វីឲ្យប្រាកដ។ |
| User-Modelling | បច្ចេកទេសដែលប្រព័ន្ធកុំព្យូទ័រសិក្សា និងវាយតម្លៃពីកម្រិតយល់ដឹង ឬភាពស្ទាត់ជំនាញរបស់អ្នកប្រើប្រាស់ ដើម្បីផ្លាស់ប្តូររបៀបសន្ទនា (ខ្លី ឬ ពន្យល់វែង) ឱ្យស័ក្តិសមដោយស្វ័យប្រវត្តិ។ | ដូចជាគ្រូបង្រៀនដែលពន្យល់មេរៀនលម្អិតដល់សិស្សទើបចូលរៀនថ្មី ប៉ុន្តែនិយាយតែចំណុចសំខាន់ៗខ្លីៗទៅកាន់សិស្សពូកែ។ |
| Mixed-initiative systems | ប្រព័ន្ធសន្ទនាដែលអាចបត់បែនបានខ្ពស់ ដែលអនុញ្ញាតឱ្យទាំងមនុស្ស និងកុំព្យូទ័រអាចជាអ្នកផ្តើមការសន្ទនា ឬប្តូរប្រធានបទបានដោយសេរី មិនមែនរង់ចាំតែម៉ាស៊ីនជាអ្នកសួរហើយមនុស្សជាអ្នកឆ្លើយតាមលំដាប់នោះទេ។ | ដូចជាការជជែកគ្នាលេងរវាងមិត្តភក្តិពីរនាក់ ដែលអ្នកណាក៏អាចលើកយកចម្ងល់មកសួរមុនបានដែរ មិនមែនដូចការសួរចម្លើយនៅតុលាការទេ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖