បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហានៃការជ្រើសរើសទម្រង់បញ្ជាក់ (Confirmation styles) ដ៏ល្អប្រសើរបំផុតសម្រាប់ការដោះស្រាយកំហុសនៅក្នុងប្រព័ន្ធសន្ទនាតាមរយៈសំឡេង ដើម្បីកែលម្អភាពងាយស្រួលក្នុងការប្រើប្រាស់ (Usability) នៅពេលមានកំហុសក្នុងការសម្គាល់សំឡេង។
វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះបានធ្វើការពិសោធន៍វាយតម្លៃលើអ្នកប្រើប្រាស់ចំនួន ១៣ នាក់ ដោយប្រើប្រាស់ប្រព័ន្ធសន្ទនាព័ត៌មានអាកាសធាតុជាភាសាជប៉ុន ដែលបានកំណត់ឱ្យមានកំហុសប្រព័ន្ធដោយចេតនា។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Explicit Confirmation ការបញ្ជាក់យ៉ាងច្បាស់លាស់ (សួរនាំរាល់ពេលបញ្ចូលព័ត៌មាន) |
ងាយស្រួលរកកំហុស និងមានភាពច្បាស់លាស់ខ្ពស់ ដែលអ្នកប្រើប្រាស់ចូលចិត្តបំផុតនៅពេលមានកំហុសកើតឡើងក្នុងការសម្គាល់សំឡេង។ | ត្រូវការចំនួនជុំនៃការសន្ទនាច្រើន (Turns) ដែលអាចធ្វើឱ្យអ្នកប្រើប្រាស់មានអារម្មណ៍ធុញទ្រាន់ និងយឺតយ៉ាវនៅពេលប្រព័ន្ធគ្មានកំហុស។ | ទទួលបានចំណាត់ថ្នាក់ល្អបំផុត (១.៥៩) ពេលមានកំហុស ប៉ុន្តែធ្លាក់ទៅចំណាត់ថ្នាក់ចុងក្រោយគេ (២.៤១) ពេលគ្មានកំហុស។ |
| Final Confirmation ការបញ្ជាក់ចុងក្រោយ (បញ្ជាក់ព័ត៌មានទាំងអស់រួមគ្នានៅចុងបញ្ចប់) |
កាត់បន្ថយពេលវេលា និងចំនួនជុំនៃការសន្ទនា ដែលជាជម្រើសល្អបំផុតនិងមានលក្ខណៈធម្មជាតិសម្រាប់អ្នកប្រើប្រាស់នៅពេលគ្មានកំហុស។ | អាចធ្វើឱ្យអ្នកប្រើប្រាស់មានការភាន់ច្រឡំនៅពេលមានកំហុសលើព័ត៌មានច្រើនក្នុងពេលតែមួយ (ឧទាហរណ៍ ខុសទាំងទីតាំងនិងពេលវេលា)។ | ទទួលបានចំណាត់ថ្នាក់ល្អបំផុត (១.៦៤) ពេលគ្មានកំហុស និងចំណាត់ថ្នាក់ទី២ (២.០០) ពេលមានកំហុស។ |
| Implicit Confirmation ការបញ្ជាក់មិនច្បាស់លាស់ (រំលឹកពាក្យចាស់មុននឹងសួរសំណួរបន្ទាប់) |
លឿន និងមានប្រសិទ្ធភាពខ្ពស់ដោយរួមបញ្ចូលការបញ្ជាក់ទៅក្នុងសំណួរបន្ទាប់ដោយស្វ័យប្រវត្តិ។ | ពិបាកប្រើបំផុត និងធ្វើឱ្យស្មុគស្មាញនៅពេលមានកំហុសកើតឡើង ព្រោះអ្នកប្រើប្រាស់ត្រូវកាត់ផ្ដាច់សំណួរបន្ទាប់ដើម្បីកែតម្រូវ។ | ទទួលបានចំណាត់ថ្នាក់មធ្យម (១.៨៩) ពេលគ្មានកំហុស ប៉ុន្តែធ្លាក់ដល់ចំណាត់ថ្នាក់អាក្រក់បំផុត (២.៤១) ពេលមានកំហុស។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ទោះបីជាឯកសារមិនបានបញ្ជាក់ពីតម្លៃជាទឹកប្រាក់ក្ដី ការអនុវត្តប្រព័ន្ធនេះទាមទារនូវហេដ្ឋារចនាសម្ព័ន្ធសូហ្វវែរ និងម៉ាស៊ីនសម្គាល់សំឡេងកម្រិតខ្ពស់។
ការសិក្សានេះត្រូវបានធ្វើឡើងទៅលើអ្នកប្រើប្រាស់ជនជាតិជប៉ុនតែ ១៣ នាក់ប៉ុណ្ណោះ (ប្រុស ៤, ស្រី ៩) លើប្រធានបទសួរព័ត៌មានអាកាសធាតុជាភាសាជប៉ុន។ ទិន្នន័យនេះមានទំហំតូច និងផ្ដោតតែលើវប្បធម៌តែមួយ ដូចនេះទម្លាប់នៃការឆ្លើយតបរបស់អ្នកប្រើប្រាស់អាចនឹងខុសគ្នាពីប្រជាជនកម្ពុជា ដែលទាមទារការសាកល្បងផ្ទាល់ជាមួយភាសាខ្មែរ។
ការរកឃើញពីវិធីសាស្ត្រផ្លាស់ប្តូរទម្រង់នៃការបញ្ជាក់នេះ មានអត្ថប្រយោជន៍យ៉ាងខ្លាំងសម្រាប់ការអភិវឌ្ឍប្រព័ន្ធសន្ទនាឆ្លាតវៃ (Voicebots) នៅក្នុងប្រទេសកម្ពុជា។
សរុបមក អ្នកអភិវឌ្ឍន៍នៅកម្ពុជាគួរតែរួមបញ្ចូលយុទ្ធសាស្ត្រប្រើប្រាស់ការបញ្ជាក់ទាំងពីរប្រភេទ (Explicit និង Final) ដោយអាស្រ័យលើកម្រិតនៃទំនុកចិត្ត (Confidence score) របស់ម៉ាស៊ីនសម្គាល់សំឡេង។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Explicit confirmation | ជាទម្រង់នៃការសន្ទនាដែលប្រព័ន្ធកុំព្យូទ័រសួរអះអាងបញ្ជាក់ទៅកាន់អ្នកប្រើប្រាស់ចំៗ និងម្តងមួយៗ (ឧ. តើអ្នកនិយាយថា ភ្នំពេញ មែនទេ?) ដើម្បីធានាថាប្រព័ន្ធពិតជាស្តាប់បានត្រឹមត្រូវ។ | ដូចជាពេលអ្នកកុម្ម៉ង់កាហ្វេ ហើយអ្នកលក់សួរត្រឡប់មកវិញភ្លាមៗថា "បងយកកាហ្វេទឹកដោះគោទឹកកក មែនទេ?"។ |
| Implicit confirmation | ជាទម្រង់នៃការបញ្ជាក់ដោយប្រយោល ដោយប្រព័ន្ធកុំព្យូទ័រយកព័ត៌មានដែលវាស្តាប់បានទៅបញ្ចូលក្នុងសំណួរបន្ទាប់តែម្តង ដោយមិនទាមទារឱ្យអ្នកប្រើប្រាស់ឆ្លើយថា បាទ/ចាស ឬ ទេ នោះឡើយ ដើម្បីចំណេញពេលវេលា។ | ដូចជាអ្នកលក់ប្រាប់ថា "ចាស កាហ្វេទឹកដោះគោទឹកកក... ចុះបងយកផ្អែមប៉ុនណាដែរ?" ដោយគ្រាន់តែរំលឹកពាក្យយើងឡើងវិញ តែបន្តទៅសំណួរបន្ទាប់យកតែម្តង។ |
| Final confirmation | ជាទម្រង់នៃការសន្ទនាដែលប្រព័ន្ធកុំព្យូទ័ររង់ចាំរហូតដល់ប្រមូលព័ត៌មានបានគ្រប់គ្រាន់ ទើបធ្វើការសួរបញ្ជាក់ព័ត៌មានទាំងអស់នោះរួមគ្នាតែម្តងនៅចុងបញ្ចប់។ | ដូចជាអ្នករត់តុរៀបរាប់ឈ្មោះម្ហូបទាំងអស់ដែលអ្នកបានកុម្ម៉ង់ឡើងវិញ ដើម្បីបញ្ជាក់ភាពត្រឹមត្រូវ មុននឹងយកទៅឱ្យចុងភៅធ្វើ។ |
| Confidence score | ជាកម្រិតពិន្ទុ (គិតជាភាគរយឬលេខ) ដែលម៉ាស៊ីនសម្គាល់សំឡេងវាយតម្លៃខ្លួនឯង ដើម្បីបង្ហាញថាវាមានភាពជឿជាក់កម្រិតណាទៅលើពាក្យដែលវាទើបតែស្តាប់បានពីអ្នកប្រើប្រាស់។ | ដូចជាការដាក់ពិន្ទុឱ្យខ្លួនឯងថាអ្នកស្តាប់ឮច្បាស់ប៉ុនណា ពេលមានគេខ្សឹបប្រាប់អ្នកក្នុងរោងកុន (បើឮច្បាស់ដាក់ ១០០% បើមិនសូវច្បាស់ដាក់ ៥០%)។ |
| Correction grammar | ជាសំណុំវិធានវេយ្យាករណ៍ដែលប្រព័ន្ធកុំព្យូទ័របង្កើតឡើងភ្លាមៗ (Dynamically generated) ដើម្បីត្រៀមខ្លួនក្នុងការចាប់យក និងយល់ពីប្រយោគរបស់អ្នកប្រើប្រាស់ នៅពេលពួកគេព្យាយាមកែតម្រូវកំហុសអ្វីមួយ។ | ដូចជាការផ្ចង់ត្រចៀកត្រៀមស្តាប់ពាក្យ "មិនមែនទេ", "ខុសហើយ", ឬ "ខ្ញុំចង់មានន័យថា..." ពេលដែលយើងដឹងថាយើងប្រហែលជាស្តាប់គេខុស។ |
| Dialog flow | ជាលំដាប់លំដោយ ជំហាន និងតក្កវិជ្ជានៃការឆ្លើយឆ្លងគ្នារវាងអ្នកប្រើប្រាស់ និងប្រព័ន្ធកុំព្យូទ័រ តាំងពីពេលចាប់ផ្តើមរហូតដល់បញ្ចប់កិច្ចការណាមួយ។ | ដូចជាគំនូសបំព្រួញ (ផែនទី) ដែលប្រាប់ពីផ្លូវដែលការសន្ទនាមួយត្រូវដើរ ថាតើត្រូវសួរអ្វីមុន និងមានអ្វីកើតឡើងបន្ត។ |
| VoiceXML | ជាភាសាកូដកុំព្យូទ័រប្រភេទស្តង់ដារ (XML-based) ដែលគេប្រើសម្រាប់សរសេរអភិវឌ្ឍប្រព័ន្ធសន្ទនាតាមរយៈសំឡេង រួមមានការគ្រប់គ្រងការអានអត្ថបទជាសំឡេង ការសម្គាល់សំឡេងមនុស្ស និងការឆ្លើយឆ្លងតាមទូរស័ព្ទ។ | ដូចជាសៀវភៅស្គ្រីប (Script) ដែលសរសេរទុកឱ្យកុំព្យូទ័រអាននិងធ្វើតាម ដើម្បីឱ្យវាចេះនិយាយឆ្លើយឆ្លងទូរស័ព្ទជាមួយមនុស្ស។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖