បញ្ហា (The Problem)៖ ប្រព័ន្ធសន្ទនាដោយស្វ័យប្រវត្តិបច្ចុប្បន្ន (Automated conversational systems) ជួបការលំបាកក្នុងការដោះស្រាយកំហុសនៃការស្គាល់សំឡេង និងអត្ថន័យ ដោយខ្វះសមត្ថភាពដូចមនុស្សក្នុងការវែកញែក និងដោះស្រាយភាពមិនប្រាកដប្រជាក្នុងការប្រាស្រ័យទាក់ទងដោយសហការគ្នា (Grounding)។
វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានបង្កើតក្របខ័ណ្ឌទ្រឹស្តីសេចក្តីសម្រេច (Decision-theoretic framework) ដោយប្រើប្រាស់ការវែកញែកបែប Bayesian ដើម្បីទាញសេចក្តីសន្និដ្ឋានពីការបរាជ័យនៃការទំនាក់ទំនង និងណែនាំសកម្មភាពជួសជុលឆ្លងកាត់កម្រិតនៃការយល់ដឹងរួមចំនួនបួន។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Decision-Theoretic Framework with Bayesian Networks ក្របខ័ណ្ឌទ្រឹស្តីសេចក្តីសម្រេចជាមួយបណ្តាញ Bayesian (វិធីសាស្រ្តស្នើឡើង) |
អាចគ្រប់គ្រងភាពមិនប្រាកដប្រជាបានយ៉ាងរឹងមាំឆ្លងកាត់កម្រិតទាំង ៤ នៃការទំនាក់ទំនង។ កាត់បន្ថយការធុញទ្រាន់របស់អ្នកប្រើប្រាស់ដោយថ្លឹងថ្លែងពីអត្ថប្រយោជន៍ និងតម្លៃនៃការសួរជួសជុលកំហុស។ | ទាមទារការគណនាស្មុគស្មាញសម្រាប់ការវិភាគតម្លៃព័ត៌មាន (VOI) និងការទាញយកទិន្នន័យប្រូបាប៊ីលីតេពីអ្នកជំនាញ។ | បានបង្ហាញយ៉ាងជោគជ័យក្នុងប្រព័ន្ធគំរូ Bayesian Receptionist ជាមួយនឹងការរកឃើញថាអ្នកប្រើប្រាស់ចូលចិត្តការសុំឱ្យនិយាយម្តងទៀតសាមញ្ញជាងការពន្យល់លម្អិត (t = 9.86, p < .0001)។ |
| Propositional Logic-based/Ad-hoc Dialogue Systems ប្រព័ន្ធសន្ទនាផ្អែកលើតក្កវិជ្ជា ឬគោលការណ៍ Ad-hoc (វិធីសាស្រ្តទូទៅ/មូលដ្ឋាន) |
មានភាពងាយស្រួលក្នុងការបង្កើតសម្រាប់គោលដៅជាក់លាក់ និងដំណើរការលឿនជាងមុនសម្រាប់ការងារសាមញ្ញ។ | ងាយនឹងបរាជ័យនៅពេលប្រព័ន្ធចាប់សំឡេងខុស ដោយសារវាផ្តោតតែលើកម្រិតគោលបំណង (Intention) និងខ្វះសមត្ថភាពវាស់វែងកម្រិតភាពមិនច្បាស់លាស់។ | បង្កើតបានជាប្រព័ន្ធសន្ទនាដែលឆាប់បរាជ័យ (Fragile automated systems) និងមិនអាចស្តារការយល់ច្រឡំដោយធម្មជាតិបានឡើយ។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការអភិវឌ្ឍប្រព័ន្ធនេះតម្រូវឱ្យមានការរួមបញ្ចូលគ្នានូវធនធានកុំព្យូទ័រសម្រាប់ដំណើរការទិន្នន័យពេលវេលាជាក់ស្តែង (Real-time) និងអ្នកជំនាញក្នុងការកំណត់ប្រូបាប៊ីលីតេ។
ការសិក្សានេះប្រើប្រាស់ទិន្នន័យកម្រងសំណួរពីនិស្សិតសាកលវិទ្យាល័យ Stanford (n=104) និងការសង្កេតលើបុគ្គលិកនៅក្រុមហ៊ុន Microsoft ។ ទិន្នន័យនេះតំណាងឱ្យប្រជាសាស្ត្រលោកខាងលិចដែលមានកម្រិតអប់រំខ្ពស់ ដែលអាចខុសគ្នាពីបរិបទប្រទេសកម្ពុជា ទាំងទម្លាប់នៃការសន្ទនា របៀបនៃការប្រើប្រាស់ភាសា និងការអត់ធ្មត់ចំពោះកំហុសរបស់ប្រព័ន្ធបច្ចេកវិទ្យា។
វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់សម្រាប់ប្រទេសកម្ពុជា ជាពិសេសក្នុងការកសាងប្រព័ន្ធឆ្លើយតបស្វ័យប្រវត្តិដែលធន់នឹងកំហុសនៃការស្តាប់ភាសាខ្មែរ។
តាមរយៈការដាក់បញ្ចូលប្រព័ន្ធដែលចេះថ្លឹងថ្លែងពីតម្លៃនៃការយល់ច្រឡំ ស្ថាប័ននៅកម្ពុជាអាចបង្កើតបទពិសោធន៍សន្ទនាជាមួយ AI ដែលមានភាពធម្មជាតិ និងអាចប៉ះប៉ូវនូវចំណុចខ្សោយនៃការចាប់សំឡេងភាសាខ្មែរបច្ចុប្បន្នបានយ៉ាងមានប្រសិទ្ធភាព។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Grounding | ដំណើរការដែលអ្នកសន្ទនាទាំងសងខាងបញ្ជាក់ និងធានាថាពួកគេយល់ស្របគ្នានិងយល់ពីអត្ថន័យដូចគ្នា មុននឹងបន្តការសន្ទនាទៅមុខទៀត ដោយការផ្ដល់សញ្ញា ឬសួរបញ្ជាក់។ | ដូចជាពេលមិត្តភក្តិប្រាប់ផ្លូវអ្នក ហើយអ្នកងក់ក្បាល ឬថា "អូខេ តើបត់ឆ្វេងនៅស្តុបមែនទេ?" ដើម្បីបញ្ជាក់ថាអ្នកយល់ច្បាស់មុននឹងជិះទៅមុខទៀត។ |
| Bayesian networks | ម៉ូដែលគណិតវិទ្យាដែលប្រើប្រូបាប៊ីលីតេដើម្បីដោះស្រាយភាពមិនប្រាកដប្រជា ដោយភ្ជាប់ទំនាក់ទំនងរវាងហេតុ និងផល ដើម្បីទស្សន៍ទាយលទ្ធផល ឬគោលបំណងដែលទំនងបំផុត។ | ដូចជាការធ្វើរោគវិនិច្ឆ័យរបស់ពេទ្យ ដែលប្រើអាការៈរោគ (ដូចជាក្តៅខ្លួន ក្អក) ដើម្បីទាយភាគរយនៃជំងឺដែលអ្នកទំនងជាកើតមាន។ |
| Decision-Theoretic | វិធីសាស្ត្រក្នុងការធ្វើសេចក្តីសម្រេចចិត្តដោយថ្លឹងថ្លែងរវាងអត្ថប្រយោជន៍ដែលរំពឹងទុក និងតម្លៃខាតបង់ (ការប្រឹងប្រែង ការរំខាន) ក្នុងស្ថានភាពដែលលទ្ធផលមិនច្បាស់លាស់ ១០០%។ | ដូចជាការសម្រេចចិត្តយកឆ័ត្រតាមខ្លួនពេលមេឃស្រទុំ ដោយថ្លឹងថ្លែងរវាងភាពរំខានក្នុងការយួរឆ័ត្រ និងហានិភ័យនៃការទទឹកភ្លៀង។ |
| Value of information (VOI) | ការគណនាដើម្បីវាយតម្លៃថាតើការស្វែងរកព័ត៌មានបន្ថែម (ឧ. ការសួរសំណួរបញ្ជាក់ទៅអ្នកប្រើប្រាស់) នឹងជួយធ្វើឱ្យការសម្រេចចិត្តរបស់ប្រព័ន្ធកាន់តែប្រសើរឡើងកម្រិតណា ធៀបនឹងការចំណាយពេលសួរ។ | ដូចជាការសម្រេចចិត្តថាតើគួរចំណាយពេល ៥ នាទីតេមើលផែនទីសិនឬអត់ បើវាអាចជួយអ្នកកុំឲ្យវង្វេងផ្លូវអស់ ១ ម៉ោង។ |
| Upward completion | ទ្រឹស្ដីដែលបញ្ជាក់ថាការយល់ដឹងក្នុងការសន្ទនាត្រូវបានសាងសង់ពីក្រោមឡើងលើ ពោលគឺបើកម្រិតខ្ពស់ (ឧ. យល់អត្ថន័យ) ត្រូវបានសម្រេច នោះកម្រិតទាប (ឧ. ឮសំឡេងច្បាស់) ក៏ត្រូវតែចាត់ទុកថាបានសម្រេចដែរ។ | ដូចជាការសាងសង់ផ្ទះ បើអ្នកឃើញដំបូល (កម្រិតខ្ពស់) នោះមានន័យថា គ្រឹះនិងជញ្ជាំង (កម្រិតទាប) ត្រូវតែបានសាងសង់រួចរាល់ហើយ។ |
| Decision-Based Transition Network (DTN) | បណ្ដាញដំណើរការដែលកំណត់ពីជំហានបន្ទាប់ក្នុងការសន្ទនារបស់ប្រព័ន្ធកុំព្យូទ័រ ដោយសម្រេចចិត្តផ្លាស់ប្ដូរស្ថានភាពសន្ទនាតាមរយៈការគណនាប្រូបាប៊ីលីតេ និងតម្លៃអត្ថប្រយោជន៍ជាមុនសិន។ | ដូចជាផ្ទាំងប្លង់ផ្លូវក្នុងវីដេអូហ្គេម ដែលតួអង្គនឹងប្តូរទៅឈុតឆាកថ្មីដោយស្វ័យប្រវត្តិអាស្រ័យលើពិន្ទុ និងជម្រើសសកម្មភាពរបស់អ្នកកន្លងមក។ |
| Adjacency pairs | គូនៃប្រយោគក្នុងការសន្ទនាដែលទាក់ទងគ្នា និងត្រូវពឹងផ្អែកគ្នាជាកាតព្វកិច្ច ដូចជាមានសំណួរត្រូវតែមានចម្លើយ ឬការសួរសុខទុក្ខត្រូវតែមានការឆ្លើយតប។ | ដូចជាការបោះបាល់តទល់គ្នា នៅពេលនរណាម្នាក់បោះបាល់ទៅ (សួរសំណួរ) វាតម្រូវឱ្យម្ខាងទៀតចាប់ហើយបោះត្រឡប់មកវិញ (ឆ្លើយតប) ជាស្វ័យប្រវត្តិ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖