បញ្ហា (The Problem)៖ ប្រព័ន្ធសន្ទនាដោយសំឡេងបើកចំហ (Open-ended spoken dialogue systems) តែងតែជួបប្រទះបញ្ហាភាពស្មុគស្មាញនៃរចនាសម្ព័ន្ធ និងកម្រិតនៃភាពមិនប្រាកដប្រជាខ្ពស់ ដែលធ្វើឱ្យការគ្រប់គ្រងការសន្ទនាក្លាយជាបញ្ហាប្រឈមធំមួយ។
វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះស្នើឡើងនូវវិធីសាស្ត្រចម្រុះមួយ ដែលរួមបញ្ចូលគំរូប្រូបាប៊ីលីតេជាមួយនឹងរចនាសម្ព័ន្ធទំនាក់ទំនងតក្កវិជ្ជា ដើម្បីងាយស្រួលក្នុងការគ្រប់គ្រងជម្រើសសកម្មភាព។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Traditional POMDPs គំរូ POMDP ប្រពៃណី |
មានសមត្ថភាពខ្ពស់ក្នុងការដោះស្រាយភាពមិនប្រាកដប្រជា និងអាចស្វែងរកគោលនយោបាយសកម្មភាពដែលល្អបំផុត (Optimal policy) តាមរយៈការរៀនដោយការពង្រឹង (Reinforcement Learning)។ | ជួបប្រទះបញ្ហាពេលវេលាគណនាកើនឡើងជាលំដាប់អិចស្ប៉ូណង់ស្យែល នៅពេលទំហំនៃសកម្មភាពមានភាពធំទូលាយ (Curse of dimensionality) ដែលធ្វើឱ្យពិបាកប្រើប្រាស់ក្នុងស្ថានភាពជាក់ស្តែង។ | មិនមានលទ្ធផលជាក់លាក់ ដោយសារវាត្រូវបានលើកឡើងជាបញ្ហាគោលដែលត្រូវដោះស្រាយក្នុងឯកសារនេះ។ |
| Logic-based Approaches អភិក្រមផ្អែកលើតក្កវិជ្ជា (ឧទាហរណ៍ Asher និង Lascarides) |
អាចធ្វើការម៉ូដែលឥរិយាបថនៃការសន្ទនាដែលមានភាពស្មុគស្មាញ និងមានរចនាសម្ព័ន្ធទំនាក់ទំនងច្បាស់លាស់បានយ៉ាងល្អ។ | ខ្វះភាពរឹងមាំ និងភាពបត់បែន (Robustness and adaptivity) ព្រមទាំងមិនមានលទ្ធភាពគ្រប់គ្រងភាពមិនប្រាកដប្រជានៃទិន្នន័យបញ្ចេញបញ្ចូល (Noise/Uncertainty) បានល្អនោះទេ។ | ឯកសារបញ្ជាក់ថាវិធីនេះសាកសមសម្រាប់តែបរិស្ថានដែលអាចសង្កេតឃើញពេញលេញ (Complete observability) ប៉ុណ្ណោះ។ |
| Relational POMDPs (Proposed) គំរូ POMDP ទំនាក់ទំនង (វិធីសាស្ត្រស្នើឡើង) |
កាត់បន្ថយទំហំនៃការស្វែងរកសកម្មភាព (Action space) បានយ៉ាងច្រើន ដោយប្រើវិធានតក្កវិជ្ជាម៉ាកូវ (MLNs) ដើម្បីត្រងយកតែសកម្មភាពដែលពាក់ព័ន្ធ មុននឹងចាប់ផ្តើមគណនា POMDP។ | ការកំណត់វិធានតក្កវិជ្ជាតម្រូវឱ្យមានចំណេះដឹងពីអ្នកជំនាញ (Domain knowledge) ហើយការបង្កើតបញ្ជីសកម្មភាពទាំងអស់អាចស៊ីពេល និងមានតម្លៃថ្លៃក្នុងការអភិវឌ្ឍន៍។ | ឯកសារនេះបង្ហាញពីក្របខណ្ឌទ្រឹស្តី (Ongoing work) ដោយមិនទាន់មានលទ្ធផលពិសោធន៍ជាតួលេខជាក់លាក់នៅឡើយទេ។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ឯកសារនេះមិនបានបញ្ជាក់លម្អិតពីការចំណាយលើធនធានកុំព្យូទ័រនោះទេ ដោយសារវាជាការស្រាវជ្រាវកំពុងដំណើរការ (Ongoing work) ប៉ុន្តែការអនុវត្តជាក់ស្តែងទាមទារសមត្ថភាពគណនាខ្ពស់សម្រាប់ការប្រើប្រាស់សម្មតិកម្ម។
ការស្រាវជ្រាវនេះត្រូវបានធ្វើឡើងនៅមជ្ឈមណ្ឌលស្រាវជ្រាវអាល្លឺម៉ង់សម្រាប់បញ្ញាសិប្បនិម្មិត (DFKI) ដោយផ្តោតលើអន្តរកម្មមនុស្ស-មនុស្សយន្ត (Human-robot interaction) ហើយមិនទាន់មានសំណុំទិន្នន័យជាក់លាក់ត្រូវបានប្រើប្រាស់នៅឡើយទេ។ សម្រាប់ប្រទេសកម្ពុជា វិធានតក្កវិជ្ជាដែលត្រូវបានសរសេរដោយដៃ (Hand-crafted rules) អាចនឹងមានភាពលម្អៀងទៅរកទម្រង់នៃការសន្ទនារបស់ជនជាតិអឺរ៉ុប ដែលទាមទារឱ្យមានការកែសម្រួលដើម្បីឆ្លុះបញ្ចាំងពីបរិបទវប្បធម៌ និងភាសាខ្មែរ។
វិធីសាស្ត្រនៃការរួមបញ្ចូលតក្កវិជ្ជាដើម្បីកាត់បន្ថយភាពស្មុគស្មាញនៃការសន្ទនានេះ មានសក្តានុពលខ្ពស់សម្រាប់ការអភិវឌ្ឍប្រព័ន្ធឆ្លើយតបអតិថិជនស្វ័យប្រវត្តិជំនាន់ថ្មីនៅកម្ពុជា។
ទោះបីជាការសាងសង់ម៉ូដែលនេះទាមទារធនធាន និងចំណេះដឹងផ្នែកគណិតវិទ្យាខ្ពស់ក៏ដោយ វានឹងក្លាយជាគ្រឹះដ៏រឹងមាំមួយសម្រាប់ការបង្កើតប្រព័ន្ធ AI ដែលមានសមត្ថភាពវិភាគ និងបន្សាំខ្លួនទៅនឹងការប្រើប្រាស់ភាសាខ្មែរក្នុងស្ថានភាពជាក់ស្តែង។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Partially Observable Markov Decision Process (POMDP) | គឺជាគំរូគណិតវិទ្យាសម្រាប់ធ្វើការសម្រេចចិត្តជាបន្តបន្ទាប់ ក្នុងស្ថានភាពដែលប្រព័ន្ធមិនអាចដឹងច្បាស់ពីស្ថានភាពពិតប្រាកដនៃបរិស្ថានជុំវិញ ដោយត្រូវពឹងផ្អែកលើការវាយតម្លៃប្រូបាប៊ីលីតេ និងការសង្កេតដែលទទួលបានមួយផ្នែកប៉ុណ្ណោះ។ | ដូចជាការដើរក្នុងបន្ទប់ងងឹតដែលអ្នកមើលមិនឃើញអ្វីទាំងអស់ ប៉ុន្តែត្រូវស្ទាបរកទ្វារចេញដោយផ្អែកលើការចងចាំ និងការប៉ះទង្គិចតិចតួច។ |
| Dialogue Management | ជាសមាសភាគកណ្តាលនៃប្រព័ន្ធសន្ទនាឆ្លាតវៃ ដែលមានតួនាទីវិភាគព័ត៌មានដែលទទួលបាន និងសម្រេចថាតើប្រព័ន្ធគួរនិយាយអ្វីបន្តទៀត ឬសួរសំណួរបែបណាទៅកាន់អ្នកប្រើប្រាស់ ដើម្បីឈានទៅសម្រេចគោលដៅនៃការសន្ទនា។ | ប្រៀបដូចជាខួរក្បាលរបស់អ្នកទទួលភ្ញៀវ ដែលត្រូវគិតថាតើគួរតបទៅអតិថិជនវិញយ៉ាងដូចម្តេចដើម្បីឲ្យត្រូវសាច់រឿង និងអាចជួយដោះស្រាយបញ្ហាបាន។ |
| Markov Logic Networks (MLNs) | គឺជាការបូកបញ្ចូលគ្នារវាងតក្កវិជ្ជាលំដាប់ទីមួយ (First-order logic) និងក្រាហ្វប្រូបាប៊ីលីតេ ដើម្បីបង្កើតជាវិធានដែលមានទម្ងន់។ វាជួយឲ្យប្រព័ន្ធអាចធ្វើការសន្និដ្ឋានទាក់ទងនឹងទំនាក់ទំនងដ៏ស្មុគស្មាញ ទោះបីជាមានភាពមិនប្រាកដប្រជាក៏ដោយ។ | ដូចជាការដាក់ពិន្ទុឲ្យច្បាប់នីមួយៗ ដោយច្បាប់ណាដែលមានពិន្ទុខ្ពស់ គឺមានឱកាសកើតឡើងច្រើនជាងគេ តែមិនមែនត្រូវរហូត ១០០% ជានិច្ចនោះទេ។ |
| Belief state | ជាការចែកចាយប្រូបាប៊ីលីតេ (Probability distribution) លើគ្រប់ស្ថានភាពទាំងអស់ដែលអាចកើតមាន ជំនួសឲ្យការជឿជាក់ថាកំពុងស្ថិតក្នុងស្ថានភាពណាមួយជាក់លាក់។ វាត្រូវបានធ្វើបច្ចុប្បន្នភាពជានិច្ចនៅពេលប្រព័ន្ធទទួលបានព័ត៌មានថ្មី (Observations)។ | ដូចជាការដែលយើងទាយថា មិត្តភក្តិរបស់យើង ៧០% នៅផ្ទះ និង ៣០% នៅសាលារៀន ដោយសារយើងមិនប្រាកដថាគាត់កំពុងនៅឯណាឲ្យប្រាកដនៅពេលនេះ។ |
| Action space | ជាបណ្តុំនៃជម្រើសសកម្មភាពទាំងអស់ដែលភ្នាក់ងារកុំព្យូទ័រ (Agent) អាចធ្វើបាននៅពេលវេលាណាមួយ។ ក្នុងបរិបទនៃការសន្ទនា គឺជារាល់ប្រយោគ សំណួរ ឬការឆ្លើយតបទាំងអស់ដែលប្រព័ន្ធអាចបញ្ចេញទៅកាន់មនុស្សបាន។ | ប្រៀបដូចជាបញ្ជីមុខម្ហូបទាំងអស់នៅក្នុងភោជនីយដ្ឋាន ដែលអ្នកអាចមានសិទ្ធិជ្រើសរើសកុម្ម៉ង់បាន។ |
| Curse of dimensionality | ជាបញ្ហាប្រឈមធំមួយនៅក្នុងការគណនាម៉ាស៊ីន កាលណាចំនួននៃអថេរ ឬលក្ខណៈ (Features) កើនឡើង ធ្វើឲ្យទំហំទិន្នន័យរួម និងពេលវេលាដែលត្រូវប្រើប្រាស់ដើម្បីស្វែងរកចម្លើយកើនឡើងយ៉ាងកប់ពពក រហូតដល់ប្រព័ន្ធមិនអាចដំណើរការទាន់ពេល។ | ដូចជាការរកម្ជុលក្នុងបាច់ចំបើង បើបាច់ចំបើងកាន់តែធំ កាន់តែទូលាយ និងមានច្រើនជាន់ នោះការស្វែងរកនឹងកាន់តែពិបាក និងប្រើពេលយូរខ្លាំង។ |
| Relational structure | ជាការរៀបចំទិន្នន័យនៃស្ថានភាព ឬសកម្មភាព ដោយបំបែកជាផ្នែកតូចៗ (Sub-states) ដែលមានទំនាក់ទំនងគ្នាទៅវិញទៅមក ជាជាងចាត់ទុកវាជាធាតុតែមួយដាច់ដោយឡែក ដែលជួយប្រព័ន្ធឲ្យងាយស្រួលវិភាគ និងទាញយកច្បាប់ទូទៅមកប្រើប្រាស់។ | ដូចជាការមើលរថយន្តមួយគ្រឿង ដោយបំបែកវាជា កង់ ម៉ាស៊ីន និងតួឡាន ហើយយល់ពីរបៀបដែលផ្នែកទាំងនេះតភ្ជាប់គ្នា ជំនួសឲ្យការមើលវាជាដុំដែកចល័តធំមួយ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖