បញ្ហា (The Problem)៖ តើគួរបង្កើតប្រព័ន្ធសន្ទនាបែបជជែកកម្សាន្ត (Chatbot) ដែលរឹងមាំ និងឆ្លើយតបបានដោយធម្មជាតិដោយរបៀបណា ជាពិសេសនៅពេលជួបប្រទះសំណួរដែលគ្មានក្នុងទិន្នន័យគំរូ (Out-of-Example)?
វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះបានអភិវឌ្ឍវិធីសាស្ត្រស្ថិតិ និងម៉ាស៊ីនរៀន (Machine Learning) ផ្សេងៗដើម្បីដោះស្រាយបញ្ហានៃប្រព័ន្ធសន្ទនា ដោយប្រើប្រាស់ទិន្នន័យជាក់ស្តែងពីភាពយន្ត និង Twitter។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| CSM (Cosine Similarity TF-IDF Retrieval) ការទាញយកចម្លើយដោយប្រើប្រាស់ Cosine Similarity លើ TF-IDF (Baseline) |
ដំណើរការបានយ៉ាងល្អនៅពេលមានសំណួរស្រដៀងគ្នាក្នុងទិន្នន័យ (CEF) និងផ្តល់ចម្លើយដែលមានភាពធម្មជាតិខ្ពស់។ | មិនអាចឆ្លើយតបបានល្អចំពោះសំណួរក្រៅគំរូ (OOE) ព្រោះវាទាមទារការស្វែងរកទិន្នន័យទាំងមូល O(n) ដែលស៊ីពេលច្រើន។ | ទទួលបានការពេញចិត្តលើភាពធម្មជាតិនៃការឆ្លើយតប (Naturalness) ៣៦,៨៤% ខ្ពស់ជាងម៉ូដែលផ្សេងៗ។ |
| SMT (Statistical Machine Translation Response Generation) ការបង្កើតការឆ្លើយតបតាមរយៈការបកប្រែដោយម៉ាស៊ីនផ្អែកលើស្ថិតិ |
អាចជ្រើសរើសពាក្យបានត្រឹមត្រូវនិងរហ័ស (O(1) Complexity) ដោយមិនបាច់ស្វែងរកក្នុង Database ទាំងមូល។ | ប្រយោគដែលបង្កើតឡើងជារឿយៗមិនអាចយល់បាន មិនសមហេតុផល និងមានកំហុសវេយ្យាករណ៍ច្រើន។ | ទោះបីជាអាចដោះស្រាយបញ្ហា OOE បានខ្លះ ប៉ុន្តែពិន្ទុវាយតម្លៃពីមនុស្ស (Subjective Evaluation) ទទួលបានទាបបំផុត។ |
| LSTM-GEN (Long Short Term Memory Response Generation) ការបង្កើតការឆ្លើយតបដោយប្រើប្រាស់បណ្តាញសរសៃប្រសាទ LSTM |
មានសមត្ថភាពខ្ពស់ក្នុងការឆ្លើយតបសំណួរក្រៅគំរូ (OOE) តាមរយៈ Soft matching និងដំណើរការលឿន O(1) ពេលបង្កើតចម្លើយ។ | ត្រូវការពេលវេលាច្រើនក្នុងការបង្ហាត់ម៉ូដែល (Training time) ហើយជួនកាលផ្តល់ចម្លើយខ្លីៗដែលកាត់ផ្តាច់ការសន្ទនា។ | ទទួលបានការពេញចិត្តលើភាពពាក់ព័ន្ធនៃចម្លើយ (Relevance) ៣៥,៩៦% ប្រៀបធៀបនឹង ៣០,២៦% នៃ CSM។ |
| RAE (Recursive Auto Encoder Paraphrase Retrieval) ការទាញយកការឆ្លើយតបដោយផ្អែកលើការស្វែងរកឃ្លាស្រដៀង (Paraphrase) តាមរយៈ RAE |
អាចចាប់យកអត្ថន័យនៃឃ្លា (Phrase based matching) បានល្អជាង CSM បន្តិចនៅក្នុងករណី OOE ។ | ត្រូវការពេលវេលាស្វែងរក O(n) និងពិន្ទុនៃភាពពាក់ព័ន្ធនៃចម្លើយ (Relevance) នៅមានកម្រិតទាបនៅឡើយ។ | ទទួលបានពិន្ទុ BLEU-4 និង Cosine TF-IDF ប្រហាក់ប្រហែលនឹង Baseline ប៉ុន្តែខ្សោយក្នុងការវាយតម្លៃពីមនុស្សពិត។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការអភិវឌ្ឍ និងការវាយតម្លៃប្រព័ន្ធសន្ទនាទាំងនេះ ទាមទារទាំងកម្មវិធីឯកទេស និងធនធានកុំព្យូទ័រធំ ជាពិសេសសម្រាប់ការបង្ហាត់ម៉ូដែល Deep Learning លើទិន្នន័យរាប់លានគូ។
ការសិក្សានេះប្រើប្រាស់ទិន្នន័យជាភាសាអង់គ្លេសដែលប្រមូលបានពីអត្ថបទភាពយន្តលោកខាងលិច និង Twitter ដែលឆ្លុះបញ្ចាំងពីវប្បធម៌ និងរបៀបនិយាយរបស់បរទេស។ សម្រាប់ប្រទេសកម្ពុជា ការយកម៉ូដែលនេះមកអនុវត្តផ្ទាល់នឹងមិនមានប្រសិទ្ធភាពទេ ដោយសារយើងខ្វះខាតទិន្នន័យសន្ទនាជាភាសាខ្មែរ (Khmer Dialogue Corpus) ដែលមានទំហំធំ និងគុណភាពខ្ពស់។ បញ្ហានេះក៏រាប់បញ្ចូលទាំងការប្រើពាក្យស្លែង ការសរសេរអក្សរឡាតាំង (Khmeringlish) ក្នុងបណ្តាញសង្គមផងដែរ។
ទោះបីជាខ្វះខាតទិន្នន័យភាសាខ្មែរក៏ដោយ វិធីសាស្ត្រ (Algorithms) ដូចជាការប្រើ LSTM និងការរួមបញ្ចូល EBDM ជាមួយ Generative Models គឺមានតម្លៃខ្ពស់សម្រាប់ការអភិវឌ្ឍប្រព័ន្ធនៅកម្ពុជា។
ការវិនិយោគលើការប្រមូលនិងសម្អាតទិន្នន័យសន្ទនាភាសាខ្មែរ គឺជាគន្លឹះតែមួយគត់ដើម្បីដោះសោសក្តានុពលនៃបច្ចេកវិទ្យាទាំងនេះសម្រាប់ស្វ័យប្រវត្តិកម្មសេវាកម្មនៅកម្ពុជា។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Example-Based Dialog Management (EBDM) | វិធីសាស្ត្រគ្រប់គ្រងការសន្ទនាដែលប្រើប្រាស់ទិន្នន័យគំរូសន្ទនាមានស្រាប់ (ឧទាហរណ៍សំណួរ-ចម្លើយ) ក្នុងប្រព័ន្ធទិន្នន័យ ដើម្បីស្វែងរក និងទាញយកចម្លើយដែលស័ក្តិសមបំផុតសម្រាប់ឆ្លើយតបទៅនឹងសំណួររបស់អ្នកប្រើប្រាស់។ | ដូចជាបណ្ណារក្សដែលរកមើលសំណួរចាស់ៗក្នុងសៀវភៅបញ្ជី ដែលមានលក្ខណៈស្រដៀងនឹងសំណួររបស់អ្នក ដើម្បីទាញយកចម្លើយនោះមកប្រាប់អ្នកវិញ។ |
| Statistical Machine Translation (SMT) | ប្រព័ន្ធបកប្រែភាសាដោយម៉ាស៊ីនដែលប្រើប្រាស់គំរូស្ថិតិដើម្បីរៀនពីរបៀបបកប្រែពាក្យ ឬឃ្លា។ ក្នុងការស្រាវជ្រាវនេះ វាត្រូវបានយកមកប្រើដើម្បីប្រៀបធៀបប្រយោគសួរជាភាសាដើម ទៅជាប្រយោគឆ្លើយ (បកប្រែសំណួរទៅជាចម្លើយ)។ | ដូចជាអ្នកដែលរៀនទន្ទេញការផ្គូផ្គងពាក្យពីសៀវភៅរាប់ពាន់ក្បាល ដើម្បីទាយថាតើសំណួរបែបនេះគួរមានចម្លើយតបបែបណាដោយផ្អែកលើស្ថិតិទម្លាប់នៃការប្រើប្រាស់។ |
| Out-of-Example (OOE) | បញ្ហាដែលកើតឡើងនៅពេលប្រព័ន្ធសន្ទនាមិនអាចស្វែងរកសំណួរគំរូណាមួយនៅក្នុងមូលដ្ឋានទិន្នន័យរបស់វា ដែលមានភាពស្រដៀងគ្នាទៅនឹងសំណួរថ្មីដែលអ្នកប្រើប្រាស់ទើបនឹងសួរ។ | ដូចជាសិស្សដែលជួបប្រទះវិញ្ញាសាប្រឡងដែលគ្រូមិនធ្លាប់បង្រៀន ឬមិនមានក្នុងសៀវភៅមេរៀនសោះ ដែលធ្វើឱ្យពួកគេមិនដឹងត្រូវឆ្លើយបែបណា។ |
| Long Short-Term Memory (LSTM) | ប្រភេទនៃបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត (RNN) ដែលមានសមត្ថភាពចងចាំព័ត៌មានអត្ថបទរយៈពេលយូរ និងអាចសម្រេចចិត្តថាព័ត៌មានណាគួរបំភ្លេចចោល។ វាស័ក្តិសមបំផុតសម្រាប់ការយល់ន័យនៃប្រយោគវែងៗ។ | ដូចជាខួរក្បាលមនុស្សដែលអាចចងចាំសាច់រឿងតាំងពីដើមដល់ចប់ និងយល់ពីបរិបទប្រយោគ ជាជាងគ្រាន់តែចងចាំពាក្យមួយៗដាច់ពីគ្នា។ |
| Recursive Autoencoder (RAE) | ម៉ូដែលបណ្តាញសរសៃប្រសាទដែលបំប្លែងទិន្នន័យអត្ថបទទៅជាវ៉ិចទ័រតាមរចនាសម្ព័ន្ធមែកធាង ដើម្បីជួយចាប់យកអត្ថន័យនៃឃ្លា និងប្រយោគ។ នៅក្នុងបរិបទនេះ វាត្រូវបានប្រើដើម្បីកំណត់អត្តសញ្ញាណឃ្លាដែលមានន័យដូចគ្នា (Paraphrase) ទោះបីជាប្រើពាក្យខុសគ្នាក៏ដោយ។ | ដូចជាអ្នកជំនាញភាសាដែលអាចប្រាប់បានយ៉ាងងាយថាប្រយោគ "ខ្ញុំឃ្លានបាយណាស់" និង "ក្រពះខ្ញុំទទេស្អាតហើយ" គឺមានអត្ថន័យចង់បានម្ហូបដូចគ្នាបេះបិទ។ |
| TF-IDF (Term Frequency-Inverse Document Frequency) | រូបមន្តគណិតវិទ្យាសម្រាប់វាស់ស្ទង់កម្រិតភាពសំខាន់នៃពាក្យមួយនៅក្នុងឯកសារមួយ។ វាផ្តល់តម្លៃខ្ពស់ដល់ពាក្យដែលកម្រមាននៅក្នុងទិន្នន័យរួម ប៉ុន្តែមានវត្តមានញឹកញាប់ក្នុងឯកសារ ឬប្រយោគជាក់លាក់ណាមួយ។ | ដូចជាការកំណត់សម្គាល់មនុស្សម្នាក់ដោយមើលលើលក្ខណៈពិសេសរបស់គាត់ (ឧ. មានស្នាមមុនធំលើមុខ) ជាជាងមើលលើលក្ខណៈទូទៅដែលអ្នកណាក៏មាន (ឧ. មានភ្នែកពីរ)។ |
| Cosine Similarity | ការវាស់វែងភាពស្រដៀងគ្នារវាងវ៉ិចទ័រពីរនៅក្នុងលំហទិន្នន័យ (Vector Space) ដោយផ្អែកលើមុំកូស៊ីនុសរវាងពួកវា។ វាត្រូវបានប្រើសម្រាប់ប្រៀបធៀបថាតើប្រយោគពីរមានន័យស្រដៀងគ្នាកម្រិតណា។ | ដូចជាការប្រៀបធៀបទិសដៅនៃការដើររបស់មនុស្សពីរនាក់ បើពួកគេដើរស្របគ្នាក្នុងទិសតែមួយ នោះមានន័យថាពួកគេមានគោលដៅដូចគ្នា (ប្រយោគមានន័យស្រដៀងគ្នា)។ |
| BLEU Score (Bilingual Evaluation Understudy) | រង្វាស់សម្រាប់វាយតម្លៃគុណភាពនៃអត្ថបទដែលបង្កើតដោយម៉ាស៊ីន (ដូចជាការបកប្រែ ឬប្រយោគឆ្លើយតប) ដោយប្រៀបធៀបភាពត្រួតស៊ីគ្នានៃកម្រងពាក្យ (n-grams) ធៀបនឹងចម្លើយយោងស្តង់ដារដែលសរសេរដោយមនុស្ស។ | ដូចជាគ្រូបង្រៀនដែលកាត់ពិន្ទុសិស្សដោយផ្ទៀងផ្ទាត់ចម្លើយសិស្សធៀបនឹងកូនសោចម្លើយស្តង់ដារ បើពាក្យពេចន៍សរសេរត្រូវគ្នាច្រើន ពិន្ទុកាន់តែខ្ពស់។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖