បញ្ហា (The Problem)៖ ការអប់រំកម្រិតមធ្យមនៅប្រទេសជប៉ុនខ្វះខាតលំហាត់សរសេរនិងការប្រឡង ដោយសារតែគ្រូបង្រៀនមានបន្ទុកការងារខ្ពស់ក្នុងការដាក់ពិន្ទុ និងការផ្តល់មតិកែលម្អ (Feedback) ដល់សិស្ស ហើយប្រព័ន្ធស្វ័យប្រវត្តិដែលមានស្រាប់ច្រើនតែផ្តល់ត្រឹមពិន្ទុដោយគ្មានការណែនាំលម្អិត។
វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះបានបង្កើតប្រព័ន្ធផ្តល់មតិកែលម្អអត្ថបទដោយស្វ័យប្រវត្តិ (AEF) ដោយប្រើប្រាស់ទ្រឹស្តីលក្ខណៈនៃការសរសេរ ៦+១ (6+1 writing traits) និងបច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិតដើម្បីវិភាគ និងផ្តល់អនុសាសន៍ដល់សិស្ស។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| LightGBM + Bag of Words ការប្រើប្រាស់ LightGBM ជាមួយបច្ចេកទេស Bag of Words |
មានល្បឿនលឿន និងទទួលបានភាពត្រឹមត្រូវខ្ពស់បំផុតនៅក្នុងការពិសោធន៍នេះ។ | មិនអាចចាប់យកអត្ថន័យស៊ីជម្រៅនៃបរិបទ (Contextual meaning) បានល្អដូចម៉ូដែល Deep Learning ទេ។ | ភាពត្រឹមត្រូវ (Accuracy) ០.៧៤៦ (ខ្ពស់ជាងគេ) |
| Proposed Neural Network (BERT/RoBERTa) បណ្តាញសរសៃប្រសាទសិប្បនិម្មិតដោយប្រើ BERT និង RoBERTa |
មានសមត្ថភាពយល់អត្ថន័យបរិបទនៃពាក្យក្នុងប្រយោគបានល្អតាមទ្រឹស្តី។ | ទាមទារធនធានកុំព្យូទ័រខ្ពស់ និងជួបបញ្ហា Underfitting ក្នុងការពិសោធន៍ជាក់ស្តែង។ | ភាពត្រឹមត្រូវ ០.៦៥ (ទាបជាង LightGBM) |
| GPT-3 Human-like Feedback ការផ្តល់មតិកែលម្អបែបមនុស្សដោយប្រើ GPT-3 |
ផ្តល់ការពន្យល់ដែលមានលក្ខណៈធម្មជាតិ និងងាយយល់សម្រាប់សិស្ស។ | មិនមាននៅក្នុង Dataset ដើម ហើយទាមទារការចំណាយលើ API។ | សិស្សពេញចិត្តជាងការទទួលបានមតិកែលម្អពីចម្លើយសិស្សដទៃ (Peer Answer) |
ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះបង្ហាញថាការប្រើប្រាស់ CPU ធម្មតា (Intel Xeon 1 core) គឺយឺតខ្លាំងសម្រាប់ការស្វែងរកតាមរយៈ Semantic Search (២ នាទី/សំណួរ) ដូច្នេះទាមទារធនធានខ្ពស់ជាងនេះ។
ការសិក្សានេះពឹងផ្អែកទាំងស្រុងលើទិន្នន័យ Riken Dataset ដែលជាសំណេរភាសាជប៉ុនរបស់សិស្សវិទ្យាល័យនៅប្រទេសជប៉ុន។ នេះមានន័យថាម៉ូដែលនេះមិនអាចយកមកប្រើផ្ទាល់ជាមួយភាសាខ្មែរបានទេ ប្រសិនបើគ្មានការបង្វឹកសារជាថ្មីជាមួយទិន្នន័យភាសាខ្មែរ។
ទោះបីជាឧបសគ្គភាសាមានក៏ដោយ វិធីសាស្ត្រនៃការប្រើប្រាស់ 6+1 Writing Traits និង AI គឺមានប្រយោជន៍យ៉ាងខ្លាំងសម្រាប់ការអប់រំនៅកម្ពុជា។
គំរូនេះមានសក្តានុពលខ្ពស់ក្នុងការធ្វើទំនើបកម្មប្រព័ន្ធអប់រំនៅកម្ពុជា ប៉ុន្តែតម្រូវឱ្យមានការបង្កើតសំណុំទិន្នន័យសំណេរភាសាខ្មែរ (Khmer Essay Dataset) ជាមុនសិន។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Automated Essay Scoring (AES) | ការប្រើប្រាស់កម្មវិធីកុំព្យូទ័រ និងបច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិត ដើម្បីដាក់ពិន្ទុលើអត្ថបទសរសេររបស់សិស្សដោយស្វ័យប្រវត្តិ ដោយមិនចាំបាច់មានគ្រូកែផ្ទាល់។ | ដូចជាការឱ្យកុំព្យូទ័រធ្វើជាគ្រូកែអត្ថបទប្រឡងជំនួសមនុស្ស ដោយផ្អែកលើចម្លើយគំរូ។ |
| 6+1 writing traits | ជាក្របខណ្ឌវាយតម្លៃសំណេរដែលបែងចែកគុណភាពអត្ថបទជា ៦ ចំណុចសំខាន់ៗ (ដូចជា គំនិត, ការរៀបចំ, សំឡេង, ពាក្យពេចន៍, លំហូរប្រយោគ, និងវេយ្យាករណ៍) បូកនឹងការបង្ហាញ ១ ទៀត។ | ដូចជាការដាក់ពិន្ទុម្ហូបមួយចាន ដោយបំបែកពិន្ទុជាផ្នែកៗ (រសជាតិ, ពណ៌សម្បុរ, ក្លិន, ការតុបតែង) មិនមែនមើលតែមួយភ្លែតហើយដាក់ពិន្ទុសរុបទេ។ |
| BERT (Bidirectional Encoder Representations from Transformers) | ជាម៉ូដែលបញ្ញាសិប្បនិម្មិត (AI) ដែលមានសមត្ថភាពអាន និងយល់អត្ថន័យនៃពាក្យនៅក្នុងប្រយោគ ដោយវិភាគបរិបទទាំងខាងឆ្វេង និងខាងស្តាំនៃពាក្យនោះ ដើម្បីយល់អត្ថន័យបានស៊ីជម្រៅ។ | ដូចអ្នកអានសៀវភៅដែលមិនគ្រាន់តែអានមួយពាក្យៗតាមលំដាប់ តែមើលពាក្យជុំវិញទាំងអស់ដើម្បីយល់ន័យពិតប្រាកដ។ |
| Semantic Textual Similarity (STS) | ជារង្វាស់បច្ចេកទេសដែលកំណត់ថាអត្ថបទពីរមានអត្ថន័យស្រដៀងគ្នាដល់កម្រិតណា ទោះបីជាប្រើពាក្យខុសគ្នាក៏ដោយ។ ក្នុងឯកសារនេះ វាប្រើដើម្បីស្វែងរកចម្លើយរបស់សិស្សដទៃដែលស្រដៀងនឹងចម្លើយសិស្ស។ | ដូចជាការដឹងថា "ខ្ញុំឃ្លានបាយ" និង "ខ្ញុំចង់ញ៉ាំអាហារ" មានន័យដូចគ្នា ទោះបីសរសេរខុសគ្នាក៏ដោយ។ |
| Bag of words | ជាវិធីសាស្ត្របំប្លែងអត្ថបទទៅជាទិន្នន័យសម្រាប់កុំព្យូទ័រ ដោយគ្រាន់តែរាប់ចំនួនពាក្យនីមួយៗដែលលេចឡើងក្នុងអត្ថបទនោះ ប៉ុន្តែមិនគិតពីលំដាប់លំដោយ ឬវេយ្យាករណ៍នៃពាក្យទេ។ | ដូចជាការយកគ្រឿងផ្សំទាំងអស់ក្នុងម្ហូបមួយមកដាក់លើតុដើម្បីរាប់ចំនួន ប៉ុន្តែមិនខ្វល់ថាគេដាក់អ្វីមុនឬក្រោយពេលចម្អិនទេ។ |
| Morphological Analysis | ជាដំណើរការបំបែកប្រយោគទៅជាពាក្យតូចៗ ឬកម្សេសពាក្យ (Morphemes) ដើម្បីវិភាគតួនាទីរបស់ពាក្យនីមួយៗ។ នេះសំខាន់ណាស់សម្រាប់ភាសាដែលសរសេរជាប់គ្នាដូចជា ភាសាជប៉ុន ឬភាសាខ្មែរ។ | ដូចជាការកាត់នំខេកមួយដុំធំ ឱ្យទៅជាចំណិតតូចៗដើម្បីងាយស្រួលពិនិត្យមើលស្នូលខាងក្នុង។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖