បញ្ហា (The Problem)៖ ឯកសារនេះពិនិត្យមើលលើភស្តុតាងនៃសុពលភាពពិន្ទុដែលផ្តល់ដោយកម្មវិធីវាយតម្លៃតែងសេចក្តីឆ្លាតវៃ (Intelligent Essay Assessor - IEA) ដើម្បីធានាថាវាអាចវាស់ស្ទង់សមត្ថភាពសរសេររបស់សិស្សក្នុងការប្រឡងបានយ៉ាងត្រឹមត្រូវ និងអាចទុកចិត្តបាន។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានប្រើប្រាស់ក្របខ័ណ្ឌសុពលភាព ដោយយកសំណេររបស់សិស្សចំនួន ៣២៤៤ នាក់មកប្រៀបធៀបពិន្ទុដែលផ្តល់ដោយ IEA ជាមួយអ្នកដាក់ពិន្ទុជាមនុស្ស។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Intelligent Essay Assessor (IEA) កម្មវិធីវាយតម្លៃតែងសេចក្តីឆ្លាតវៃ (IEA) |
ចំណេញពេលវេលា និងថវិកាក្នុងការដាក់ពិន្ទុទ្រង់ទ្រាយធំ អាចដំណើរការបាន២៤ម៉ោង និងមានភាពស្របគ្នាខ្ពស់ជាមួយពិន្ទុរបស់អ្នកជំនាញ។ ដំណើរការវាយតម្លៃមានភាពថេរ និងមិនលម្អៀង។ | ទាមទារឱ្យមានការវាយបញ្ចូលអត្ថបទសំណេរទៅក្នុងកុំព្យូទ័រជាមុន (key-entered) ត្រូវការទិន្នន័យបណ្តុះបណ្តាលដែលបានដាក់ពិន្ទុរួច និងមិនបានប្រើប្រាស់កម្រិតវិនិច្ឆ័យ (Rubric) ដោយផ្ទាល់ឡើយ។ | មានទំនាក់ទំនងមេគុណ Pearson r=0.69 ជាមួយអ្នកជំនាញ ដែលខ្ពស់ជាងទំនាក់ទំនងរវាងអ្នកអានធម្មតានិងអ្នកជំនាញ។ |
| Trained Human Readers អ្នកដាក់ពិន្ទុជាមនុស្ស (ដែលបានឆ្លងកាត់ការបណ្តុះបណ្តាល) |
អាចអាននិងដាក់ពិន្ទុលើសំណេរសរសេរដោយដៃផ្ទាល់ និងអាចប្រើប្រាស់កម្រិតវិនិច្ឆ័យ (Rubric) ដើម្បីធ្វើការវាយតម្លៃយ៉ាងជាក់លាក់។ | ចំណាយថវិកាច្រើន និងត្រូវការពេលវេលាយូរក្នុងការដាក់ពិន្ទុ។ ពិន្ទុមានភាពប្រែប្រួលខ្ពស់ (Inconsistent) អាស្រ័យលើអារម្មណ៍ ឬភាពលម្អៀងរបស់បុគ្គល។ | មានទំនាក់ទំនងមេគុណ Pearson ត្រឹមតែ r=0.64 ជាមួយអ្នកជំនាញ ដែលទាបជាងកម្មវិធី IEA។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការប្រើប្រាស់ប្រព័ន្ធ IEA ទាមទារការវិនិយោគធនធានជាមុនលើការប្រមូលទិន្នន័យ និងកម្លាំងម៉ាស៊ីន ប៉ុន្តែផ្តល់នូវការសន្សំសំចៃខ្ពស់សម្រាប់ការប្រើប្រាស់រយៈពេលវែង។
ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងរដ្ឋភាគខាងត្បូងនៃសហរដ្ឋអាមេរិក ដោយប្រើប្រាស់សំណេរភាសាអង់គ្លេសរបស់សិស្សថ្នាក់ទី៤ ទី៨ និងទី១០ (ចំនួន៣២៤៤នាក់)។ សម្រាប់បរិបទប្រទេសកម្ពុជា នេះគឺជាចំណុចដែលត្រូវប្រុងប្រយ័ត្ន ព្រោះទម្រង់វេយ្យាករណ៍ វប្បធម៌នៃការសរសេរ និងកម្រិតភាសាខ្មែរ មានលក្ខណៈខុសប្លែកទាំងស្រុង ដែលទាមទារឱ្យមានការបង្កើតម៉ូដែលភាសាធម្មជាតិ (NLP) សម្រាប់ភាសាខ្មែរដាច់ដោយឡែក។
ទោះបីជាមានបញ្ហាប្រឈមផ្នែកភាសាក៏ដោយ បច្ចេកវិទ្យាដាក់ពិន្ទុស្វ័យប្រវត្តិនេះមានសក្តានុពលធំធេងសម្រាប់ការធ្វើទំនើបកម្មប្រព័ន្ធអប់រំនៅកម្ពុជា។
ការអភិវឌ្ឍប្រព័ន្ធស្រដៀងនឹង IEA សម្រាប់ភាសាខ្មែរ នឹងក្លាយជាជំហានដ៏សំខាន់មួយក្នុងការជំរុញបច្ចេកវិទ្យាអប់រំ (EdTech) នៅក្នុងប្រទេសកម្ពុជាឱ្យស្របតាមស្តង់ដារអន្តរជាតិ។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Automated Essay Scorer (AES) | កម្មវិធីកុំព្យូទ័រដែលប្រើប្រាស់បញ្ញាសិប្បនិម្មិត (AI) និងក្បួនដោះស្រាយភាសាដើម្បីអាន វិភាគ និងផ្តល់ពិន្ទុលើតែងសេចក្តីរបស់សិស្សដោយស្វ័យប្រវត្តិជំនួសឱ្យមនុស្ស។ | ដូចជាការបង្រៀនកុំព្យូទ័រឱ្យចេះធ្វើជាគ្រូបង្រៀន ដែលអាចកែសំណេររបស់សិស្សរាប់ពាន់សន្លឹកក្នុងពេលតែមួយភ្លែត។ |
| Latent Semantic Analysis (LSA) | បច្ចេកទេសរៀនដោយម៉ាស៊ីន (Machine learning) ដែលវិភាគទំនាក់ទំនងអត្ថន័យរវាងពាក្យនិងកថាខណ្ឌ ដោយផ្អែកលើទម្រង់នៃការប្រើប្រាស់ពាក្យទាំងនោះនៅក្នុងឯកសារអត្ថបទចំនួនច្រើនសន្ធឹកសន្ធាប់។ | ដូចជាវចនានុក្រមឆ្លាតវៃក្នុងខួរក្បាលកុំព្យូទ័រ ដែលមិនត្រឹមតែស្គាល់ពាក្យ តែដឹងថាពាក្យ "សិស្ស" និង "សាលារៀន" តែងតែមានអត្ថន័យពាក់ព័ន្ធគ្នាយ៉ាងជិតស្និទ្ធ។ |
| Cohen's Kappa | រង្វាស់ស្ថិតិសម្រាប់វាស់កម្រិតនៃការយល់ស្របគ្នា (Agreement) រវាងអ្នកវាយតម្លៃពីរនាក់ (ឬរវាងម៉ាស៊ីននិងមនុស្ស) ដោយមានការកាត់កងដកចេញនូវភាគរយនៃការយល់ស្របគ្នាដែលកើតឡើងដោយចៃដន្យ។ | ដូចជាការសួរគ្រូពីរនាក់ឱ្យចាត់ថ្នាក់សិស្ស ហើយកាត់កងចោលនូវករណីដែលគ្រូទាំងពីរទាយត្រូវដូចគ្នាដោយចៃដន្យ ដើម្បីរកមើលថាតើពួកគាត់ពិតជាមានស្តង់ដារវាយតម្លៃដូចគ្នាមែនឬអត់។ |
| Spearman rank-order correlation | រង្វាស់ស្ថិតិដែលវាស់ស្ទង់ភាពខ្លាំងនៃទំនាក់ទំនងរវាងអថេរពីរ ដោយផ្អែកលើចំណាត់ថ្នាក់ (Rank) របស់វា ជាជាងតម្លៃពិន្ទុពិតប្រាកដ។ ឧទាហរណ៍ វាស់ថាតើអ្នកដែលបានលេខ១ពីគ្រូទី១ ក៏បានលេខ១ពីគ្រូទី២ដែរឬទេ។ | ដូចជាការប្រៀបធៀបបញ្ជីឈ្មោះសិស្សពូកែប្រចាំថ្នាក់របស់គ្រូពីរនាក់ ថាតើការរៀបលំដាប់លេខ១ លេខ២ លេខ៣ មានភាពស្រដៀងគ្នាដែរឬទេ។ |
| Multiple regression | វិធីសាស្ត្រស្ថិតិដែលប្រើប្រាស់អថេរឯករាជ្យច្រើន (ឧទាហរណ៍ ខ្លឹមសារ ស្ទីលសរសេរ អក្ខរាវិរុទ្ធ) ដើម្បីគណនា និងទស្សន៍ទាយលទ្ធផលនៃអថេរអាស្រ័យតែមួយ (ពិន្ទុសរុបនៃតែងសេចក្តី)។ | ដូចជាការថ្លឹងថ្លែងគ្រឿងផ្សំច្រើនមុខ (សាច់ បន្លែ គ្រឿងទេស) ដើម្បីទាយថាតើសម្លមួយចាននោះនឹងមានរសជាតិឆ្ងាញ់កម្រិតណា។ |
| Text image | ក្នុងទ្រឹស្តីនៃដំណើរការគិតរបស់អ្នកដាក់ពិន្ទុ (Wolfe's theory) វាគឺជាការបង្កើតរូបភាព ឬការយល់ដឹងជារួមអំពីខ្លឹមសារនៅក្នុងគំនិតរបស់អ្នកអាន បន្ទាប់ពីបានអានអត្ថបទសំណេររួច។ | ដូចជាការស្តាប់គេនិយាយរៀបរាប់ពីអ្វីមួយ រួចយើងអាចបង្កើតជារូបភាពសាច់រឿងពេញលេញមួយនៅក្នុងការគិតរបស់យើង។ |
| Cross-validation set | សំណុំទិន្នន័យដាច់ដោយឡែកមួយ ដែលត្រូវបានប្រើដើម្បីសាកល្បងភាពត្រឹមត្រូវនៃក្បួន (Model) បន្ទាប់ពីវាត្រូវបានបង្វឹក (Trained) រួចរាល់ ដើម្បីធានាថាវាមិនត្រឹមតែទន្ទេញចាំទិន្នន័យចាស់ តែអាចកែសំណេរថ្មីបានត្រឹមត្រូវ។ | ដូចជាការឱ្យសិស្សធ្វើលំហាត់សាកល្បងថ្មីៗ ដែលមិនធ្លាប់មានក្នុងសៀវភៅមេរៀន ដើម្បីចង់ដឹងថាសិស្សនោះពិតជាចេះមេរៀនមែន ឬគ្រាន់តែទន្ទេញចាំមាត់។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖