បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហានៃការអប់រំតាមបែបប្រពៃណីដែលអនុវត្តវិធីសាស្ត្រតែមួយសម្រាប់សិស្សទាំងអស់ (One-size-fits-all) ដែលមិនអាចឆ្លើយតបទៅនឹងតម្រូវការ និងរចនាប័ទ្មនៃការរៀនសូត្រខុសៗគ្នារបស់សិស្សម្នាក់ៗ។
វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានប្រើប្រាស់បច្ចេកទេសវិភាគទិន្នន័យកម្រិតខ្ពស់ រួមទាំងការរៀនរបស់ម៉ាស៊ីន (Machine Learning) និងការកែច្នៃភាសាធម្មជាតិ (NLP) ដើម្បីវិភាគទិន្នន័យសិស្ស និងបង្កើតគំរូសម្រាប់ការព្យាករណ៍។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Linear Regression តម្រែតម្រង់លីនេអ៊ែរ (Linear Regression) |
ងាយស្រួលយល់ និងអនុវត្តសម្រាប់ការទស្សន៍ទាយជាមូលដ្ឋាន។ | មានភាពត្រឹមត្រូវទាបជាងគេ (Accuracy ៨០.២៥%) និងពិន្ទុ F1 ទាប (៨០.៥៥%) បើធៀបនឹងវិធីសាស្ត្រផ្សេងទៀត។ | Accuracy ៨០.២៥%, MAE ០.១៨ |
| Decision Tree ដើមឈើសម្រេចចិត្ត (Decision Tree) |
មានភាពត្រឹមត្រូវប្រសើរជាង Linear Regression និងងាយស្រួលបកស្រាយលទ្ធផល។ | នៅមានកម្រិតទាបជាង Random Forest និង KNN ក្នុងការចាត់ថ្នាក់ទិន្នន័យស្មុគស្មាញ។ | Accuracy ៨៦.៤៥%, F1 Score ៨៦.១២% |
| Random Forest ព្រៃចៃដន្យ (Random Forest) |
មានកំហុសព្យាករណ៍ទាបបំផុត (Lowest Error) និងមានស្ថេរភាពខ្ពស់ក្នុងការទស្សន៍ទាយ។ | ទាមទារធនធានកុំព្យូទ័រច្រើនជាង Decision Tree សម្រាប់ដំណើរការ។ | Accuracy ៨៨.៤៧%, MAE ០.១២ (ល្អបំផុត) |
| Support Vector Machine (SVM) ម៉ាស៊ីនវ៉ិចទ័រគាំទ្រ (SVM) |
មានពិន្ទុ F1 ខ្ពស់ (៨៩.៦០%) ដែលបង្ហាញពីតុល្យភាពល្អរវាង Precision និង Recall ។ | ភាពត្រឹមត្រូវសរុប (Accuracy ៨៤.៧៧%) នៅមានកម្រិតទាបជាង Random Forest និង KNN ។ | Accuracy ៨៤.៧៧%, F1 Score ៨៩.៦០% |
| K-Nearest Neighbors (KNN) K-អ្នកជិតខាងដែលនៅជិតបំផុត (KNN) |
ផ្តល់នូវលទ្ធផលល្អបំផុតទាំងភាពត្រឹមត្រូវ (Accuracy) និងពិន្ទុ F1 ក្នុងការសិក្សានេះ។ | អាចចំណាយពេលយូរក្នុងការគណនាប្រសិនបើទិន្នន័យមានទំហំធំខ្លាំង (Computationally expensive)។ | Accuracy ៨៩.៦០% (ខ្ពស់បំផុត), F1 Score ៩០.៨៥% |
ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តទាមទារហេដ្ឋារចនាសម្ព័ន្ធបច្ចេកវិទ្យាដ៏រឹងមាំដើម្បីប្រមូល និងរក្សាទុកទិន្នន័យធំ (Big Data) ព្រមទាំងចំណេះដឹងបច្ចេកទេសកម្រិតខ្ពស់។
ឯកសារមិនបានបញ្ជាក់ពីប្រភពទិន្នន័យជាក់លាក់ (ប្រទេស ឬសាកលវិទ្យាល័យ) ដែលត្រូវបានប្រើប្រាស់ក្នុងការពិសោធន៍នោះទេ ដោយគ្រាន់តែរៀបរាប់ថាជាទិន្នន័យពីអន្តរកម្មរបស់សិស្ស។ សម្រាប់កម្ពុជា នេះជាចំណុចសំខាន់ព្រោះឥរិយាបថ និងបរិបទសង្គមរបស់សិស្សខ្មែរអាចខុសពីបរទេស ដែលតម្រូវឱ្យមានការបន្សាំគំរូទិន្នន័យឡើងវិញ។
វិធីសាស្ត្រនេះមានសារៈសំខាន់ខ្លាំងសម្រាប់កម្ពុជា ខណៈដែលវិស័យអប់រំកំពុងងាកទៅរកប្រព័ន្ធឌីជីថល និង E-Learning កាន់តែច្រើន។
ការប្រើប្រាស់ Big Data Analytics នឹងជួយបង្កើនប្រសិទ្ធភាពនៃការបង្រៀន និងកាត់បន្ថយអត្រាបោះបង់ការសិក្សានៅកម្ពុជា ប៉ុន្តែទាមទារការយកចិត្តទុកដាក់លើឯកជនភាពទិន្នន័យជាចម្បង។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Big Data Analytics | ដំណើរការនៃការត្រួតពិនិត្យ និងវិភាគទិន្នន័យដ៏ច្រើនសន្ធឹកសន្ធាប់ និងស្មុគស្មាញ (ដូចជាពិន្ទុ ការចូលរៀន និងការចុចមើលមេរៀនរបស់សិស្សរាប់ពាន់នាក់) ដើម្បីស្វែងរកគំរូ ឬនិន្នាការដែលមិនអាចមើលឃើញដោយភ្នែកទទេ។ | ដូចជាអ្នកគ្រប់គ្រងបណ្ណាល័យម្នាក់ដែលចងចាំសៀវភៅដែលសិស្សគ្រប់គ្នាបានអាន ដើម្បីទស្សន៍ទាយថាសិស្សម្នាក់ៗនឹងចូលចិត្តសៀវភៅអ្វីបន្ទាប់។ |
| Adaptive Learning | ប្រព័ន្ធអប់រំឆ្លាតវៃដែលកែប្រែខ្លឹមសារមេរៀន ឬកម្រិតលំបាកនៃលំហាត់ដោយស្វ័យប្រវត្តិ និងភ្លាមៗ (Real-time) ទៅតាមសមត្ថភាព និងល្បឿននៃការយល់ដឹងរបស់សិស្សម្នាក់ៗ។ | ដូចជាគ្រូឯកជនម្នាក់ដែលប្តូរសំណួរឱ្យស្រួលជាងមុនភ្លាមៗ នៅពេលឃើញសិស្សឆ្លើយខុសច្រើនដង ឬឱ្យលំហាត់ពិបាកជាងមុនពេលសិស្សឆ្លើយត្រូវ។ |
| Natural Language Processing (NLP) | សាខាមួយនៃបញ្ញាសិប្បនិម្មិត (AI) ដែលជួយឱ្យកុំព្យូទ័រអាចអាន យល់ និងបកស្រាយភាសាមនុស្ស (ដូចជាមតិយោបល់ដែលសិស្សសរសេរក្នុងវេទិកាពិភាក្សា) ជំនួសឱ្យការគ្រាន់តែរាប់ពិន្ទុ។ | ដូចជាការបង្រៀនកុំព្យូទ័រឱ្យចេះអានសំបុត្រ និងយល់អត្ថន័យដូចមនុស្សអានអញ្ចឹង។ |
| Sentiment Analysis | បច្ចេកទេសមួយក្នុង NLP ដែលប្រើដើម្បីកំណត់ថា តើអត្ថបទ ឬមតិយោបល់របស់សិស្សមានលក្ខណៈវិជ្ជមាន (សប្បាយចិត្ត) អវិជ្ជមាន (មិនពេញចិត្ត) ឬអព្យាក្រឹត ដើម្បីឱ្យគ្រូអាចកែលម្អការបង្រៀនបាន។ | ដូចជាការអានទឹកមុខរបស់មិត្តភក្តិដើម្បីដឹងថាគេកំពុងពេញចិត្ត ឬខឹងនឹងយើង។ |
| K-Nearest Neighbors (KNN) | ជាក្បួនដោះស្រាយ (Algorithm) ដែលព្យាករណ៍លទ្ធផលរបស់សិស្សម្នាក់ ដោយផ្អែកលើការប្រៀបធៀបជាមួយសិស្សមួយក្រុមទៀតដែលមានលក្ខណៈសម្បត្តិស្រដៀងគ្នាបំផុត (Neighbors)។ | ដូចពាក្យស្លោកថា "មើលមិត្តភក្តិដើម្បីស្គាល់បុគ្គល" (ប្រសិនបើសិស្សដែលមានទម្លាប់រៀនដូចអ្នកទទួលបាននិទ្ទេស A នោះអ្នកក៏ទំនងជានឹងទទួលបាន A ដែរ)។ |
| Collaborative Filtering | វិធីសាស្ត្រដែលប្រព័ន្ធប្រើដើម្បីណែនាំមេរៀន ឬធនធានសិក្សាដល់សិស្សម្នាក់ ដោយមើលទៅលើអ្វីដែលសិស្សផ្សេងទៀតដែលមានចំណាប់អារម្មណ៍ដូចគ្នាបានជ្រើសរើស ឬពេញចិត្ត។ | ដូចពេលដែល Facebook ឬ YouTube ណែនាំវីដេអូឱ្យអ្នកមើល ដោយសារតែមានមនុស្សដែលមានចំណូលចិត្តដូចអ្នក បានមើលវីដេអូនោះដែរ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖