Original Title: Educational Data Mining 2010
Source: www.educationaldatamining.org
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការទាញយកទិន្នន័យអប់រំឆ្នាំ ២០១០៖ សន្និសីទអន្តរជាតិលើកទី៣ ស្តីពីការទាញយកទិន្នន័យអប់រំ

ចំណងជើងដើម៖ Educational Data Mining 2010

អ្នកនិពន្ធ៖ Ryan S.J.d. Baker, Agathe Merceron, Philip I. Pavlik Jr.

ឆ្នាំបោះពុម្ព៖ 2010, 3rd International Conference on Educational Data Mining

វិស័យសិក្សា៖ Educational Data Mining

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះជាកម្រងអត្ថបទស្រាវជ្រាវដែលដោះស្រាយលើការវិភាគទិន្នន័យធំៗ (Large Data Sets) ដែលទទួលបានពីកម្មវិធីអប់រំ និងពិន្ទុតេស្តរបស់សិស្ស ដើម្បីឆ្លើយតបទៅនឹងសំណួរស្រាវជ្រាវអប់រំ សិក្សាពីរបៀបរៀនរបស់សិស្ស និងកែលម្អប្រព័ន្ធបង្រៀនឆ្លាតវៃ (Intelligent Tutoring Systems)។

វិធីសាស្ត្រ (The Methodology)៖ សន្និសីទនេះបានប្រមូលផ្តុំនូវវិធីសាស្ត្រគណនាចម្រុះពីវិទ្យាសាស្ត្រកុំព្យូទ័រ ចិត្តវិទ្យា ចិត្តមាត្រ និងស្ថិតិ ដើម្បីវិភាគទិន្នន័យអប់រំ ដោយផ្តោតលើវិធីសាស្ត្រសំខាន់ៗមួយចំនួន។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Static Assessment
ការវាយតម្លៃបែបប្រពៃណី ឬឋិតិវន្ត
ងាយស្រួលក្នុងការអនុវត្ត និងមិនទាមទារប្រព័ន្ធបច្ចេកវិទ្យា ឬកម្មវិធីកុំព្យូទ័រស្មុគស្មាញឡើយ។ មិនអាចវាស់ស្ទង់ពីដំណើរការនៃការរៀនសូត្ររបស់សិស្ស ឬផ្តល់ជំនួយភ្លាមៗនៅពេលសិស្សជួបការលំបាកបានទេ។ ផ្តល់តែលទ្ធផលចុងក្រោយ (ខុស ឬ ត្រូវ) ដែលមិនសូវមានប្រសិទ្ធភាពក្នុងការទស្សន៍ទាយសមត្ថភាពពិតប្រាកដ ឬការកែលម្អការរៀនសូត្រ។
Dynamic Assessment (via Intelligent Tutoring Systems)
ការវាយតម្លៃសកម្ម តាមរយៈប្រព័ន្ធបង្រៀនឆ្លាតវៃ
អាចវាយតម្លៃនិងបង្រៀនក្នុងពេលតែមួយ ព្រមទាំងអាចតាមដានបរិមាណនិងប្រភេទនៃជំនួយដែលសិស្សត្រូវការ។ ត្រូវការចំណាយពេលវេលា និងធនធានច្រើនក្នុងការអភិវឌ្ឍប្រព័ន្ធ និងទាមទារឱ្យមានទិន្នន័យច្រើនដើម្បីដំណើរការក្បួនដោះស្រាយ។ ផ្តល់ភាពសុក្រឹតខ្ពស់ក្នុងការទស្សន៍ទាយពិន្ទុតេស្តរបស់សិស្ស (R-squared ខ្ពស់ជាង) ដោយផ្អែកលើការឆ្លើយតបនិងការសុំជំនួយរបស់ពួកគេ។
Bayesian Knowledge Tracing (BKT)
ការតាមដានចំណេះដឹងតាមគោលការណ៍បេស
អាចតាមដានការវិវត្តនៃចំណេះដឹងរបស់សិស្សតាមពេលវេលាជាក់ស្តែង និងប៉ាន់ស្មានប្រូបាប៊ីលីតេនៃការយល់ដឹង។ អាចជួបប្រទះបញ្ហាក្នុងការប៉ាន់ស្មានប៉ារ៉ាម៉ែត្រ (Parameter plausibility) ប្រសិនបើមិនមានទិន្នន័យគ្រប់គ្រាន់។ ផ្តល់សមត្ថភាពក្នុងការកំណត់យ៉ាងច្បាស់អំពីពេលវេលាដែលសិស្សទើបតែទទួលបានចំណេះដឹងថ្មី (Moment of learning)។
Machine Learning Classifiers for Behavior Detection
ការប្រើប្រាស់ Machine Learning ដើម្បីចាប់យកអាកប្បកិរិយា
អាចរកឃើញដោយស្វ័យប្រវត្តិនូវការបាត់បង់ការយកចិត្តទុកដាក់ (Off-task) ឬការលេងស៊ីកេងប្រព័ន្ធ (Gaming the system)។ ទាមទារនូវការកត់ត្រា និងបែងចែកចំណាត់ថ្នាក់ទិន្នន័យវីដេអូ ឬសកម្មភាពដោយមនុស្សផ្ទាល់ (Text Replay Tagging) ជាមុនសិន ដែលចំណាយពេលយូរ។ មានអត្រាភាពត្រឹមត្រូវមធ្យមប្រមាណ 74% ក្នុងការចាប់យកស្ថានភាពអារម្មណ៍ និងការផ្តោតអារម្មណ៍របស់សិស្សក្នុងអំឡុងពេលសិក្សា។

ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវ និងការអនុវត្តប្រព័ន្ធនៅក្នុងឯកសារនេះទាមទារនូវប្រព័ន្ធកុំព្យូទ័រ ធនធានទិន្នន័យធំៗ និងអ្នកជំនាញអន្តរវិស័យដើម្បីដំណើរការប្រកបដោយប្រសិទ្ធភាព។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការស្រាវជ្រាវភាគច្រើនបំផុតត្រូវបានអនុវត្តនៅក្នុងសហរដ្ឋអាមេរិក (ឧទាហរណ៍ រដ្ឋ Massachusetts និង Pennsylvania) ដោយប្រើប្រាស់ទិន្នន័យសិស្សកម្រិតមធ្យមសិក្សា និងសាកលវិទ្យាល័យ ដែលមានប្រព័ន្ធបច្ចេកវិទ្យាទំនើប។ នេះជាបញ្ហាប្រឈមមួយសម្រាប់កម្ពុជា ដោយសារបរិបទនៃការអប់រំ កម្រិតហេដ្ឋារចនាសម្ព័ន្ធបច្ចេកវិទ្យា និងទម្លាប់នៃការរៀនសូត្ររបស់សិស្សនៅកម្ពុជាមានភាពខុសគ្នាស្រឡះពីសិស្សនៅតំបន់ទាំងនោះ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាមានគម្លាតផ្នែកបរិបទ និងកម្រិតបច្ចេកវិទ្យាក៏ដោយ គោលគំនិតនៃការទាញយកទិន្នន័យអប់រំ (EDM) នេះនៅតែអាចយកមកកែច្នៃ និងអនុវត្តបានយ៉ាងមានសក្តានុពលសម្រាប់ប្រព័ន្ធអប់រំឌីជីថលនៅកម្ពុជា។

ការចាប់ផ្តើមប្រមូល និងវិភាគទិន្នន័យពីប្រព័ន្ធគ្រប់គ្រងការសិក្សាដោយប្រើប្រាស់បច្ចេកទេស EDM នឹងជួយស្ថាប័នអប់រំកម្ពុជាផ្លាស់ប្តូរពីការវាយតម្លៃដោយរង់ចាំលទ្ធផលចុងតំណាក់កាល ទៅជាការជួយជ្រោមជ្រែងសិស្សឲ្យបានទាន់ពេលវេលា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃបរិមាណវិភាគនិងទិន្នន័យអប់រំ: និស្សិតត្រូវចាប់ផ្តើមស្វែងយល់ពីមូលដ្ឋានគ្រឹះនៃ Data Science ផ្តោតលើភាសា Python ឬ R និងសាកល្បងប្រើប្រាស់កម្មវិធី WekaRapidMiner ដើម្បីស្គាល់ពីចំណាត់ថ្នាក់ទិន្នន័យ (Classification) និងការចង្កោម (Clustering) លើទិន្នន័យសិល្បនិម្មិត។
  2. ការប្រមូលនិងសម្អាតទិន្នន័យពី LMS: អនុវត្តការទាញយកកំណត់ហេតុទិន្នន័យ (Log data) ចេញពីប្រព័ន្ធគ្រប់គ្រងការសិក្សាដូចជា MoodleCanvas ដោយប្រើប្រាស់ SQL Queries ហើយរៀនសម្អាតទិន្នន័យដែលមិនចាំបាច់ ដើម្បីរៀបចំសម្រាប់ការវិភាគ។
  3. ការអនុវត្តម៉ូដែលតាមដានចំណេះដឹង (Knowledge Tracing): សាកល្បងសរសេរកូដដើម្បីបង្កើតម៉ូដែល Bayesian Knowledge Tracing (BKT) សាមញ្ញមួយ ដែលអាចគណនាប្រូបាប៊ីលីតេនៃការយល់ដឹងរបស់សិស្ស ផ្អែកលើប្រវត្តិជោគជ័យនិងបរាជ័យក្នុងការធ្វើតេស្តរបស់ពួកគេ។
  4. វិភាគអាកប្បកិរិយាសិស្សនិងរចនាប្រព័ន្ធប្រកាសអាសន្ន (Early Warning System): ប្រើប្រាស់បច្ចេកទេស Decision TreesLogistic Regression ដើម្បីវិភាគរកសញ្ញាណនៃសិស្សដែលងាយប្រឈមនឹងការបោះបង់ការសិក្សា តាមរយៈការវាយតម្លៃលើពេលវេលាចូលរៀន និងការធ្វើលំហាត់ក្នុងប្រព័ន្ធ។
  5. អភិវឌ្ឍប្រព័ន្ធវាយតម្លៃសកម្មមូលដ្ឋាន (Develop Basic Dynamic Assessment): រួមបញ្ចូលម៉ូដែលទស្សន៍ទាយដែលបានរៀន ទៅក្នុងកម្មវិធីអប់រំខ្នាតតូច Intelligent Tutoring System (ITS) ដើម្បីបង្កើតជាមុខងារផ្តល់ជំនួយ (Hints) ដោយស្វ័យប្រវត្តិទៅតាមកម្រិតនៃកំហុសរបស់សិស្សម្នាក់ៗ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Bayesian Knowledge Tracing (BKT) វាជាវិធីសាស្ត្រគណនាប្រូបាប៊ីលីតេដើម្បីតាមដានថាតើសិស្សម្នាក់បានយល់ដឹងពីជំនាញណាមួយកម្រិតណា ដោយផ្អែកលើប្រវត្តិដែលគាត់ឆ្លើយខុសឬត្រូវកន្លងមក ដែលជួយប្រព័ន្ធឱ្យដឹងថាពេលណាគួរឈប់ដាក់លំហាត់ប្រភេទដដែលៗ។ ដូចជាគ្រូពេទ្យសង្កេតមើលអាការៈអ្នកជំងឺបន្តិចម្តងៗ តាមរយៈសញ្ញាផ្សេងៗ រហូតដល់ប្រាកដចិត្ត១០០%ថាអ្នកជំងឺពិតជាបានជាសះស្បើយមែន ទើបឈប់ឲ្យថ្នាំ។
Intelligent Tutoring Systems (ITS) វាជាប្រព័ន្ធកុំព្យូទ័រអប់រំដែលអាចសម្របខ្លួនទៅតាមសមត្ថភាពរបស់សិស្សម្នាក់ៗ ដោយផ្តល់នូវលំហាត់ ជំនួយ (hints) និងការណែនាំភ្លាមៗនៅពេលសិស្សជួបការលំបាក ជំនួសឱ្យការគ្រាន់តែផ្តល់ពិន្ទុខុសឬត្រូវនៅចុងបញ្ចប់។ ដូចជាមានគ្រូបង្រៀនផ្ទាល់ខ្លួនម្នាក់អង្គុយក្បែរអ្នក តាមមើលរាល់សកម្មភាពធ្វើលំហាត់របស់អ្នក ហើយប្រាប់គន្លឹះភ្លាមៗនៅពេលអ្នកគិតលែងចេញ។
Hidden Markov Models (HMM) វាជាម៉ូដែលស្ថិតិដែលត្រូវបានប្រើដើម្បីទស្សន៍ទាយស្ថានភាពលាក់កំបាំង (ឧទាហរណ៍៖ ដំណើរការគិត ឬការយល់ដឹងរបស់សិស្ស) ដោយធ្វើការសង្កេតវិភាគទៅលើសកម្មភាពជាក់ស្តែងដែលបញ្ចេញមកក្រៅជារៀងរាល់ជំហាន (ឧទាហរណ៍៖ ការចុចកណ្តុរកុំព្យូទ័រ ឬរយៈពេលដែលសិស្សចំណាយ)។ ដូចជាការទស្សន៍ទាយថាតើមិត្តភក្តិរបស់អ្នកកំពុងសប្បាយចិត្ត ឬខឹងបាក់ទឹកចិត្ត (ស្ថានភាពលាក់កំបាំង) ដោយគ្រាន់តែសង្កេតមើលរបៀបដែលគេដើរ ឬបិទទ្វារ (សកម្មភាពជាក់ស្តែងដែលអាចមើលឃើញ)។
Expectation Maximization (EM) algorithm វាជាក្បួនដោះស្រាយគណិតវិទ្យាដែលប្រើសម្រាប់ស្វែងរកតម្លៃប៉ារ៉ាម៉ែត្រល្អបំផុតនៅក្នុងម៉ូដែលស្ថិតិ នៅពេលដែលមានទិន្នន័យខ្លះបាត់បង់ ឬមិនអាចសង្កេតឃើញដោយផ្ទាល់ តាមរយៈការធ្វើបច្ចុប្បន្នភាពការប៉ាន់ស្មានសារចុះសារឡើងរហូតដល់មានភាពសុក្រឹត។ ដូចជាការព្យាយាមផ្គុំរូបភាព (jigsaw puzzle) ដ៏ធំមួយដោយមិនមានរូបគំរូដើម ដែលអ្នកត្រូវសាកល្បងផ្គុំបណ្តើរ កែតម្រូវបណ្តើររហូតដល់ចេញជារូបរាងដែលសមហេតុផលបំផុត។
Association Rule Mining វាជាបច្ចេកទេសទាញយកទិន្នន័យដែលស្វែងរកទំនាក់ទំនងរវាងសកម្មភាពផ្សេងៗគ្នានៅក្នុងសំណុំទិន្នន័យធំៗ ដើម្បីរកឱ្យឃើញថាតើសកម្មភាពអ្វីខ្លះដែលសិស្សតែងតែធ្វើបន្តបន្ទាប់គ្នាជាប់លាប់។ ដូចជាការសង្កេតឃើញរបស់អ្នកលក់ទំនិញនៅផ្សារទំនើបថា អតិថិជនណាដែលទិញនំប៉័ង តែងតែទិញទឹកដោះគោស្រស់មកជាមួយគ្នាជានិច្ច។
Gaming the System វាសំដៅលើអាកប្បកិរិយាដែលសិស្សព្យាយាមកេងបន្លំឬរកផ្លូវកាត់តាមរយៈប្រព័ន្ធអប់រំកុំព្យូទ័រ (ឧទាហរណ៍៖ ចុចយកជំនួយរហូតដល់ឃើញចម្លើយ ឬចុចទាយចម្លើយលឿនៗ) ដើម្បីបានទៅមុខលឿនដោយមិនបានខិតខំប្រើប្រាស់ការគិត។ ដូចជាការលេងហ្គេមដែលអ្នកចុចប៊ូតុងចុះឡើងៗញាប់ៗដើម្បីឲ្យឆាប់ឆ្លងវគ្គ ដោយមិនបានខ្វល់ពីសាច់រឿងឬច្បាប់ក្បួនពិតប្រាកដរបស់ហ្គេមនោះឡើយ។
Dynamic Assessment វាជាការវាយតម្លៃសិស្សដោយមិនគ្រាន់តែមើលលើចម្លើយខុសឬត្រូវនៅពេលបញ្ចប់ការធ្វើតេស្តនោះទេ ប៉ុន្តែវាវាយតម្លៃទៅលើទំហំនៃជំនួយ (Hints) ដែលសិស្សត្រូវការ និងដំណើរការនៃការដោះស្រាយបញ្ហារបស់ពួកគេនៅក្នុងពេលកំពុងធ្វើតេស្តនោះតែម្តង។ ជំនួសឲ្យការដាក់ពិន្ទុត្រឹមតែសន្លឹកកិច្ចការប្រឡង វាដូចជាគ្រូកំពុងដាក់ពិន្ទុវាយតម្លៃទៅលើការខិតខំប្រឹងប្រែង និងចំនួនដងដែលសិស្សសុំឱ្យគ្រូជួយប្រាប់តម្រុយនៅពេលកំពុងប្រឡង។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖