Original Title: Generalizability of Course Workload Models Across Institutions
Source: anonymous.4open.science
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ភាពទូទៅនៃគំរូទស្សន៍ទាយបន្ទុកការងារក្នុងវគ្គសិក្សាឆ្លងកាត់គ្រឹះស្ថានសិក្សា

ចំណងជើងដើម៖ Generalizability of Course Workload Models Across Institutions

អ្នកនិពន្ធ៖ Conrad Borchers (Carnegie Mellon University), Zachary A. Pardos (University of California, Berkeley)

ឆ្នាំបោះពុម្ព៖ 2025

វិស័យសិក្សា៖ Educational Data Mining

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហាប្រឈមក្នុងការផ្ទេរគំរូទស្សន៍ទាយបន្ទុកការងាររបស់និស្សិត (ពេលវេលា កម្លាំងចិត្ត និងភាពតានតឹង) ពីសាកលវិទ្យាល័យមួយទៅសាកលវិទ្យាល័យមួយទៀត ដោយសារចំនួនក្រេឌីតតែមួយមុខមិនអាចវាស់ស្ទង់បន្ទុកការងារពិតប្រាកដបានទេ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់វិធីសាស្ត្រជាពីរដំណាក់កាលដោយអនុវត្តម៉ាស៊ីនរៀន (Machine Learning) ដើម្បីវិភាគទំហំបន្ទុកការងារក្នុងវគ្គសិក្សានៅគ្រឹះស្ថានឧត្តមសិក្សាពីរដែលមានលក្ខណៈខុសគ្នា។

ការប្រមូលនិងវិភាគទិន្នន័យពីប្រព័ន្ធគ្រប់គ្រងការសិក្សា និងការចុះឈ្មោះចូលរៀន (LMS and Enrollment Data Analysis)
ការទស្សន៍ទាយបន្ទុកការងារដោយប្រើម៉ាស៊ីនរៀន (Workload Prediction using Machine Learning)
ការផ្ទេរគំរូ និងការកែសម្រួលបន្ថែមជាមួយទិន្នន័យថ្មី (Model Transfer and Fine-Tuning)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

លទ្ធផលបង្ហាញថា លក្ខណៈពិសេសដែលទាញចេញពី LMS និងការចុះឈ្មោះចូលរៀន អាចពន្យល់ពីបន្ទុកការងារបានច្រើនជាងចំនួនក្រេឌីត (Credit Hours) ដល់ទៅជិតពីរដងនៅក្នុងគ្រឹះស្ថានទាំងពីរ។
ការយកគំរូដែលបានបង្វឹកនៅសាកលវិទ្យាល័យមួយទៅប្រើប្រាស់ផ្ទាល់នៅសាកលវិទ្យាល័យមួយទៀត (Out-of-the-box transfer) នាំឱ្យមានការទស្សន៍ទាយលម្អៀង ដែលមានកំហុសខ្ពស់ជាងកម្រិតស្តង់ដារ។
ការកែសម្រួលគំរូ (Fine-tuning) ដោយប្រើប្រាស់ទិន្នន័យក្នុងស្រុកក្នុងបរិមាណតិចតួច (ត្រឹមតែ ២០ ទៅ ៣០ វគ្គសិក្សា) អាចកាត់បន្ថយកំហុសក្នុងការទស្សន៍ទាយបានយ៉ាងច្រើន ដែលជួយឱ្យមានភាពត្រឹមត្រូវប្រហាក់ប្រហែលនឹងគំរូដែលបង្វឹកក្នុងស្រុកផ្ទាល់។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Out-of-the-Box Transfer ការផ្ទេរគំរូដោយផ្ទាល់ដោយមិនកែសម្រួល	មិនតម្រូវឱ្យមានការប្រមូលទិន្នន័យបន្ថែម ឬទិន្នន័យស្ទង់មតិពីស្ថាប័នគោលដៅឡើយ។ ចំណេញពេលវេលាក្នុងការដាក់ឱ្យប្រើប្រាស់ដំបូង។	មានភាពលម្អៀងខ្លាំង (Systematic bias) ដោយសារភាពខុសគ្នានៃការប្រើប្រាស់ប្រព័ន្ធ LMS និងបរិបទស្ថាប័ន។ ដំណើរការអន់ជាងការប្រើប្រាស់តម្លៃមធ្យមនៃទិន្នន័យមូលដ្ឋាន (Baseline)។	អត្រាកំហុសមធ្យម (MAE) កើនឡើងយ៉ាងខ្លាំង ឧទាហរណ៍ ការទស្សន៍ទាយភាពតានតឹងផ្លូវចិត្តពី West ទៅ East មាន MAE ដល់ទៅ ១.៥៤៦ ធៀបនឹង ១.០០៦ របស់ Baseline។
Fine-Tuned Transfer ការផ្ទេរគំរូដោយមានការកែសម្រួល (Fine-tuning)	ត្រូវការទិន្នន័យស្ទង់មតិថ្មីក្នុងបរិមាណតិចតួចបំផុតដើម្បីកែតម្រូវគំរូ។ កាត់បន្ថយកំហុសនិងភាពលម្អៀងបានយ៉ាងឆាប់រហ័ស និងមានប្រសិទ្ធភាពខ្ពស់។	នៅតែទាមទារការប្រមូលទិន្នន័យជាក់ស្តែង (Ground-truth data) ខ្លះពីនិស្សិតនៅស្ថាប័នគោលដៅ ដើម្បីធ្វើការកែសម្រួល។	ការបន្ថែមទិន្នន័យត្រឹមតែ ២០ ទៅ ៣០ វគ្គសិក្សាប៉ុណ្ណោះ អាចកាត់បន្ថយកំហុសបានយ៉ាងច្រើន ដោយធ្វើឱ្យដំណើរការគំរូមានភាពត្រឹមត្រូវប្រហាក់ប្រហែលនឹងគំរូដែលបង្វឹកក្នុងស្រុក។
Combined Dataset Model ការបង្វឹកគំរូដោយបញ្ជូលទិន្នន័យស្ថាប័នរួមគ្នា	អាចចាប់យកទម្រង់ទូទៅនៃបន្ទុកការងាររបស់និស្សិតឆ្លងស្ថាប័នបានល្អ។ បង្កើតបានជាគំរូមួយដែលអាចប្រើប្រាស់ជាទូទៅ (Institution-general model)។	ទាមទារការសម្របសម្រួលក្នុងការចែករំលែកទិន្នន័យរវាងសាកលវិទ្យាល័យផ្សេងៗគ្នា និងតម្រូវឱ្យមានរចនាសម្ព័ន្ធទិន្នន័យ (Feature engineering) ដូចគ្នា។	ម៉ូដែលរួមបញ្ចូលគ្នានេះជួយឱ្យភាពត្រឹមត្រូវកើនឡើងប្រមាណ ១៥% (Improvement over baseline) សម្រាប់ការទស្សន៍ទាយបន្ទុកការងាររួម (Combined Load) ។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តគំរូទស្សន៍ទាយនេះមិនទាមទារកុំព្យូទ័រដែលមានសមត្ថភាពខ្ពស់ខ្លាំងនោះទេ ប៉ុន្តែទាមទារយ៉ាងចាំបាច់នូវទិន្នន័យច្បាស់លាស់ពីប្រព័ន្ធ LMS ការចុះឈ្មោះ និងការស្ទង់មតិ។

Dataset: កំណត់ត្រាសកម្មភាពពីប្រព័ន្ធ LMS (ដូចជា Moodle ឬ Canvas) ទិន្នន័យចុះឈ្មោះចូលរៀន (ក្រេឌីត, ពិន្ទុ GPA) និងលទ្ធផលស្ទង់មតិបន្ទុកការងារ SWAT ពីនិស្សិត។
Software: កម្មវិធី Python (ប្រើប្រាស់បណ្ណាល័យ Scikit-learn, XGBoost) និងភាសា R (ប្រើប្រាស់កញ្ចប់ lme4 និង MuMIn សម្រាប់គំរូ Mixed-effects)។
Hardware: កុំព្យូទ័រខ្នាតស្តង់ដារ (Standard CPU) ក៏អាចដំណើរការបាន ដោយសារគំរូដូចជា Random Forest និង Linear Regression មិនតម្រូវឱ្យប្រើ GPU ធំឡើយសម្រាប់ការហ្វឹកហាត់លើទិន្នន័យរាប់រយមុខវិជ្ជា។
Expertise: ជំនាញផ្នែកវិទ្យាសាស្ត្រទិន្នន័យ (Data Science) ការវិភាគទិន្នន័យអប់រំ (Educational Data Mining) និងចំណេះដឹងផ្នែកវិស្វកម្មលក្ខណៈពិសេស (Feature Engineering)។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងនៅសាកលវិទ្យាល័យរដ្ឋធំមួយ (West School) និងមហាវិទ្យាល័យឯកជនតូចមួយ (East School) នៅសហរដ្ឋអាមេរិក។ ទិន្នន័យនេះឆ្លុះបញ្ចាំងពីវប្បធម៌អប់រំ បទដ្ឋាននៃការដាក់ពិន្ទុ និងការវាយតម្លៃរបស់និស្សិតអាមេរិក ដែលអាចខុសគ្នាពីបរិបទនៅកម្ពុជា ដែលនិស្សិតអាចមានកត្តាសម្ពាធផ្សេងៗ (ដូចជាកត្តាសេដ្ឋកិច្ច ការធ្វើការក្រៅម៉ោងច្រើន) និងមានទម្លាប់ប្រើប្រាស់ប្រព័ន្ធ LMS មិនដូចគ្នាទាំងស្រុង។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់និងអាចយកមកអនុវត្តបាននៅតាមគ្រឹះស្ថានឧត្តមសិក្សានៅកម្ពុជា ដើម្បីជួយដល់ការប្រឹក្សាយោបល់ការសិក្សារបស់និស្សិត និងកាត់បន្ថយការបោះបង់ការសិក្សាដោយសារសម្ពាធ។

សាកលវិទ្យាល័យរដ្ឋធំៗ (ឧទាហរណ៍ RUPP ឬ ITC): ស្ថាប័នទាំងនេះអាចប្រើប្រាស់ទិន្នន័យពីប្រព័ន្ធ Moodle របស់ខ្លួន ដើម្បីទស្សន៍ទាយពីមុខវិជ្ជាណាដែលផ្តល់សម្ពាធខ្លាំងដល់និស្សិត និងជួយណែនាំនិស្សិតក្នុងការជ្រើសរើសមុខវិជ្ជាឱ្យមានតុល្យភាពក្នុងមួយឆមាស។
ក្រសួងអប់រំ យុវជន និងកីឡា (MoEYS): អាចយកគំនិតនេះទៅសិក្សាបង្កើតស្តង់ដាររួមមួយក្នុងការវាស់ស្ទង់បន្ទុកការងារសម្រាប់ការវាយតម្លៃការផ្តល់ក្រេឌីត (Credit system evaluation) ដើម្បីធានាគុណភាពនិងភាពស្មើគ្នានៃកម្មវិធីសិក្សានៅទូទាំងប្រទេស។

ជារួម ការផ្លាស់ប្តូរពីការវាស់ស្ទង់តែលើចំនួនក្រេឌីត មកការប្រើប្រាស់ទិន្នន័យជាក់ស្តែងពីប្រព័ន្ធ LMS (Learning Management System) នឹងធ្វើឱ្យការរៀបចំកម្មវិធីសិក្សានៅកម្ពុជាកាន់តែមានភាពបត់បែន និងគាំទ្រដល់សុខុមាលភាពនិស្សិតបានកាន់តែប្រសើរ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

រៀបចំការប្រមូលទិន្នន័យមូលដ្ឋាន (Data Collection): ទាញយកទិន្នន័យកំណត់ត្រាសកម្មភាពនិស្សិតពីប្រព័ន្ធ Moodle ឬ Canvas (ដូចជាចំនួនកិច្ចការ ការចូលរួមក្នុង Forum) និងទិន្នន័យចុះឈ្មោះ (ពិន្ទុ GPA ប្រវត្តិមុខវិជ្ជា) ដោយរក្សាការសម្ងាត់ព័ត៌មានបុគ្គល។
ធ្វើការស្ទង់មតិពីនិស្សិត (Ground Truth Survey): ប្រើប្រាស់កម្រងសំណួរស្ទង់មតិ SWAT (Subjective Workload Assessment Technique) ដើម្បីប្រមូលទិន្នន័យពីការវាយតម្លៃរបស់និស្សិតផ្ទាល់លើពេលវេលាចំណាយ ការប្រឹងប្រែងផ្លូវចិត្ត និងភាពតានតឹងសម្រាប់មុខវិជ្ជានីមួយៗ។
ធ្វើវិស្វកម្មលក្ខណៈពិសេស (Feature Engineering): ប្រើប្រាស់ Python ជាមួយបណ្ណាល័យ Pandas ដើម្បីគណនាលក្ខណៈពិសេសៗ (Features) ដូចជាមធ្យមភាគនៃការពន្យារពេលដាក់កិច្ចការ គម្លាតស្តង់ដារនៃពិន្ទុ GPA និងសូចនាករនៃការចូលរួមនៅក្នុងប្រព័ន្ធអនឡាញ។
បង្វឹក និងសាកល្បងគំរូ (Model Training & Testing): ប្រើប្រាស់ Scikit-learn ដើម្បីបង្វឹកគំរូដូចជា Random Forest ឬ XGBoost ដោយបែងចែកទិន្នន័យ ២៥% ទុកសម្រាប់ធ្វើតេស្ត (Holdout test set) និងវាស់ស្ទង់កំហុសជាមធ្យមដោយប្រើរង្វាស់ MAE (Mean Absolute Error)។
កែសម្រួលគំរូឆ្លងស្ថាប័ន (Cross-Institutional Fine-Tuning): ប្រសិនបើមានគម្រោងពង្រីកគំរូនេះទៅសាកលវិទ្យាល័យផ្សេងទៀត ត្រូវប្រមូលទិន្នន័យស្ទង់មតិប្រមាណ ២០ ទៅ ៣០ មុខវិជ្ជាពីស្ថាប័នថ្មីនោះ ដើម្បីយកមកកែសម្រួល (Fine-tune) ម៉ូដែលដើម បញ្ចៀសភាពលម្អៀង និងបង្កើនភាពត្រឹមត្រូវ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Educational Data Mining (EDM)	ជាវិស័យស្រាវជ្រាវដែលប្រើប្រាស់បច្ចេកទេសវិភាគទិន្នន័យ និងម៉ាស៊ីនរៀន (Machine Learning) ដើម្បីទាញយកព័ត៌មានលាក់កំបាំងពីទិន្នន័យអប់រំ (ដូចជាកំណត់ត្រាសកម្មភាពនិស្សិត និងពិន្ទុ) ក្នុងគោលបំណងស្វែងយល់ពីអាកប្បកិរិយារបស់អ្នករៀន និងកែលម្អគុណភាពនៃការបង្រៀន។	ដូចជាអ្នកជីករ៉ែដែលរែងយកមាសចេញពីដីខ្សាច់ធំៗ អញ្ចឹងដែរ EDM គឺការរកមើលចំណេះដឹងមានប្រយោជន៍ពីក្នុងគំនរទិន្នន័យរបស់និស្សិតរាប់ពាន់នាក់។
Domain adaptation	ជាបច្ចេកទេសក្នុងម៉ាស៊ីនរៀនដែលកែសម្រួលម៉ូដែលដែលបានបង្វឹកនៅលើប្រភពទិន្នន័យមួយ (ឧទាហរណ៍ សាកលវិទ្យាល័យធំមួយ) ឱ្យអាចដំណើរការបានល្អនៅលើទិន្នន័យថ្មីដែលមានលក្ខណៈខុសគ្នាខ្លះ (ឧទាហរណ៍ សាកលវិទ្យាល័យតូចមួយ) ដើម្បីដោះស្រាយបញ្ហាភាពខុសគ្នានៃបរិបទ។	ដូចជាការយកអ្នកបើកបរឡានចង្កូតឆ្វេងនៅខ្មែរ ទៅបង្ហាត់បន្ថែមបន្តិចបន្តួចសិន មុននឹងឱ្យគាត់ទៅបើកឡានចង្កូតស្តាំនៅប្រទេសថៃដោយសុវត្ថិភាព។
fine-tuning	ជាដំណើរការយកម៉ូដែលបញ្ញាសិប្បនិម្មិតដែលបានហ្វឹកហាត់រួចមកហើយ មកបង្វឹកបន្ថែមជាមួយនឹងទិន្នន័យថ្មីក្នុងបរិមាណតិចតួច ដើម្បីឱ្យវាស្គាល់បរិបទថ្មីនិងអាចធ្វើការទស្សន៍ទាយបានកាន់តែច្បាស់លាស់ ដោយមិនចាំបាច់បង្វឹកពីចំណុចសូន្យឡើងវិញ។	ដូចជាចុងភៅដែលចេះធ្វើម្ហូបយ៉ាងស្ទាត់ជំនាញស្រាប់ រួចគ្រាន់តែមកភ្លក់និងថែមថយគ្រឿងទេសបន្តិចបន្តួច ដើម្បីតម្រូវតាមចំណង់ចំណូលចិត្តអ្នកញ៉ាំប្រចាំតំបន់ថ្មី។
Mean Absolute Error (MAE)	ជារង្វាស់គណិតវិទ្យាសម្រាប់វាស់ស្ទង់កំហុសរបស់ម៉ូដែល ដោយគណនាចម្ងាយជាមធ្យមរវាងតម្លៃដែលម៉ូដែលទស្សន៍ទាយបាន និងតម្លៃពិតប្រាកដ ដោយមិនគិតថាវាទាយលើស ឬខ្វះនោះទេ។	ដូចជាការប៉ាន់ស្មានអាយុមនុស្សម្នាក់ បើអ្នកទាយខុសលើស ២ ឆ្នាំ ឬខ្វះ ២ ឆ្នាំ កំហុសរបស់អ្នកគឺ ២ ឆ្នាំដូចគ្នា (MAE = ២)។
feature importance	ជាការវាយតម្លៃនិងផ្តល់ចំណាត់ថ្នាក់ថាតើអថេរ ឬកត្តាណាមួយ (ឧទាហរណ៍ ចំនួនកិច្ចការ ចំនួនក្រេឌីត ឬពិន្ទុ GPA) មានឥទ្ធិពលខ្លាំងជាងគេក្នុងការជួយឱ្យម៉ូដែលធ្វើការទស្សន៍ទាយបន្ទុកការងារបានត្រឹមត្រូវ។	ដូចជាការសួរគ្រូពេទ្យថា តើរោគសញ្ញាមួយណា (ក្តៅខ្លួន ឈឺក ឬក្អក) ដែលធ្វើឱ្យគាត់ហ៊ានសន្និដ្ឋានថាអ្នកជំងឺផ្តាសាយធំច្បាស់ជាងគេ។
out-of-the-box	ស្ថានភាពនៃការយកគំរូទស្សន៍ទាយដែលត្រូវបានបង្កើតនិងបង្វឹកនៅកន្លែងមួយ ទៅប្រើប្រាស់ភ្លាមៗនៅកន្លែងមួយទៀតដោយមិនមានការកែប្រែ ឬការបញ្ចួលទិន្នន័យក្នុងស្រុកបន្ថែមទាល់តែសោះ ដែលជាទូទៅតែងតែផ្តល់លទ្ធផលមិនសូវច្បាស់លាស់។	ដូចជាការទិញអាវយឺតទំហំ Freesize ពីផ្សារមកពាក់ភ្លាមៗដោយមិនបាច់យកទៅឱ្យជាងកាត់តម្រូវទំហំខ្លួន (ជួនកាលវាអាចរលុងពេក ឬតឹងពេក)។
course load analytics (CLA)	ជាវិធីសាស្ត្រនៃការប្រមូល និងវិភាគទិន្នន័យពីប្រព័ន្ធសិក្សា ដើម្បីវាយតម្លៃ និងទស្សន៍ទាយអំពីកម្រិតបន្ទុកការងារជាក់ស្តែងរបស់មុខវិជ្ជានីមួយៗ (រួមមានកម្រិតចំណាយពេល កម្លាំងខួរក្បាល និងភាពតានតឹង) ជំនួសឱ្យការពឹងផ្អែកតែលើចំនួនក្រេឌីត។	ដូចជាកម្មវិធីតាមដានសុខភាព (Fitness Tracker) ដែលប្រាប់ថាលំហាត់ប្រាណនេះចំណាយកម្លាំងប៉ុន្មានកាឡូរីពិតប្រាកដ ជំនួសឱ្យការគ្រាន់តែប្រាប់ថាលំហាត់នោះត្រូវធ្វើប៉ុន្មាននាទី។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖