Original Title: Generalizability and Transferability of Course Workload Models Across Institutions
Source: anonymous.4open.science
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ភាពទូទៅ និងលទ្ធភាពផ្ទេរនៃម៉ូដែលបន្ទុកការងារវគ្គសិក្សាឆ្លងកាត់ស្ថាប័ន

ចំណងជើងដើម៖ Generalizability and Transferability of Course Workload Models Across Institutions

អ្នកនិពន្ធ៖ Conrad Borchers (Carnegie Mellon University), Zachary A. Pardos (University of California, Berkeley)

ឆ្នាំបោះពុម្ព៖ 2025

វិស័យសិក្សា៖ Educational Data Mining

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការទស្សន៍ទាយបន្ទុកការងាររបស់និស្សិតក្នុងវគ្គសិក្សាឆ្លងកាត់ស្ថាប័នផ្សេងៗគ្នានៅតែមិនទាន់មានការស្រាវជ្រាវគ្រប់គ្រាន់ ខណៈពេលដែលការផ្ទេរម៉ូដែលទស្សន៍ទាយដោយផ្ទាល់តែងតែទទួលបរាជ័យដោយសារភាពខុសគ្នានៃបរិបទស្ថាប័ន។

វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះបានធ្វើការវាយតម្លៃលើម៉ូដែលទស្សន៍ទាយបន្ទុកការងារ (Workload-prediction models) ដោយប្រើប្រាស់ទិន្នន័យពីប្រព័ន្ធគ្រប់គ្រងការសិក្សា និងទិន្នន័យចុះឈ្មោះចូលរៀន មកពីស្ថាប័នអប់រំពីរផ្សេងគ្នានៅសហរដ្ឋអាមេរិក រួមមានការសាកល្បងផ្ទេរម៉ូដែលដោយផ្ទាល់ និងការកែសម្រួលម៉ូដែលដើម្បីពិនិត្យមើលលទ្ធភាពនៃការប្រើប្រាស់ទូទៅ។

ការប្រមូលទិន្នន័យប្រព័ន្ធគ្រប់គ្រងការសិក្សា និងការចុះឈ្មោះ (LMS and Enrollment Data Collection) ពីសាកលវិទ្យាល័យស្រាវជ្រាវសាធារណៈធំមួយ និងមហាវិទ្យាល័យឯកជនតូចមួយ។
ការប្រើប្រាស់ក្បួនដោះស្រាយការរៀនដោយម៉ាស៊ីន (Machine Learning Algorithms) ដូចជា Random Forest និង XGBoost ដើម្បីទស្សន៍ទាយបន្ទុកការងារ (ពេលវេលា ការប្រឹងប្រែងផ្លូវចិត្ត និងភាពតានតឹងផ្លូវចិត្ត)។
ការធ្វើតេស្តផ្ទេរម៉ូដែលដោយផ្ទាល់ (Out-of-the-box Transfer) និងការកែសម្រួលម៉ូដែល (Fine-tuning) ជាមួយទិន្នន័យក្នុងស្រុកក្នុងបរិមាណតិចតួចពីស្ថាប័នគោលដៅ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ទិន្នន័យ LMS និងទិន្នន័យចុះឈ្មោះចូលរៀនអាចពន្យល់ពីភាពខុសគ្នានៃការយល់ឃើញលើបន្ទុកការងារបានច្រើនជាងការប្រើប្រាស់ចំនួនក្រេឌីតម៉ោង (Credit hours) តែមួយមុខ (ពន្យល់បានរហូតដល់ ៤២% ធៀបនឹង ១៩% នៅស្ថាប័ន East School)។
ការអនុវត្តម៉ូដែលដែលបានបណ្តុះបណ្តាលពីស្ថាប័នមួយទៅស្ថាប័នមួយទៀតដោយផ្ទាល់ (Out-of-the-box) បណ្តាលឱ្យមានកំហុសជាប្រព័ន្ធ ដោយកំហុសក្នុងការទស្សន៍ទាយ (Prediction errors) កើនឡើងចន្លោះពី ៧% ទៅ ៥៤% អាស្រ័យលើប្រភេទការងារ។
ការកែសម្រួលម៉ូដែល (Fine-tuning) ដោយប្រើទិន្នន័យក្នុងស្រុកត្រឹមតែ ២០ ទៅ ៣០ វគ្គសិក្សា អាចកាត់បន្ថយកំហុសបានយ៉ាងច្រើនគួរឱ្យកត់សម្គាល់ ដែលបង្ហាញពីលទ្ធភាពខ្ពស់នៃការប្រើប្រាស់ម៉ូដែលរួមសម្រាប់ទស្សន៍ទាយបន្ទុកការងារឆ្លងកាត់ស្ថាប័នជាច្រើន។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Out-of-the-box Transfer ការផ្ទេរម៉ូដែលដោយផ្ទាល់ដោយមិនកែសម្រួល	ចំណេញពេលវេលា និងថវិកា ដោយមិនតម្រូវឱ្យមានការប្រមូលទិន្នន័យបន្ថែមពីស្ថាប័នគោលដៅឡើយ។ វាមានភាពងាយស្រួលក្នុងការដាក់ឱ្យអនុវត្តភ្លាមៗ។	បង្កើតឱ្យមានកំហុសនិងភាពលម្អៀងជាប្រព័ន្ធ (Systematic bias) ខ្ពស់ ដោយសារភាពខុសគ្នានៃការចាត់ថ្នាក់ពិន្ទុ និងទម្លាប់នៃការផ្តល់កិច្ចការរវាងស្ថាប័ន។ វាផ្តល់លទ្ធផលអន់ជាងការស្មានបែបមធ្យម (Mean baseline) ទៅទៀត។	កំហុសក្នុងការទស្សន៍ទាយ (MAE) បានកើនឡើងចន្លោះពី ៧% ទៅ ៥៤% នៅពេលអនុវត្តឆ្លងកាត់ស្ថាប័នដោយមិនមានការកែសម្រួល។
Fine-tuned Transfer ការកែសម្រួលម៉ូដែលដោយប្រើទិន្នន័យក្នុងស្រុកបន្តិចបន្តួច	ជួយកែតម្រូវភាពលម្អៀង និងបង្កើនភាពត្រឹមត្រូវនៃការទស្សន៍ទាយឱ្យស្របទៅនឹងបរិបទស្ថាប័នថ្មី ដោយទាមទារទិន្នន័យក្នុងស្រុកតែបន្តិចបន្តួចប៉ុណ្ណោះ។	នៅតែតម្រូវឱ្យមានការចំណាយលើការប្រមូលទិន្នន័យពិត (Ground-truth data) តាមរយៈការស្ទង់មតិពីនិស្សិតនៅស្ថាប័នគោលដៅដដែល។	គ្រាន់តែប្រើប្រាស់ទិន្នន័យពី ២០-៣០ វគ្គសិក្សាក្នុងស្រុក កំហុសនៃការទស្សន៍ទាយត្រូវបានកាត់បន្ថយយ៉ាងខ្លាំង ហើយកម្រិតភាពត្រឹមត្រូវមានស្ថិរភាពនៅពេលប្រើទិន្នន័យប្រមាណ ៨០-១០០ វគ្គសិក្សា។
Joint Data Model (Random Forest) ម៉ូដែលប្រើប្រាស់ទិន្នន័យរួមពីស្ថាប័នច្រើន	មានសមត្ថភាពចាប់យកសញ្ញា និងលក្ខណៈទូទៅនៃបន្ទុកការងារដែលអាចអនុវត្តបានឆ្លងស្ថាប័ន ដែលជាការត្រួសត្រាយផ្លូវសម្រាប់ម៉ូដែលទូទៅ (Institution-general model)។	ទាមទារឱ្យមានកិច្ចសហការចែករំលែកទិន្នន័យរវាងស្ថាប័ន និងការធ្វើស្តង់ដារលក្ខណៈទិន្នន័យ (Feature standardization) ដែលមានភាពស្មុគស្មាញ។	ម៉ូដែល Random Forest ទទួលបានភាពត្រឹមត្រូវខ្ពស់ ដោយកាត់បន្ថយកំហុស MAE បាន ១៧.០៥% ធៀបនឹង Baseline លើទិន្នន័យរួម។

ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះទាមទារនូវទិន្នន័យសកម្មភាពសិក្សាពីប្រព័ន្ធអេឡិចត្រូនិក ការចំណាយលើការស្ទង់មតិ និងសមត្ថភាពក្នុងការវិភាគទិន្នន័យ។

Dataset: ទិន្នន័យសកម្មភាពពីប្រព័ន្ធ LMS (Moodle ឬ Canvas) និងទិន្នន័យចុះឈ្មោះចូលរៀន (ចំនួនក្រេឌីត GPA និងទំហំថ្នាក់រៀន) ព្រមទាំងទិន្នន័យស្ទង់មតិពីការយល់ឃើញរបស់និស្សិត (SWAT workload survey)។
Software: ភាសាកូដ R (កញ្ចប់ lme4 និង MuMIn សម្រាប់ Mixed-effects models) និង Python (កញ្ចប់ scikit-learn សម្រាប់ Random Forest, XGBoost)។
Financial: ថវិកាលើកទឹកចិត្តសម្រាប់ការស្ទង់មតិ ($15 ក្នុងមួយអ្នកចូលរួម សម្រាប់ការស្រាវជ្រាវនេះ) ដើម្បីធានាបាននូវទិន្នន័យ Ground-truth ដែលមានគុណភាព។
Expertise: អ្នកជំនាញផ្នែកវិទ្យាសាស្ត្រទិន្នន័យអប់រំ (Educational Data Mining) ដើម្បីធ្វើ Feature Engineering និងការកែសម្រួលម៉ូដែល (Fine-tuning)។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងដោយពឹងផ្អែកលើទិន្នន័យពីគ្រឹះស្ថានឧត្តមសិក្សាចំនួនពីរនៅសហរដ្ឋអាមេរិក (សាកលវិទ្យាល័យសាធារណៈធំមួយ និងមហាវិទ្យាល័យឯកជនតូចមួយ) ដោយមានការចូលរួមពីនិស្សិតដោយស្ម័គ្រចិត្ត។ ទិន្នន័យនេះឆ្លុះបញ្ចាំងពីវប្បធម៌អប់រំលោកខាងលិច ដែលចំនួនកិច្ចការ និងការវាយតម្លៃមានភាពខុសគ្នាពីបរិបទនៅកម្ពុជា។ សម្រាប់កម្ពុជា ភាពខុសគ្នានៃការប្រើប្រាស់ប្រព័ន្ធ LMS វប្បធម៌នៃការសិក្សា និងការគាំទ្រផ្លូវចិត្ត អាចធ្វើឱ្យម៉ូដែលដើមនេះមិនអាចអនុវត្តបានដោយផ្ទាល់ឡើយ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះជាយ៉ាងណា វិធីសាស្ត្រនៃការកែសម្រួលម៉ូដែល (Fine-tuning) នេះ មានសក្តានុពលខ្ពស់សម្រាប់សាកលវិទ្យាល័យនៅកម្ពុជា ក្នុងការបង្កើតប្រព័ន្ធតាមដានសុខុមាលភាព និងបន្ទុកការងាររបស់និស្សិត។

សាកលវិទ្យាល័យភូមិន្ទភ្នំពេញ (RUPP) និង វិទ្យាស្ថានបច្ចេកវិទ្យាកម្ពុជា (ITC): អាចប្រើប្រាស់វិធីសាស្ត្រនេះដើម្បីទស្សន៍ទាយពីភាពតានតឹងផ្លូវចិត្តរបស់និស្សិត STEM ដោយប្រមូលទិន្នន័យពី Moodle ឬ Google Classroom ផ្សំជាមួយទិន្នន័យរដ្ឋបាល ដើម្បីកំណត់អត្តសញ្ញាណនិស្សិតដែលប្រឈមនឹងការបោះបង់ការសិក្សា។
ផ្នែកប្រឹក្សាយោបល់ការសិក្សា (Academic Advising): អាចបង្កើតជាឧបករណ៍សម្រាប់ជួយទីប្រឹក្សាសិក្សា និងនិស្សិតឆ្នាំទី១ ក្នុងការរៀបចំកាលវិភាគសិក្សា ដើម្បីចៀសវាងការចុះឈ្មោះរៀនមុខវិជ្ជាដែលមានកម្រិតសម្ពាធផ្លូវចិត្តខ្ពស់ត្រួតស៊ីគ្នាក្នុងឆមាសតែមួយ។

ការចាប់ផ្តើមជាមួយនឹងការប្រមូលទិន្នន័យស្ទង់មតិក្នុងទ្រង់ទ្រាយតូច (២០-៣០ មុខវិជ្ជា) នៅតាមសាកលវិទ្យាល័យនីមួយៗ គឺជាជំហានដ៏មានប្រសិទ្ធភាពក្នុងការទាញយកប្រយោជន៍ពីប្រព័ន្ធវិភាគទិន្នន័យអប់រំនេះនៅកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

រៀបចំស្តង់ដារនៃការប្រមូលទិន្នន័យ (Standardize LMS Data): នាយកដ្ឋានព័ត៌មានវិទ្យាត្រូវរៀបចំការណែនាំដល់សាស្ត្រាចារ្យឱ្យប្រើប្រាស់ប្រព័ន្ធ Moodle ឬ Google Classroom ក្នុងស្តង់ដារតែមួយ ដើម្បីងាយស្រួលទាញយកទិន្នន័យដូចជា ចំនួនកិច្ចការ កាលបរិច្ឆេទប្រគល់ និងអន្តរកម្មក្នុងវេទិកាពិភាក្សា។
ធ្វើការស្ទង់មតិសាកល្បងក្នុងស្រុក (Pilot Survey Data Collection): ជ្រើសរើសវគ្គសិក្សាចំនួន ៣០ ជាគំរូសាកល្បង និងប្រើប្រាស់កម្រងសំណួរ SWAT Workload Survey ដើម្បីប្រមូលទិន្នន័យពីនិស្សិតពាក់ព័ន្ធនឹងកម្រិតនៃការប្រឹងប្រែងផ្លូវចិត្ត និងពេលវេលាដែលបានចំណាយ។
កសាងលក្ខណៈពិសេសទិន្នន័យ (Feature Engineering): ប្រើប្រាស់ Python Pandas ដើម្បីរៀបចំ និងច្របាច់បញ្ចូលទិន្នន័យពី LMS ជាមួយទិន្នន័យរដ្ឋបាលសាកលវិទ្យាល័យ (ដូចជា GPA មធ្យម ទំហំថ្នាក់ និងចំនួនក្រេឌីត) ឱ្យទៅជាទម្រង់ដែលអាចឱ្យម៉ាស៊ីនរៀនសូត្របាន។
បណ្តុះបណ្តាល និងកែសម្រួលម៉ូដែល (Model Fine-Tuning): ប្រើប្រាស់ក្បួនដោះស្រាយ Random Forest តាមរយៈ Scikit-learn ដោយយកម៉ូដែលទូទៅជាគោល បន្ទាប់មកកែសម្រួលវា (Fine-tune) ដោយប្រើទិន្នន័យ ៣០ វគ្គសិក្សាដែលបានប្រមូលពីសាកលវិទ្យាល័យរបស់ខ្លួន។
អភិវឌ្ឍផ្ទាំងព័ត៌មានសម្រាប់ផ្តល់ប្រឹក្សា (Dashboard Integration): បង្កើតផ្ទាំងព័ត៌មានបង្ហាញលទ្ធផល (Dashboard) ដោយប្រើ Tableau ឬ PowerBI ដើម្បីផ្តល់ជូនទីប្រឹក្សាសិក្សា នូវសញ្ញាព្រមានជាមុន (Early warning alerts) សម្រាប់វគ្គសិក្សាណាដែលមានបន្ទុកតានតឹងខ្លាំងខុសធម្មតា។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Out-of-the-box Transfer	ដំណើរការយកម៉ូដែលបញ្ញាសិប្បនិម្មិតដែលបានបណ្តុះបណ្តាលរួចពីស្ថាប័នមួយ ទៅប្រើប្រាស់ផ្ទាល់នៅស្ថាប័នមួយទៀត ដោយមិនមានការកែសម្រួល ឬបន្ថែមទិន្នន័យថ្មីទៅក្នុងម៉ូដែលនោះឡើយ។	ដូចជាការយកសម្លៀកបំពាក់ដែលកាត់តម្រូវខ្នាតសម្រាប់មិត្តភក្តិអ្នក មកស្លៀកភ្លាមៗដោយមិនបានវាស់និងកាត់កែតម្រូវឱ្យត្រូវរាងរបស់អ្នក។
Fine-tuning	វិធីសាស្ត្រយកម៉ូដែលទស្សន៍ទាយដែលរៀនចេះរួចមកហើយ មកបង្រៀនបន្ថែមដោយប្រើទិន្នន័យក្នុងស្រុកគោលដៅចំនួនតិចតួច ដើម្បីឱ្យវាស្គាល់ពីលក្ខណៈពិសេសរបស់បរិបទថ្មី និងកាត់បន្ថយកំហុសនៃការទស្សន៍ទាយ។	ដូចជាចុងភៅដែលចេះធ្វើម្ហូបអឺរ៉ុបរួចហើយ មកចំណាយពេលរៀនបន្ថែមបន្តិចបន្តួចពីរសជាតិខ្មែរ ដើម្បីអាចចម្អិនម្ហូបត្រូវមាត់អ្នកស្រុក។
Feature engineering	ដំណើរការទាញយកព័ត៌មានមានប្រយោជន៍ពីទិន្នន័យឆៅ (ដូចជាសកម្មភាពចុចលើប្រព័ន្ធ LMS) មកបំប្លែងជាអថេរ ឬលក្ខណៈពិសេស (ដូចជាមធ្យមភាគនៃចំនួនកិច្ចការ) ដើម្បីឱ្យក្បួនដោះស្រាយម៉ាស៊ីនងាយស្រួលយល់ និងធ្វើការទស្សន៍ទាយបានច្បាស់លាស់។	ដូចជាការយកឈើដែលទើបតែកាប់ថ្មីៗ មកចិត និងខាត់ឱ្យរលោងជាបន្ទះៗ ដើម្បីឱ្យជាងឈើងាយស្រួលយកទៅធ្វើតុទូ។
Mean absolute error (MAE)	រង្វាស់សម្រាប់វាយតម្លៃកម្រិតភាពត្រឹមត្រូវរបស់ម៉ូដែល ដោយគណនាមធ្យមភាគនៃគម្លាតកំហុសរវាងតម្លៃដែលម៉ូដែលទស្សន៍ទាយ និងតម្លៃពិតប្រាកដជារួម ដើម្បីចង់ដឹងថាម៉ូដែលនោះទាយខុសកម្រិតណា។	ដូចជាការបាញ់ធ្នូជាច្រើនដង ហើយយើងវាស់ចម្ងាយជាមធ្យមពីចំណុចដែលព្រួញបានធ្លាក់ទៅកាន់ចំណុចកណ្តាលនៃផ្ទាំងស៊ីប ដើម្បីដឹងថាយើងបាញ់ខុសប៉ុនណា។
Domain adaptation	បច្ចេកទេសក្នុងបញ្ញាសិប្បនិម្មិតដែលជួយកែសម្រួលភាពខុសគ្នានៃទម្រង់ទិន្នន័យរវាងប្រភពដើម (Source domain) និងប្រភពគោលដៅ (Target domain) ដើម្បីឱ្យម៉ូដែលនៅតែអាចដំណើរការបានល្អក្នុងបរិស្ថានថ្មីដែលវាមិនធ្លាប់ជួប។	ដូចជាអ្នកចេះបើកឡានចង្កូតឆ្វេងនៅខ្មែរ ហើយត្រូវសម្របខ្លួនប្រើបច្ចេកទេសពិសេសដើម្បីអាចបើកឡានចង្កូតស្តាំនៅប្រទេសថៃបានយ៉ាងរលូន។
Random Forest	ក្បួនដោះស្រាយការរៀនដោយម៉ាស៊ីន ដែលបង្កើតដើមឈើសម្រេចចិត្ត (Decision Trees) ជាច្រើនបញ្ចូលគ្នា ហើយយកចម្លើយរួមពីដើមឈើទាំងនោះមកទស្សន៍ទាយលទ្ធផលចុងក្រោយ ដើម្បីធានាភាពត្រឹមត្រូវខ្ពស់ និងជៀសវាងការទន្ទេញចាំទិន្នន័យខ្លាំងពេក។	ដូចជាការសួរយោបល់ពីអ្នកជំនាញ១០០នាក់ផ្សេងគ្នា រួចយកចម្លើយដែលមានអ្នកស្របតាមច្រើនជាងគេ ដើម្បីធ្វើការសម្រេចចិត្តចុងក្រោយ ជាជាងការជឿលើមនុស្សតែម្នាក់។
Distributional shifts	បាតុភូតដែលកើតឡើងនៅពេលដែលលក្ខណៈ ឬទម្រង់ស្ថិតិនៃទិន្នន័យនៅស្ថាប័នថ្មី មានភាពខុសប្លែកពីទិន្នន័យដែលម៉ូដែលបានធ្លាប់រៀនពីមុន ដែលធ្វើឱ្យសមត្ថភាពនៃការទស្សន៍ទាយរបស់វាធ្លាក់ចុះយ៉ាងខ្លាំង។	ដូចជាសិស្សដែលធ្លាប់តែរៀននិងប្រឡងតែលំហាត់បូកដក ស្រាប់តែពេលប្រឡងថ្នាក់ជាតិចេញសុទ្ធតែលំហាត់គុណចែក ដែលធ្វើឱ្យគាត់មិនអាចធ្វើបានល្អ។
Ground-truth	ទិន្នន័យជាក់ស្តែងនិងត្រឹមត្រូវបំផុតដែលប្រមូលបានពីការសង្កេតផ្ទាល់ (ដូចជាទិន្នន័យស្ទង់មតិពីនិស្សិត) ដែលត្រូវបានប្រើប្រាស់ជាខ្នាតវាស់ ដើម្បីបង្រៀនម៉ាស៊ីន និងផ្ទៀងផ្ទាត់ថាតើម៉ូដែលទស្សន៍ទាយបានត្រូវឬខុស។	ដូចជាសៀវភៅចម្លើយ (Answer key) របស់គ្រូ ដែលប្រើសម្រាប់ផ្ទៀងផ្ទាត់ថាតើសិស្សធ្វើលំហាត់ត្រូវឬខុសពិតប្រាកដ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖