បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហាប្រឈមក្នុងការផ្ទេរគំរូទស្សន៍ទាយបន្ទុកការងាររបស់និស្សិត (ពេលវេលា កម្លាំងចិត្ត និងភាពតានតឹង) ពីសាកលវិទ្យាល័យមួយទៅសាកលវិទ្យាល័យមួយទៀត ដោយសារចំនួនក្រេឌីតតែមួយមុខមិនអាចវាស់ស្ទង់បន្ទុកការងារពិតប្រាកដបានទេ។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់វិធីសាស្ត្រជាពីរដំណាក់កាលដោយអនុវត្តម៉ាស៊ីនរៀន (Machine Learning) ដើម្បីវិភាគទំហំបន្ទុកការងារក្នុងវគ្គសិក្សានៅគ្រឹះស្ថានឧត្តមសិក្សាពីរដែលមានលក្ខណៈខុសគ្នា។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Out-of-the-Box Transfer ការផ្ទេរគំរូដោយផ្ទាល់ដោយមិនកែសម្រួល |
មិនតម្រូវឱ្យមានការប្រមូលទិន្នន័យបន្ថែម ឬទិន្នន័យស្ទង់មតិពីស្ថាប័នគោលដៅឡើយ។ ចំណេញពេលវេលាក្នុងការដាក់ឱ្យប្រើប្រាស់ដំបូង។ | មានភាពលម្អៀងខ្លាំង (Systematic bias) ដោយសារភាពខុសគ្នានៃការប្រើប្រាស់ប្រព័ន្ធ LMS និងបរិបទស្ថាប័ន។ ដំណើរការអន់ជាងការប្រើប្រាស់តម្លៃមធ្យមនៃទិន្នន័យមូលដ្ឋាន (Baseline)។ | អត្រាកំហុសមធ្យម (MAE) កើនឡើងយ៉ាងខ្លាំង ឧទាហរណ៍ ការទស្សន៍ទាយភាពតានតឹងផ្លូវចិត្តពី West ទៅ East មាន MAE ដល់ទៅ ១.៥៤៦ ធៀបនឹង ១.០០៦ របស់ Baseline។ |
| Fine-Tuned Transfer ការផ្ទេរគំរូដោយមានការកែសម្រួល (Fine-tuning) |
ត្រូវការទិន្នន័យស្ទង់មតិថ្មីក្នុងបរិមាណតិចតួចបំផុតដើម្បីកែតម្រូវគំរូ។ កាត់បន្ថយកំហុសនិងភាពលម្អៀងបានយ៉ាងឆាប់រហ័ស និងមានប្រសិទ្ធភាពខ្ពស់។ | នៅតែទាមទារការប្រមូលទិន្នន័យជាក់ស្តែង (Ground-truth data) ខ្លះពីនិស្សិតនៅស្ថាប័នគោលដៅ ដើម្បីធ្វើការកែសម្រួល។ | ការបន្ថែមទិន្នន័យត្រឹមតែ ២០ ទៅ ៣០ វគ្គសិក្សាប៉ុណ្ណោះ អាចកាត់បន្ថយកំហុសបានយ៉ាងច្រើន ដោយធ្វើឱ្យដំណើរការគំរូមានភាពត្រឹមត្រូវប្រហាក់ប្រហែលនឹងគំរូដែលបង្វឹកក្នុងស្រុក។ |
| Combined Dataset Model ការបង្វឹកគំរូដោយបញ្ជូលទិន្នន័យស្ថាប័នរួមគ្នា |
អាចចាប់យកទម្រង់ទូទៅនៃបន្ទុកការងាររបស់និស្សិតឆ្លងស្ថាប័នបានល្អ។ បង្កើតបានជាគំរូមួយដែលអាចប្រើប្រាស់ជាទូទៅ (Institution-general model)។ | ទាមទារការសម្របសម្រួលក្នុងការចែករំលែកទិន្នន័យរវាងសាកលវិទ្យាល័យផ្សេងៗគ្នា និងតម្រូវឱ្យមានរចនាសម្ព័ន្ធទិន្នន័យ (Feature engineering) ដូចគ្នា។ | ម៉ូដែលរួមបញ្ចូលគ្នានេះជួយឱ្យភាពត្រឹមត្រូវកើនឡើងប្រមាណ ១៥% (Improvement over baseline) សម្រាប់ការទស្សន៍ទាយបន្ទុកការងាររួម (Combined Load) ។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តគំរូទស្សន៍ទាយនេះមិនទាមទារកុំព្យូទ័រដែលមានសមត្ថភាពខ្ពស់ខ្លាំងនោះទេ ប៉ុន្តែទាមទារយ៉ាងចាំបាច់នូវទិន្នន័យច្បាស់លាស់ពីប្រព័ន្ធ LMS ការចុះឈ្មោះ និងការស្ទង់មតិ។
ការសិក្សានេះត្រូវបានធ្វើឡើងនៅសាកលវិទ្យាល័យរដ្ឋធំមួយ (West School) និងមហាវិទ្យាល័យឯកជនតូចមួយ (East School) នៅសហរដ្ឋអាមេរិក។ ទិន្នន័យនេះឆ្លុះបញ្ចាំងពីវប្បធម៌អប់រំ បទដ្ឋាននៃការដាក់ពិន្ទុ និងការវាយតម្លៃរបស់និស្សិតអាមេរិក ដែលអាចខុសគ្នាពីបរិបទនៅកម្ពុជា ដែលនិស្សិតអាចមានកត្តាសម្ពាធផ្សេងៗ (ដូចជាកត្តាសេដ្ឋកិច្ច ការធ្វើការក្រៅម៉ោងច្រើន) និងមានទម្លាប់ប្រើប្រាស់ប្រព័ន្ធ LMS មិនដូចគ្នាទាំងស្រុង។
វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់និងអាចយកមកអនុវត្តបាននៅតាមគ្រឹះស្ថានឧត្តមសិក្សានៅកម្ពុជា ដើម្បីជួយដល់ការប្រឹក្សាយោបល់ការសិក្សារបស់និស្សិត និងកាត់បន្ថយការបោះបង់ការសិក្សាដោយសារសម្ពាធ។
ជារួម ការផ្លាស់ប្តូរពីការវាស់ស្ទង់តែលើចំនួនក្រេឌីត មកការប្រើប្រាស់ទិន្នន័យជាក់ស្តែងពីប្រព័ន្ធ LMS (Learning Management System) នឹងធ្វើឱ្យការរៀបចំកម្មវិធីសិក្សានៅកម្ពុជាកាន់តែមានភាពបត់បែន និងគាំទ្រដល់សុខុមាលភាពនិស្សិតបានកាន់តែប្រសើរ។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Educational Data Mining (EDM) | ជាវិស័យស្រាវជ្រាវដែលប្រើប្រាស់បច្ចេកទេសវិភាគទិន្នន័យ និងម៉ាស៊ីនរៀន (Machine Learning) ដើម្បីទាញយកព័ត៌មានលាក់កំបាំងពីទិន្នន័យអប់រំ (ដូចជាកំណត់ត្រាសកម្មភាពនិស្សិត និងពិន្ទុ) ក្នុងគោលបំណងស្វែងយល់ពីអាកប្បកិរិយារបស់អ្នករៀន និងកែលម្អគុណភាពនៃការបង្រៀន។ | ដូចជាអ្នកជីករ៉ែដែលរែងយកមាសចេញពីដីខ្សាច់ធំៗ អញ្ចឹងដែរ EDM គឺការរកមើលចំណេះដឹងមានប្រយោជន៍ពីក្នុងគំនរទិន្នន័យរបស់និស្សិតរាប់ពាន់នាក់។ |
| Domain adaptation | ជាបច្ចេកទេសក្នុងម៉ាស៊ីនរៀនដែលកែសម្រួលម៉ូដែលដែលបានបង្វឹកនៅលើប្រភពទិន្នន័យមួយ (ឧទាហរណ៍ សាកលវិទ្យាល័យធំមួយ) ឱ្យអាចដំណើរការបានល្អនៅលើទិន្នន័យថ្មីដែលមានលក្ខណៈខុសគ្នាខ្លះ (ឧទាហរណ៍ សាកលវិទ្យាល័យតូចមួយ) ដើម្បីដោះស្រាយបញ្ហាភាពខុសគ្នានៃបរិបទ។ | ដូចជាការយកអ្នកបើកបរឡានចង្កូតឆ្វេងនៅខ្មែរ ទៅបង្ហាត់បន្ថែមបន្តិចបន្តួចសិន មុននឹងឱ្យគាត់ទៅបើកឡានចង្កូតស្តាំនៅប្រទេសថៃដោយសុវត្ថិភាព។ |
| fine-tuning | ជាដំណើរការយកម៉ូដែលបញ្ញាសិប្បនិម្មិតដែលបានហ្វឹកហាត់រួចមកហើយ មកបង្វឹកបន្ថែមជាមួយនឹងទិន្នន័យថ្មីក្នុងបរិមាណតិចតួច ដើម្បីឱ្យវាស្គាល់បរិបទថ្មីនិងអាចធ្វើការទស្សន៍ទាយបានកាន់តែច្បាស់លាស់ ដោយមិនចាំបាច់បង្វឹកពីចំណុចសូន្យឡើងវិញ។ | ដូចជាចុងភៅដែលចេះធ្វើម្ហូបយ៉ាងស្ទាត់ជំនាញស្រាប់ រួចគ្រាន់តែមកភ្លក់និងថែមថយគ្រឿងទេសបន្តិចបន្តួច ដើម្បីតម្រូវតាមចំណង់ចំណូលចិត្តអ្នកញ៉ាំប្រចាំតំបន់ថ្មី។ |
| Mean Absolute Error (MAE) | ជារង្វាស់គណិតវិទ្យាសម្រាប់វាស់ស្ទង់កំហុសរបស់ម៉ូដែល ដោយគណនាចម្ងាយជាមធ្យមរវាងតម្លៃដែលម៉ូដែលទស្សន៍ទាយបាន និងតម្លៃពិតប្រាកដ ដោយមិនគិតថាវាទាយលើស ឬខ្វះនោះទេ។ | ដូចជាការប៉ាន់ស្មានអាយុមនុស្សម្នាក់ បើអ្នកទាយខុសលើស ២ ឆ្នាំ ឬខ្វះ ២ ឆ្នាំ កំហុសរបស់អ្នកគឺ ២ ឆ្នាំដូចគ្នា (MAE = ២)។ |
| feature importance | ជាការវាយតម្លៃនិងផ្តល់ចំណាត់ថ្នាក់ថាតើអថេរ ឬកត្តាណាមួយ (ឧទាហរណ៍ ចំនួនកិច្ចការ ចំនួនក្រេឌីត ឬពិន្ទុ GPA) មានឥទ្ធិពលខ្លាំងជាងគេក្នុងការជួយឱ្យម៉ូដែលធ្វើការទស្សន៍ទាយបន្ទុកការងារបានត្រឹមត្រូវ។ | ដូចជាការសួរគ្រូពេទ្យថា តើរោគសញ្ញាមួយណា (ក្តៅខ្លួន ឈឺក ឬក្អក) ដែលធ្វើឱ្យគាត់ហ៊ានសន្និដ្ឋានថាអ្នកជំងឺផ្តាសាយធំច្បាស់ជាងគេ។ |
| out-of-the-box | ស្ថានភាពនៃការយកគំរូទស្សន៍ទាយដែលត្រូវបានបង្កើតនិងបង្វឹកនៅកន្លែងមួយ ទៅប្រើប្រាស់ភ្លាមៗនៅកន្លែងមួយទៀតដោយមិនមានការកែប្រែ ឬការបញ្ចួលទិន្នន័យក្នុងស្រុកបន្ថែមទាល់តែសោះ ដែលជាទូទៅតែងតែផ្តល់លទ្ធផលមិនសូវច្បាស់លាស់។ | ដូចជាការទិញអាវយឺតទំហំ Freesize ពីផ្សារមកពាក់ភ្លាមៗដោយមិនបាច់យកទៅឱ្យជាងកាត់តម្រូវទំហំខ្លួន (ជួនកាលវាអាចរលុងពេក ឬតឹងពេក)។ |
| course load analytics (CLA) | ជាវិធីសាស្ត្រនៃការប្រមូល និងវិភាគទិន្នន័យពីប្រព័ន្ធសិក្សា ដើម្បីវាយតម្លៃ និងទស្សន៍ទាយអំពីកម្រិតបន្ទុកការងារជាក់ស្តែងរបស់មុខវិជ្ជានីមួយៗ (រួមមានកម្រិតចំណាយពេល កម្លាំងខួរក្បាល និងភាពតានតឹង) ជំនួសឱ្យការពឹងផ្អែកតែលើចំនួនក្រេឌីត។ | ដូចជាកម្មវិធីតាមដានសុខភាព (Fitness Tracker) ដែលប្រាប់ថាលំហាត់ប្រាណនេះចំណាយកម្លាំងប៉ុន្មានកាឡូរីពិតប្រាកដ ជំនួសឱ្យការគ្រាន់តែប្រាប់ថាលំហាត់នោះត្រូវធ្វើប៉ុន្មាននាទី។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖