Original Title: Interaction and survival analysis of graduation data
Source: internationalscholarsjournals.org
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

អន្តរកម្ម និងការវិភាគអត្រារស់រាននៃទិន្នន័យការបញ្ចប់ការសិក្សា

ចំណងជើងដើម៖ Interaction and survival analysis of graduation data

អ្នកនិពន្ធ៖ Justin R. Chimka (4207 Bell Engineering Center, Fayetteville, AR), Lauren Holloway Lowe

ឆ្នាំបោះពុម្ព៖ 2019 International Journal of Education Research and Reviews

វិស័យសិក្សា៖ Education Data Analysis

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហាអត្រាបោះបង់ការសិក្សា និងការរក្សានិស្សិត ដោយធ្វើការសិក្សាពីកត្តាអន្តរកម្មផ្សេងៗដែលជះឥទ្ធិពលដល់ការបញ្ចប់ការសិក្សារបស់និស្សិតមហាវិទ្យាល័យវិស្វកម្ម។

វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះប្រើប្រាស់ទិន្នន័យនៃការរស់រានដើម្បីវិភាគពីរយៈពេលចាប់ពីការចុះឈ្មោះចូលរៀនរហូតដល់ការបញ្ចប់ការសិក្សារបស់ក្រុមនិស្សិតគោលដៅ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Main Effects Cox Proportional Hazards Model
ម៉ូដែលហានិភ័យសមាមាត្រខុកបែបឥទ្ធិពលគោល
ងាយស្រួលក្នុងការបកស្រាយ និងស្វែងយល់ពីឥទ្ធិពលនៃកត្តានីមួយៗដោយឡែកពីគ្នា (ដូចជាយេនឌ័រ ឬពិន្ទុប្រឡង) ទៅលើអត្រាបញ្ចប់ការសិក្សា។ វាទាមទារទិន្នន័យតិចជាងបើធៀបនឹងការវិភាគអន្តរកម្ម។ មិនអាចបង្ហាញពីទំនាក់ទំនងស៊ីជម្រៅនៅពេលដែលកត្តាពីរមានឥទ្ធិពលរួមបញ្ចូលគ្នាទៅលើលទ្ធផល ដែលអាចធ្វើឱ្យយើងរំលងព័ត៌មានសំខាន់ៗ។ រកឃើញឥទ្ធិពលជាមូលដ្ឋាននៃពិន្ទុស្តង់ដារគណិតវិទ្យា យេនឌ័រ និងពិន្ទុវិទ្យាសាស្ត្រ (ACT) ក្នុងការប្រែប្រួលអត្រាបញ្ចប់ការសិក្សា។
First-order Interaction Cox Proportional Hazards Model
ម៉ូដែលហានិភ័យសមាមាត្រខុកបែបអន្តរកម្មលំដាប់ទី១
ផ្តល់លទ្ធផលលម្អិត និងស៊ីជម្រៅដោយបង្ហាញពីរបៀបដែលកត្តាពីរ (ឧទាហរណ៍ មុខជំនាញ និងពិន្ទុប្រឡង) ធ្វើអន្តរកម្មគ្នាជះឥទ្ធិពលដល់ការបញ្ចប់ការសិក្សា ដែលជួយឱ្យឃើញទិន្នន័យដែលលាក់កំបាំង។ ទាមទារទិន្នន័យច្រើនដើម្បីគាំទ្រដល់ការវិភាគអន្តរកម្ម (ដូចដែលបានឃើញក្នុងករណីនិស្សិតមានតែពិន្ទុ SAT គឺមិនមានទិន្នន័យគ្រប់គ្រាន់សម្រាប់វិភាគនោះទេ) និងមានភាពស្មុគស្មាញក្នុងការបកស្រាយ។ រកឃើញថានិស្សិតស្រីផ្នែកវិស្វកម្មមានឱកាសរៀនចប់ខ្ពស់ប្រសិនបើមានពិន្ទុគណិតវិទ្យាខ្ពស់ ហើយនិស្សិតប្រុសមិនមែនវិស្វកម្មមានពិន្ទុអង់គ្លេសខ្ពស់បែរជាងាយបោះបង់ការសិក្សា ដោយម៉ូដែលជារួមមានស្ថិតិសំខាន់ (Global P-value < 0.05)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការវិភាគនេះមិនតម្រូវឱ្យមានធនធានកុំព្យូទ័រធំដុំនោះទេ ប៉ុន្តែទាមទារសំណុំទិន្នន័យនិស្សិតរយៈពេលវែងដែលមានភាពពេញលេញ និងចំណេះដឹងផ្នែកស្ថិតិកម្រិតខ្ពស់។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងដោយប្រើទិន្នន័យនិស្សិតតែ ៤២៩ នាក់នៅសាកលវិទ្យាល័យអូក្លាហូម៉ា (សហរដ្ឋអាមេរិក) ក្នុងឆ្នាំ ១៩៩៥។ ទិន្នន័យនេះផ្តោតតែលើនិស្សិតដែលជ្រើសរើសរៀនផ្នែកវិស្វកម្ម និងផ្អែកលើប្រព័ន្ធពិន្ទុប្រឡងស្តង់ដាររបស់អាមេរិក (ACT/SAT)។ សម្រាប់ប្រទេសកម្ពុជា ប្រព័ន្ធអប់រំ និងបរិបទសង្គមមានភាពខុសគ្នាស្រឡះ ដូច្នេះយើងចាំបាច់ត្រូវប្រើប្រាស់ទិន្នន័យពិន្ទុប្រឡងសញ្ញាបត្រមធ្យមសិក្សាទុតិយភូមិ (បាក់ឌុប) និងបន្ថែមអថេរកត្តាជីវភាពគ្រួសារជាក់ស្តែងរបស់និស្សិតខ្មែរជំនួសវិញ ដើម្បីឱ្យការវិភាគមានសុក្រឹតភាពនិងឆ្លើយតបទៅនឹងបរិបទក្នុងស្រុក។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនៃការវិភាគការរស់រាន (Survival Analysis) នេះមានសក្តានុពល និងអត្ថប្រយោជន៍យ៉ាងធំធេងសម្រាប់គ្រឹះស្ថានឧត្តមសិក្សានៅកម្ពុជា ក្នុងការស្វែងយល់និងកាត់បន្ថយអត្រាបោះបង់ការសិក្សា។

ការអនុវត្តវិធីសាស្ត្រវិភាគបែបអន្តរកម្មនេះនឹងជួយឱ្យគ្រឹះស្ថានឧត្តមសិក្សានៅកម្ពុជាអាចបង្កើតយន្តការគាំទ្រនិស្សិត (Early Warning Systems) បានចំគោលដៅ និងទាន់ពេលវេលា ដើម្បីជំរុញអត្រាបញ្ចប់ការសិក្សាឱ្យកាន់តែខ្ពស់។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ប្រមូល និងសម្អាតទិន្នន័យអតីតកាល (Data Collection & Preprocessing): ចាប់ផ្តើមប្រមូលទិន្នន័យប្រវត្តិរូបនិស្សិត ពិន្ទុប្រឡងបាក់ឌុប មុខជំនាញ ភេទ និងស្ថានភាពចុះឈ្មោះរៀនរៀងរាល់ឆមាស (យ៉ាងហោចណាស់សម្រាប់និស្សិត ៤ ទៅ ៦ ជំនាន់មុន)។ ប្រើប្រាស់ Microsoft ExcelSQL Database ដើម្បីរៀបចំរចនាសម្ព័ន្ធទិន្នន័យជាទម្រង់សម្រាប់ការវិភាគរស់រាន (Survival Data Format) ដោយមានជួរឈរបញ្ជាក់ពីរយៈពេល និងស្ថានភាពចុងក្រោយ (រៀនចប់ ឬបោះបង់)។
  2. សិក្សាមូលដ្ឋានគ្រឹះស្តីពីម៉ូដែលការរស់រាន (Learn Survival Analysis Fundamentals): ក្រុមអ្នកស្រាវជ្រាវគួរចំណាយពេលសិក្សាស្វែងយល់អំពីទ្រឹស្តីនៃម៉ូដែល Cox Proportional Hazards ការគណនា Hazard Ratio និងការប្រើប្រាស់ Kaplan-Meier Estimator តាមរយៈឯកសារ ឬវគ្គសិក្សាតាមអ៊ីនធឺណិត ដើម្បីយល់ពីរបៀបដែលអថេរពេលវេលាត្រូវបានគណនាបញ្ចូលក្នុងស្ថិតិ។
  3. អនុវត្តការវិភាគកត្តាគោល និងអន្តរកម្ម (Perform Main & Interaction Effects Analysis): ប្រើប្រាស់ភាសាកម្មវិធី R (ដោយប្រើ survival package) ឬកម្មវិធី Stata ដើម្បីដំណើរការម៉ូដែល Cox Regression។ ជាដំបូងត្រូវដំណើរការម៉ូដែលបែបឥទ្ធិពលគោល (Main effects) បន្ទាប់មកត្រូវបង្កើតអថេរអន្តរកម្ម (ឧទាហរណ៍៖ គុណតម្លៃអថេរយេនឌ័រ ជាមួយពិន្ទុគណិតវិទ្យា) ដើម្បីវិភាគក្នុងម៉ូដែលទីពីរដើម្បីស្វែងរកលទ្ធផលស៊ីជម្រៅ។
  4. ធ្វើតេស្តសម្មតិកម្ម និងវាយតម្លៃម៉ូដែល (Hypothesis Testing & Validation): ដើម្បីធានាថាលទ្ធផលអាចជឿទុកចិត្តបាន ត្រូវដំណើរការការធ្វើតេស្ត Schoenfeld residuals នៅក្នុងកម្មវិធី RStata ដើម្បីផ្ទៀងផ្ទាត់ថាតើម៉ូដែលគោរពតាមលក្ខខណ្ឌ Proportional Hazards Assumption ដែរឬទេ (ពោលគឺ Global P-value ត្រូវតែធំជាង ០.០៥)។
  5. បកស្រាយលទ្ធផល និងបង្កើតយន្តការគាំទ្រនិស្សិត (Interpret & Act on Findings): យកលទ្ធផលនៃការវិភាគមកបកស្រាយជារបាយការណ៍ដែលអាចអនុវត្តបាន។ ឧទាហរណ៍ ប្រសិនបើរឃើញថានិស្សិតមកពីខេត្តឆ្ងាយដែលមានពិន្ទុគណិតវិទ្យាមធ្យម មានហានិភ័យបោះបង់ការសិក្សាខ្ពស់នៅឆ្នាំទី១ សាកលវិទ្យាល័យអាចប្រើទិន្នន័យនេះដើម្បីបង្កើតកម្មវិធីបង្រៀនបំប៉ន (Tutoring programs) ឬផ្តល់ការប្រឹក្សាយោបល់ដើម្បីជួយគាំទ្រពួកគេឱ្យរៀនចប់។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Survival analysis (ការវិភាគការរស់រាន ឬការវិភាគរយៈពេលរស់រាន) ជាផ្នែកមួយនៃស្ថិតិដែលសិក្សាអំពីទិន្នន័យពេលវេលាដែលទាមទាររហូតដល់ព្រឹត្តិការណ៍ណាមួយកើតឡើង ដូចជាការខូចខាតម៉ាស៊ីន ឬក្នុងបរិបទនេះគឺការបញ្ចប់ការសិក្សារបស់និស្សិត។ វាជួយដោះស្រាយបញ្ហាទិន្នន័យដែលមិនទាន់ចប់ (Censored data) នៅពេលការតាមដានត្រូវបានបញ្ចប់ខណៈពេលដែលនិស្សិតនៅកំពុងរៀននៅឡើយ។ ដូចជាការប្រើនាឡិកាចាប់ម៉ោងដើម្បីមើលថាតើអំពូលភ្លើងមួយអាចភ្លឺបានប៉ុន្មានម៉ោងទើបខូច ដោយបូករួមទាំងការគណនាអំពូលដែលមិនទាន់ខូចពេលយើងឈប់តាមដានផងដែរ។
Cox proportional hazards models (ម៉ូដែលហានិភ័យសមាមាត្រខុក) ជាវិធីសាស្ត្រស្ថិតិមួយប្រភេទនៃការវិភាគការរស់រាន ដែលប្រើសម្រាប់វាយតម្លៃពីឥទ្ធិពលនៃកត្តាផ្សេងៗ (ដូចជាពិន្ទុប្រឡង ទីកន្លែងកំណើត) ទៅលើរយៈពេលដែលព្រឹត្តិការណ៍ណាមួយនឹងកើតឡើង (ឧទាហរណ៍ ការបញ្ចប់ការសិក្សា)។ ម៉ូដែលនេះសន្មតថាហានិភ័យ ឬឱកាសនៃការកើតឡើងនៃព្រឹត្តិការណ៍ មានសមាមាត្រថេរតាមពេលវេលា។ ដូចជាការប្រៀបធៀបមើលថាតើកត្តាអ្វីខ្លះ (ពូជ ជី ឬទឹក) ធ្វើឱ្យគ្រាប់ពូជមួយប្រភេទដុះពន្លកលឿនជាងគ្រាប់ពូជមួយប្រភេទទៀត ក្នុងរយៈពេលតាមដានដូចគ្នា។
First-order interaction terms (តួអន្តរកម្មលំដាប់ទី១) នៅក្នុងម៉ូដែលស្ថិតិ វាសំដៅលើកាលៈទេសៈដែលឥទ្ធិពលនៃអថេរទី១ (ឧទាហរណ៍ ពិន្ទុគណិតវិទ្យា) ទៅលើលទ្ធផលអថេរអាស្រ័យ (ការបញ្ចប់ការសិក្សា) មានការប្រែប្រួល និងមិនថេរនោះទេ ដោយវាអាស្រ័យលើតម្លៃនៃអថេរទី២ (ឧទាហរណ៍ មុខជំនាញជាវិស្វកម្ម ឬមិនមែនវិស្វកម្ម)។ វាបង្ហាញពីឥទ្ធិពលរួមបញ្ជូលគ្នានៃកត្តាពីរ។ ដូចជាការលាយថ្នាំពេទ្យពីរមុខបញ្ចូលគ្នា ដែលឥទ្ធិពលនៃថ្នាំទាំងពីរពេលប្រើរួមគ្នា គឺខុសប្លែកពីការបូកបញ្ចូលឥទ្ធិពលនៃការប្រើថ្នាំនីមួយៗដាច់ដោយឡែកពីគ្នា។
Hazard ratio (អត្រាធៀបហានិភ័យ) ជាទំហំរង្វាស់នៅក្នុងការវិភាគរស់រាន ដែលប្រៀបធៀបប្រូបាប៊ីលីតេ (ហានិភ័យ) នៃការកើតឡើងនៃព្រឹត្តិការណ៍មួយរវាងក្រុមពីរផ្សេងគ្នា។ ក្នុងបរិបទនៃការសិក្សានេះ ប្រសិនបើតម្លៃធំជាង ១ មានន័យថាព្រឹត្តិការណ៍នោះ (ការរៀនចប់) មានឱកាសកើតឡើងខ្ពស់ជាង។ ដូចជាការនិយាយថា អ្នកពាក់មួកសុវត្ថិភាពមាន "ឱកាសរស់រាន" ខ្ពស់ជាងអ្នកមិនពាក់មួក ២ ដង នៅពេលមានគ្រោះថ្នាក់ចរាចរណ៍ (អត្រាធៀបហានិភ័យ = ២)។
Schoenfeld residuals (សំណល់ស្កូនហ្វែល) ជារង្វាស់ស្ថិតិដែលប្រើសម្រាប់ធ្វើតេស្តសម្មតិកម្មគោលនៃម៉ូដែល Cox Proportional Hazards ដើម្បីផ្ទៀងផ្ទាត់ថាតើឥទ្ធិពលនៃអថេរនីមួយៗរក្សាបាននូវសមាមាត្រថេរឬអត់ នៅគ្រប់ចន្លោះពេលវេលាទាំងអស់។ ប្រសិនបើសំណល់នេះប្រែប្រួលតាមពេលវេលា មានន័យថាម៉ូដែលនោះលែងត្រឹមត្រូវហើយ។ ដូចជាការថ្លឹងជញ្ជីងម្តងហើយម្តងទៀតរៀងរាល់ម៉ោង ដើម្បីពិនិត្យមើលថាតើជញ្ជីងនោះនៅតែមានភាពត្រឹមត្រូវដដែល ឬក៏ប្រែប្រួលលំអៀងខុសប្រក្រតីនៅពេលវេលាខុសគ្នា។
Time dependent covariate (អថេរប្រែប្រួលតាមពេលវេលា) ជាកត្តាឬអថេរឯករាជ្យនៅក្នុងម៉ូដែលស្ថិតិ ដែលតម្លៃរបស់វាអាចផ្លាស់ប្តូរនៅខណៈពេលកំពុងធ្វើការតាមដាន។ ឧទាហរណ៍ មុខជំនាញរបស់និស្សិតនៅក្នុងការសិក្សានេះគឺប្រែប្រួល ដោយសារនិស្សិតម្នាក់អាចប្តូរជំនាញពីវិស្វកម្មទៅជំនាញផ្សេងទៀតនៅឆ្នាំណាមួយ អំឡុងពេលសិក្សា។ ដូចជាការវាយតម្លៃសុខភាពរបស់អ្នកជំងឺ ដោយផ្អែកលើសម្ពាធឈាមដែលតែងតែប្រែឡើងចុះជារៀងរាល់ថ្ងៃ មិនមែននៅថេររហូតតាំងពីថ្ងៃចូលពេទ្យនោះទេ។
Main effects models (ម៉ូដែលឥទ្ធិពលគោល) ជាម៉ូដែលស្ថិតិដែលវាស់ស្ទង់ឥទ្ធិពលនៃកត្តានីមួយៗទៅលើលទ្ធផល ដោយសន្មតថាកត្តាទាំងនោះធ្វើការឯករាជ្យពីគ្នា និងមិនមានទំនាក់ទំនងឬអន្តរកម្មស្មុគស្មាញជាមួយកត្តាដទៃទៀតឡើយ។ លទ្ធផលបង្ហាញត្រឹមតែឥទ្ធិពលផ្ទាល់របស់អថេរមួយប៉ុណ្ណោះ។ ដូចជាការវាយតម្លៃសមត្ថភាពបុគ្គលិកម្នាក់ៗដាច់ដោយឡែកពីគ្នា ដោយមិនខ្វល់ថាពួកគេធ្វើការងារជាក្រុមជាមួយអ្នកដទៃបានល្អកម្រិតណានោះទេ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖