បញ្ហា (The Problem)៖ ការស្រាវជ្រាវនេះដោះស្រាយបញ្ហាកង្វះខាតភាពយុត្តិធម៌នៃក្បួនដោះស្រាយ (Algorithmic Fairness) ក្នុងបរិបទអប់រំ ដែលការព្យាករណ៍សិស្សប្រឈមនឹងហានិភ័យដោយប្រើប្រាស់ម៉ាស៊ីនរៀនអាចបង្កើត ឬពង្រីកភាពលម្អៀងដែលមានស្រាប់ (ដូចជាយេនឌ័រ ឬពិការភាព)។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះវាយតម្លៃក្បួនដោះស្រាយម៉ាស៊ីនរៀន (Machine Learning Algorithms) ជាច្រើនប្រភេទ ដើម្បីព្យាករណ៍ពីលទ្ធផលរបស់សិស្សដោយប្រើប្រាស់សំណុំទិន្នន័យសិក្សាបើកចំហ និងវាស់ស្ទង់ភាពត្រឹមត្រូវជាមួយរង្វាស់ភាពយុត្តិធម៌ផ្សេងៗ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Kamishima's Prejudice Remover (KPR) ឧបករណ៍លុបបំបាត់ការរើសអើងរបស់ Kamishima |
មានលក្ខខណ្ឌកំណត់ (Regularization term) ដើម្បីកាត់បន្ថយភាពលម្អៀងដោយផ្ទាល់នៅពេលកំពុងបង្វឹកម៉ូដែល និងរក្សាបាននូវភាពត្រឹមត្រូវខ្ពស់។ | ទទួលបានតម្លៃព័ត៌មានទៅវិញទៅមក (Normalized Mutual Information - NMI) ទាបជាងគេបើប្រៀបធៀបជាមួយក្បួនផ្សេងទៀត។ | សម្រេចបានភាពសុក្រឹត (Accuracy) ៩៦.៨% និងកែលម្អតម្លៃយុត្តិធម៌បានប្រសើរជាងម៉ូដែលធម្មតា។ |
| Zafar's Margin-Based Classifier (ZMBC) ចំណាត់ថ្នាក់ផ្អែកលើរឹមរបស់ Zafar |
អាចអនុវត្តលក្ខខណ្ឌយុត្តិធម៌បានល្អទៅលើចំណាត់ថ្នាក់ផ្អែកលើរឹម (Margin-based classifiers) ដើម្បីគ្រប់គ្រងផលប៉ះពាល់មិនស្មើគ្នា (Disparate Impact)។ | អាចមានភាពស្មុគស្មាញក្នុងការកំណត់ប៉ារ៉ាម៉ែត្រ (Parameter tuning) ដើម្បីធ្វើឱ្យមានតុល្យភាពរវាងភាពត្រឹមត្រូវនិងភាពយុត្តិធម៌។ | សម្រេចបានភាពសុក្រឹត (Accuracy) ៩៦.៧% និងមានភាពយុត្តិធម៌ប្រហាក់ប្រហែលគ្នានឹង KPR។ |
| Classical Logistic Regression (LR) តម្រែតម្រង់ឡូជីស្ទិកបុរាណ |
ជាម៉ូដែលមូលដ្ឋាន (Baseline) ដ៏សាមញ្ញ ងាយស្រួលបកស្រាយលទ្ធផល និងប្រើប្រាស់ធនធានកុំព្យូទ័រតិច។ | ម៉ូដែលនេះចម្លង និងពង្រីកភាពលម្អៀង (Bias) ដែលមានក្នុងទិន្នន័យ ជាពិសេសប្រឆាំងនឹងក្រុមសិស្សមានពិការភាព។ | សម្រេចបានភាពសុក្រឹត (Accuracy) ៩៦.៧% ប៉ុន្តែមានអត្រា Disparate Impact ខ្ពស់មិនយុត្តិធម៌សម្រាប់សិស្សពិការ។ |
| Naive Bayes (NB) ណាយអ៊ីវបេយ |
ភាពសុក្រឹតនៃម៉ូដែលកើនឡើងយ៉ាងច្បាស់នៅពេលដែលយើងដកចេញនូវទិន្នន័យរសើប (Sensitive attributes ដូចជាយេនឌ័រនិងពិការភាព)។ | មានតម្លៃភាពយុត្តិធម៌ ABROCA អាក្រក់ជាងគេ ដែលបង្ហាញពីគម្លាតធំរវាងក្រុមផ្សេងៗ។ | ភាពសុក្រឹត (Accuracy) កើនពី ៩០.៩% ទៅដល់ ៩៤.៩% នៅពេលមិនប្រើប្រាស់ទិន្នន័យរសើប (Sensitive information)។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តការសិក្សានេះទាមទារធនធានកម្រិតមធ្យម ជាពិសេសទិន្នន័យសិស្សក្នុងបរិមាណច្រើន និងចំណេះដឹងពាក់ព័ន្ធនឹងក្បួនដោះស្រាយភាពយុត្តិធម៌។
ការសិក្សានេះត្រូវបានធ្វើឡើងដោយប្រើប្រាស់សំណុំទិន្នន័យ OULAD របស់សាកលវិទ្យាល័យ Open University (ចក្រភពអង់គ្លេស) ក្នុងឆ្នាំ២០១៣-២០១៤ ដែលក្រុមនិស្សិតមានពិការភាព (Students with declared disability) មានចំនួនតិចតួចបំផុតក្នុងទិន្នន័យ។ សម្រាប់ប្រទេសកម្ពុជា បញ្ហានេះមានសារៈសំខាន់ណាស់ ពីព្រោះប្រព័ន្ធអប់រំនៅកម្ពុជាមានភាពលម្អៀងទិន្នន័យខុសៗគ្នា (ដូចជា គម្លាតរវាងសិស្សទីក្រុងនិងជនបទ ឬលទ្ធភាពទទួលបានអ៊ីនធឺណិត) ដែលតម្រូវឱ្យមានការត្រួតពិនិត្យយ៉ាងប្រុងប្រយ័ត្នមុននឹងយកម៉ូដែលបែបនេះមកអនុវត្ត។
ការវិភាគនេះគឺមានអត្ថប្រយោជន៍ និងអាចយកមកអនុវត្តបាននៅក្នុងគ្រឹះស្ថានឧត្តមសិក្សានៅកម្ពុជា ដើម្បីជួយអន្តរាគមន៍ទាន់ពេលវេលាដល់សិស្សដែលប្រឈមនឹងការធ្លាក់ ឬបោះបង់ការសិក្សា ដោយប្រកាន់ខ្ជាប់នូវភាពយុត្តិធម៌។
ការដាក់បញ្ចូលនូវរង្វាស់ភាពយុត្តិធម៌ (Fairness metrics) ក្នុងការវិភាគទិន្នន័យអប់រំ នឹងជួយស្ថាប័នកម្ពុជាកាត់បន្ថយអត្រាបោះបង់ការសិក្សាប្រកបដោយប្រសិទ្ធភាព និងធានាបាននូវសមធម៌ក្នុងបរិយាកាសសិក្សាឌីជីថល។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Learning Analytics | ការប្រមូល វិភាគ និងប្រើប្រាស់ទិន្នន័យសកម្មភាពរបស់សិស្ស (ដូចជាការចុចមើលមេរៀន និងប្រវត្តិនៃការផ្ញើកិច្ចការ) ដើម្បីស្វែងយល់ពីរបៀបដែលពួកគេរៀន និងជួយកែលម្អបរិយាកាសសិក្សាឱ្យកាន់តែប្រសើរ។ | ដូចជាគ្រូពេទ្យពិនិត្យមើលរោគសញ្ញានិងប្រវត្តិសុខភាពរបស់អ្នកជំងឺ ដើម្បីផ្សំថ្នាំព្យាបាលឱ្យត្រូវនឹងជំងឺអ៊ីចឹងដែរ គ្រាន់តែនេះជាការប្រើទិន្នន័យដើម្បីជួយសិស្សក្នុងការរៀនសូត្រ។ |
| Algorithmic fairness | ដំណើរការនៃការធានាថាកម្មវិធីកុំព្យូទ័រឆ្លាតវៃ ឬម៉ាស៊ីនរៀន (Machine Learning) មិនធ្វើការសម្រេចចិត្តដែលមានការរើសអើង ឬលម្អៀងទៅលើក្រុមមនុស្សណាមួយដោយផ្អែកលើភេទ ពណ៌សម្បុរ ឬពិការភាពឡើយ។ | ដូចជាអាជ្ញាកណ្តាលកាត់ក្តីក្នុងការប្រកួតកីឡាដោយមិនលម្អៀងទៅខាងក្រុមណាមួយ ដោយឈរលើច្បាប់តែមួយសម្រាប់ទាំងអស់គ្នា ទោះបីជាកីឡាករមានសាវតារខុសគ្នាក៏ដោយ។ |
| Disparate Impact | រង្វាស់គណិតវិទ្យាដែលប្រើដើម្បីវាស់ស្ទង់ថាតើលទ្ធផល ឬការសម្រេចចិត្តពីប្រព័ន្ធកុំព្យូទ័រ បានផ្តល់ផលប៉ះពាល់អវិជ្ជមានដល់ក្រុមជនជាតិ យេនឌ័រ ឬសិស្សមានពិការភាពច្រើនជាងក្រុមមួយទៀតឬអត់ ទោះបីជាគ្មានការតាំងចិត្តរើសអើងក៏ដោយ។ | ដូចជាការតម្រូវឱ្យអ្នកពាក់ស្បែកជើងធម្មតានិងអ្នកពាក់ស្បែកជើងកីឡារត់លើផ្លូវរអិលតែមួយ ដែលច្បាប់នេះមើលទៅស្មើគ្នា ប៉ុន្តែវាធ្វើឱ្យអ្នកអត់មានស្បែកជើងកីឡាដួលធ្លាក់ច្រើនជាង។ |
| Normalized Mutual Information | រូបមន្តគណិតវិទ្យាដែលប្រើដើម្បីវាស់ស្ទង់ថាតើព័ត៌មានពីរ (ឧទាហរណ៍ ភេទរបស់សិស្ស និងលទ្ធផលប្រឡង) មានទំនាក់ទំនងពឹងផ្អែកគ្នាខ្លាំងកម្រិតណា ដើម្បីកំណត់រកមើលថាតើទិន្នន័យមានលាក់នូវការរើសអើងដោយប្រយោលដែរឬទេ។ | ដូចជាការសង្កេតមើលថាតើម៉ាកកាបូបស្ពាយរបស់សិស្សមានទំនាក់ទំនងយ៉ាងជិតស្និទ្ធនឹងពិន្ទុប្រឡងប្រចាំខែរបស់ពួកគេកម្រិតណា ដើម្បីដឹងថាការដាក់ពិន្ទុមានភាពលម្អៀងលើឋានៈសង្គមឬអត់។ |
| Underestimation Index | សូចនាករដែលកុំព្យូទ័រប្រើដើម្បីចាប់កំហុសនៅពេលដែលវាបានទស្សន៍ទាយលទ្ធផលទាបជាងការពិតសម្រាប់ក្រុមសិស្សភាគតិចណាមួយ ដោយសារតែម៉ូដែលមិនមានទិន្នន័យគ្រប់គ្រាន់ក្នុងការស្គាល់ពីក្រុមនោះច្បាស់។ | ដូចជាការដែលយើងវាយតម្លៃសមត្ថភាពសិស្សចំណូលថ្មីទាបជាងការពិត ព្រោះយើងមិនទាន់ស្គាល់ពីប្រវត្តិ ឬមិនទាន់បានឃើញសកម្មភាពការងាររបស់ពួកគេគ្រប់គ្រាន់។ |
| At-risk students | ក្រុមនិស្សិតដែលត្រូវបានប្រព័ន្ធកុំព្យូទ័រវាយតម្លៃនិងទស្សន៍ទាយថាមានភាគរយខ្ពស់ក្នុងការប្រឡងធ្លាក់ ឬបោះបង់ការសិក្សា ដែលតម្រូវឱ្យគ្រូបង្រៀននិងសាលាផ្តល់ជំនួយនិងអន្តរាគមន៍បន្ទាន់មុនពេលហួសពេល។ | ដូចជាការទស្សន៍ទាយប្រាប់មុននូវដើមឈើណាដែលអាចនឹងងាប់ដោយសារខ្វះជាតិទឹក ដើម្បីឱ្យអ្នកថែសួនប្រញាប់យកទឹកទៅស្រោចសង្គ្រោះវាទាន់ពេលវេលា។ |
| Kamishima’s Prejudice Remover | ក្បួនដោះស្រាយម៉ាស៊ីនរៀនដែលបានបន្ថែមសមីការគណិតវិទ្យាពិសេសមួយ (Regularizer) ដើម្បីទប់ស្កាត់ម៉ូដែលកុំឱ្យរៀន និងយកត្រាប់តាមទម្លាប់នៃការរើសអើងដែលមានបង្កប់ស្រាប់នៅក្នុងសំណុំទិន្នន័យចាស់ៗ។ | ដូចជាការដាក់តម្រងចម្រោះទឹកស្អាត ដើម្បីច្រោះយកក្អែល និងមេរោគចេញ មុននឹងយើងយកទឹកនោះមកបរិភោគ ឬប្រើប្រាស់។ |
| Virtual Learning Environments | ប្រព័ន្ធបច្ចេកវិទ្យាអប់រំតាមអ៊ីនធឺណិត ដែលសាលាប្រើសម្រាប់ផ្ទុកឯកសារមេរៀន ដាក់កិច្ចការ និងតាមដានរាល់សកម្មភាពសិក្សារបស់សិស្សម្នាក់ៗ រួមទាំងចំនួនដងនៃការ Log in និងការទាញយកឯកសារ។ | គឺជាថ្នាក់រៀនលើអ៊ីនធឺណិត ដែលមានសមត្ថភាពកត់ត្រារាល់ការដើរចេញចូល ទាញសៀវភៅអាន និងការឆ្លើយសំណួររបស់សិស្សដោយស្វ័យប្រវត្តិ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖