Original Title: Addressing Bias for Equity in AI-driven Customized Learning Systems
Source: doi.org/10.15702/mall.2024.27.4.70
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការដោះស្រាយភាពលំអៀងដើម្បីសមធម៌នៅក្នុងប្រព័ន្ធសិក្សាតាមតម្រូវការដែលដំណើរការដោយ AI

ចំណងជើងដើម៖ Addressing Bias for Equity in AI-driven Customized Learning Systems

អ្នកនិពន្ធ៖ Junseong Bang (Ymatics Corp.), Sangmin-Michelle Lee (Kyung Hee University)

ឆ្នាំបោះពុម្ព៖ 2024 (Multimedia-Assisted Language Learning)

វិស័យសិក្សា៖ Education Technology

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហានៃភាពលំអៀង (Bias) ដែលកើតឡើងនៅក្នុងប្រព័ន្ធសិក្សាតាមតម្រូវការដែលដំណើរការដោយ AI ជាពិសេសនៅក្នុងសៀវភៅសិក្សadigital AI ដែលនឹងដាក់ឱ្យប្រើប្រាស់នៅប្រទេសកូរ៉េ ដែលអាចគំរាមកំហែងដល់សមធម៌នៃការអប់រំ។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកនិពន្ធបានធ្វើការពិនិត្យឡើងវិញនូវអក្សរសិល្ប៍ដែលមានស្រាប់ និងវិភាគជាប្រព័ន្ធទៅលើដំណាក់កាលនៃការប្រមូលទិន្នន័យ និងការដំណើរការក្បួនដោះស្រាយ ដើម្បីកំណត់ប្រភពនៃបញ្ហា និងស្នើដំណោះស្រាយ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Standard AI Model Training (Baseline)
ការបណ្តុះបណ្តាលគំរូ AI តាមស្តង់ដារ (មិនមានការកែតម្រូវភាពលំអៀង)
មានប្រសិទ្ធភាពខ្ពស់ក្នុងការបង្កើតការព្យាករណ៍សម្រាប់ក្រុមដែលមានទិន្នន័យច្រើន (Majority Groups) និងងាយស្រួលក្នុងការអនុវត្ត។ ងាយនឹងមានបញ្ហា Overfitting និងបង្កើតលទ្ធផលលំអៀងខ្លាំងចំពោះក្រុមភាគតិច ឬក្រុមដែលមានទិន្នន័យមិនគ្រប់គ្រាន់។ បង្កើតឱ្យមានវិសមភាពក្នុងការអប់រំ ដោយផ្តល់លទ្ធផលមិនសុក្រឹតចំពោះសិស្សដែលមកពីតំបន់ដាច់ស្រយាល ឬមានប្រវត្តិមិនសូវល្អ។
Data Balancing & Reweighting (e.g., Weighted Sampling)
ការថ្លឹងថ្លែងទិន្នន័យ និងការយកគំរូតាមទម្ងន់ (Weighted Sampling)
ជួយកាត់បន្ថយភាពលំអៀងដោយផ្តល់ទម្ងន់បន្ថែមដល់ទិន្នន័យនៃក្រុមភាគតិច ធ្វើឱ្យគំរូ AI មានភាពយុត្តិធម៌ជាងមុន។ ទាមទារឱ្យមានការរៀបចំទិន្នន័យ (Data Preprocessing) ដ៏ស្មុគស្មាញ និងអាចកាត់បន្ថយភាពត្រឹមត្រូវជារួម (Overall Accuracy) ប្រសិនបើមិនបានធ្វើតេស្តត្រឹមត្រូវ។ ធ្វើឱ្យប្រសើរឡើងនូវរង្វាស់សមធម៌ (Equity Metrics) ដូចជា ABROCA និង MADD។
Human-in-the-loop (TPCEK Framework)
ការដាក់បញ្ចូលមនុស្សក្នុងដំណើរការ (ក្របខណ្ឌ TPCEK សម្រាប់គ្រូបង្រៀន)
អនុញ្ញាតឱ្យគ្រូបង្រៀនប្រើប្រាស់ការវិនិច្ឆ័យប្រកបដោយក្រមសីលធម៌ ដើម្បីកែតម្រូវលទ្ធផលដែលផ្តល់ដោយ AI ឱ្យស្របតាមបរិបទជាក់ស្តែងរបស់សិស្ស។ ទាមទារពេលវេលា និងការបណ្តុះបណ្តាលគ្រូបង្រៀនយ៉ាងខ្លាំងក្លាលើផ្នែកសីលធម៌ AI និងបច្ចេកវិទ្យា។ ធានាបាននូវសមធម៌នៃការអប់រំតាមរយៈការអន្តរាគមន៍របស់គ្រូ មិនពឹងផ្អែកទាំងស្រុងលើបច្ចេកវិទ្យា។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សាមិនបានបញ្ជាក់ពីតម្លៃជាទឹកប្រាក់ទេ ប៉ុន្តែបានសង្កត់ធ្ងន់លើតម្រូវការធនធានទិន្នន័យ និងធនធានមនុស្សយ៉ាងច្រើន។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងក្នុងបរិបទនៃប្រទេសកូរ៉េខាងត្បូង ដោយផ្តោតលើការរៀបចំសម្រាប់សៀវភៅសិក្សាឌីជីថល AI (AIDT)។ វាមានសារៈសំខាន់សម្រាប់កម្ពុជា ព្រោះប្រព័ន្ធ AI ដែលប្រើប្រាស់ទិន្នន័យបរទេសអាចនឹងមិនដំណើរការល្អ ឬមានភាពលំអៀងចំពោះសិស្សកម្ពុជា ជាពិសេសទាក់ទងនឹងភាសា និងបរិបទវប្បធម៌។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រ និងការរកឃើញនៅក្នុងការសិក្សានេះ មានប្រយោជន៍យ៉ាងខ្លាំងសម្រាប់អ្នករៀបចំគោលនយោបាយអប់រំនៅកម្ពុជា ដើម្បីត្រៀមខ្លួនទទួលយកបច្ចេកវិទ្យា AI។

ការអនុវត្តតាមអនុសាសន៍នៃការសិក្សានេះនឹងជួយឱ្យកម្ពុជាកាត់បន្ថយគម្លាតឌីជីថល (Digital Divide) និងធានាថាសិស្សគ្រប់រូបទទួលបានផលប្រយោជន៍ស្មើគ្នាក្នុងយុគសម័យ AI។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាអំពីភាពលំអៀងនៃទិន្នន័យ (Understand Data Bias): និស្សិត ឬអ្នកស្រាវជ្រាវគួរចាប់ផ្តើមដោយការសិក្សាអំពីប្រភេទនៃភាពលំអៀងក្នុង AI ដូចជា Representation Bias និង Measurement Bias ដោយប្រើប្រាស់ឯកសារយោងដូចជា (Baker & Hawn, 2022)។
  2. វាយតម្លៃទិន្នន័យក្នុងស្រុក (Evaluate Local Datasets): ធ្វើការសាកល្បងលើទិន្នន័យអប់រំដែលមានស្រាប់នៅកម្ពុជា ដើម្បីមើលថាតើទិន្នន័យនោះតំណាងឱ្យសិស្សនៅតំបន់ជនបទ និងទីក្រុងបានស្មើគ្នាដែរឬទេ ដោយប្រើបច្ចេកទេសវិភាគស្ថិតិ។
  3. អនុវត្តរង្វាស់សមធម៌ (Implement Equity Metrics): សាកល្បងប្រើប្រាស់រង្វាស់ដូចជា (ABROCA) ឬ (MADD) ទៅលើគំរូ AI សាមញ្ញមួយ ដើម្បីវាស់វែងភាពខុសគ្នានៃការអនុវត្តរវាងក្រុមសិស្សផ្សេងៗគ្នា។
  4. អភិវឌ្ឍន៍គោលការណ៍ណែនាំសម្រាប់គ្រូ (Develop Guidelines): បង្កើតសៀវភៅណែនាំសាមញ្ញមួយសម្រាប់គ្រូបង្រៀនអំពីរបៀបសម្គាល់កំហុស ឬភាពលំអៀងនៅក្នុងប្រព័ន្ធ AI ដែលពួកគេប្រើប្រាស់ក្នុងថ្នាក់រៀន ដោយផ្អែកលើគំរូ (TPCEK)។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Knowledge Tracing ជាវិធីសាស្ត្រដែល AI ប្រើប្រាស់ដើម្បីតាមដាន និងធ្វើបច្ចុប្បន្នភាពស្ថានភាពចំណេះដឹងរបស់សិស្សជាបន្តបន្ទាប់ ដោយផ្អែកលើចម្លើយ និងសកម្មភាពរបស់ពួកគេ ដើម្បីទស្សន៍ទាយសមត្ថភាពនាពេលអនាគត។ ដូចជាគ្រូពេទ្យដែលតាមដានសុខភាពអ្នកជំងឺជាប្រចាំ ដើម្បីដឹងថាត្រូវផ្តល់ថ្នាំអ្វីបន្តទៀត។
Algorithmic Bias កំហុសជាប្រព័ន្ធនៅក្នុងកុំព្យូទ័រដែលបង្កើតលទ្ធផលមិនយុត្តិធម៌ ដោយផ្តល់ផលប្រយោជន៍ដល់ក្រុមមួយ និងធ្វើឱ្យប៉ះពាល់ដល់ក្រុមមួយទៀត (ឧទាហរណ៍៖ AI វាយតម្លៃសិស្សនៅទីក្រុងបានល្អជាងសិស្សជនបទ ដោយសារទិន្នន័យបង្រៀន)។ ប្រៀបដូចជាអាជ្ញាកណ្តាលម្នាក់ដែលកាត់សេចក្តីលំអៀងទៅខាងក្រុមដែលខ្លួនស្គាល់ច្បាស់ និងមិនអើពើចំពោះក្រុមដែលខ្លួនមិនសូវស្គាល់។
Feedback Loop ដំណើរការដែលលទ្ធផលនៃប្រព័ន្ធ AI ត្រូវបានប្រើប្រាស់ត្រឡប់មកវិញជាទិន្នន័យបញ្ចូល ដែលអាចធ្វើឱ្យភាពលំអៀងកាន់តែធ្ងន់ធ្ងរឡើងៗតាមពេលវេលា (ឧទាហរណ៍៖ AI គិតថាសិស្សខ្សោយ -> ផ្តល់លំហាត់ងាយ -> សិស្សមិនរីកចម្រើន -> AI កាន់តែជឿថាសិស្សខ្សោយ)។ ដូចជាការយកមីក្រូហ្វូនទៅដាក់ជិតធុងបាស ដែលធ្វើឱ្យសំឡេងរំខានកាន់តែលាន់ខ្លាំងឡើងៗដោយសារសំឡេងវិលត្រឡប់ចូលមីក្រូវិញ។
Overfitting ស្ថានភាពដែលគំរូ AI រៀនលម្អិតពេកពីទិន្នន័យបណ្តុះបណ្តាល (Training Data) រហូតដល់ចងចាំទាំងចំណុចមិនសំខាន់ ធ្វើឱ្យវាមិនអាចដំណើរការបានល្អជាមួយទិន្នន័យថ្មី ឬសិស្សដែលមិនធ្លាប់ជួបពីមុន។ ដូចជាសិស្សដែលទន្ទេញចម្លើយនៃវិញ្ញាសាចាស់ៗយ៉ាងស្ទាត់ ប៉ុន្តែធ្លាក់ពេលប្រឡងពិតប្រាកដ ដោយសារសំណួរត្រូវបានកែប្រែទម្រង់បន្តិច។
Weighted Sampling បច្ចេកទេសស្ថិតិដែលផ្តល់ "ទម្ងន់" ឬសារៈសំខាន់បន្ថែមទៅលើទិន្នន័យនៃក្រុមភាគតិច (Underrepresented Groups) ក្នុងអំឡុងពេលបណ្តុះបណ្តាល AI ដើម្បីកុំឱ្យ AI មើលរំលងក្រុមនោះ។ ដូចជាការប្រើឧបករណ៍បំពងសំឡេងឱ្យមនុស្សដែលមានសំឡេងតិច នៅក្នុងបន្ទប់ដែលមានមនុស្សនិយាយគ្នាច្រើន ដើម្បីឱ្យគេអាចស្តាប់ឮសំឡេងគាត់ស្មើនឹងអ្នកដទៃ។
TPCEK (Technological Pedagogical Content Ethical Knowledge) ក្របខណ្ឌសមត្ថភាពគ្រូបង្រៀនដែលបន្ថែមផ្នែក "សីលធម៌" (Ethical) ទៅលើចំណេះដឹងបច្ចេកវិទ្យា និងគរុកោសល្យ ដើម្បីធានាថាគ្រូអាចប្រើប្រាស់ AI ដោយការទទួលខុសត្រូវ និងយុត្តិធម៌។ ដូចជាអ្នកបើកបរដែលមិនត្រឹមតែចេះបើកឡាន (បច្ចេកទេស) និងចេះច្បាប់ចរាចរណ៍ (ខ្លឹមសារ) ប៉ុណ្ណោះទេ ថែមទាំងមានចិត្តធម៌ចេះប្រយ័ត្នអ្នកថ្មើរជើង (សីលធម៌)។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖