Original Title: Addressing Bias for Equity in AI-driven Customized Learning Systems
Source: doi.org/10.15702/mall.2024.27.4.70
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការដោះស្រាយភាពលំអៀងដើម្បីសមធម៌នៅក្នុងប្រព័ន្ធសិក្សាតាមតម្រូវការដែលដំណើរការដោយ AI

ចំណងជើងដើម៖ Addressing Bias for Equity in AI-driven Customized Learning Systems

អ្នកនិពន្ធ៖ Junseong Bang (Ymatics Corp.), Sangmin-Michelle Lee (Kyung Hee University)

ឆ្នាំបោះពុម្ព៖ 2024 (Multimedia-Assisted Language Learning)

វិស័យសិក្សា៖ Education Technology

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហានៃភាពលំអៀង (Bias) ដែលកើតឡើងនៅក្នុងប្រព័ន្ធសិក្សាតាមតម្រូវការដែលដំណើរការដោយ AI ជាពិសេសនៅក្នុងសៀវភៅសិក្សadigital AI ដែលនឹងដាក់ឱ្យប្រើប្រាស់នៅប្រទេសកូរ៉េ ដែលអាចគំរាមកំហែងដល់សមធម៌នៃការអប់រំ។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកនិពន្ធបានធ្វើការពិនិត្យឡើងវិញនូវអក្សរសិល្ប៍ដែលមានស្រាប់ និងវិភាគជាប្រព័ន្ធទៅលើដំណាក់កាលនៃការប្រមូលទិន្នន័យ និងការដំណើរការក្បួនដោះស្រាយ ដើម្បីកំណត់ប្រភពនៃបញ្ហា និងស្នើដំណោះស្រាយ។

ការវិភាគប្រភពនៃភាពលំអៀង (Analysis of Bias Sources) នៅតាមដំណាក់កាលប្រមូលទិន្នន័យ ការវិភាគ និងចំណាត់ថ្នាក់
ការពិនិត្យមើលរង្វាស់បច្ចេកទេស (Technical Metrics) ដូចជា ABROCA និង MADD ដើម្បីវាយតម្លៃភាពសមធម៌នៃគំរូ AI
ការស្នើឡើងនូវក្របខណ្ឌ TPCEK (Technological Pedagogical Content Ethical Knowledge) សម្រាប់អភិវឌ្ឍសមត្ថភាពគ្រូបង្រៀន

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ប្រព័ន្ធ AI អាចបង្កើតភាពលំអៀងតាមរយៈទិន្នន័យប្រវត្តិសាស្ត្រដែលមិនមានតុល្យភាព និងក្បួនដោះស្រាយ (Algorithms) ដែលអាចធ្វើឱ្យសិស្សក្នុងក្រុមភាគតិច ឬក្រុមងាយរងគ្រោះទទួលបានលទ្ធផលសិក្សាមិនល្អ។
ដំណោះស្រាយបច្ចេកទេសរួមមានការធានានូវភាពសម្បូរបែបនៃទិន្នន័យ (Data Diversity), ការប្រើប្រាស់ការយកគំរូតាមទម្ងន់ (Weighted Sampling), និងការកែតម្រូវគំរូ AI ដើម្បីកាត់បន្ថយភាពលំអៀង។
គ្រូបង្រៀនដើរតួនាទីយ៉ាងសំខាន់ក្នុងការរក្សាសមធម៌ ហើយចាំបាច់ត្រូវមានសមត្ថភាពផ្នែកសីលធម៌ AI (AI Ethics) ដើម្បីត្រួតពិនិត្យ និងធ្វើអន្តរាគមន៍លើលទ្ធផលដែលផ្តល់ដោយប្រព័ន្ធ AI។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Standard AI Model Training (Baseline) ការបណ្តុះបណ្តាលគំរូ AI តាមស្តង់ដារ (មិនមានការកែតម្រូវភាពលំអៀង)	មានប្រសិទ្ធភាពខ្ពស់ក្នុងការបង្កើតការព្យាករណ៍សម្រាប់ក្រុមដែលមានទិន្នន័យច្រើន (Majority Groups) និងងាយស្រួលក្នុងការអនុវត្ត។	ងាយនឹងមានបញ្ហា Overfitting និងបង្កើតលទ្ធផលលំអៀងខ្លាំងចំពោះក្រុមភាគតិច ឬក្រុមដែលមានទិន្នន័យមិនគ្រប់គ្រាន់។	បង្កើតឱ្យមានវិសមភាពក្នុងការអប់រំ ដោយផ្តល់លទ្ធផលមិនសុក្រឹតចំពោះសិស្សដែលមកពីតំបន់ដាច់ស្រយាល ឬមានប្រវត្តិមិនសូវល្អ។
Data Balancing & Reweighting (e.g., Weighted Sampling) ការថ្លឹងថ្លែងទិន្នន័យ និងការយកគំរូតាមទម្ងន់ (Weighted Sampling)	ជួយកាត់បន្ថយភាពលំអៀងដោយផ្តល់ទម្ងន់បន្ថែមដល់ទិន្នន័យនៃក្រុមភាគតិច ធ្វើឱ្យគំរូ AI មានភាពយុត្តិធម៌ជាងមុន។	ទាមទារឱ្យមានការរៀបចំទិន្នន័យ (Data Preprocessing) ដ៏ស្មុគស្មាញ និងអាចកាត់បន្ថយភាពត្រឹមត្រូវជារួម (Overall Accuracy) ប្រសិនបើមិនបានធ្វើតេស្តត្រឹមត្រូវ។	ធ្វើឱ្យប្រសើរឡើងនូវរង្វាស់សមធម៌ (Equity Metrics) ដូចជា ABROCA និង MADD។
Human-in-the-loop (TPCEK Framework) ការដាក់បញ្ចូលមនុស្សក្នុងដំណើរការ (ក្របខណ្ឌ TPCEK សម្រាប់គ្រូបង្រៀន)	អនុញ្ញាតឱ្យគ្រូបង្រៀនប្រើប្រាស់ការវិនិច្ឆ័យប្រកបដោយក្រមសីលធម៌ ដើម្បីកែតម្រូវលទ្ធផលដែលផ្តល់ដោយ AI ឱ្យស្របតាមបរិបទជាក់ស្តែងរបស់សិស្ស។	ទាមទារពេលវេលា និងការបណ្តុះបណ្តាលគ្រូបង្រៀនយ៉ាងខ្លាំងក្លាលើផ្នែកសីលធម៌ AI និងបច្ចេកវិទ្យា។	ធានាបាននូវសមធម៌នៃការអប់រំតាមរយៈការអន្តរាគមន៍របស់គ្រូ មិនពឹងផ្អែកទាំងស្រុងលើបច្ចេកវិទ្យា។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សាមិនបានបញ្ជាក់ពីតម្លៃជាទឹកប្រាក់ទេ ប៉ុន្តែបានសង្កត់ធ្ងន់លើតម្រូវការធនធានទិន្នន័យ និងធនធានមនុស្សយ៉ាងច្រើន។

Data Infrastructure: ត្រូវការទិន្នន័យដែលមានគុណភាពខ្ពស់ និងសម្បូរបែប (Diverse Datasets) ដែលតំណាងឱ្យគ្រប់ក្រុមសិស្ស រួមទាំងសិស្សនៅជនបទ និងសិស្សដែលមានសមត្ថភាពខុសៗគ្នា។
Human Capital: ការបណ្តុះបណ្តាលគ្រូបង្រៀនតាមក្របខណ្ឌ TPCEK (Technological Pedagogical Content Ethical Knowledge) ដើម្បីឱ្យពួកគេយល់ពីរបៀបប្រើប្រាស់ និងត្រួតពិនិត្យ AI។
Computational Power: ត្រូវការកម្លាំងកុំព្យូទ័រសម្រាប់ការបណ្តុះបណ្តាលគំរូ AI ឡើងវិញ (Retraining) ជាមួយបច្ចេកទេសកាត់បន្ថយភាពលំអៀង។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងក្នុងបរិបទនៃប្រទេសកូរ៉េខាងត្បូង ដោយផ្តោតលើការរៀបចំសម្រាប់សៀវភៅសិក្សាឌីជីថល AI (AIDT)។ វាមានសារៈសំខាន់សម្រាប់កម្ពុជា ព្រោះប្រព័ន្ធ AI ដែលប្រើប្រាស់ទិន្នន័យបរទេសអាចនឹងមិនដំណើរការល្អ ឬមានភាពលំអៀងចំពោះសិស្សកម្ពុជា ជាពិសេសទាក់ទងនឹងភាសា និងបរិបទវប្បធម៌។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រ និងការរកឃើញនៅក្នុងការសិក្សានេះ មានប្រយោជន៍យ៉ាងខ្លាំងសម្រាប់អ្នករៀបចំគោលនយោបាយអប់រំនៅកម្ពុជា ដើម្បីត្រៀមខ្លួនទទួលយកបច្ចេកវិទ្យា AI។

Ministry of Education (MoEYS): ក្រសួងអប់រំអាចប្រើប្រាស់ក្របខណ្ឌនេះដើម្បីវាយតម្លៃឧបករណ៍ EdTech មុននឹងអនុញ្ញាតឱ្យប្រើប្រាស់នៅតាមសាលារៀនរដ្ឋ ដើម្បីជៀសវាងការរើសអើងសិស្សក្រីក្រ ឬសិស្សនៅតំបន់ដាច់ស្រយាល។
Khmer Language AI Development: អ្នកអភិវឌ្ឍន៍កម្មវិធីសិក្សានៅកម្ពុជាត្រូវប្រុងប្រយ័ត្នចំពោះទិន្នន័យបណ្តុះបណ្តាល (Training Data) ដើម្បីធានាថាវាគ្របដណ្តប់លើគ្រាមភាសា និងកម្រិតចំណេះដឹងផ្សេងៗគ្នារបស់សិស្សខ្មែរ។
Teacher Training Centers (TEC): ការបញ្ចូលចំណេះដឹងអំពីសីលធម៌ AI (AI Ethics) ទៅក្នុងកម្មវិធីបណ្តុះបណ្តាលគ្រូនៅកម្ពុជា គឺជារឿងចាំបាច់ដើម្បីឱ្យគ្រូអាចប្រើប្រាស់បច្ចេកវិទ្យាប្រកបដោយប្រសិទ្ធភាព។

ការអនុវត្តតាមអនុសាសន៍នៃការសិក្សានេះនឹងជួយឱ្យកម្ពុជាកាត់បន្ថយគម្លាតឌីជីថល (Digital Divide) និងធានាថាសិស្សគ្រប់រូបទទួលបានផលប្រយោជន៍ស្មើគ្នាក្នុងយុគសម័យ AI។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាអំពីភាពលំអៀងនៃទិន្នន័យ (Understand Data Bias): និស្សិត ឬអ្នកស្រាវជ្រាវគួរចាប់ផ្តើមដោយការសិក្សាអំពីប្រភេទនៃភាពលំអៀងក្នុង AI ដូចជា Representation Bias និង Measurement Bias ដោយប្រើប្រាស់ឯកសារយោងដូចជា (Baker & Hawn, 2022)។
វាយតម្លៃទិន្នន័យក្នុងស្រុក (Evaluate Local Datasets): ធ្វើការសាកល្បងលើទិន្នន័យអប់រំដែលមានស្រាប់នៅកម្ពុជា ដើម្បីមើលថាតើទិន្នន័យនោះតំណាងឱ្យសិស្សនៅតំបន់ជនបទ និងទីក្រុងបានស្មើគ្នាដែរឬទេ ដោយប្រើបច្ចេកទេសវិភាគស្ថិតិ។
អនុវត្តរង្វាស់សមធម៌ (Implement Equity Metrics): សាកល្បងប្រើប្រាស់រង្វាស់ដូចជា (ABROCA) ឬ (MADD) ទៅលើគំរូ AI សាមញ្ញមួយ ដើម្បីវាស់វែងភាពខុសគ្នានៃការអនុវត្តរវាងក្រុមសិស្សផ្សេងៗគ្នា។
អភិវឌ្ឍន៍គោលការណ៍ណែនាំសម្រាប់គ្រូ (Develop Guidelines): បង្កើតសៀវភៅណែនាំសាមញ្ញមួយសម្រាប់គ្រូបង្រៀនអំពីរបៀបសម្គាល់កំហុស ឬភាពលំអៀងនៅក្នុងប្រព័ន្ធ AI ដែលពួកគេប្រើប្រាស់ក្នុងថ្នាក់រៀន ដោយផ្អែកលើគំរូ (TPCEK)។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Knowledge Tracing	ជាវិធីសាស្ត្រដែល AI ប្រើប្រាស់ដើម្បីតាមដាន និងធ្វើបច្ចុប្បន្នភាពស្ថានភាពចំណេះដឹងរបស់សិស្សជាបន្តបន្ទាប់ ដោយផ្អែកលើចម្លើយ និងសកម្មភាពរបស់ពួកគេ ដើម្បីទស្សន៍ទាយសមត្ថភាពនាពេលអនាគត។	ដូចជាគ្រូពេទ្យដែលតាមដានសុខភាពអ្នកជំងឺជាប្រចាំ ដើម្បីដឹងថាត្រូវផ្តល់ថ្នាំអ្វីបន្តទៀត។
Algorithmic Bias	កំហុសជាប្រព័ន្ធនៅក្នុងកុំព្យូទ័រដែលបង្កើតលទ្ធផលមិនយុត្តិធម៌ ដោយផ្តល់ផលប្រយោជន៍ដល់ក្រុមមួយ និងធ្វើឱ្យប៉ះពាល់ដល់ក្រុមមួយទៀត (ឧទាហរណ៍៖ AI វាយតម្លៃសិស្សនៅទីក្រុងបានល្អជាងសិស្សជនបទ ដោយសារទិន្នន័យបង្រៀន)។	ប្រៀបដូចជាអាជ្ញាកណ្តាលម្នាក់ដែលកាត់សេចក្តីលំអៀងទៅខាងក្រុមដែលខ្លួនស្គាល់ច្បាស់ និងមិនអើពើចំពោះក្រុមដែលខ្លួនមិនសូវស្គាល់។
Feedback Loop	ដំណើរការដែលលទ្ធផលនៃប្រព័ន្ធ AI ត្រូវបានប្រើប្រាស់ត្រឡប់មកវិញជាទិន្នន័យបញ្ចូល ដែលអាចធ្វើឱ្យភាពលំអៀងកាន់តែធ្ងន់ធ្ងរឡើងៗតាមពេលវេលា (ឧទាហរណ៍៖ AI គិតថាសិស្សខ្សោយ -> ផ្តល់លំហាត់ងាយ -> សិស្សមិនរីកចម្រើន -> AI កាន់តែជឿថាសិស្សខ្សោយ)។	ដូចជាការយកមីក្រូហ្វូនទៅដាក់ជិតធុងបាស ដែលធ្វើឱ្យសំឡេងរំខានកាន់តែលាន់ខ្លាំងឡើងៗដោយសារសំឡេងវិលត្រឡប់ចូលមីក្រូវិញ។
Overfitting	ស្ថានភាពដែលគំរូ AI រៀនលម្អិតពេកពីទិន្នន័យបណ្តុះបណ្តាល (Training Data) រហូតដល់ចងចាំទាំងចំណុចមិនសំខាន់ ធ្វើឱ្យវាមិនអាចដំណើរការបានល្អជាមួយទិន្នន័យថ្មី ឬសិស្សដែលមិនធ្លាប់ជួបពីមុន។	ដូចជាសិស្សដែលទន្ទេញចម្លើយនៃវិញ្ញាសាចាស់ៗយ៉ាងស្ទាត់ ប៉ុន្តែធ្លាក់ពេលប្រឡងពិតប្រាកដ ដោយសារសំណួរត្រូវបានកែប្រែទម្រង់បន្តិច។
Weighted Sampling	បច្ចេកទេសស្ថិតិដែលផ្តល់ "ទម្ងន់" ឬសារៈសំខាន់បន្ថែមទៅលើទិន្នន័យនៃក្រុមភាគតិច (Underrepresented Groups) ក្នុងអំឡុងពេលបណ្តុះបណ្តាល AI ដើម្បីកុំឱ្យ AI មើលរំលងក្រុមនោះ។	ដូចជាការប្រើឧបករណ៍បំពងសំឡេងឱ្យមនុស្សដែលមានសំឡេងតិច នៅក្នុងបន្ទប់ដែលមានមនុស្សនិយាយគ្នាច្រើន ដើម្បីឱ្យគេអាចស្តាប់ឮសំឡេងគាត់ស្មើនឹងអ្នកដទៃ។
TPCEK (Technological Pedagogical Content Ethical Knowledge)	ក្របខណ្ឌសមត្ថភាពគ្រូបង្រៀនដែលបន្ថែមផ្នែក "សីលធម៌" (Ethical) ទៅលើចំណេះដឹងបច្ចេកវិទ្យា និងគរុកោសល្យ ដើម្បីធានាថាគ្រូអាចប្រើប្រាស់ AI ដោយការទទួលខុសត្រូវ និងយុត្តិធម៌។	ដូចជាអ្នកបើកបរដែលមិនត្រឹមតែចេះបើកឡាន (បច្ចេកទេស) និងចេះច្បាប់ចរាចរណ៍ (ខ្លឹមសារ) ប៉ុណ្ណោះទេ ថែមទាំងមានចិត្តធម៌ចេះប្រយ័ត្នអ្នកថ្មើរជើង (សីលធម៌)។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖