Original Title: การสร้างแบบทดสอบความรู้เชิงสหวิทยาการ ตามแนวคิดการเรียนรู้ในศตวรรษที่ 21 ของนักเรียนระดับมัธยมศึกษาตอนปลาย
Source: buuir.buu.ac.th
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការបង្កើតការធ្វើតេស្តចំណេះដឹងអន្តរកម្មសិក្សាដោយផ្អែកលើគំនិតនៃការរៀនសូត្រសតវត្សទី២១ របស់សិស្សមធ្យមសិក្សាទុតិយភូមិ

ចំណងជើងដើម៖ การสร้างแบบทดสอบความรู้เชิงสหวิทยาการ ตามแนวคิดการเรียนรู้ในศตวรรษที่ 21 ของนักเรียนระดับมัธยมศึกษาตอนปลาย

អ្នកនិពន្ធ៖ Awasda Kitsoun (Burapha University)

ឆ្នាំបោះពុម្ព៖ 2020

វិស័យសិក្សា៖ Education and Cognitive Science

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការស្រាវជ្រាវនេះដោះស្រាយពីកង្វះខាតនូវឧបករណ៍វាយតម្លៃស្តង់ដារ ដើម្បីវាស់ស្ទង់ចំណេះដឹងអន្តរកម្មសិក្សា (Interdisciplinary knowledge) ដែលស្របតាមគំនិតនៃការរៀនសូត្រនៅសតវត្សទី២១ សម្រាប់សិស្សមធ្យមសិក្សាទុតិយភូមិនៅប្រទេសថៃ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់វិធីសាស្ត្រស្រាវជ្រាវបែបអង្កេត ដោយប្រមូលទិន្នន័យពីសិស្សចំនួន ១,០៣២ នាក់តាមរយៈការជ្រើសរើសគំរូពហុដំណាក់កាល និងប្រើប្រាស់កម្មវិធី LISREL 8.7 សម្រាប់ការវិភាគ។

ការរចនាតេស្តចំណេះដឹងចំនួន ១៩ សំណួរ គ្របដណ្តប់លើវិស័យចំនួន ៥ (Test Design)
ការសាកល្បងភាពត្រឹមត្រូវនៃខ្លឹមសារ និងភាពជឿជាក់ (Content Validity & Reliability Testing)
ការវិភាគកត្តាបញ្ជាក់ (Confirmatory Factor Analysis - CFA)
ការបង្កើតបទដ្ឋានតេស្តតាមកម្រិត (Norms Establishment)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

តេស្តដែលត្រូវបានបង្កើតឡើងមានសំណួរចំនួន ១៩ ដែលមានភាពត្រឹមត្រូវនៃខ្លឹមសារខ្ពស់ជាង .៧០ គ្រប់សំណួរ និងមានភាពជឿជាក់សរុប (Reliability) ស្មើនឹង .៧១០។
ការវិភាគកត្តាបញ្ជាក់ (CFA) បានបង្ហាញថារចនាសម្ព័ន្ធនៃតេស្តដែលបែងចែកជា ៥ វិស័យ (ដូចជាការយល់ដឹងពីពិភពលោក និងចំណេះដឹងផ្នែកហិរញ្ញវត្ថុ) មានភាពស៊ីចង្វាក់គ្នា និងត្រឹមត្រូវក្នុងកម្រិតខ្ពស់។
បទដ្ឋានសម្រាប់វាស់ស្ទង់ត្រូវបានបែងចែកជា ៣ កម្រិត (Stanines) រួមមាន កម្រិតខ្ពស់ (៧-៩) កម្រិតមធ្យម (៤-៦) និងកម្រិតទាប (១-៣)។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Index of Item-Objective Congruence (IOC) ការវាស់ស្ទង់ភាពត្រឹមត្រូវនៃខ្លឹមសារដោយអ្នកជំនាញ (IOC)	ងាយស្រួលក្នុងការគណនា និងផ្តល់ភាពច្បាស់លាស់ពីអ្នកជំនាញថាតើសំណួរពិតជាវាស់ស្ទង់ចំគោលដៅឬទេ។	ពឹងផ្អែកលើគំនិត និងការវិនិច្ឆ័យរបស់អ្នកជំនាញសុទ្ធសាធ ដែលជួនកាលអាចមានភាពលំអៀង។	សំណួរចំនួន ៣០ ទទួលបានពិន្ទុ IOC ពី ០.៥០ ដល់ ១.០០ ដែលចាត់ទុកថាអាចទទួលយកបានសម្រាប់ការសាកល្បងបន្ត។
Confirmatory Factor Analysis (CFA) ការវិភាគកត្តាបញ្ជាក់ (CFA) ដោយប្រើកម្មវិធី LISREL	បង្ហាញយ៉ាងច្បាស់ពីរចនាសម្ព័ន្ធនៃអថេរ និងបញ្ជាក់ពីទំនាក់ទំនងនៃទ្រឹស្តីជាមួយនឹងទិន្នន័យជាក់ស្តែងតាមបែបស្ថិតិ។	ទាមទារទំហំគំរូធំ (អ្នកចូលរួមច្រើន) និងចំណេះដឹងស្ថិតិកម្រិតខ្ពស់ដើម្បីដំណើរការកម្មវិធី និងបកស្រាយលទ្ធផល។	ម៉ូដែលតេស្តមានភាពស៊ីចង្វាក់គ្នាខ្ពស់ជាមួយនឹងទិន្នន័យជាក់ស្តែង (Chi-square=99.77, p=0.067, RMSEA=0.015) ដោយរក្សាទុកសំណួរចំនួន ១៩។
Stanine Norms ការបង្កើតបទដ្ឋានតេស្តតាមប្រព័ន្ធ Stanine	ងាយស្រួលបែងចែកកម្រិតសមត្ថភាពសិស្សជាក្រុមច្បាស់លាស់ ដោយផ្អែកលើខ្សែកោងធម្មតា (Normal Distribution)។	ការបែងចែកជាក្រុមទូលំទូលាយពេក មិនអាចបង្ហាញពីពិន្ទុពិតប្រាកដ ឬកម្រិតលម្អិតជាក់លាក់របស់សិស្សម្នាក់ៗនោះទេ។	បែងចែកកម្រិតចំណេះដឹងសិស្សជា ៣ ក្រុម៖ ទាប (ពិន្ទុ ០-៨), មធ្យម (៩-១៤), និងខ្ពស់ (១៥-១៩)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារការប្រមូលទិន្នន័យពីសិស្សចំនួនច្រើន គួបផ្សំនឹងការប្រើប្រាស់កម្មវិធីស្ថិតិកម្រិតខ្ពស់ដើម្បីវិភាគ និងផ្ទៀងផ្ទាត់រចនាសម្ព័ន្ធនៃតេស្ត។

Dataset: ទិន្នន័យបានមកពីសិស្សថ្នាក់ទី១២ ចំនួន ១,០៣២ នាក់ មកពីសាលារៀនចំនួន ១២ ក្នុងខេត្តចំនួន ៤ នៃភូមិភាគខាងកើតប្រទេសថៃ។
Software: កម្មវិធី LISREL 8.7 សម្រាប់ការវិភាគកត្តាបញ្ជាក់ (CFA) និងកម្មវិធី SPSS សម្រាប់គណនាស្ថិតិពិពណ៌នា។
Hardware: កុំព្យូទ័រស្ដង់ដារទូទៅដែលអាចដំណើរការកម្មវិធីស្ថិតិ និងផ្ទុកទិន្នន័យលើសពី ១០០០ ជួរ។
Expertise: អ្នកជំនាញផ្នែកចិត្តមាត្រ (Psychometrics) ចំនួន ៣រូប ដើម្បីវាយតម្លៃសុពលភាពខ្លឹមសារ (IOC) និងអ្នកស្រាវជ្រាវដែលមានជំនាញស្ថិតិ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងទៅលើសិស្សថ្នាក់ទី១២ នៅក្នុងខេត្តចំនួន៤ នៃភូមិភាគខាងកើតប្រទេសថៃ ដែលជាតំបន់ឧស្សាហកម្ម និងសេដ្ឋកិច្ច។ ទិន្នន័យ និងខ្លឹមសារតេស្តមានភាពលំអៀងទៅរកបរិបទសង្គម-សេដ្ឋកិច្ចរបស់ថៃ (ឧទាហរណ៍ ការបញ្ចូលទស្សនវិជ្ជាសេដ្ឋកិច្ចគ្រប់គ្រាន់)។ សម្រាប់ប្រទេសកម្ពុជា ការចម្លងតេស្តនេះដោយផ្ទាល់អាចនឹងមិនឆ្លុះបញ្ចាំងពីការពិតទេ ដោយសារភាពខុសគ្នានៃកម្មវិធីសិក្សា បរិបទសង្គម និងភូមិសាស្ត្រនយោបាយ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាខ្លឹមសារសំណួរខ្លះត្រូវកែសម្រួលក៏ដោយ វិធីសាស្ត្ររចនា និងវាយតម្លៃគុណភាពតេស្ត (Test Construction & Validation) នេះ មានប្រយោជន៍ខ្លាំងណាស់សម្រាប់ការអភិវឌ្ឍប្រព័ន្ធវាស់ស្ទង់វិស័យអប់រំនៅកម្ពុជា។

នាយកដ្ឋានធានាគុណភាពអប់រំ នៃក្រសួងអប់រំ យុវជន និងកីឡា (MoEYS): អាចប្រើប្រាស់ក្របខ័ណ្ឌនៃការវិភាគកត្តាបញ្ជាក់ (CFA) នេះ ដើម្បីបង្កើតតេស្តស្តង់ដារជាតិ វាស់ស្ទង់បំណិនសតវត្សទី២១ (PISA-like tests) របស់សិស្សកម្ពុជាឲ្យមានសុពលភាពត្រឹមត្រូវ។
វិទ្យាស្ថានជាតិអប់រំ (NIE) និង សាកលវិទ្យាល័យភូមិន្ទភ្នំពេញ (RUPP): អាចបញ្ចូលនីតិវិធីនៃការរចនាតេស្តនេះ ទៅក្នុងកម្មវិធីបណ្តុះបណ្តាលគរុកោសល្យ ដើម្បីឲ្យគ្រូបង្រៀនថ្មីៗចេះបង្កើតឧបករណ៍វាស់ស្ទង់អន្តរកម្មសិក្សា ដែលឆ្លងកាត់ការធ្វើតេស្តភាពជឿជាក់ (Reliability) និងភាពលំបាកនៃសំណួរ (Difficulty Index)។
សាលារៀនជំនាន់ថ្មី (New Generation Schools - NGS): អាចយកទម្រង់នៃការវាយតម្លៃចំណេះដឹងទាំង ៥ វិស័យ (ដូចជាបរិស្ថាន ហិរញ្ញវត្ថុ ពលរដ្ឋវិជ្ជា) ទៅអនុវត្តផ្ទាល់តាមរយៈការបង្រៀនបែប Project-Based Learning ដើម្បីតាមដានសមត្ថភាពសិស្ស។

សរុបមក ការអនុវត្តវិធីសាស្ត្របង្កើតតេស្តតាមស្តង់ដារនេះ នឹងជួយប្រព័ន្ធអប់រំកម្ពុជាផ្លាស់ប្តូរពីការវាយតម្លៃផ្អែកលើការទន្ទេញចាំមាត់ ទៅជាការវាស់ស្ទង់បំណិនគិតកម្រិតខ្ពស់ដែលស្របតាមទីផ្សារការងារសតវត្សទី២១ជាក់ស្តែង។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះទ្រឹស្តីវាស់ស្ទង់អប់រំ: អ្នកស្រាវជ្រាវត្រូវស្វែងយល់ស៊ីជម្រៅអំពីទ្រឹស្តី Bloom's Taxonomy កំណែថ្មី ក្របខ័ណ្ឌជំនាញសតវត្សទី២១ និងគោលការណ៍នៃការវាស់ស្ទង់ចិត្តមាត្រ (Psychometrics) ដូចជាសុពលភាព (Validity) និងភាពជឿជាក់ (Reliability)។
រៀនប្រើប្រាស់កម្មវិធីស្ថិតិ: ត្រូវអនុវត្តការប្រើប្រាស់កម្មវិធី SPSS សម្រាប់វិភាគស្ថិតិពិពណ៌នា (កម្រិតភាពលំបាក និងអំណាចរើសអើងនៃសំណួរ) និងកម្មវិធីដូចជា LISREL ឬ AMOS សម្រាប់ការវិភាគកត្តាបញ្ជាក់ (Confirmatory Factor Analysis - CFA)។
អនុវត្តការរចនាតេស្ត និងវាយតម្លៃដោយអ្នកជំនាញ (IOC): សាកល្បងបង្កើតតេស្តអន្តរកម្មសិក្សាដោយខ្លួនឯង រួចអញ្ជើញអ្នកជំនាញយ៉ាងតិច ៣រូប ដើម្បីវាយតម្លៃភាពត្រឹមត្រូវនៃខ្លឹមសារ (Index of Item-Objective Congruence - IOC) ដោយសំណួរត្រូវមានពិន្ទុចាប់ពី ០.៥០ ឡើងទៅ។
ការប្រមូលទិន្នន័យសាកល្បង (Pilot Testing): យកតេស្តដែលបានកែសម្រួលទៅសាកល្បងជាមួយសិស្សវិទ្យាល័យ (ឧទាហរណ៍៖ សិស្សថ្នាក់ទី១២ នៅសាលាណាមួយក្នុងរាជធានីភ្នំពេញ) ក្នុងចំនួនគំរូប្រមាណ ៣០ ទៅ ៥០នាក់ ដើម្បីរកតម្លៃ Cronbach's Alpha (ត្រូវធំជាង ០.៧០)។
ការវិភាគទិន្នន័យធំ និងការបង្កើតបទដ្ឋាន (Norming): ប្រមូលទិន្នន័យពីសិស្សលើសពី ៤០០នាក់ រួចប្រើប្រាស់ CFA ដើម្បីបញ្ជាក់រចនាសម្ព័ន្ធតេស្ត។ បន្ទាប់មក បំប្លែងពិន្ទុឆៅទៅជាពិន្ទុ Stanine (១ ដល់ ៩) ដើម្បីបង្កើតបទដ្ឋានវាយតម្លៃថ្នាក់ជាតិ ឬថ្នាក់តំបន់។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Confirmatory Factor Analysis	គឺជាវិធីសាស្ត្រស្ថិតិកម្រិតខ្ពស់ដែលត្រូវបានប្រើប្រាស់ដើម្បីផ្ទៀងផ្ទាត់ថាតើទិន្នន័យដែលប្រមូលបានពិតជាស្របទៅនឹងរចនាសម្ព័ន្ធនៃទ្រឹស្តីដែលបានកំណត់ទុកជាមុនឬយ៉ាងណា។ នៅក្នុងការស្រាវជ្រាវនេះ វាជួយបញ្ជាក់ថា តើសំណួរនីមួយៗពិតជាវាស់ស្ទង់ចំអថេរ (ដូចជាចំណេះដឹងផ្នែកហិរញ្ញវត្ថុ ឬបរិស្ថាន) ដែលយើងចង់វាស់មែនឬទេ។	ដូចជាការយកប្លង់ផ្ទះដែលបានគូររួច (ទ្រឹស្តី) ទៅផ្ទៀងផ្ទាត់ជាមួយផ្ទះដែលបានសាងសង់រួច (ទិន្នន័យជាក់ស្តែង) ថាតើវាដូចគ្នាឬអត់។
Index of item objective congruence	ជារង្វាស់ដែលប្រើដើម្បីវាយតម្លៃសុពលភាពខ្លឹមសារនៃសំណួរប្រឡង (Content Validity) ដោយពឹងផ្អែកលើការដាក់ពិន្ទុរបស់អ្នកជំនាញ ដើម្បីបញ្ជាក់ថាសំណួរនីមួយៗពិតជាវាស់ស្ទង់ចំគោលបំណងនៃការសិក្សាដែលបានកំណត់មែន ដោយសំណួរដែលទទួលយកបានត្រូវមានពិន្ទុចាប់ពី ០.៥០ ឡើងទៅ។	ដូចជាការអញ្ជើញចុងភៅជំនាញ៣នាក់មកភ្លក់ម្ហូប ដើម្បីបញ្ជាក់ថាតើមុខម្ហូបនេះពិតជាមានរសជាតិត្រូវតាមរូបមន្តដើមឬទេ។
Stannine Norm	ជាប្រព័ន្ធនៃការពិន្ទុស្តង់ដារដែលបែងចែកលទ្ធផលនៃការធ្វើតេស្តជា៩កម្រិត (ពី១ដល់៩) ដោយផ្អែកលើខ្សែកោងរបាយធម្មតា (Normal Distribution) ដើម្បីងាយស្រួលប្រៀបធៀបសមត្ថភាពសិស្សថានរណាស្ថិតក្នុងកម្រិតខ្ពស់ មធ្យម ឬទាប បើធៀបនឹងក្រុមទាំងមូល។	ដូចជាការតម្រៀបសិស្ស១០០នាក់តាមពិន្ទុ រួចកាត់បែងចែកពួកគេជា៩ក្រុមធំៗ ដើម្បីងាយស្រួលចំណាត់ថ្នាក់កម្រិតសមត្ថភាព។
Discrimination	ជាសូចនាករស្ថិតិ (អំណាចរើសអើង) ដែលបង្ហាញពីសមត្ថភាពរបស់សំណួរប្រឡងនីមួយៗ ក្នុងការបែងចែករវាងសិស្សដែលរៀនពូកែ (ក្រុមពិន្ទុខ្ពស់សរុប) និងសិស្សដែលរៀនខ្សោយ (ក្រុមពិន្ទុទាបសរុប)។ សំណួរល្អ គឺសិស្សពូកែឆ្លើយត្រូវ ចំណែកសិស្សខ្សោយឆ្លើយខុស។	ដូចជាសំណាញ់រែងត្រីដែលអាចបែងចែកយ៉ាងច្បាស់រវាងត្រីធំ (សិស្សពូកែ) និងត្រីតូច (សិស្សខ្សោយ)។
Difficulty index	ជាតម្លៃស្ថិតិដែលគណនាពីភាគរយនៃសិស្សដែលឆ្លើយត្រូវលើសំណួរនីមួយៗ ដើម្បីដឹងថាសំណួរនោះងាយពេក លំបាកពេក ឬល្មម។ សំណួរដែលល្អជាទូទៅគួរតែមានសិស្សឆ្លើយត្រូវប្រហែលពាក់កណ្តាលនៃសិស្សសរុប (ចន្លោះ ០.២០ ទៅ ០.៨០)។	ដូចជារបារលោតកម្ពស់ បើដាក់ទាបពេកលោតផុតគ្រប់គ្នា បើដាក់ខ្ពស់ពេកគ្មានអ្នកលោតរួច ដូច្នេះត្រូវដាក់កម្ពស់ល្មមទើបដឹងថានរណាមានសមត្ថភាពពិត។
Interdisciplinary	ជាការរៀនសូត្រ ឬការវាយតម្លៃដែលទាញយកចំណេះដឹងពីមុខវិជ្ជាផ្សេងៗគ្នាជាច្រើន (ដូចជាវិទ្យាសាស្ត្រ សេដ្ឋកិច្ច សង្គមវិជ្ជា) មកបន្ស៊ីគ្នា ដើម្បីដោះស្រាយបញ្ហាស្មុគស្មាញណាមួយក្នុងជីវិតពិត ដែលមិនអាចដោះស្រាយបានដោយប្រើចំណេះដឹងត្រឹមមុខវិជ្ជាតែមួយ។	ដូចជាការចម្អិនម្ហូបមួយមុខដែលត្រូវប្រើគ្រឿងទេសចម្រុះមុខបញ្ចូលគ្នា ទើបចេញជារសជាតិឆ្ងាញ់ពេញលេញដែលអាចញ៉ាំបាន។
Measurement Error	ជាភាពលំអៀង ឬកំហុសនៃភាពខុសគ្នារវាងពិន្ទុពិតប្រាកដដែលសិស្សគួរទទួលបាន និងពិន្ទុដែលវាស់ស្ទង់បានជាក់ស្តែងចេញពីការធ្វើតេស្ត ដោយសារតែកត្តារំខានផ្សេងៗដូចជា សំណួរមិនច្បាស់លាស់ សិស្សទាយចម្លើយ ឬបញ្ហាក្នុងការប្រមូលទិន្នន័យ។	ដូចជាការថ្លឹងទម្ងន់នៅលើជញ្ជីងដែលខូច ដែលធ្វើឱ្យទម្ងន់ដែលបង្ហាញមិនមែនជាទម្ងន់ពិតប្រាកដរបស់អ្នក។
Root Mean Squared Error of Approximation	ហៅកាត់ថា RMSEA ជាសូចនាករមួយក្នុង CFA ដែលប្រើសម្រាប់វាស់ស្ទង់កម្រិតនៃកំហុស ឬភាពមិនស៊ីចង្វាក់គ្នារវាងម៉ូដែលទ្រឹស្តី និងទិន្នន័យជាក់ស្តែង។ តម្លៃកាន់តែតូច (ជាទូទៅតូចជាង ០.០៧) បង្ហាញថាម៉ូដែលនោះកាន់តែមានភាពត្រឹមត្រូវខ្ពស់។	ដូចជាការវាស់ទំហំខោអាវដែលកាត់រួចធៀបនឹងទំហំខ្លួនពិតប្រាកដ បើភាពខុសគ្នាកាន់តែតិច មានន័យថាខោអាវនោះកាត់បានកាន់តែត្រឹមត្រូវល្អ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖