Original Title: การสร้างแบบทดสอบความรู้เชิงสหวิทยาการ ตามแนวคิดการเรียนรู้ในศตวรรษที่ 21 ของนักเรียนระดับมัธยมศึกษาตอนปลาย
Source: buuir.buu.ac.th
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការបង្កើតការធ្វើតេស្តចំណេះដឹងអន្តរកម្មសិក្សាដោយផ្អែកលើគំនិតនៃការរៀនសូត្រសតវត្សទី២១ របស់សិស្សមធ្យមសិក្សាទុតិយភូមិ

ចំណងជើងដើម៖ การสร้างแบบทดสอบความรู้เชิงสหวิทยาการ ตามแนวคิดการเรียนรู้ในศตวรรษที่ 21 ของนักเรียนระดับมัธยมศึกษาตอนปลาย

អ្នកនិពន្ធ៖ Awasda Kitsoun (Burapha University)

ឆ្នាំបោះពុម្ព៖ 2020

វិស័យសិក្សា៖ Education and Cognitive Science

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការស្រាវជ្រាវនេះដោះស្រាយពីកង្វះខាតនូវឧបករណ៍វាយតម្លៃស្តង់ដារ ដើម្បីវាស់ស្ទង់ចំណេះដឹងអន្តរកម្មសិក្សា (Interdisciplinary knowledge) ដែលស្របតាមគំនិតនៃការរៀនសូត្រនៅសតវត្សទី២១ សម្រាប់សិស្សមធ្យមសិក្សាទុតិយភូមិនៅប្រទេសថៃ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់វិធីសាស្ត្រស្រាវជ្រាវបែបអង្កេត ដោយប្រមូលទិន្នន័យពីសិស្សចំនួន ១,០៣២ នាក់តាមរយៈការជ្រើសរើសគំរូពហុដំណាក់កាល និងប្រើប្រាស់កម្មវិធី LISREL 8.7 សម្រាប់ការវិភាគ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Index of Item-Objective Congruence (IOC)
ការវាស់ស្ទង់ភាពត្រឹមត្រូវនៃខ្លឹមសារដោយអ្នកជំនាញ (IOC)
ងាយស្រួលក្នុងការគណនា និងផ្តល់ភាពច្បាស់លាស់ពីអ្នកជំនាញថាតើសំណួរពិតជាវាស់ស្ទង់ចំគោលដៅឬទេ។ ពឹងផ្អែកលើគំនិត និងការវិនិច្ឆ័យរបស់អ្នកជំនាញសុទ្ធសាធ ដែលជួនកាលអាចមានភាពលំអៀង។ សំណួរចំនួន ៣០ ទទួលបានពិន្ទុ IOC ពី ០.៥០ ដល់ ១.០០ ដែលចាត់ទុកថាអាចទទួលយកបានសម្រាប់ការសាកល្បងបន្ត។
Confirmatory Factor Analysis (CFA)
ការវិភាគកត្តាបញ្ជាក់ (CFA) ដោយប្រើកម្មវិធី LISREL
បង្ហាញយ៉ាងច្បាស់ពីរចនាសម្ព័ន្ធនៃអថេរ និងបញ្ជាក់ពីទំនាក់ទំនងនៃទ្រឹស្តីជាមួយនឹងទិន្នន័យជាក់ស្តែងតាមបែបស្ថិតិ។ ទាមទារទំហំគំរូធំ (អ្នកចូលរួមច្រើន) និងចំណេះដឹងស្ថិតិកម្រិតខ្ពស់ដើម្បីដំណើរការកម្មវិធី និងបកស្រាយលទ្ធផល។ ម៉ូដែលតេស្តមានភាពស៊ីចង្វាក់គ្នាខ្ពស់ជាមួយនឹងទិន្នន័យជាក់ស្តែង (Chi-square=99.77, p=0.067, RMSEA=0.015) ដោយរក្សាទុកសំណួរចំនួន ១៩។
Stanine Norms
ការបង្កើតបទដ្ឋានតេស្តតាមប្រព័ន្ធ Stanine
ងាយស្រួលបែងចែកកម្រិតសមត្ថភាពសិស្សជាក្រុមច្បាស់លាស់ ដោយផ្អែកលើខ្សែកោងធម្មតា (Normal Distribution)។ ការបែងចែកជាក្រុមទូលំទូលាយពេក មិនអាចបង្ហាញពីពិន្ទុពិតប្រាកដ ឬកម្រិតលម្អិតជាក់លាក់របស់សិស្សម្នាក់ៗនោះទេ។ បែងចែកកម្រិតចំណេះដឹងសិស្សជា ៣ ក្រុម៖ ទាប (ពិន្ទុ ០-៨), មធ្យម (៩-១៤), និងខ្ពស់ (១៥-១៩)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារការប្រមូលទិន្នន័យពីសិស្សចំនួនច្រើន គួបផ្សំនឹងការប្រើប្រាស់កម្មវិធីស្ថិតិកម្រិតខ្ពស់ដើម្បីវិភាគ និងផ្ទៀងផ្ទាត់រចនាសម្ព័ន្ធនៃតេស្ត។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងទៅលើសិស្សថ្នាក់ទី១២ នៅក្នុងខេត្តចំនួន៤ នៃភូមិភាគខាងកើតប្រទេសថៃ ដែលជាតំបន់ឧស្សាហកម្ម និងសេដ្ឋកិច្ច។ ទិន្នន័យ និងខ្លឹមសារតេស្តមានភាពលំអៀងទៅរកបរិបទសង្គម-សេដ្ឋកិច្ចរបស់ថៃ (ឧទាហរណ៍ ការបញ្ចូលទស្សនវិជ្ជាសេដ្ឋកិច្ចគ្រប់គ្រាន់)។ សម្រាប់ប្រទេសកម្ពុជា ការចម្លងតេស្តនេះដោយផ្ទាល់អាចនឹងមិនឆ្លុះបញ្ចាំងពីការពិតទេ ដោយសារភាពខុសគ្នានៃកម្មវិធីសិក្សា បរិបទសង្គម និងភូមិសាស្ត្រនយោបាយ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាខ្លឹមសារសំណួរខ្លះត្រូវកែសម្រួលក៏ដោយ វិធីសាស្ត្ររចនា និងវាយតម្លៃគុណភាពតេស្ត (Test Construction & Validation) នេះ មានប្រយោជន៍ខ្លាំងណាស់សម្រាប់ការអភិវឌ្ឍប្រព័ន្ធវាស់ស្ទង់វិស័យអប់រំនៅកម្ពុជា។

សរុបមក ការអនុវត្តវិធីសាស្ត្របង្កើតតេស្តតាមស្តង់ដារនេះ នឹងជួយប្រព័ន្ធអប់រំកម្ពុជាផ្លាស់ប្តូរពីការវាយតម្លៃផ្អែកលើការទន្ទេញចាំមាត់ ទៅជាការវាស់ស្ទង់បំណិនគិតកម្រិតខ្ពស់ដែលស្របតាមទីផ្សារការងារសតវត្សទី២១ជាក់ស្តែង។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះទ្រឹស្តីវាស់ស្ទង់អប់រំ: អ្នកស្រាវជ្រាវត្រូវស្វែងយល់ស៊ីជម្រៅអំពីទ្រឹស្តី Bloom's Taxonomy កំណែថ្មី ក្របខ័ណ្ឌជំនាញសតវត្សទី២១ និងគោលការណ៍នៃការវាស់ស្ទង់ចិត្តមាត្រ (Psychometrics) ដូចជាសុពលភាព (Validity) និងភាពជឿជាក់ (Reliability)។
  2. រៀនប្រើប្រាស់កម្មវិធីស្ថិតិ: ត្រូវអនុវត្តការប្រើប្រាស់កម្មវិធី SPSS សម្រាប់វិភាគស្ថិតិពិពណ៌នា (កម្រិតភាពលំបាក និងអំណាចរើសអើងនៃសំណួរ) និងកម្មវិធីដូចជា LISRELAMOS សម្រាប់ការវិភាគកត្តាបញ្ជាក់ (Confirmatory Factor Analysis - CFA)
  3. អនុវត្តការរចនាតេស្ត និងវាយតម្លៃដោយអ្នកជំនាញ (IOC): សាកល្បងបង្កើតតេស្តអន្តរកម្មសិក្សាដោយខ្លួនឯង រួចអញ្ជើញអ្នកជំនាញយ៉ាងតិច ៣រូប ដើម្បីវាយតម្លៃភាពត្រឹមត្រូវនៃខ្លឹមសារ (Index of Item-Objective Congruence - IOC) ដោយសំណួរត្រូវមានពិន្ទុចាប់ពី ០.៥០ ឡើងទៅ។
  4. ការប្រមូលទិន្នន័យសាកល្បង (Pilot Testing): យកតេស្តដែលបានកែសម្រួលទៅសាកល្បងជាមួយសិស្សវិទ្យាល័យ (ឧទាហរណ៍៖ សិស្សថ្នាក់ទី១២ នៅសាលាណាមួយក្នុងរាជធានីភ្នំពេញ) ក្នុងចំនួនគំរូប្រមាណ ៣០ ទៅ ៥០នាក់ ដើម្បីរកតម្លៃ Cronbach's Alpha (ត្រូវធំជាង ០.៧០)។
  5. ការវិភាគទិន្នន័យធំ និងការបង្កើតបទដ្ឋាន (Norming): ប្រមូលទិន្នន័យពីសិស្សលើសពី ៤០០នាក់ រួចប្រើប្រាស់ CFA ដើម្បីបញ្ជាក់រចនាសម្ព័ន្ធតេស្ត។ បន្ទាប់មក បំប្លែងពិន្ទុឆៅទៅជាពិន្ទុ Stanine (១ ដល់ ៩) ដើម្បីបង្កើតបទដ្ឋានវាយតម្លៃថ្នាក់ជាតិ ឬថ្នាក់តំបន់។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Confirmatory Factor Analysis គឺជាវិធីសាស្ត្រស្ថិតិកម្រិតខ្ពស់ដែលត្រូវបានប្រើប្រាស់ដើម្បីផ្ទៀងផ្ទាត់ថាតើទិន្នន័យដែលប្រមូលបានពិតជាស្របទៅនឹងរចនាសម្ព័ន្ធនៃទ្រឹស្តីដែលបានកំណត់ទុកជាមុនឬយ៉ាងណា។ នៅក្នុងការស្រាវជ្រាវនេះ វាជួយបញ្ជាក់ថា តើសំណួរនីមួយៗពិតជាវាស់ស្ទង់ចំអថេរ (ដូចជាចំណេះដឹងផ្នែកហិរញ្ញវត្ថុ ឬបរិស្ថាន) ដែលយើងចង់វាស់មែនឬទេ។ ដូចជាការយកប្លង់ផ្ទះដែលបានគូររួច (ទ្រឹស្តី) ទៅផ្ទៀងផ្ទាត់ជាមួយផ្ទះដែលបានសាងសង់រួច (ទិន្នន័យជាក់ស្តែង) ថាតើវាដូចគ្នាឬអត់។
Index of item objective congruence ជារង្វាស់ដែលប្រើដើម្បីវាយតម្លៃសុពលភាពខ្លឹមសារនៃសំណួរប្រឡង (Content Validity) ដោយពឹងផ្អែកលើការដាក់ពិន្ទុរបស់អ្នកជំនាញ ដើម្បីបញ្ជាក់ថាសំណួរនីមួយៗពិតជាវាស់ស្ទង់ចំគោលបំណងនៃការសិក្សាដែលបានកំណត់មែន ដោយសំណួរដែលទទួលយកបានត្រូវមានពិន្ទុចាប់ពី ០.៥០ ឡើងទៅ។ ដូចជាការអញ្ជើញចុងភៅជំនាញ៣នាក់មកភ្លក់ម្ហូប ដើម្បីបញ្ជាក់ថាតើមុខម្ហូបនេះពិតជាមានរសជាតិត្រូវតាមរូបមន្តដើមឬទេ។
Stannine Norm ជាប្រព័ន្ធនៃការពិន្ទុស្តង់ដារដែលបែងចែកលទ្ធផលនៃការធ្វើតេស្តជា៩កម្រិត (ពី១ដល់៩) ដោយផ្អែកលើខ្សែកោងរបាយធម្មតា (Normal Distribution) ដើម្បីងាយស្រួលប្រៀបធៀបសមត្ថភាពសិស្សថានរណាស្ថិតក្នុងកម្រិតខ្ពស់ មធ្យម ឬទាប បើធៀបនឹងក្រុមទាំងមូល។ ដូចជាការតម្រៀបសិស្ស១០០នាក់តាមពិន្ទុ រួចកាត់បែងចែកពួកគេជា៩ក្រុមធំៗ ដើម្បីងាយស្រួលចំណាត់ថ្នាក់កម្រិតសមត្ថភាព។
Discrimination ជាសូចនាករស្ថិតិ (អំណាចរើសអើង) ដែលបង្ហាញពីសមត្ថភាពរបស់សំណួរប្រឡងនីមួយៗ ក្នុងការបែងចែករវាងសិស្សដែលរៀនពូកែ (ក្រុមពិន្ទុខ្ពស់សរុប) និងសិស្សដែលរៀនខ្សោយ (ក្រុមពិន្ទុទាបសរុប)។ សំណួរល្អ គឺសិស្សពូកែឆ្លើយត្រូវ ចំណែកសិស្សខ្សោយឆ្លើយខុស។ ដូចជាសំណាញ់រែងត្រីដែលអាចបែងចែកយ៉ាងច្បាស់រវាងត្រីធំ (សិស្សពូកែ) និងត្រីតូច (សិស្សខ្សោយ)។
Difficulty index ជាតម្លៃស្ថិតិដែលគណនាពីភាគរយនៃសិស្សដែលឆ្លើយត្រូវលើសំណួរនីមួយៗ ដើម្បីដឹងថាសំណួរនោះងាយពេក លំបាកពេក ឬល្មម។ សំណួរដែលល្អជាទូទៅគួរតែមានសិស្សឆ្លើយត្រូវប្រហែលពាក់កណ្តាលនៃសិស្សសរុប (ចន្លោះ ០.២០ ទៅ ០.៨០)។ ដូចជារបារលោតកម្ពស់ បើដាក់ទាបពេកលោតផុតគ្រប់គ្នា បើដាក់ខ្ពស់ពេកគ្មានអ្នកលោតរួច ដូច្នេះត្រូវដាក់កម្ពស់ល្មមទើបដឹងថានរណាមានសមត្ថភាពពិត។
Interdisciplinary ជាការរៀនសូត្រ ឬការវាយតម្លៃដែលទាញយកចំណេះដឹងពីមុខវិជ្ជាផ្សេងៗគ្នាជាច្រើន (ដូចជាវិទ្យាសាស្ត្រ សេដ្ឋកិច្ច សង្គមវិជ្ជា) មកបន្ស៊ីគ្នា ដើម្បីដោះស្រាយបញ្ហាស្មុគស្មាញណាមួយក្នុងជីវិតពិត ដែលមិនអាចដោះស្រាយបានដោយប្រើចំណេះដឹងត្រឹមមុខវិជ្ជាតែមួយ។ ដូចជាការចម្អិនម្ហូបមួយមុខដែលត្រូវប្រើគ្រឿងទេសចម្រុះមុខបញ្ចូលគ្នា ទើបចេញជារសជាតិឆ្ងាញ់ពេញលេញដែលអាចញ៉ាំបាន។
Measurement Error ជាភាពលំអៀង ឬកំហុសនៃភាពខុសគ្នារវាងពិន្ទុពិតប្រាកដដែលសិស្សគួរទទួលបាន និងពិន្ទុដែលវាស់ស្ទង់បានជាក់ស្តែងចេញពីការធ្វើតេស្ត ដោយសារតែកត្តារំខានផ្សេងៗដូចជា សំណួរមិនច្បាស់លាស់ សិស្សទាយចម្លើយ ឬបញ្ហាក្នុងការប្រមូលទិន្នន័យ។ ដូចជាការថ្លឹងទម្ងន់នៅលើជញ្ជីងដែលខូច ដែលធ្វើឱ្យទម្ងន់ដែលបង្ហាញមិនមែនជាទម្ងន់ពិតប្រាកដរបស់អ្នក។
Root Mean Squared Error of Approximation ហៅកាត់ថា RMSEA ជាសូចនាករមួយក្នុង CFA ដែលប្រើសម្រាប់វាស់ស្ទង់កម្រិតនៃកំហុស ឬភាពមិនស៊ីចង្វាក់គ្នារវាងម៉ូដែលទ្រឹស្តី និងទិន្នន័យជាក់ស្តែង។ តម្លៃកាន់តែតូច (ជាទូទៅតូចជាង ០.០៧) បង្ហាញថាម៉ូដែលនោះកាន់តែមានភាពត្រឹមត្រូវខ្ពស់។ ដូចជាការវាស់ទំហំខោអាវដែលកាត់រួចធៀបនឹងទំហំខ្លួនពិតប្រាកដ បើភាពខុសគ្នាកាន់តែតិច មានន័យថាខោអាវនោះកាត់បានកាន់តែត្រឹមត្រូវល្អ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖