Original Title: Evaluation of English achievement test: A comparison between high and low achievers amongst selected elementary school students of Pakistan
Source: internationalscholarsjournals.org
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការវាយតម្លៃលើការធ្វើតេស្តសមិទ្ធផលភាសាអង់គ្លេស៖ ការប្រៀបធៀបរវាងសិស្សដែលទទួលបានពិន្ទុខ្ពស់ និងទាប ក្នុងចំណោមសិស្សបឋមសិក្សាដែលបានជ្រើសរើសនៅប្រទេសប៉ាគីស្ថាន

ចំណងជើងដើម៖ Evaluation of English achievement test: A comparison between high and low achievers amongst selected elementary school students of Pakistan

អ្នកនិពន្ធ៖ Zubair Haider (Department of Educational Training, The Islamic University of Bahawalpur), Farah Latif, Samina Akhtar, Maria Mushtaq

ឆ្នាំបោះពុម្ព៖ 2015 International Journal of Educational Research and Reviews

វិស័យសិក្សា៖ Education

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះវាយតម្លៃគុណភាព និងភាពជឿជាក់នៃការធ្វើតេស្តសមិទ្ធផលភាសាអង់គ្លេស (English Achievement Test) ព្រមទាំងប្រៀបធៀបកម្រិតនៃការសិក្សារបស់សិស្សប្រុស និងសិស្សស្រីថ្នាក់ទី៨ នៅប្រទេសប៉ាគីស្ថាន។

វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះប្រើប្រាស់វិធីសាស្ត្រពិពណ៌នា ដោយដាក់ឲ្យសិស្សចំនួន ១៥០នាក់ ធ្វើតេស្តសំណួរពហុជម្រើសចំនួន ៥០សំណួរ ព្រមទាំងធ្វើការវិភាគលើកម្រិតលំបាក និងភាពជឿជាក់នៃសំណួរនីមួយៗ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Kuder-Richardson Formula 20 (KR20)
រូបមន្ត Kuder-Richardson 20 សម្រាប់ការវាស់វែងភាពជឿជាក់
ផ្តល់លទ្ធផលសុក្រឹតខ្ពស់បំផុតសម្រាប់ការវាស់វែងភាពជឿជាក់នៃតេស្តដែលមានចម្លើយប្រភេទត្រូវ/ខុស (០ ឬ ១) ដោយឆ្លុះបញ្ចាំងពីភាពស៊ីសង្វាក់គ្នានៃសំណួរទាំងអស់។ មាននីតិវិធីគណនាស្មុគស្មាញ និងចំណាយពេលច្រើន ជាពិសេសនៅពេលអនុវត្តលើសំណុំទិន្នន័យធំដោយមិនប្រើប្រាស់កម្មវិធីកុំព្យូទ័រ។ ទទួលបានមេគុណភាពជឿជាក់ (Reliability coefficient) ខ្ពស់ជាងគេ គឺ ០.៧៨ ដែលបង្ហាញថាតេស្តនេះមានភាពគួរឱ្យទុកចិត្តកម្រិតល្អ។
Kuder-Richardson Formula 21 (KR21)
រូបមន្ត Kuder-Richardson 21 សម្រាប់ការវាស់វែងភាពជឿជាក់
ងាយស្រួលនិងលឿនក្នុងការគណនាជាង KR20 ដែលត្រូវបានបង្កើតឡើងដើម្បីដោះស្រាយភាពស្មុគស្មាញសម្រាប់ទិន្នន័យធំៗ។ ផ្តល់លទ្ធផលប្រហាក់ប្រហែល ប៉ុន្តែមិនសូវសុក្រឹតស្មើ KR20 នោះទេ ហើយតម្លៃដែលទទួលបានភាគច្រើនមានទំហំតូចជាង KR20 បន្តិច។ ទទួលបានមេគុណភាពជឿជាក់ ០.៧០ ដែលនៅតែស្ថិតក្នុងកម្រិតអាចទទួលយកបាន (>០.៥០)។
Split-Half Reliability Method
វិធីសាស្ត្រពុះចែកវិញ្ញាសាជាពីរដើម្បីវាស់វែងភាពជឿជាក់
ងាយស្រួលក្នុងការអនុវត្ត ដោយគ្រាន់តែបែងចែកវិញ្ញាសាតែមួយជាពីរផ្នែក (ឧទាហរណ៍ សំណួរសេស និងគូ) ដើម្បីប្រៀបធៀបទំនាក់ទំនងពិន្ទុ។ លទ្ធផលនៃមេគុណភាពជឿជាក់អាចប្រែប្រួលខ្លាំង អាស្រ័យទៅលើរបៀបនៃការបែងចែកសំណួរ ហើយវាមិនបានវាស់វែងភាពស៊ីសង្វាក់គ្នានៃសំណួរនីមួយៗនោះទេ។ ទទួលបានមេគុណភាពជឿជាក់ ០.៧៤ សម្រាប់ការធ្វើតេស្តទាំងមូល។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះមិនតម្រូវឱ្យមានធនធានបច្ចេកវិទ្យាខ្ពស់ ឬចំណាយថវិកាច្រើននោះទេ ដោយពឹងផ្អែកជាចម្បងលើកម្មវិធីវិភាគស្ថិតិជាមូលដ្ឋាន និងទិន្នន័យដែលប្រមូលបានពីសាលារៀនដោយផ្ទាល់។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រមូលទិន្នន័យពីសិស្សថ្នាក់ទី៨ ចំនួន១៥០នាក់ នៅសាលាទីក្រុងក្នុងខេត្ត Punjab ប្រទេសប៉ាគីស្ថាន ដែលមិនអាចតំណាងឱ្យសិស្សនៅតំបន់ជនបទបានឡើយ។ ចំណុចខ្វះខាតដ៏ធំមួយក្នុងឯកសារនេះ គឺអ្នកនិពន្ធបានបកស្រាយលទ្ធផលស្ថិតិខុស (Z-test = 1.80 គឺតូចជាងតម្លៃ Critical 1.96 ដែលតាមក្បួនស្ថិតិមានន័យថា គ្មានភាពខុសគ្នាទេ ប៉ុន្តែអ្នកនិពន្ធបែរជាសន្និដ្ឋានថាមានភាពខុសគ្នាជាលក្ខណៈស្ថិតិរវាងសិស្សប្រុសនិងស្រីទៅវិញ)។ សម្រាប់អ្នកស្រាវជ្រាវនៅកម្ពុជា នេះជាមេរៀនដ៏សំខាន់ដែលត្រូវប្រុងប្រយ័ត្នបំផុតក្នុងការអាន និងបកស្រាយលទ្ធផលស្ថិតិឱ្យបានត្រឹមត្រូវ ដើម្បីចៀសវាងការធ្វើសេចក្តីសន្និដ្ឋានខុស។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាមានចំណុចខ្វះខាតផ្នែកស្ថិតិខ្លះនៅក្នុងការបកស្រាយលទ្ធផល ប៉ុន្តែវិធីសាស្ត្រវាយតម្លៃគុណភាពវិញ្ញាសាប្រឡង (Item Analysis) នេះ មានប្រយោជន៍ខ្លាំងណាស់សម្រាប់ពង្រឹងគុណភាពអប់រំនៅកម្ពុជា។

ជារួម ការអនុវត្តការវិភាគសំណួរប្រឡង (Item Analysis) ជាប្រព័ន្ធនៅតាមគ្រឹះស្ថានសិក្សានៅកម្ពុជា នឹងជួយធានាថាការវាស់ស្ទង់សមត្ថភាពសិស្សប្រព្រឹត្តទៅដោយសុក្រឹត និងអាចជឿទុកចិត្តបាន ក៏ដូចជាជួយកសាងធនាគារសំណួរប្រឡងដែលមានស្តង់ដារខ្ពស់។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាស្វែងយល់ពីទ្រឹស្តីវាស់វែងការអប់រំ: ចាប់ផ្តើមដោយការស្វែងយល់ពីមូលដ្ឋានគ្រឹះនៃ Classical Test Theory (CTT) ដើម្បីយល់ច្បាស់ពីរូបមន្ត និងអត្ថន័យនៃការគណនា Item Difficulty Index (Id) និង Discrimination Index (D) តាមរយៈឯកសារ ឬវីដេអូបង្រៀនខ្លីៗនៅលើអ៊ីនធឺណិត។
  2. ប្រមូល និងរៀបចំទិន្នន័យប្រឡងជាក់ស្តែង: យកទិន្នន័យពិន្ទុប្រឡងពិតប្រាកដរបស់សិស្ស (ឧទាហរណ៍ តេស្តប្រចាំខែវិញ្ញាសាពហុជម្រើស) បញ្ចូលទៅក្នុងកម្មវិធី Microsoft ExcelGoogle Sheets ដោយកំណត់ដាក់លេខ ១ សម្រាប់សិស្សដែលឆ្លើយត្រូវ និងលេខ ០ សម្រាប់សិស្សដែលឆ្លើយខុស តាមជួរឈរនៃសំណួរនីមួយៗ។
  3. អនុវត្តការវិភាគដោយប្រើកម្មវិធីស្ថិតិ: ប្រើប្រាស់កម្មវិធី SPSS, Jamovi (កម្មវិធីឥតគិតថ្លៃ), ឬ JASP ដើម្បីនាំចូលទិន្នន័យពី Excel រួចដំណើរការវិភាគរកតម្លៃ Cronbach's Alpha និងការវិភាគ Item-Total Statistics ដើម្បីពិនិត្យមើលគុណភាពនិងភាពជឿជាក់នៃវិញ្ញាសារបស់អ្នក។
  4. ចម្រាញ់ និងកែលម្អវិញ្ញាសាប្រឡង: ផ្អែកលើលទ្ធផលវិភាគ សូមធ្វើការសម្រេចចិត្តលុបចោល ឬកែសម្រួលសំណួរណាដែលមានតម្លៃ Id ទាបជាង ០.២០ (ពិបាកពេក) ឬខ្ពស់ជាង ០.៨០ (ងាយពេក) និងសំណួរដែលមានតម្លៃ Discrimination ទាបជាង ០.២០ ព្រោះវាគ្មានសមត្ថភាពបែងចែកសិស្សពូកែនិងខ្សោយបានទេ។
  5. រៀបចំធនាគារសំណួរដែលមានស្តង់ដារ (Item Bank): ចងក្រងសំណួរដែលបានឆ្លងកាត់ការវិភាគ និងកែលម្អរួច ទៅក្នុងប្រព័ន្ធផ្ទុកទិន្នន័យរួមមួយ (ដូចជា MoodleGoogle Forms/Sheets របស់សាលា) ដើម្បីសន្សំទុកសម្រាប់ឱ្យគ្រូដទៃទៀតអាចទាញយកមកប្រើប្រាស់ដោយមានទំនុកចិត្តនៅឆ្នាំសិក្សាក្រោយៗ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Item analysis (ការវិភាគសំណួរប្រឡង) ដំណើរការនៃការវាយតម្លៃគុណភាពនៃសំណួរនីមួយៗនៅក្នុងការធ្វើតេស្ត ដោយប្រើប្រាស់ស្ថិតិដើម្បីពិនិត្យមើលថាតើសំណួរទាំងនោះងាយស្រួលពេក ពិបាកពេក ឬមានសមត្ថភាពអាចបែងចែករវាងសិស្សពូកែនិងសិស្សខ្សោយបានកម្រិតណា។ ដូចជាការភ្លក់ម្ហូបនីមួយៗនៅលើតុ ដើម្បីដឹងថាអាហារមួយណាឆ្ងាញ់ មួយណាប្រៃពេក ឬសាបពេក មុននឹងសម្រេចចិត្តបម្រើដល់ភ្ញៀវ។
Item difficulty / Id (សន្ទស្សន៍កម្រិតលំបាកនៃសំណួរ) រង្វាស់ភាគរយដែលបង្ហាញពីចំនួនសិស្សដែលបានឆ្លើយសំណួរណាមួយត្រឹមត្រូវ។ បើភាគរយខ្ពស់ (ឧទាហរណ៍ > ៨០%) មានន័យថាសំណួរនោះងាយស្រួលពេក ហើយបើភាគរយទាប (ឧទាហរណ៍ < ២០%) មានន័យថាសំណួរនោះពិបាកពេក។ ដូចជាការវាស់កម្ពស់របារលោត បើមនុស្សភាគច្រើនលោតរំលងបានយ៉ាងងាយ មានន័យថារបារនោះទាបពេក (ងាយស្រួលពេក)។
Discriminatory power / D (អំណាចនៃការបែងចែកសំណួរ) សមត្ថភាពនៃសំណួរមួយក្នុងការបែងចែកឲ្យដាច់រវាងសិស្សដែលរៀនពូកែ (ក្រុមសិស្សដែលទទួលបានពិន្ទុខ្ពស់សរុប) និងសិស្សដែលរៀនខ្សោយ (ក្រុមសិស្សដែលទទួលបានពិន្ទុទាបសរុប)។ សំណួរល្អ គឺសិស្សពូកែឆ្លើយត្រូវច្រើន ចំណែកសិស្សខ្សោយឆ្លើយខុសច្រើន។ ដូចជាតម្រងរែងគ្រាប់ខ្សាច់ ដែលអាចញែកគ្រាប់ខ្សាច់ធំៗ (សិស្សពូកែ) ចេញពីគ្រាប់ខ្សាច់តូចៗ (សិស្សខ្សោយ) បានយ៉ាងច្បាស់។
Validity (សុពលភាព) កម្រិតនៃភាពត្រឹមត្រូវដែលឧបករណ៍ធ្វើតេស្តមួយ ពិតជាអាចវាស់វែងនូវអ្វីដែលវាត្រូវបានបង្កើតឡើងដើម្បីវាស់វែងប្រាកដមែន។ ឧទាហរណ៍ តេស្តភាសាអង់គ្លេស ត្រូវតែវាស់ពីចំណេះដឹងភាសាអង់គ្លេស មិនមែនចំណេះដឹងគណិតវិទ្យានោះទេ។ ដូចជាការប្រើជញ្ជីងដើម្បីថ្លឹងទម្ងន់ គឺជារឿងត្រឹមត្រូវ តែបើអ្នកប្រើបន្ទាត់ដើម្បីវាស់ទម្ងន់ នោះគឺគ្មានសុពលភាពទេ។
Reliability (ភាពជឿជាក់) លក្ខណៈនៃការធ្វើតេស្តដែលផ្តល់លទ្ធផលថេរ និងស្របគ្នា ទោះបីជាត្រូវបានគេធ្វើតេស្តច្រើនដង ឬក្នុងពេលវេលាខុសគ្នាក៏ដោយ សម្រាប់សិស្សដែលមានសមត្ថភាពដដែល។ ដូចជាជញ្ជីងថ្លឹងទម្ងន់ដែលមានគុណភាពល្អ ទោះអ្នកឡើងថ្លឹងប៉ុន្មានដងជាប់ៗគ្នា ក៏វានៅតែបង្ហាញតួលេខដដែល មិនលោតឡើងចុះខុសគ្នា។
Cronbach's alpha (មេគុណអាល់ហ្វារបស់ Cronbach) រង្វាស់ស្ថិតិដែលប្រើដើម្បីវាយតម្លៃភាពស៊ីសង្វាក់គ្នាខាងក្នុង (Internal Consistency) នៃការធ្វើតេស្ត ពោលគឺវាស់ថាតើសំណួរទាំងអស់នៅក្នុងការធ្វើតេស្ត កំពុងដំណើរការរួមគ្នាដើម្បីវាស់វែងលើគោលគំនិតតែមួយឬយ៉ាងណា។ (តម្លៃល្អជាទូទៅគឺចាប់ពី 0.50 ដល់ 1)។ ដូចជាការត្រួតពិនិត្យក្រុមតន្ត្រីករ ថាតើអ្នកលេងឧបករណ៍តន្ត្រីនីមួយៗកំពុងលេងបទចម្រៀងតែមួយ និងស៊ីចង្វាក់គ្នាដែរឬទេ។
Kuder Richardson formula / KR20 (រូបមន្ត Kuder Richardson) រូបមន្តស្ថិតិដែលត្រូវបានប្រើជាពិសេសសម្រាប់វាស់ភាពជឿជាក់ (Reliability) នៃការធ្វើតេស្តដែលមានសំណួរប្រភេទឆ្លើយត្រូវ ឬខុស (ឲ្យពិន្ទុ ១ សម្រាប់ត្រូវ និង ០ សម្រាប់ខុស)។ វាជួយប្រាប់ពីភាពស៊ីសង្វាក់គ្នានៃសំណួរក្នុងតេស្តនោះ។ ដូចជាប្រព័ន្ធកុំព្យូទ័រដែលឆែកមើលចម្លើយត្រូវឬខុសរាប់រយខួរក្បាល ដើម្បីប្រាប់យើងថាវិញ្ញាសាទាំងមូលមានស្ថិរភាពគួរឲ្យទុកចិត្តកម្រិតណា។
Criterion-referenced tests (តេស្តផ្អែកលើលក្ខណៈវិនិច្ឆ័យ) ប្រភេទនៃការធ្វើតេស្តដែលវាស់វែងសមត្ថភាពរបស់សិស្ស ដោយធៀបទៅនឹងស្តង់ដារ ឬលក្ខណៈវិនិច្ឆ័យជាក់លាក់ណាមួយ (ឧទាហរណ៍៖ ត្រូវចេះវេយ្យាករណ៍កម្រិតណា) ជាជាងការប្រៀបធៀបសិស្សម្នាក់ទៅនឹងសិស្សម្នាក់ទៀត។ ដូចជាការប្រឡងយកប័ណ្ណបើកបរ ដែលគេតម្រូវឲ្យអ្នកចេះបើកបរតាមស្តង់ដារកំណត់ (ជាប់ឬធ្លាក់) មិនមែនប្រកួតគ្នាថានរណាបើកលឿនជាងនរណានោះទេ។
Z-test (តេស្ត Z) វិធីសាស្ត្រស្ថិតិដែលប្រើប្រាស់ដើម្បីកំណត់ថាតើមធ្យមភាគនៃក្រុមគំរូពីរ (ឧទាហរណ៍៖ ពិន្ទុសិស្សប្រុស និងពិន្ទុសិស្សស្រី) ពិតជាមានភាពខុសគ្នាជាលក្ខណៈស្ថិតិប្រាកដមែន ឬគ្រាន់តែជាការប្រែប្រួលដោយចៃដន្យ ក្នុងករណីដែលមានទិន្នន័យច្រើន។ ដូចជាការប្រើកែវពង្រីកដើម្បីមើលឲ្យច្បាស់ថា ក្រុមទាំងពីរពិតជាមានសមត្ថភាពខុសគ្នាមែន ឬមួយវាគ្រាន់តែជារឿងចៃដន្យដែលកើតឡើងក្នុងពេលប្រឡងតែប៉ុណ្ណោះ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖