បញ្ហា (The Problem)៖ ឯកសារនេះវាយតម្លៃគុណភាព និងភាពជឿជាក់នៃការធ្វើតេស្តសមិទ្ធផលភាសាអង់គ្លេស (English Achievement Test) ព្រមទាំងប្រៀបធៀបកម្រិតនៃការសិក្សារបស់សិស្សប្រុស និងសិស្សស្រីថ្នាក់ទី៨ នៅប្រទេសប៉ាគីស្ថាន។
វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះប្រើប្រាស់វិធីសាស្ត្រពិពណ៌នា ដោយដាក់ឲ្យសិស្សចំនួន ១៥០នាក់ ធ្វើតេស្តសំណួរពហុជម្រើសចំនួន ៥០សំណួរ ព្រមទាំងធ្វើការវិភាគលើកម្រិតលំបាក និងភាពជឿជាក់នៃសំណួរនីមួយៗ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Kuder-Richardson Formula 20 (KR20) រូបមន្ត Kuder-Richardson 20 សម្រាប់ការវាស់វែងភាពជឿជាក់ |
ផ្តល់លទ្ធផលសុក្រឹតខ្ពស់បំផុតសម្រាប់ការវាស់វែងភាពជឿជាក់នៃតេស្តដែលមានចម្លើយប្រភេទត្រូវ/ខុស (០ ឬ ១) ដោយឆ្លុះបញ្ចាំងពីភាពស៊ីសង្វាក់គ្នានៃសំណួរទាំងអស់។ | មាននីតិវិធីគណនាស្មុគស្មាញ និងចំណាយពេលច្រើន ជាពិសេសនៅពេលអនុវត្តលើសំណុំទិន្នន័យធំដោយមិនប្រើប្រាស់កម្មវិធីកុំព្យូទ័រ។ | ទទួលបានមេគុណភាពជឿជាក់ (Reliability coefficient) ខ្ពស់ជាងគេ គឺ ០.៧៨ ដែលបង្ហាញថាតេស្តនេះមានភាពគួរឱ្យទុកចិត្តកម្រិតល្អ។ |
| Kuder-Richardson Formula 21 (KR21) រូបមន្ត Kuder-Richardson 21 សម្រាប់ការវាស់វែងភាពជឿជាក់ |
ងាយស្រួលនិងលឿនក្នុងការគណនាជាង KR20 ដែលត្រូវបានបង្កើតឡើងដើម្បីដោះស្រាយភាពស្មុគស្មាញសម្រាប់ទិន្នន័យធំៗ។ | ផ្តល់លទ្ធផលប្រហាក់ប្រហែល ប៉ុន្តែមិនសូវសុក្រឹតស្មើ KR20 នោះទេ ហើយតម្លៃដែលទទួលបានភាគច្រើនមានទំហំតូចជាង KR20 បន្តិច។ | ទទួលបានមេគុណភាពជឿជាក់ ០.៧០ ដែលនៅតែស្ថិតក្នុងកម្រិតអាចទទួលយកបាន (>០.៥០)។ |
| Split-Half Reliability Method វិធីសាស្ត្រពុះចែកវិញ្ញាសាជាពីរដើម្បីវាស់វែងភាពជឿជាក់ |
ងាយស្រួលក្នុងការអនុវត្ត ដោយគ្រាន់តែបែងចែកវិញ្ញាសាតែមួយជាពីរផ្នែក (ឧទាហរណ៍ សំណួរសេស និងគូ) ដើម្បីប្រៀបធៀបទំនាក់ទំនងពិន្ទុ។ | លទ្ធផលនៃមេគុណភាពជឿជាក់អាចប្រែប្រួលខ្លាំង អាស្រ័យទៅលើរបៀបនៃការបែងចែកសំណួរ ហើយវាមិនបានវាស់វែងភាពស៊ីសង្វាក់គ្នានៃសំណួរនីមួយៗនោះទេ។ | ទទួលបានមេគុណភាពជឿជាក់ ០.៧៤ សម្រាប់ការធ្វើតេស្តទាំងមូល។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះមិនតម្រូវឱ្យមានធនធានបច្ចេកវិទ្យាខ្ពស់ ឬចំណាយថវិកាច្រើននោះទេ ដោយពឹងផ្អែកជាចម្បងលើកម្មវិធីវិភាគស្ថិតិជាមូលដ្ឋាន និងទិន្នន័យដែលប្រមូលបានពីសាលារៀនដោយផ្ទាល់។
ការសិក្សានេះប្រមូលទិន្នន័យពីសិស្សថ្នាក់ទី៨ ចំនួន១៥០នាក់ នៅសាលាទីក្រុងក្នុងខេត្ត Punjab ប្រទេសប៉ាគីស្ថាន ដែលមិនអាចតំណាងឱ្យសិស្សនៅតំបន់ជនបទបានឡើយ។ ចំណុចខ្វះខាតដ៏ធំមួយក្នុងឯកសារនេះ គឺអ្នកនិពន្ធបានបកស្រាយលទ្ធផលស្ថិតិខុស (Z-test = 1.80 គឺតូចជាងតម្លៃ Critical 1.96 ដែលតាមក្បួនស្ថិតិមានន័យថា គ្មានភាពខុសគ្នាទេ ប៉ុន្តែអ្នកនិពន្ធបែរជាសន្និដ្ឋានថាមានភាពខុសគ្នាជាលក្ខណៈស្ថិតិរវាងសិស្សប្រុសនិងស្រីទៅវិញ)។ សម្រាប់អ្នកស្រាវជ្រាវនៅកម្ពុជា នេះជាមេរៀនដ៏សំខាន់ដែលត្រូវប្រុងប្រយ័ត្នបំផុតក្នុងការអាន និងបកស្រាយលទ្ធផលស្ថិតិឱ្យបានត្រឹមត្រូវ ដើម្បីចៀសវាងការធ្វើសេចក្តីសន្និដ្ឋានខុស។
ទោះបីជាមានចំណុចខ្វះខាតផ្នែកស្ថិតិខ្លះនៅក្នុងការបកស្រាយលទ្ធផល ប៉ុន្តែវិធីសាស្ត្រវាយតម្លៃគុណភាពវិញ្ញាសាប្រឡង (Item Analysis) នេះ មានប្រយោជន៍ខ្លាំងណាស់សម្រាប់ពង្រឹងគុណភាពអប់រំនៅកម្ពុជា។
ជារួម ការអនុវត្តការវិភាគសំណួរប្រឡង (Item Analysis) ជាប្រព័ន្ធនៅតាមគ្រឹះស្ថានសិក្សានៅកម្ពុជា នឹងជួយធានាថាការវាស់ស្ទង់សមត្ថភាពសិស្សប្រព្រឹត្តទៅដោយសុក្រឹត និងអាចជឿទុកចិត្តបាន ក៏ដូចជាជួយកសាងធនាគារសំណួរប្រឡងដែលមានស្តង់ដារខ្ពស់។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Item analysis (ការវិភាគសំណួរប្រឡង) | ដំណើរការនៃការវាយតម្លៃគុណភាពនៃសំណួរនីមួយៗនៅក្នុងការធ្វើតេស្ត ដោយប្រើប្រាស់ស្ថិតិដើម្បីពិនិត្យមើលថាតើសំណួរទាំងនោះងាយស្រួលពេក ពិបាកពេក ឬមានសមត្ថភាពអាចបែងចែករវាងសិស្សពូកែនិងសិស្សខ្សោយបានកម្រិតណា។ | ដូចជាការភ្លក់ម្ហូបនីមួយៗនៅលើតុ ដើម្បីដឹងថាអាហារមួយណាឆ្ងាញ់ មួយណាប្រៃពេក ឬសាបពេក មុននឹងសម្រេចចិត្តបម្រើដល់ភ្ញៀវ។ |
| Item difficulty / Id (សន្ទស្សន៍កម្រិតលំបាកនៃសំណួរ) | រង្វាស់ភាគរយដែលបង្ហាញពីចំនួនសិស្សដែលបានឆ្លើយសំណួរណាមួយត្រឹមត្រូវ។ បើភាគរយខ្ពស់ (ឧទាហរណ៍ > ៨០%) មានន័យថាសំណួរនោះងាយស្រួលពេក ហើយបើភាគរយទាប (ឧទាហរណ៍ < ២០%) មានន័យថាសំណួរនោះពិបាកពេក។ | ដូចជាការវាស់កម្ពស់របារលោត បើមនុស្សភាគច្រើនលោតរំលងបានយ៉ាងងាយ មានន័យថារបារនោះទាបពេក (ងាយស្រួលពេក)។ |
| Discriminatory power / D (អំណាចនៃការបែងចែកសំណួរ) | សមត្ថភាពនៃសំណួរមួយក្នុងការបែងចែកឲ្យដាច់រវាងសិស្សដែលរៀនពូកែ (ក្រុមសិស្សដែលទទួលបានពិន្ទុខ្ពស់សរុប) និងសិស្សដែលរៀនខ្សោយ (ក្រុមសិស្សដែលទទួលបានពិន្ទុទាបសរុប)។ សំណួរល្អ គឺសិស្សពូកែឆ្លើយត្រូវច្រើន ចំណែកសិស្សខ្សោយឆ្លើយខុសច្រើន។ | ដូចជាតម្រងរែងគ្រាប់ខ្សាច់ ដែលអាចញែកគ្រាប់ខ្សាច់ធំៗ (សិស្សពូកែ) ចេញពីគ្រាប់ខ្សាច់តូចៗ (សិស្សខ្សោយ) បានយ៉ាងច្បាស់។ |
| Validity (សុពលភាព) | កម្រិតនៃភាពត្រឹមត្រូវដែលឧបករណ៍ធ្វើតេស្តមួយ ពិតជាអាចវាស់វែងនូវអ្វីដែលវាត្រូវបានបង្កើតឡើងដើម្បីវាស់វែងប្រាកដមែន។ ឧទាហរណ៍ តេស្តភាសាអង់គ្លេស ត្រូវតែវាស់ពីចំណេះដឹងភាសាអង់គ្លេស មិនមែនចំណេះដឹងគណិតវិទ្យានោះទេ។ | ដូចជាការប្រើជញ្ជីងដើម្បីថ្លឹងទម្ងន់ គឺជារឿងត្រឹមត្រូវ តែបើអ្នកប្រើបន្ទាត់ដើម្បីវាស់ទម្ងន់ នោះគឺគ្មានសុពលភាពទេ។ |
| Reliability (ភាពជឿជាក់) | លក្ខណៈនៃការធ្វើតេស្តដែលផ្តល់លទ្ធផលថេរ និងស្របគ្នា ទោះបីជាត្រូវបានគេធ្វើតេស្តច្រើនដង ឬក្នុងពេលវេលាខុសគ្នាក៏ដោយ សម្រាប់សិស្សដែលមានសមត្ថភាពដដែល។ | ដូចជាជញ្ជីងថ្លឹងទម្ងន់ដែលមានគុណភាពល្អ ទោះអ្នកឡើងថ្លឹងប៉ុន្មានដងជាប់ៗគ្នា ក៏វានៅតែបង្ហាញតួលេខដដែល មិនលោតឡើងចុះខុសគ្នា។ |
| Cronbach's alpha (មេគុណអាល់ហ្វារបស់ Cronbach) | រង្វាស់ស្ថិតិដែលប្រើដើម្បីវាយតម្លៃភាពស៊ីសង្វាក់គ្នាខាងក្នុង (Internal Consistency) នៃការធ្វើតេស្ត ពោលគឺវាស់ថាតើសំណួរទាំងអស់នៅក្នុងការធ្វើតេស្ត កំពុងដំណើរការរួមគ្នាដើម្បីវាស់វែងលើគោលគំនិតតែមួយឬយ៉ាងណា។ (តម្លៃល្អជាទូទៅគឺចាប់ពី 0.50 ដល់ 1)។ | ដូចជាការត្រួតពិនិត្យក្រុមតន្ត្រីករ ថាតើអ្នកលេងឧបករណ៍តន្ត្រីនីមួយៗកំពុងលេងបទចម្រៀងតែមួយ និងស៊ីចង្វាក់គ្នាដែរឬទេ។ |
| Kuder Richardson formula / KR20 (រូបមន្ត Kuder Richardson) | រូបមន្តស្ថិតិដែលត្រូវបានប្រើជាពិសេសសម្រាប់វាស់ភាពជឿជាក់ (Reliability) នៃការធ្វើតេស្តដែលមានសំណួរប្រភេទឆ្លើយត្រូវ ឬខុស (ឲ្យពិន្ទុ ១ សម្រាប់ត្រូវ និង ០ សម្រាប់ខុស)។ វាជួយប្រាប់ពីភាពស៊ីសង្វាក់គ្នានៃសំណួរក្នុងតេស្តនោះ។ | ដូចជាប្រព័ន្ធកុំព្យូទ័រដែលឆែកមើលចម្លើយត្រូវឬខុសរាប់រយខួរក្បាល ដើម្បីប្រាប់យើងថាវិញ្ញាសាទាំងមូលមានស្ថិរភាពគួរឲ្យទុកចិត្តកម្រិតណា។ |
| Criterion-referenced tests (តេស្តផ្អែកលើលក្ខណៈវិនិច្ឆ័យ) | ប្រភេទនៃការធ្វើតេស្តដែលវាស់វែងសមត្ថភាពរបស់សិស្ស ដោយធៀបទៅនឹងស្តង់ដារ ឬលក្ខណៈវិនិច្ឆ័យជាក់លាក់ណាមួយ (ឧទាហរណ៍៖ ត្រូវចេះវេយ្យាករណ៍កម្រិតណា) ជាជាងការប្រៀបធៀបសិស្សម្នាក់ទៅនឹងសិស្សម្នាក់ទៀត។ | ដូចជាការប្រឡងយកប័ណ្ណបើកបរ ដែលគេតម្រូវឲ្យអ្នកចេះបើកបរតាមស្តង់ដារកំណត់ (ជាប់ឬធ្លាក់) មិនមែនប្រកួតគ្នាថានរណាបើកលឿនជាងនរណានោះទេ។ |
| Z-test (តេស្ត Z) | វិធីសាស្ត្រស្ថិតិដែលប្រើប្រាស់ដើម្បីកំណត់ថាតើមធ្យមភាគនៃក្រុមគំរូពីរ (ឧទាហរណ៍៖ ពិន្ទុសិស្សប្រុស និងពិន្ទុសិស្សស្រី) ពិតជាមានភាពខុសគ្នាជាលក្ខណៈស្ថិតិប្រាកដមែន ឬគ្រាន់តែជាការប្រែប្រួលដោយចៃដន្យ ក្នុងករណីដែលមានទិន្នន័យច្រើន។ | ដូចជាការប្រើកែវពង្រីកដើម្បីមើលឲ្យច្បាស់ថា ក្រុមទាំងពីរពិតជាមានសមត្ថភាពខុសគ្នាមែន ឬមួយវាគ្រាន់តែជារឿងចៃដន្យដែលកើតឡើងក្នុងពេលប្រឡងតែប៉ុណ្ណោះ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖