បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហានៃភាពអាស្រ័យលើសំណាកនៅក្នុងការប៉ាន់ស្មានកម្រិតលំបាកនៃសំណួរប្រឡង ដោយប្រៀបធៀបភាពមិនប្រែប្រួលរវាងទ្រឹស្តីតេស្តបុរាណ (Classical Test Theory - CTT) និងទ្រឹស្តីឆ្លើយតបសំណួរ (Item Response Theory - IRT)។
វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះប្រើប្រាស់វិធីសាស្ត្របរិមាណ (Quantitative method) ដោយទាញយកសំណាកឯករាជ្យចំនួន ១៥៥ ពីទិន្នន័យសិស្ស ដើម្បីធ្វើតេស្តសម្មតិកម្ម។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Classical Test Theory (CTT) ទ្រឹស្តីតេស្តបុរាណ (CTT) |
មានភាពងាយស្រួលក្នុងការគណនា ប្រើប្រាស់ និងយល់ដោយអ្នកដែលមិនមែនជាអ្នកជំនាញ។ មានសម្មតិកម្មទ្រឹស្តីខ្សោយដែលធ្វើឱ្យវាងាយស្រួលអនុវត្តក្នុងស្ថានភាពសាកល្បងជាច្រើន។ | ប៉ារ៉ាម៉ែត្រកម្រិតលំបាកនៃសំណួរនិងសមត្ថភាពសិស្សប្រែប្រួលទៅតាមសំណាក (Sample dependent)។ មិនមានព័ត៌មានលម្អិតថាតើសិស្សម្នាក់ៗនឹងអាចឆ្លើយសំណួរជាក់លាក់ណាមួយបានកម្រិតណានោះទេ។ | ប៉ារ៉ាម៉ែត្រកម្រិតលំបាកនៃការធ្វើតេស្តគឺមានការប្រែប្រួល (Variant) កាត់តាមក្រុមសំណាកឯករាជ្យផ្សេងៗគ្នា ដែលបង្ហាញពីភាពទន់ខ្សោយរបស់វាក្នុងការវាស់វែងច្បាស់លាស់។ |
| Item Response Theory (IRT) ទ្រឹស្តីឆ្លើយតបសំណួរ (IRT) |
ប៉ារ៉ាម៉ែត្រមិនប្រែប្រួលទៅតាមសំណាក (Sample-free/Invariant)។ អាចវាយតម្លៃសមត្ថភាពសិស្ស និងកម្រិតលំបាកសំណួរដាច់ដោយឡែកពីគ្នា ដែលផ្តល់លទ្ធផលសុក្រឹត និងអាចប្រៀបធៀបបានឆ្លងកាត់តេស្តផ្សេងៗគ្នា។ | ត្រូវការសម្មតិកម្មរឹងមាំ (Unidimensionality និង Local independence) ដែលជារឿយៗពិបាកនឹងបំពេញក្នុងភាពជាក់ស្តែង។ ទាមទារកុំព្យូទ័រដែលមានសមត្ថភាពគណនាខ្ពស់ និងក្បួនគណនាស្មុគស្មាញ។ | ប៉ារ៉ាម៉ែត្រកម្រិតលំបាករក្សាបាននូវភាពមិនប្រែប្រួល (Invariant) ទោះបីជាមានការផ្លាស់ប្តូរក្រុមសិស្សឯករាជ្យផ្សេងៗគ្នា និងទំហំសំណាកក៏ដោយ។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារទិន្នន័យសំណាកធំ និងកម្មវិធីកុំព្យូទ័រជំនាញសម្រាប់ការគណនាស្មុគស្មាញនៃម៉ូដែល IRT និងការវិភាគស្ថិតិ។
ការសិក្សានេះត្រូវបានធ្វើឡើងដោយប្រើទិន្នន័យពិតពីការប្រឡងសញ្ញាបត្រមធ្យមសិក្សាបឋមភូមិមុខវិជ្ជាគណិតវិទ្យានៅប្រទេសបុតស្វាណា (Botswana) ឆ្នាំ២០០៤ លើសិស្សចំនួន ៣៥,២៦២ នាក់។ ទោះបីជាបរិបទសង្គមមានភាពខុសគ្នាពីកម្ពុជាក៏ដោយ ប៉ុន្តែដោយសារនេះគឺជាការសិក្សាផ្ទៀងផ្ទាត់ទ្រឹស្តីស្ថិតិ (IRT ធៀបនឹង CTT) លទ្ធផលនិងគោលការណ៍ដែលរកឃើញនៅតែមានតម្លៃជាសកល និងអាចយកមកប្រើប្រាស់ក្នុងប្រព័ន្ធវាស់វែងការអប់រំនៅកម្ពុជាបានយ៉ាងពេញលេញ។
វិធីសាស្ត្រគណនាផ្អែកលើ IRT នេះមានសារៈសំខាន់ខ្លាំងណាស់សម្រាប់ការកែទម្រង់និងធ្វើឲ្យប្រព័ន្ធវាយតម្លៃការប្រឡងនៅកម្ពុជាមានភាពយុត្តិធម៌និងស្តង់ដារអន្តរជាតិ។
ជារួម ការផ្លាស់ប្តូរការប្រើប្រាស់ពី CTT មក IRT នឹងជួយលើកកម្ពស់គុណភាពនៃការរៀបចំវិញ្ញាសា និងការវាស់វែងសមត្ថភាពសិស្សនៅកម្ពុជាឲ្យមានភាពត្រឹមត្រូវ យុត្តិធម៌ និងមិនមានភាពលំអៀង។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Classical test theory (CTT) (ទ្រឹស្តីតេស្តបុរាណ) | ជាក្របខណ្ឌវាស់វែងបែបប្រពៃណី ដែលចាត់ទុកពិន្ទុដែលសិស្សទទួលបាន (Observed score) គឺជាការបូកបញ្ចូលគ្នារវាងសមត្ថភាពពិត (True score) និងកំហុសឆ្គងនៃការវាស់វែង (Error)។ លក្ខណៈនៃតេស្តនេះអាស្រ័យខ្លាំងលើក្រុមសិស្សដែលបានធ្វើតេស្តមានន័យថាលទ្ធផលប្រែប្រួលតាមសំណាក។ | ដូចជាការវាស់កម្ពស់ដោយប្រើខ្សែម៉ែត្រដែលអាចយឺតបាន ដែលលទ្ធផលអាចប្រែប្រួលបន្តិចបន្តួចរាល់ពេលវាស់ម្តងៗទៅតាមអ្នកដែលកាន់វា។ |
| Item response theory (IRT) (ទ្រឹស្តីឆ្លើយតបសំណួរ) | ជាក្របខណ្ឌវាស់វែងទំនើបដែលប្រើប្រាស់រូបមន្តគណិតវិទ្យាដើម្បីពណ៌នាពីទំនាក់ទំនងរវាងសមត្ថភាពកំបាំងរបស់សិស្ស (Latent trait) និងលទ្ធភាពដែលពួកគេអាចឆ្លើយសំណួរនីមួយៗបានត្រឹមត្រូវ ដោយប៉ារ៉ាម៉ែត្រនេះមិនពឹងផ្អែកលើក្រុមសិស្សដែលត្រូវវាស់វែងនោះទេ។ | ដូចជាការបង្កើតជញ្ជីងស្តង់ដារមួយដែលអាចថ្លឹងដឹងទម្ងន់ពិតប្រាកដរបស់វត្ថុ ទោះបីជាយកទៅថ្លឹងនៅទីណាក៏ដោយ។ |
| Invariance (ភាពមិនប្រែប្រួល) | ជាលក្ខណៈសម្បត្តិដ៏សំខាន់នៃរង្វាស់ ដែលបង្ហាញថាប៉ារ៉ាម៉ែត្រនៃសំណួរ (ដូចជាកម្រិតលំបាក) ឬសមត្ថភាពសិស្ស មិនមានការផ្លាស់ប្តូរឡើយ ទោះបីជាត្រូវបានវាស់ស្ទង់ជាមួយក្រុមសិស្សផ្សេងៗគ្នា ឬសំណុំសំណួរផ្សេងៗគ្នាក៏ដោយ (Sample-free និង Item-free)។ | ដូចជាកម្ដៅរំពុះរបស់ទឹកសាបគឺតែងតែ ១០០ អង្សាសេជានិច្ច ទោះបីជាអ្នកដាំវានៅក្នុងឆ្នាំងតូច ឬឆ្នាំងធំក៏ដោយ។ |
| Item difficulty parameter (ប៉ារ៉ាម៉ែត្រកម្រិតលំបាកនៃសំណួរ) | ជាសូចនាករដែលបញ្ជាក់ថាតើសំណួរប្រឡងមួយមានភាពលំបាកកម្រិតណា។ នៅក្នុង CTT វាគិតជាភាគរយនៃអ្នកឆ្លើយត្រូវ ចំណែកក្នុង IRT វាជារង្វាស់ដែលឯករាជ្យពីសមត្ថភាពរួមរបស់ក្រុមសិស្ស (ជាទូទៅតាងដោយ b-value)។ | ដូចជាកម្ពស់នៃរបារលោតផ្លោះ—បើរៀបចំកាន់តែខ្ពស់ មានតែអ្នកដែលមានសមត្ថភាពលោតខ្ពស់ប៉ុណ្ណោះដែលអាចលោតរំលងបាន។ |
| Unidimensionality (ឯកវិមាត្រ ឬ វិមាត្រទោល) | ជាសម្មតិកម្មគោលនៅក្នុង IRT ដែលសន្មតថាការធ្វើតេស្តមួយកំពុងវាស់វែងសមត្ថភាព លក្ខណៈ ឬជំនាញតែមួយគត់របស់សិស្ស (ឧទាហរណ៍ វាស់តែចំណេះដឹងគណិតវិទ្យា ដោយមិនលាយឡំជាមួយសមត្ថភាពអានភាសា)។ | ដូចជាការប្រកួតរត់ប្រណាំងដែលកាត់សេចក្តីដោយពឹងផ្អែកលើ "ល្បឿន" តែមួយមុខគត់ មិនមែនយកភាពស្រស់ស្អាតមកគិតបញ្ចូលគ្នានោះទេ។ |
| Local independence (ភាពឯករាជ្យនៃសំណួរ) | ជាសម្មតិកម្មមួយទៀតរបស់ IRT ដែលបញ្ជាក់ថាចម្លើយដែលសិស្សឆ្លើយលើសំណួរមួយ មិនមានឥទ្ធិពល ឬផ្តល់តម្រុយជួយឱ្យសិស្សឆ្លើយសំណួរមួយទៀតបាននោះទេ ពោលគឺឱកាសឆ្លើយត្រូវលើសំណួរនីមួយៗគឺដាច់ដោយឡែកពីគ្នា។ | ដូចជាការទិញឆ្នោតពីរផ្សេងគ្នា ការត្រូវរង្វាន់ឆ្នោតទីមួយមិនធានា ឬបង្កើនឱកាសឱ្យអ្នកត្រូវរង្វាន់ឆ្នោតទីពីរនោះទេ។ |
| Repeated measure ANOVA (ការវិភាគវ៉ារ្យង់វាស់វែងដដែលៗ) | ជាវិធីសាស្ត្រស្ថិតិដែលត្រូវបានប្រើប្រាស់នៅក្នុងការសិក្សានេះ ដើម្បីប្រៀបធៀបមធ្យមភាគនៃទិន្នន័យនៅពេលដែលសំណាកតែមួយ ឬប៉ារ៉ាម៉ែត្រតែមួយត្រូវបានវាស់វែងច្រើនដង ឬឆ្លងកាត់លក្ខខណ្ឌក្រុមផ្សេងៗគ្នា ដើម្បីទាញសេចក្តីសន្និដ្ឋានថាតើវាមានភាពខុសគ្នាគួរឱ្យកត់សម្គាល់ដែរឬទេ។ | ដូចជាការយកសិស្សម្នាក់ទៅប្រឡងគណិតវិទ្យាដដែលៗ ៥ដង ដើម្បីមើលថាតើពិន្ទុរបស់គាត់ថេរ ឬមានការប្រែប្រួលខុសប្លែកគ្នាឆ្ងាយ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖