Original Title: Modified Product Estimators for Population Mean in Simple Random Sampling Using Coefficients of Kurtosis and Skewness and Function of Quartiles of Auxiliary Variable
Source: li01.tci-thaijo.org
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ឧបករណ៍ប៉ាន់ស្មានផលគុណដែលបានកែសម្រួលសម្រាប់មធ្យមសាកលក្នុងការជ្រើសរើសគំរូចៃដន្យសាមញ្ញ ដោយប្រើមេគុណភាពកំពូល (Kurtosis) ភាពវៀច (Skewness) និងអនុគមន៍ក្វាទីលនៃអថេរជំនួយ

ចំណងជើងដើម៖ Modified Product Estimators for Population Mean in Simple Random Sampling Using Coefficients of Kurtosis and Skewness and Function of Quartiles of Auxiliary Variable

អ្នកនិពន្ធ៖ Wuttichai Srisodaphol (Department of Statistics, Faculty of Science, Khon Kaen University, Thailand), Apidach Chuankrathok, Surunya Worasan

ឆ្នាំបោះពុម្ព៖ 2015, Kasetsart J. (Nat. Sci.) / Agriculture and Natural Resources

វិស័យសិក្សា៖ Statistics

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហានៃការកែលម្អភាពត្រឹមត្រូវក្នុងការប៉ាន់ស្មានមធ្យមសាកល (Population mean) នៅក្នុងការជ្រើសរើសគំរូចៃដន្យសាមញ្ញ ដោយកាត់បន្ថយកំហុសការេមធ្យម (MSE) តាមរយៈអថេរជំនួយ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានបង្កើតឧបករណ៍ប៉ាន់ស្មានផលគុណថ្មីចំនួនបួន ដោយរួមបញ្ចូលនូវប៉ារ៉ាម៉ែត្រនៃអថេរជំនួយ និងប្រៀបធៀបប្រសិទ្ធភាពរបស់វាជាមួយនឹងវិធីសាស្ត្រមុនៗដោយប្រើប្រាស់ទិន្នន័យជាក់ស្តែង។

ការបង្កើតសមីការប៉ាន់ស្មានផលគុណថ្មី (Formulation of New Product Estimators)
ការគណនាកំហុសការេមធ្យម និងភាពលម្អៀង (Calculation of Mean Square Error and Bias)
ការប្រើប្រាស់មេគុណភាពកំពូល និងភាពវៀច (Use of Kurtosis and Skewness Coefficients)
ការវិភាគទិន្នន័យជាក់ស្តែងលើពន្ធប្រេងឥន្ធនៈម៉ូតូ (Empirical Analysis on Motor Fuel Tax Data)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ឧបករណ៍ប៉ាន់ស្មានដែលបានស្នើឡើងទីមួយ និងទីបី បង្ហាញពីប្រសិទ្ធភាពខ្ពស់ជាងឧបករណ៍ប៉ាន់ស្មានមុនៗដែលបង្កើតដោយ Pandey និង Dubey (1988) និងអ្នកផ្សេងទៀត។
ឧបករណ៍ប៉ាន់ស្មានទីបីទទួលបានប្រសិទ្ធភាពធៀបភាគរយ (Percent Relative Efficiency) ខ្ពស់បំផុតរហូតដល់ ៣៥០.៩១% នៅក្នុងការធ្វើតេស្តលើទិន្នន័យជាក់ស្តែង។
ការប្រើប្រាស់ចន្លោះអន្តរក្វាទីល (Inter-quartile range) និងមធ្យមក្វាទីលរួមជាមួយមេគុណនៃអថេរជំនួយ អាចកាត់បន្ថយកំហុសការេមធ្យមនៃការប៉ាន់ស្មានបានយ៉ាងមានប្រសិទ្ធភាព។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Existing Product Estimators (e.g., Pandey & Dubey) ឧបករណ៍ប៉ាន់ស្មានផលគុណដែលមានស្រាប់	ងាយស្រួលប្រើប្រាស់នៅពេលអថេរជំនួយ និងអថេរសិក្សាមានទំនាក់ទំនងអវិជ្ជមានដោយមិនត្រូវការទិន្នន័យស្មុគស្មាញច្រើន។	មិនបានប្រើប្រាស់ព័ត៌មានបន្ថែមដូចជាក្វាទីលនៃអថេរជំនួយ ដែលធ្វើឱ្យប្រសិទ្ធភាព និងសុក្រឹតភាពនៅមានកម្រិតនៅឡើយ។	ត្រូវបានប្រើជាគោល (Baseline) សម្រាប់ការប្រៀបធៀបប្រសិទ្ធភាពរបស់ឧបករណ៍ថ្មី។
Proposed Estimator 1 (y_AS1) ឧបករណ៍ប៉ាន់ស្មានដែលបានស្នើឡើងទី១ (ប្រើប្រាស់ចន្លោះអន្តរក្វាទីល និងមេគុណភាពវៀច)	ផ្តល់ប្រសិទ្ធភាពខ្ពស់ជាងវិធីសាស្ត្រចាស់ៗ និងកាត់បន្ថយកំហុសការេមធ្យម (MSE) បានយ៉ាងល្អប្រសើរ។	ទាមទារឱ្យមានទិន្នន័យអថេរជំនួយគ្រប់គ្រាន់ ដើម្បីគណនាក្វាទីល និងមេគុណភាពវៀចបានត្រឹមត្រូវ។	ទទួលបានប្រសិទ្ធភាពធៀបភាគរយ (PRE) រហូតដល់ ៣២៧.៤១% បើធៀបនឹងឧបករណ៍ប៉ាន់ស្មានរបស់ Pandey & Dubey។
Proposed Estimator 3 (y_AS3) ឧបករណ៍ប៉ាន់ស្មានដែលបានស្នើឡើងទី៣ (ប្រើប្រាស់មធ្យមក្វាទីល និងមេគុណភាពវៀច)	ជាឧបករណ៍ដែលផ្តល់ប្រសិទ្ធភាពខ្ពស់បំផុតក្នុងការសិក្សានេះសម្រាប់ការប៉ាន់ស្មានមធ្យមប្រជាករទាំងមូល។	ទោះបីជាផ្តល់កំហុសការេមធ្យមតូចបំផុត ប៉ុន្តែលទ្ធផលមានភាពលម្អៀង (Biased) បន្តិចបន្តួច និងត្រូវការការគណនាស្មុគស្មាញជាងវិធីបុរាណ។	ទទួលបានប្រសិទ្ធភាពធៀបភាគរយ (PRE) ខ្ពស់បំផុតរហូតដល់ ៣៥០.៧៩% បើធៀបនឹងឧបករណ៍ប៉ាន់ស្មានបុរាណ។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះមិនបានបញ្ជាក់ច្បាស់លាស់ពីការចំណាយលើធនធានកុំព្យូទ័រនោះទេ ប៉ុន្តែជាទូទៅការវិភាគនេះតម្រូវឱ្យមានកម្មវិធីកុំព្យូទ័រផ្នែកស្ថិតិ និងសំណុំទិន្នន័យសមស្រប។

Software: កម្មវិធីវិភាគស្ថិតិដូចជា R, Python (ប្រើបណ្ណាល័យ SciPy ឬ StatsModels) ឬ SPSS សម្រាប់ការគណនាប៉ារ៉ាម៉ែត្រក្វាទីល និងការវិភាគកំហុសអថេរ។
Dataset: សំណុំទិន្នន័យគំរូ និងទិន្នន័យប្រជាករដែលមានអថេរសិក្សា និងអថេរជំនួយ ដែលមានទំនាក់ទំនងអវិជ្ជមានជាមួយគ្នា (Negative correlation)។
Expertise: ចំណេះដឹងផ្នែកទ្រឹស្តីស្ថិតិកម្រិតខ្ពស់ ជាពិសេសពាក់ព័ន្ធនឹងទ្រឹស្តីនៃការជ្រើសរើសគំរូ កំហុសការេមធ្យម និងរង្វាស់ទម្រង់របាយ (Skewness និង Kurtosis)។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះបានសាកល្បងលើសំណុំទិន្នន័យពីសហរដ្ឋអាមេរិកស្តីពីពន្ធប្រេងឥន្ធនៈម៉ូតូ និងប្រវែងផ្លូវជាតិ ដែលមានទំហំគំរូតូចខ្លាំង (N=48, n=15) តាំងពីឆ្នាំ១៩៨០។ ទិន្នន័យនេះមិនឆ្លុះបញ្ចាំងពីបរិបទសេដ្ឋកិច្ច ឬភូមិសាស្ត្ររបស់ប្រទេសកម្ពុជានោះទេ ប៉ុន្តែទ្រឹស្តីស្ថិតិដែលបានអភិវឌ្ឍន៍អាចយកមកអនុវត្តជាសកលលើសំណុំទិន្នន័យផ្សេងៗដែលមានលក្ខណៈស្រដៀងគ្នា។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រប៉ាន់ស្មានដោយប្រើអថេរជំនួយនេះ មានអត្ថប្រយោជន៍យ៉ាងខ្លាំងសម្រាប់ប្រទេសកម្ពុជា ពិសេសក្នុងការធ្វើជំរឿន ឬការស្ទង់មតិដែលការប្រមូលទិន្នន័យជាក់ស្តែងមានការលំបាក និងចំណាយខ្ពស់។

វិស័យកសិកម្ម (Agriculture Sector): អាចប្រើដើម្បីប៉ាន់ស្មានទិន្នផលស្រូវសរុប (អថេរសិក្សា) ដោយផ្អែកលើទំហំផ្ទៃដីដាំដុះ ឬបរិមាណទឹកភ្លៀង (អថេរជំនួយ) ក្នុងខេត្តបាត់ដំបង ឬពោធិ៍សាត់។
វិស័យសេដ្ឋកិច្ច និងពន្ធដារ (Economy and Taxation): ស្ថាប័នរដ្ឋអាចយកទ្រឹស្តីនេះទៅគណនាប៉ាន់ស្មានចំណូលពន្ធមធ្យមប្រចាំតំបន់ ដោយប្រើប្រាស់ទិន្នន័យចំនួនបុគ្គលិក ឬទំហំអាជីវកម្មជាអថេរជំនួយជំនួស។
ការស្ទង់មតិសុខភាពសាធារណៈ (Public Health Surveys): អាចជួយប៉ាន់ស្មានអត្រាអ្នកជំងឺប្រចាំតំបន់ ដោយប្រើប្រាស់ទិន្នន័យចំនួនប្រជាជនសរុប ឬកម្រិតប្រាក់ចំណូលក្នុងគ្រួសារជាអថេរជំនួយក្នុងការសិក្សា។

ជារួម ការបញ្ជ្រាបប៉ារ៉ាម៉ែត្រក្វាទីល និងរូបរាងរបាយនៃទិន្នន័យទៅក្នុងឧបករណ៍ប៉ាន់ស្មាន នឹងជួយឱ្យអ្នកស្រាវជ្រាវ និងស្ថាប័នកម្ពុជាអាចទាញយកការសន្និដ្ឋានអំពីប្រជាករទាំងមូលបានកាន់តែសុក្រឹត ទោះបីជាមានទំហំគំរូតូចក៏ដោយ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះនៃទ្រឹស្តីជ្រើសរើសគំរូ: ស្វែងយល់ពីគោលគំនិតនៃការជ្រើសរើសគំរូចៃដន្យសាមញ្ញ និងការប្រើប្រាស់អថេរជំនួយ ដោយអានសៀវភៅស្ថិតិ ឬរៀនវគ្គសិក្សាតាមរយៈ Coursera ផ្នែក Sampling Theory។
អនុវត្តការសរសេរកូដសម្រាប់ការវិភាគទិន្នន័យបន្ថែម: រៀនគណនា និងបកស្រាយអំពី មេគុណភាពកំពូល (Kurtosis), ភាពវៀច (Skewness), និងក្វាទីល (Quartiles) ដោយប្រើប្រាស់បណ្ណាល័យ Pandas និង SciPy នៅក្នុងភាសា Python ឬការប្រើប្រាស់ភាសា R។
សាកល្បងសរសេរកូដសម្រាប់ឧបករណ៍ប៉ាន់ស្មានថ្មី: បំប្លែងសមីការប៉ាន់ស្មានផលគុណដែលបានស្នើឡើងនៅក្នុងឯកសារនេះ (y_AS1 ដល់ y_AS4) ជាទម្រង់កូដ Python និងប្រៀបធៀបកំហុសការេមធ្យម (MSE) របស់វាជាមួយនឹងវិធីសាស្ត្រធម្មតា។
អនុវត្តផ្ទាល់លើសំណុំទិន្នន័យជាក់ស្តែងនៅកម្ពុជា: ទាញយកសំណុំទិន្នន័យពិតប្រាកដពីវិទ្យាស្ថានជាតិស្ថិតិ (NIS Cambodia) ដូចជាទិន្នន័យជំរឿនកសិកម្ម ឬជំរឿនសេដ្ឋកិច្ច ហើយសាកល្បងអនុវត្តម៉ូដែលនេះដើម្បីវាយតម្លៃប្រសិទ្ធភាពរបស់វាក្នុងបរិបទប្រទេសកម្ពុជា។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Product Estimator (ឧបករណ៍ប៉ាន់ស្មានផលគុណ)	វិធីសាស្ត្រគណនាក្នុងស្ថិតិដែលត្រូវបានប្រើដើម្បីប៉ាន់ស្មានមធ្យមនៃប្រជាករ ដោយពឹងផ្អែកលើអថេរជំនួយដែលមានទំនាក់ទំនងអវិជ្ជមាន (negative correlation) ជាមួយនឹងអថេរសិក្សា។	ដូចជាការទស្សន៍ទាយថាថ្ងៃនេះនឹងលក់ឆ័ត្រដាច់តិចតួច ដោយមើលឃើញថាសីតុណ្ហភាពខាងក្រៅកំពុងតែកើនឡើងក្ដៅខ្លាំង (កាលណាអថេរមួយឡើង អថេរមួយទៀតចុះ)។
Auxiliary Variable (អថេរជំនួយ)	អថេរបន្ថែមដែលគេដឹងតម្លៃមុនរួចរាល់ ហើយមានទំនាក់ទំនងជាមួយនឹងអថេរចម្បងដែលគេចង់សិក្សា។ វាត្រូវបានប្រើប្រាស់ដើម្បីជួយឱ្យការប៉ាន់ស្មានតម្លៃអថេរចម្បងមានភាពសុក្រឹតជាងមុន។	ដូចជាការប្រើប្រាស់ព័ត៌មានអំពី 'កម្ពស់' របស់មនុស្សម្នាក់ ដើម្បីជួយទាយ 'ទម្ងន់' របស់គាត់ឱ្យកាន់តែជិតការពិត។
Coefficient of Kurtosis (មេគុណភាពកំពូល)	រង្វាស់ស្ថិតិដែលបង្ហាញពីភាពស្រួច ឬសំប៉ែតនៃកំពូលរបាយទិន្នន័យ (distribution) ក៏ដូចជាកម្រិតនៃទិន្នន័យដែលនៅចុងសងខាង (tails) បើធៀបនឹងរបាយធម្មតា (normal distribution)។	ដូចជាការវាស់ថាតើភ្នំមួយមានកំពូលស្រួចខ្លាំង ឬរាបស្មើ បើប្រៀបធៀបទៅនឹងភ្នំទូទៅ។
Coefficient of Skewness (មេគុណភាពវៀច)	រង្វាស់ដែលវាស់ពីភាពមិនស៊ីមេទ្រី (អតុល្យភាព) នៃរបាយទិន្នន័យ ដែលប្រាប់យើងថាតើទិន្នន័យភាគច្រើនផ្ដុំគ្នានៅខាងឆ្វេង ឬខាងស្ដាំនៃចំណុចកណ្តាល (មធ្យមភាគ)។	ដូចជាជញ្ជីងដែលមានទម្ងន់ធ្ងន់ផ្អៀងទៅតែម្ខាង ដែលបង្ហាញថាទិន្នន័យមិនមានតុល្យភាពស្មើគ្នាសងខាង។
Inter-quartile range (ចន្លោះអន្តរក្វាទីល)	រង្វាស់នៃការបែកខ្ញែកទិន្នន័យ ដោយវាស់គម្លាតរវាងក្វាទីលទី១ (២៥%) និងក្វាទីលទី៣ (៧៥%) ដែលតំណាងឱ្យពាក់កណ្តាលកណ្តាលនៃសំណុំទិន្នន័យ ដោយមិនរាប់បញ្ចូលទិន្នន័យដែលខុសគេខ្លាំងពេកនៅចុងសងខាង (outliers)។	ដូចជាការមិនរាប់បញ្ចូលសិស្សដែលរៀនពូកែបំផុតលំដាប់កំពូល និងខ្សោយបំផុតនៅបាតតារាង ហើយផ្តោតមើលតែពិន្ទុរបស់សិស្សកម្រិតមធ្យមភាគច្រើននៅក្នុងថ្នាក់ដើម្បីវាយតម្លៃកម្រិតសិក្សារួម។
Mean Square Error (កំហុសការេមធ្យម)	រង្វាស់នៃកម្រិតភាពត្រឹមត្រូវនៃម៉ូដែលប៉ាន់ស្មាន ដោយគណនាមធ្យមនៃការេនៃគម្លាតរវាងតម្លៃដែលម៉ូដែលទាយបាន និងតម្លៃពិតប្រាកដ។ កាលណាតម្លៃនេះកាន់តែតូច ការប៉ាន់ស្មានកាន់តែមានភាពត្រឹមត្រូវ។	ដូចជាការវាស់ចម្ងាយសរុបនៃគ្រាប់ព្រួញនីមួយៗដែលអ្នកបាញ់ខុសពីចំណុចកណ្តាលនៃផ្ទាំងស៊ីប កាលណាចម្ងាយសរុបកាន់តែខ្លី ន័យថាអ្នកបាញ់កាន់តែចំគោលដៅ។
Simple Random Sampling (ការជ្រើសរើសគំរូចៃដន្យសាមញ្ញ)	វិធីសាស្ត្រទាញយកគំរូពីប្រជាករដែលសមាជិកនីមួយៗមានឱកាសស្មើៗគ្នាក្នុងការត្រូវបានជ្រើសរើស ដើម្បីធានាថាសំណុំទំរូមានភាពជាតំណាងល្អ និងគ្មានការលម្អៀង។	ដូចជាការចាប់ឆ្នោតផ្សងសំណាង ដោយសន្លឹកឆ្នោតទាំងអស់ត្រូវបានក្រឡុកចូលគ្នាយ៉ាងសព្វ ហើយចាប់យកមួយៗដោយមិនមើលមុន។
Percent Relative Efficiency (ប្រសិទ្ធភាពធៀបភាគរយ)	វិធីប្រៀបធៀបប្រសិទ្ធភាពរវាងឧបករណ៍ប៉ាន់ស្មានពីរ ដោយយកកំហុសការេមធ្យម (MSE) របស់វាចែកនឹងគ្នា ហើយគុណនឹង១០០។ បើតម្លៃនេះធំជាង ១០០% មានន័យថាឧបករណ៍ប៉ាន់ស្មានដែលស្នើឡើងមានប្រសិទ្ធភាពជាងឧបករណ៍គោល។	ដូចជាការប្រៀបធៀបកម្រិតស៊ីសាំងរវាងម៉ូតូពីរគ្រឿង បើលទ្ធផលលើសពី ១០០% បានន័យថាម៉ូតូថ្មីរត់បានឆ្ងាយជាងនិងសន្សំសំចៃជាងម៉ូតូចាស់។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖