បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហានៃការប៉ាន់ស្មានរបាយអ៉ីពែរធរណីមាត្រ (Hypergeometric distribution) ដែលមានភាពស្មុគស្មាញនៅពេលប្រភាគគំរូធំជាង ០.១ ដោយស្នើឡើងនូវរូបមន្តប្រូបាប៊ីលីតេទ្វេធាកែសម្រួលថ្មីមួយ។
វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះប្រើប្រាស់ការធ្វើត្រាប់តាម (Simulation study) ដើម្បីប្រៀបធៀបភាពត្រឹមត្រូវនិងប្រសិទ្ធភាពនៃវិធីសាស្ត្រប៉ាន់ស្មានចំនួនបីផ្សេងគ្នាដោយផ្អែកលើការវាស់វែងចម្ងាយ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Hypergeometric Distribution (Exact) ការគណនារបាយអ៉ីពែរធរណីមាត្រជាក់ស្តែង (Baseline) |
ផ្តល់តម្លៃប្រូបាប៊ីលីតេពិតប្រាកដ និងជាក់ស្តែងបំផុតដោយមិនចាំបាច់មានការប៉ាន់ស្មាន។ | មានភាពលំបាកក្នុងការគណនា និងរៀបចំទម្រង់បែបបទវិភាគតាមបែបគណិតវិទ្យានៅពេលចំនួនប្រជាជនមានទំហំធំខ្លាំង។ | ជាតម្លៃគោល (Baseline) សម្រាប់វាស់វែងគម្លាត (TVD) នៃវិធីសាស្ត្រប៉ាន់ស្មានផ្សេងៗទៀត។ |
| Binomial Approximation ការប៉ាន់ស្មានតាមរបាយទ្វេធាធម្មតា |
ងាយស្រួលគណនា និងមានប្រសិទ្ធភាពគ្រប់គ្រាន់នៅពេលប្រភាគគំរូ (Sampling fraction, f) តូចជាង ឬស្មើ ០.១។ | បាត់បង់ភាពត្រឹមត្រូវនៅពេលប្រភាគគំរូ (f) ធំជាង ០.១ ដែលធ្វើឱ្យមានកំហុស (Error) កើនឡើងខ្លាំង។ | ចម្ងាយបម្រែបម្រួលសរុប (TVD) ឡើងដល់ប្រហែល ០.១២ សម្រាប់ f=0.4, p=0.02 និង N=100 ដែលជាតម្លៃខ្ពស់ជាងគេ។ |
| Ord's Approximation ការប៉ាន់ស្មានរបស់ Ord |
ផ្តល់លទ្ធផលគ្រាន់បើជាងការប៉ាន់ស្មានទ្វេធាធម្មតា ក្នុងការរក្សាគម្លាតបម្រែបម្រួលឱ្យនៅទាបជាង ០.០៤។ | នៅតែមិនអាចយកឈ្នះវិធីសាស្ត្រ Modified Binomial បានទេ បើទោះជាប្រភាគគំរូធំ ឬតូចក្តី។ | ចម្ងាយបម្រែបម្រួលសរុប (TVD) មិនលើសពី ០.០៤ សម្រាប់ចំនួនប្រជាជន (N) ពី 100 ដល់ 20000 ពេល f > 0.1។ |
| Modified Binomial Approximation (using Krawtchouk's Polynomial) ការប៉ាន់ស្មានទ្វេធាដែលបានកែសម្រួលដោយប្រើពហុធា Krawtchouk |
មានភាពត្រឹមត្រូវខ្ពស់បំផុត និងមានចម្ងាយបម្រែបម្រួលសរុប (TVD) តូចជាងគេជានិច្ច ទោះជាប្រភាគគំរូមានទំហំធំជាង ០.១ ក៏ដោយ។ | រូបមន្តមានភាពស្មុគស្មាញវែងអន្លាយ និងទាមទារការគណនាថ្នាក់ខ្ពស់ (រហូតដល់ r=4) ជាងវិធីសាស្ត្រធម្មតា។ | គម្លាត (TVD) ខិតជិតសូន្យបំផុតសម្រាប់ f តូច និងមានតម្លៃទាបជាងគេបំផុតធៀបនឹងវិធីសាស្ត្រផ្សេងទៀតសម្រាប់គ្រប់ស្ថានភាពទាំង ២៨៨។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ទោះបីជាឯកសារមិនបានបញ្ជាក់ចំៗពីឧបករណ៍ដែលត្រូវប្រើក៏ដោយ ការធ្វើត្រាប់តាម (Simulation study) លើស្ថានភាពចំនួន ២៨៨ ផ្សេងៗគ្នា ទាមទារឱ្យមានកម្មវិធីកុំព្យូទ័រផ្នែកស្ថិតិ និងចំណេះដឹងគណិតវិទ្យា។
ការសិក្សានេះពឹងផ្អែកទាំងស្រុងលើទិន្នន័យធ្វើត្រាប់តាម (Simulated Data) ដោយកុំព្យូទ័រ ផ្អែកលើទ្រឹស្តីគណិតវិទ្យាសុទ្ធសាធ (Theoretical Mathematics)។ ដោយសារវាមិនពាក់ព័ន្ធនឹងទិន្នន័យជីវសាស្ត្រ ឬប្រជាសាស្ត្រជាក់ស្តែង វាមិនមានបញ្ហាលម្អៀងទិន្នន័យ (Data Bias) ឡើយ។ ភាពគ្មានលម្អៀងនេះធានាថារូបមន្តអាចត្រូវយកទៅអនុវត្តបានជាសកល រួមទាំងការសិក្សាស្ថិតិក្នុងប្រទេសកម្ពុជាផងដែរ។
រូបមន្តប្រូបាប៊ីលីតេដែលបានកែសម្រួលនេះ មានសារៈប្រយោជន៍ខ្ពស់សម្រាប់ការងារវិភាគស្ថិតិ និងការគ្រប់គ្រងគុណភាពនៅប្រទេសកម្ពុជា។
ជារួម វិធីសាស្ត្រនេះផ្តល់នូវឧបករណ៍គណិតវិទ្យាដ៏រឹងមាំសម្រាប់អ្នកស្ថិតិ និងអ្នកស្រាវជ្រាវកម្ពុជា ក្នុងការបង្កើនភាពត្រឹមត្រូវនៃរបាយការណ៍របស់ពួកគេ។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Hypergeometric Distribution (របាយអ៉ីពែរធរណីមាត្រ) | ជារបាយប្រូបាប៊ីលីតេដែលត្រូវបានប្រើដើម្បីគណនាឱកាសនៃការទទួលបានលទ្ធផលជាក់លាក់មួយ នៅពេលដែលការដកសំណាកត្រូវបានធ្វើឡើងដោយមិនមានការដាក់វត្ថុនោះចូលទៅក្នុងបណ្តុំដើមវិញ (Without replacement) ដែលធ្វើឱ្យប្រូបាប៊ីលីតេនៃការទាញយកម្តងៗមានការប្រែប្រួល។ | វាប្រៀបដូចជាការចាប់បៀចេញពីហ៊ូដោយមិនដាក់ចូលវិញ ដែលរាល់ពេលអ្នកចាប់បានសន្លឹកមួយ ឱកាសក្នុងការចាប់បានសន្លឹកបន្ទាប់នឹងផ្លាស់ប្តូរជានិច្ច។ |
| Binomial Distribution (របាយទ្វេធា) | ជារបាយប្រូបាប៊ីលីតេដែលវាស់វែងចំនួនដងនៃភាពជោគជ័យក្នុងព្រឹត្តិការណ៍សាកល្បងដែលមានលទ្ធផលតែពីរ (ជោគជ័យ ឬបរាជ័យ) ដោយរាល់ការសាកល្បងនីមួយៗគឺឯករាជ្យពីគ្នា (With replacement)។ | វាប្រៀបដូចជាការបោះកាក់រាល់ដង ដែលមិនថាអ្នកបោះប៉ុន្មានដងទេ ឱកាសចេញ 'ក្បាល' ឬ 'ប៉ោល' គឺនៅតែ ៥០/៥០ ដដែល។ |
| Krawtchouk’s Polynomial (ពហុធា Krawtchouk) | គឺជាទម្រង់សមីការគណិតវិទ្យា (Orthogonal polynomials) ដែលមានទំនាក់ទំនងយ៉ាងជិតស្និទ្ធជាមួយរបាយទ្វេធា ហើយត្រូវបានប្រើប្រាស់ក្នុងការសិក្សានេះដើម្បីពង្រីក និងកែតម្រូវការប៉ាន់ស្មានឱ្យកាន់តែសុក្រឹត។ | វាប្រៀបដូចជាប៊ូតុងកែតម្រូវរលកសញ្ញាវិទ្យុ (Fine-tuning) ដែលជួយចាប់យកសំឡេងដែលនៅមិនច្បាស់ ឱ្យមកជាច្បាស់ល្អត្រឹមត្រូវ។ |
| Sampling Fraction (ប្រភាគនៃការដកសំណាក) | គឺជាផលធៀបរវាងទំហំនៃគំរូដែលត្រូវបានជ្រើសរើស (n) ធៀបនឹងទំហំនៃប្រជាជនសរុប (N)។ នៅពេលប្រភាគនេះមានទំហំធំ (>0.1) ការប្រើប្រាស់រូបមន្តធម្មតានឹងមានកំហុសច្រើន។ | វាប្រៀបដូចជាការដួសទឹកស៊ុបមួយស្លាបព្រាពីឆ្នាំងធំ (ប្រភាគតូច) ធៀបនឹងការដួសស៊ុបពាក់កណ្តាលឆ្នាំង (ប្រភាគធំ) ដែលធ្វើឱ្យរសជាតិឬបរិមាណដែលនៅសល់ប្រែប្រួលខ្លាំង។ |
| Total Variation Distance (ចម្ងាយបម្រែបម្រួលសរុប) | ជារង្វាស់ស្ថិតិដែលប្រាប់ពីកម្រិតនៃភាពខុសគ្នា (ឬកំហុស) រវាងរបាយប្រូបាប៊ីលីតេពីរផ្សេងគ្នា។ តម្លៃកាន់តែខិតជិតសូន្យ មានន័យថាការប៉ាន់ស្មានកាន់តែមានភាពត្រឹមត្រូវខ្ពស់។ | វាប្រៀបដូចជាការយកស្រមោលពីរមកត្រួតស៊ីគ្នា ហើយវាស់មើលថាមានគែមណាខ្លះដែលលៀនចេញមិនស៊ីគ្នា។ បើលៀនចេញតិច មានន័យថាវាដូចគ្នាខ្លាំង។ |
| Simple Random Sampling without Replacement (ការជ្រើសរើសគំរូចៃដន្យសាមញ្ញដោយមិនដាក់ចូលវិញ) | ជាបច្ចេកទេសជ្រើសរើសគំរូដែលសមាជិកនីមួយៗមានឱកាសស្មើគ្នាក្នុងការត្រូវបានជ្រើសរើស ប៉ុន្តែនៅពេលដែលសមាជិកណាមួយត្រូវបានជ្រើសរើសហើយ វាមិនអាចត្រូវបានជ្រើសរើសជាលើកទីពីរនោះទេ។ | ដូចជាការចាប់ឆ្នោតយករង្វាន់ ដែលអ្នកឈ្នះរួចហើយមិនអាចចូលរួមចាប់ឆ្នោតម្តងទៀតបានទេ។ |
| Ord’s Probability / Approximation (ការប៉ាន់ស្មានរបស់ Ord) | ជារូបមន្តស្ថិតិជំនួសមួយបែបដែលត្រូវបានបង្កើតឡើងដើម្បីប៉ាន់ស្មានរបាយអ៉ីពែរធរណីមាត្រទៅជារបាយទ្វេធា ដែលជាទូទៅផ្តល់លទ្ធផលល្អប្រសើរជាងរូបមន្តធម្មតា ប៉ុន្តែនៅមានកម្រិតបើធៀបនឹងរូបមន្តថ្មី។ | ដូចជាការប្រើរូបមន្តកាត់កេរ្តិ៍ចាស់មួយដើម្បីព្យាករណ៍អាកាសធាតុ ដែលមានភាពត្រឹមត្រូវល្មម ប៉ុន្តែមិនអាចប្រៀបនឹងប្រព័ន្ធផ្កាយរណបថ្មីបានទេ។ |
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖