បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហាប្រឈមក្នុងការទាញយកការប៉ាន់ស្មានស្ថិតិដូចជាតម្លៃមធ្យម និងពិន្ទុភាគរយ ឱ្យបានត្រឹមត្រូវពីទិន្នន័យសេដ្ឋកិច្ចដែលប្រមូលបានជាទម្រង់កម្រិតចន្លោះ (Interval-censored data) ដើម្បីជួយកាត់បន្ថយការចំណាយលើការអង្កេត។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះស្នើឡើងនូវម៉ូដែលប៉ាន់ស្មានដង់ស៊ីតេថ្មីមួយ និងធ្វើការវាយតម្លៃដំណើរការរបស់វាធៀបនឹងវិធីសាស្ត្រមុនៗតាមរយៈការសិក្សាក្លែងធ្វើទិន្នន័យ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Piecewise Quadratic Density Estimator (PQDE) ឧបករណ៍ប៉ាន់ស្មានដង់ស៊ីតេប្រភេទ Piecewise Quadratic (វិធីសាស្ត្រស្នើឡើង) |
មានភាពសាមញ្ញ ងាយស្រួលក្នុងការធ្វើស្វ័យប្រវត្តិកម្ម និងមានតម្លៃថោកក្នុងការគណនា។ អាចរក្សាផ្ទៃក្រឡាក្នុងចន្លោះនីមួយៗបានល្អ និងស័ក្តិសមបំផុតសម្រាប់ទិន្នន័យកម្រិតចន្លោះ (Interval-censored data) ទំហំធំ។ | អាចបង្កើតជាទម្រង់កោងអវិជ្ជមានក្នុងករណីខ្លះ (ទោះបីជាមានវិធីកែតម្រូវក៏ដោយ) និងអាចពង្រីកកំហុសសំណាក (Sampling errors) នៅត្រង់ផ្នែកកន្ទុយនៃរបាយ (Tails) ប្រសិនបើទំហំសំណាកតូចពេក។ | សម្រេចបាននូវកំហុសការេមធ្យមធៀប (Relative MSE) ត្រឹមតែ ២.១១១% សម្រាប់តម្លៃមធ្យម (ក្នុងសំណាកទំហំ ៥០០) ដែលប្រហាក់ប្រហែលខ្លាំងទៅនឹងការគណនាផ្ទាល់ពីទិន្នន័យដែលមិនបានកម្រិត។ |
| Direct Estimation from Uncensored Point Data ការប៉ាន់ស្មានផ្ទាល់ពីទិន្នន័យចំណុចដែលមិនត្រូវបានកម្រិត (ស្តង់ដារគោល) |
ផ្តល់នូវភាពត្រឹមត្រូវខ្ពស់បំផុត ដោយសារវាប្រើប្រាស់តម្លៃពិតប្រាកដនៃទិន្នន័យនីមួយៗក្នុងការគណនាតម្លៃមធ្យម និងភាគរយ។ | ការប្រមូលទិន្នន័យលម្អិតបែបនេះសម្រាប់ការអង្កេតប្រជាជនទំហំធំ គឺមានការចំណាយថវិកា និងពេលវេលាខ្ពស់ខ្លាំងណាស់ ព្រមទាំងប្រឈមនឹងបញ្ហាសម្ងាត់ទិន្នន័យ។ | ផ្តល់តម្លៃ Relative MSE ២.០៣៣% សម្រាប់តម្លៃមធ្យម (ក្នុងសំណាកទំហំ ៥០០) ដែលត្រូវបានប្រើជាបន្ទាត់គោល (Baseline) សម្រាប់វាស់ស្ទង់ប្រសិទ្ធភាពរបស់ PQDE ។ |
| Kernel Density Estimate (KDE) on Point Data ការប៉ាន់ស្មានដង់ស៊ីតេខឺណែល (KDE) លើទិន្នន័យចំណុច |
ផ្តល់នូវខ្សែកោងរលូនល្អ និងមានប្រសិទ្ធភាពក្នុងការកាត់បន្ថយកំហុសឆ្គងពីការទាញយកសំណាកនៅផ្នែកកន្ទុយនៃរបាយ។ | ទាមទារទិន្នន័យចំណុចច្បាស់លាស់ (Point data) សម្រាប់ការគណនា ហើយជួនកាលធ្វើឱ្យបាត់បង់ទម្រង់របាយទ្វេ (Bimodal shape) ដោយសារកម្រិតនៃការធ្វើឱ្យរលូន (Smoothing parameter) ខ្លាំងពេក។ | ប្រើប្រាស់ជាចម្បងសម្រាប់ការប្រៀបធៀបរូបភាព (Visual baseline) ដើម្បីបញ្ជាក់ថា PQDE អាចរក្សារាងរបាយបានល្អជាង KDE ក្នុងករណីទិន្នន័យមានទម្រង់ជា Bimodal។ |
ការចំណាយលើធនធាន (Resource Cost)៖ វិធីសាស្ត្រនេះត្រូវបានរចនាឡើងដើម្បីមានភាពសាមញ្ញ និងចំណាយធនធានកុំព្យូទ័រតិចតួចបំផុតក្នុងការគណនា ដែលជួយឱ្យគម្រោងអង្កេតទ្រង់ទ្រាយធំអាចកាត់បន្ថយការចំណាយលើការប្រមូលទិន្នន័យបានយ៉ាងច្រើនសន្ធឹកសន្ធាប់។
ការសិក្សានេះប្រើប្រាស់ទិន្នន័យក្លែងធ្វើ (Synthetic data) ដែលបង្កើតឡើងដោយផ្អែកលើលក្ខណៈទិន្នន័យប្រាក់ឈ្នួលនៃការអង្កេត OES របស់សហរដ្ឋអាមេរិក (ផ្តោតលើរបាយ Lognormal និង Bimodal)។ សម្រាប់ប្រទេសកម្ពុជា ការចែកចាយប្រាក់ចំណូល ឬប្រាក់ឈ្នួលនៅក្នុងវិស័យក្រៅប្រព័ន្ធ (Informal sector) អាចមានលក្ខណៈខុសប្លែក និងមានភាពលម្អៀងផ្សេងៗ ដែលទាមទារឱ្យមានការសាកល្បង និងកែតម្រូវចន្លោះថ្នាក់ (Interval bounds) ឡើងវិញមុននឹងយកមកអនុវត្តជាក់ស្តែង។
វិធីសាស្ត្រ PQDE នេះមានសក្តានុពលខ្ពស់សម្រាប់ស្ថាប័នរដ្ឋ និងអង្គការនានានៅកម្ពុជា ក្នុងការធ្វើអង្កេតសេដ្ឋកិច្ច ឬសង្គមទ្រង់ទ្រាយធំប្រកបដោយប្រសិទ្ធភាពចំណាយ។
ជារួម ឧបករណ៍នេះអាចជួយប្រទេសកំពុងអភិវឌ្ឍន៍ដូចជាកម្ពុជា កាត់បន្ថយការចំណាយលើការប្រមូលទិន្នន័យសេដ្ឋកិច្ចបានយ៉ាងច្រើន ខណៈនៅតែទទួលបានការប៉ាន់ស្មានស្ថិតិដែលមានភាពត្រឹមត្រូវ និងគួរជាទីទុកចិត្ត។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Interval-censored data | ទិន្នន័យដែលត្រូវបានប្រមូល និងកត់ត្រាជាទម្រង់ចន្លោះ (ឧទាហរណ៍៖ ចំណូលពី ១០០ ទៅ ២០០ ដុល្លារ) ជាជាងការកត់ត្រាតម្លៃពិតប្រាកដនីមួយៗ។ វាត្រូវបានប្រើប្រាស់ជាញឹកញាប់ក្នុងការអង្កេតដើម្បីកាត់បន្ថយការចំណាយ និងងាយស្រួលប្រមូលព័ត៌មានពីអ្នកឆ្លើយតប។ | ដូចជាការសួរអាយុមនុស្សថា 'តើអ្នកមានអាយុចន្លោះពី ២០ ទៅ ៣០ ឆ្នាំ ឬ ៣០ ទៅ ៤០ ឆ្នាំ?' ជាជាងសួររកអាយុពិតប្រាកដជាតួលេខច្បាស់លាស់។ |
| Piecewise quadratic density estimator | វិធីសាស្ត្រស្ថិតិដែលបង្កើតឡើងក្នុងឯកសារនេះ ដើម្បីប៉ាន់ស្មានទម្រង់របាយទិន្នន័យ ដោយប្រើប្រាស់សមីការដឺក្រេទី២ (ប៉ារ៉ាបូល) យកមកតភ្ជាប់គ្នាតាមចន្លោះថ្នាក់ទិន្នន័យនីមួយៗ ដើម្បីបង្កើតបានជាខ្សែកោងរលូនមួយតំណាងឱ្យទិន្នន័យទាំងមូលដោយរក្សាទំហំផ្ទៃក្រឡាឱ្យនៅដដែល។ | ដូចជាការយកដែកពត់រាងកោងខ្លីៗ (ប៉ារ៉ាបូល) ជាច្រើនដុំ មកផ្សារភ្ជាប់គ្នាតាមចន្លោះនីមួយៗ ដើម្បីបង្កើតជារូបរាងស្ពានកោងមួយដែលរលូនជាប់គ្នា។ |
| Kernel density estimate | វិធីសាស្ត្រមិនផ្អែកលើប៉ារ៉ាម៉ែត្រ (Non-parametric) សម្រាប់ប៉ាន់ស្មានអនុគមន៍ដង់ស៊ីតេប្រូបាប៊ីលីតេនៃអថេរចៃដន្យ ដោយវាធ្វើឱ្យទិន្នន័យចំណុចនីមួយៗមានភាពរលូន (Smoothing) ក្លាយជាខ្សែកោងជាប់គ្នាដែលបង្ហាញពីរបាយនៃទិន្នន័យពិត។ | ដូចជាការទម្លាក់គ្រាប់ខ្សាច់មួយក្ដាប់ទៅលើដី គ្រាប់ខ្សាច់នីមួយៗតំណាងឱ្យទិន្នន័យ ដែលពេលវារួមបញ្ចូលគ្នាបង្កើតបានជាពំនូកខ្សាច់ធំមួយដែលមានរាងរលូន។ |
| Lognormal Distribution | របាយប្រូបាប៊ីលីតេនៃអថេរចៃដន្យដែលតម្លៃលោការីតរបស់វាមានទម្រង់ជារបាយធម្មតា (Normal distribution)។ វាតែងតែត្រូវបានប្រើប្រាស់ដើម្បីពណ៌នាពីរបាយប្រាក់ឈ្នួល ព្រោះវាមិនមានតម្លៃអវិជ្ជមាន និងមានកន្ទុយលាតសន្ធឹងវែងទៅខាងស្តាំ (Positive skew)។ | ដូចជារបាយនៃទ្រព្យសម្បត្តិក្នុងសង្គម ដែលមនុស្សភាគច្រើនមានចំណូលមធ្យម (ប្រមូលផ្តុំនៅខាងឆ្វេង) ប៉ុន្តែមានមនុស្សតិចតួចណាស់ដែលមានទ្រព្យសម្បត្តិមហាសាល (កន្ទុយលាតវែងទៅស្តាំ)។ |
| Bimodal Distribution | ទម្រង់នៃរបាយទិន្នន័យដែលមានចំណុចកំពូល (កន្លែងមានទិន្នន័យប្រមូលផ្តុំច្រើន) ចំនួនពីរផ្សេងគ្នា។ នៅក្នុងទិន្នន័យសេដ្ឋកិច្ច វាបង្ហាញថាមានក្រុមប្រជាជនពីរដែលមានលក្ខណៈខុសគ្នា (ឧទាហរណ៍៖ កម្មករជំនាញ និងកម្មករគ្មានជំនាញ) លាយឡំគ្នាក្នុងសំណុំទិន្នន័យតែមួយ។ | ដូចជាការវាស់កម្ពស់សិស្សក្នុងថ្នាក់មួយដែលមានទាំងក្មេងប្រុស និងក្មេងស្រី ដែលកម្ពស់មធ្យមរបស់ក្មេងប្រុស និងក្មេងស្រីបង្កើតបានជាកំពូលភ្នំពីរខុសគ្នានៅលើតារាងតែមួយ។ |
| Mean Square Error | រង្វាស់ស្ថិតិដែលប្រើសម្រាប់វាយតម្លៃភាពត្រឹមត្រូវនៃម៉ូដែលប៉ាន់ស្មាន ដោយគណនាមធ្យមភាគនៃការ៉េនៃផលសងរវាងតម្លៃដែលបានប៉ាន់ស្មានដោយម៉ូដែល និងតម្លៃពិតប្រាកដ។ តម្លៃកំហុសនេះកាន់តែតូច បង្ហាញថាម៉ូដែលកាន់តែមានភាពសុក្រឹត។ | ដូចជាការប្រកួតបាញ់ធ្នូ ដែលគេវាស់ចម្ងាយពីចំណុចព្រួញដោតទៅកាន់ចំណុចកណ្តាលស៊ីប រួចយកចម្ងាយនោះមកលើកជាការ៉េដើម្បីដាក់ពិន័យឱ្យកាន់តែធ្ងន់ធ្ងរចំពោះការបាញ់ខុសគោលដៅឆ្ងាយ។ |
| Connector points | ចំណុចព្រំដែនរវាងចន្លោះថ្នាក់នីមួយៗនៅលើក្រាហ្វ ដែលតម្លៃនៃអនុគមន៍ប៉ារ៉ាបូលខាងឆ្វេង និងខាងស្តាំត្រូវជួបគ្នា ហើយក្បួនដោះស្រាយតម្រូវឱ្យចំណុចទាំងនេះមានភាពរលូន ជៀសវាងការបត់ស្រួចៗដែលអាចកាត់ផ្តាច់រូបរាងរបាយទិន្នន័យ។ | ដូចជាសន្លាក់តភ្ជាប់ផ្លូវដែកពីរទូ ដែលវិស្វករត្រូវកែតម្រូវកម្ពស់វាឱ្យស្មើគ្នា និងរលូនល្អ ដើម្បីកុំឱ្យរថភ្លើងរលាក់ខ្លាំងពេលបើកឆ្លងកាត់។ |
| Closed-form | សមីការគណិតវិទ្យាដែលអាចដោះស្រាយ ឬគណនារកចម្លើយបានដោយផ្ទាល់តាមរយៈចំនួនជំហានកំណត់ជាក់លាក់មួយ ដោយមិនតម្រូវឱ្យប្រើប្រាស់កម្មវិធីកុំព្យូទ័រធ្វើការគណនាប៉ាន់ស្មានម្តងហើយម្តងទៀត (Iterative approximation) ឡើយ។ | ដូចជាការចុចម៉ាស៊ីនគិតលេខតាមរូបមន្ត 1+1=2 ដែលទទួលបានចម្លើយភ្លាមៗ និងជាក់លាក់ ជាជាងការស្មានចម្លើយសាកល្បងរហូតទាល់តែត្រូវ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖