បញ្ហា (The Problem)៖ ទិន្នន័យស៊េរីពេលវេលា (Time series) តែងតែរងផលប៉ះពាល់ដោយទិន្នន័យខុសប្រក្រតី (Outliers) ដែលធ្វើឱ្យការប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្រសម្រាប់ដំណើរការ Gaussian AR(1) មានភាពលំអៀង និងមិនច្បាស់លាស់។ ការសិក្សានេះដោះស្រាយបញ្ហាទិន្នន័យខុសប្រក្រតីបូកបញ្ចូល (Additive Outliers) ដែលធ្វើឱ្យខូចខាតដល់ភាពត្រឹមត្រូវនៃម៉ូដែលស្ថិតិ។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានប្រើប្រាស់ការធ្វើត្រាប់តាមម៉ុងតេការឡូ (Monte Carlo simulations) ដើម្បីប្រៀបធៀបឧបករណ៍ប៉ាន់ប្រមាណចំនួនបួនផ្សេងគ្នា ដោយស្នើឡើងនូវវិធីសាស្ត្ររឹងមាំថ្មីមួយ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Weighted symmetric estimator (W) ឧបករណ៍ប៉ាន់ប្រមាណស៊ីមេទ្រីមានទម្ងន់មូលដ្ឋាន |
ងាយស្រួលក្នុងការគណនា និងប្រើប្រាស់ជាមូលដ្ឋានសម្រាប់ទិន្នន័យធម្មតាដែលគ្មានកំហុស។ | ងាយរងគ្រោះ និងប្រែប្រួលខ្លាំងនៅពេលមានវត្តមានទិន្នន័យខុសប្រក្រតី (Outliers) ធ្វើឱ្យមានភាពលំអៀងធ្ងន់ធ្ងរ។ | មានកំហុសការ៉េមធ្យម (MSE) ធំជាងគេបំផុតនៅក្នុងការធ្វើត្រាប់តាមស្ទើរតែទាំងអស់ ពិសេសពេលមានការរំខានពីកំហុសទិន្នន័យ។ |
| Recursive mean adjusted weighted symmetric estimator (R-W) ឧបករណ៍ប៉ាន់ប្រមាណកែតម្រូវដោយមធ្យមវិលជុំ |
មានភាពប្រសើរជាងវិធីសាស្ត្រមូលដ្ឋានក្នុងការកាត់បន្ថយភាពលម្អៀងនៃកំហុស។ | ការប្រើប្រាស់មធ្យម (Mean) នៅតែធ្វើឱ្យការគណនារងឥទ្ធិពលពីទិន្នន័យខុសប្រក្រតីធំៗដដែល។ | ផ្តល់កំហុសការ៉េមធ្យម (MSE) ទាបជាងវិធីសាស្ត្រមូលដ្ឋាន ប៉ុន្តែនៅតែខ្ពស់ជាងវិធីប្រើមេដ្យាន។ |
| Recursive median adjusted weighted symmetric estimator (Rmd-W) ឧបករណ៍ប៉ាន់ប្រមាណកែតម្រូវដោយមេដ្យានវិលជុំ |
មានភាពរឹងមាំ (Robust) ជាងមុនចំពោះទិន្នន័យខុសប្រក្រតី ដោយសារមេដ្យានមិនសូវរងឥទ្ធិពលពីតម្លៃខ្លាំងតូចឬធំពេក។ | ប្រសិទ្ធភាពនៅមានកម្រិតបើធៀបនឹងការកាត់តម្លៃចុងសងខាង (winsorized) នៃទិន្នន័យទាំងស្រុង។ | ជាទូទៅទទួលបានចំណាត់ថ្នាក់ល្អលេខ ២ ក្នុងចំណោមវិធីសាស្ត្រទាំងអស់ដែលមាន MSE ទាប។ |
| Adjusted recursive median based on α-winsorized mean (W-Rmd-W) ឧបករណ៍ប៉ាន់ប្រមាណស្នើឡើងថ្មីកែតម្រូវដោយមធ្យម α-winsorized នៃមេដ្យានវិលជុំ |
មានភាពរឹងមាំបំផុតប្រឆាំងនឹងទិន្នន័យខុសប្រក្រតី ព្រោះលុបបំបាត់ឥទ្ធិពលតម្លៃចុងសងខាងទាំងស្រុងដោយជំនួសវាដោយតម្លៃដែលសង្កេតឃើញជិតបំផុត។ | ត្រូវការការគណនាស្មុគស្មាញ និងមានច្រើនដំណាក់កាលជាងវិធីមុនៗ។ | ផ្តល់កំហុសការ៉េមធ្យម (MSE) ទាបបំផុតក្នុងស្ទើរតែគ្រប់ស្ថានភាព ជាពិសេសពេលសំណាកតូចនិងពេលតម្លៃ ρ កៀកនឹង ១។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះពឹងផ្អែកទាំងស្រុងលើការធ្វើត្រាប់តាមតាមប្រព័ន្ធកុំព្យូទ័រ (Computer Simulations) ដូច្នេះវាមិនតម្រូវឱ្យមានការចុះប្រមូលទិន្នន័យផ្ទាល់នោះទេ។
ការសិក្សានេះពឹងផ្អែកទាំងស្រុងលើការធ្វើត្រាប់តាមបែបគណិតវិទ្យាដោយកុំព្យូទ័រ ដូច្នេះវាមិនមានបញ្ហាលំអៀងទៅលើប្រជាសាស្ត្រ ឬតំបន់ភូមិសាស្ត្រជាក់លាក់ណាមួយឡើយ។ ទោះជាយ៉ាងណាក៏ដោយ ទិន្នន័យជាក់ស្តែងនៅក្នុងប្រទេសកម្ពុជា (ដូចជាសេដ្ឋកិច្ច ឬអាកាសធាតុ) អាចមានប្រភេទនៃទិន្នន័យខុសប្រក្រតីចម្រុះ និងស្មុគស្មាញជាងការសន្មត់ខាងទ្រឹស្តីនៅក្នុងការសិក្សានេះ។
ទោះបីជាការសិក្សានេះជាការសាកល្បងបែបទ្រឹស្តីក៏ដោយ វិធីសាស្ត្ររឹងមាំ (Robust method) នេះមានប្រយោជន៍យ៉ាងខ្លាំងសម្រាប់ការវិភាគទិន្នន័យនៅកម្ពុជា ដែលតែងតែមានភាពខ្វះចន្លោះ ឬកំហុសក្នុងការកត់ត្រាដោយដៃ។
សរុបមក វិធីសាស្ត្រកែតម្រូវស្ថិតិនេះជួយឱ្យស្ថាប័នស្រាវជ្រាវ និងរដ្ឋាភិបាលកម្ពុជាអាចធ្វើការទស្សន៍ទាយ និងសន្និដ្ឋានបានត្រឹមត្រូវ ទោះបីជាប្រព័ន្ធប្រមូលទិន្នន័យនៅមានកំហុសមួយចំនួនក៏ដោយ។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Gaussian AR(1) process (ដំណើរការ Gaussian AR(1)) | ជាដំណើរការស្ថិតិនៃស៊េរីពេលវេលាលំដាប់ទី១ ដែលតម្លៃបច្ចុប្បន្នត្រូវបានគណនាដោយពឹងផ្អែកលើតម្លៃមុនវាភ្លាមៗ បូកបញ្ចូលជាមួយនឹងកំហុសចៃដន្យដែលមានរបាយបែប Gaussian (Normal distribution)។ | ដូចជាការទស្សន៍ទាយសីតុណ្ហភាពថ្ងៃនេះ ដោយផ្អែកលើសីតុណ្ហភាពកាលពីម្សិលមិញ បូកនឹងកត្តាប្រែប្រួលអាកាសធាតុចៃដន្យបន្តិចបន្តួច។ |
| Additive Outliers (ទិន្នន័យខុសប្រក្រតីបូកបញ្ចូល) | ជាទិន្នន័យដែលមានតម្លៃលោតខុសគេខ្លាំង ដែលកើតឡើងតែមួយគ្រា (ឧទាហរណ៍ ដោយសារកំហុសក្នុងការវាយបញ្ចូលទិន្នន័យ) ហើយវាមិនមានឥទ្ធិពលអូសបន្លាយដល់ទិន្នន័យនៅពេលបន្ទាប់ៗទៀតនោះទេ។ | ដូចជាការកត់ត្រាពិន្ទុសិស្សខុសដោយអចេតនាសម្រាប់មុខវិជ្ជាមួយ (ឧទាហរណ៍ វាយលេខ ១០ ទៅជា ១០០) ប៉ុន្តែវាមិនប៉ះពាល់ដល់ពិន្ទុមុខវិជ្ជាផ្សេងទៀតរបស់គាត់ទេ។ |
| α-winsorized mean (មធ្យម α-winsorized) | ជារង្វាស់ស្ថិតិរឹងមាំមួយ ដែលត្រូវបានគណនាដោយការជំនួសតម្លៃទិន្នន័យដែលខុសប្រក្រតីខ្លាំងនៅចុងសងខាង (ខ្ពស់ពេក ឬទាបពេក) ដោយតម្លៃដែលនៅក្បែរវាបំផុត ជាជាងការលុបវាចោលទាំងស្រុង។ | ដូចជាការកាត់សក់សរសៃណាដែលវែងខុសគេឱ្យស្មើនឹងប្រវែងសក់ទូទៅ ដើម្បីឱ្យមើលទៅមានរបៀបរៀបរយ ជាជាងការដកសក់នោះចោលតែម្តង។ |
| Recursive median adjustment (ការកែតម្រូវមេដ្យានវិលជុំ) | ជាបច្ចេកទេសកែតម្រូវទិន្នន័យជាបន្តបន្ទាប់ ដោយការដកតម្លៃមេដ្យាននៃទិន្នន័យដែលបានអង្កេតកន្លងមក ដើម្បីកាត់បន្ថយឥទ្ធិពលនៃទិន្នន័យខុសប្រក្រតី ក្នុងពេលធ្វើការប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្រ។ | ដូចជាការកែតម្រូវចង្កូតរថយន្តជាបន្តបន្ទាប់ដោយពឹងផ្អែកលើចំណុចកណ្តាលនៃគន្លងផ្លូវ ដើម្បីកុំឱ្យរថយន្តរេចង្កូតធ្លាក់ផ្លូវដោយសារការប៉ះទង្គិចនឹងដុំថ្ម។ |
| Monte Carlo simulations (ការធ្វើត្រាប់តាមម៉ុងតេការឡូ) | ជាវិធីសាស្ត្រគណនាតាមកុំព្យូទ័រ ដែលប្រើប្រាស់ការទាញយកសំណាកចៃដន្យរាប់ពាន់ឬម៉ឺនដង ដើម្បីសាកល្បងនិងវាយតម្លៃថាតើម៉ូដែល ឬឧបករណ៍ប៉ាន់ប្រមាណដំណើរការបានល្អកម្រិតណាក្នុងស្ថានភាពផ្សេងៗគ្នា។ | ដូចជាការឱ្យកុំព្យូទ័របោះកាក់រាប់ម៉ឺនដងជំនួសមនុស្ស ដើម្បីគណនារកប្រូបាប៊ីលីតេនៃការចេញក្បាល ឬកន្ទុយឱ្យបានច្បាស់លាស់។ |
| Mean Square Error / MSE (កំហុសការ៉េមធ្យម) | ជារង្វាស់សម្រាប់វាស់ស្ទង់គុណភាពនៃឧបករណ៍ប៉ាន់ប្រមាណ ដោយគណនាពីមធ្យមនៃការ៉េនៃគម្លាតរវាងតម្លៃដែលបានប៉ាន់ប្រមាណ និងតម្លៃពិតប្រាកដ។ តម្លៃ MSE កាន់តែតូច បង្ហាញថាការប៉ាន់ប្រមាណកាន់តែសុក្រឹត។ | ដូចជារង្វាស់នៃការបាញ់ធ្នូ ប្រសិនបើព្រួញទាំងអស់បាញ់ចំជិតចំណុចកណ្តាលបំផុត នោះកំហុស (MSE) គឺតូចបំផុត បង្ហាញថាអ្នកបាញ់មានភាពសុក្រឹតខ្ពស់។ |
| Weighted symmetric estimator (ឧបករណ៍ប៉ាន់ប្រមាណស៊ីមេទ្រីមានទម្ងន់) | ជារូបមន្តស្ថិតិជាក់លាក់មួយសម្រាប់ប៉ាន់ប្រមាណប៉ារ៉ាម៉ែត្រក្នុងស៊េរីពេលវេលា ដោយផ្តល់ទម្ងន់ស្មើគ្នា (ស៊ីមេទ្រី) ដល់ទិន្នន័យសង្កេត ដើម្បីកាត់បន្ថយភាពលម្អៀង បើធៀបនឹងវិធីសាស្ត្រ OLS (Ordinary Least Squares) ធម្មតា។ | ដូចជាការថ្លឹងជញ្ជីងដែលយើងដាក់កម្រិតទម្ងន់ឱ្យមានតុល្យភាពស្មើគ្នាសងខាង ដើម្បីទទួលបានការវាស់វែងមួយដែលត្រឹមត្រូវនិងមិនលម្អៀង។ |
| Innovations outlier (ទិន្នន័យខុសប្រក្រតីអន្តរាគមន៍ / Innovations Outlier) | ជាប្រភេទនៃទិន្នន័យខុសប្រក្រតីនៅក្នុងស៊េរីពេលវេលា ដែលមិនត្រឹមតែធ្វើឱ្យទិន្នន័យនៅចំណុចនោះប្រែប្រួលប៉ុណ្ណោះទេ តែវាបានផ្លាស់ប្តូររចនាសម្ព័ន្ធទិន្នន័យ និងជះឥទ្ធិពលដល់តម្លៃទិន្នន័យនៅពេលបន្ទាប់ៗជាបន្តបន្ទាប់។ | ដូចជាការបែកកង់ឡានពាក់កណ្តាលផ្លូវ ដែលមិនត្រឹមតែធ្វើឱ្យល្បឿនថយចុះភ្លាមៗនៅនាទីនោះទេ តែវានឹងបន្តធ្វើឱ្យឡានធ្វើដំណើរយឺតរហូតដល់ចុងបញ្ចប់នៃការធ្វើដំណើរ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖