បញ្ហា (The Problem)៖ ឯកសារនេះតំណាងឱ្យបណ្តុំមូលបទសង្ខេបពីសន្និសីទអន្តរជាតិ SMTDA ឆ្នាំ ២០១០ ដែលដោះស្រាយបញ្ហាប្រឈមនៃភាពមិនប្រាកដប្រជា និងការវិភាគទិន្នន័យស្មុគស្មាញ (Complex data analysis) ក្នុងវិស័យសេដ្ឋកិច្ច សុខាភិបាល វិស្វកម្ម និងបច្ចេកវិទ្យា។
វិធីសាស្ត្រ (The Methodology)៖ សន្និសីទនេះបានផ្តោតលើការអនុវត្តគំរូគណិតវិទ្យា ក្បួនដោះស្រាយកុំព្យូទ័រ និងវិធីសាស្ត្រស្ថិតិផ្សេងៗគ្នាដើម្បីដោះស្រាយចំណោទបញ្ហាជាក់ស្តែង តាមរយៈអភិក្រមដូចខាងក្រោម៖
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Stationary Wavelet Transform (SWT) + Artificial Neural Networks (ANN) ការបម្លែង Wavelet ថេរ (SWT) រួមបញ្ចូលជាមួយបណ្តាញប្រសាទសិប្បនិម្មិត (ANN) |
មានសមត្ថភាពខ្ពស់ក្នុងការចាប់យកលក្ខណៈស្មុគស្មាញនៃទិន្នន័យមិនលីនេអ៊ែរ (Non-linear) និងផ្តល់ការព្យាករណ៍បានច្បាស់លាស់។ | ទាមទារការគណនាខ្ពស់ មានភាពស្មុគស្មាញក្នុងការរៀបចំ និងត្រូវការពេលវេលាយូរក្នុងការហ្វឹកហាត់ម៉ូដែល។ | ផ្តល់ភាពត្រឹមត្រូវខ្ពស់បំផុតលើការព្យាករណ៍ចរាចរណ៍បណ្តាញ WiMAX និងទិន្នន័យហិរញ្ញវត្ថុ ជាពិសេសនៅពេលប្រើជាមួយក្បួន Haar និង Reverse biorthogonal 1។ |
| ARIMA (AutoRegressive Integrated Moving Average) ម៉ូដែលមធ្យមភាគផ្លាស់ទីនិងតម្រែតម្រង់ស្វ័យប្រវត្តិ (ARIMA) |
ងាយស្រួលក្នុងការយល់និងអនុវត្ត និងមានប្រសិទ្ធភាពល្អសម្រាប់ទិន្នន័យពេលវេលាដែលមានលំនាំ (Pattern) ច្បាស់លាស់។ | មិនសូវមានប្រសិទ្ធភាពសម្រាប់ទិន្នន័យដែលមានការប្រែប្រួលខុសប្រក្រតីខ្លាំង ឬទិន្នន័យដែលគ្មានលក្ខណៈលីនេអ៊ែរ។ | ផ្តល់លទ្ធផលទាបជាង ANN ក្នុងការសាកល្បងរួមបញ្ចូលជាមួយវិធីសាស្ត្របម្លែង Wavelet សម្រាប់ការទស្សន៍ទាយទិន្នន័យជាក់ស្តែង។ |
| Linear Regression & Random Walk ការវិភាគតម្រែតម្រង់លីនេអ៊ែរ និងម៉ូដែលដើរដោយចៃដន្យ (Random Walk) |
ជាវិធីសាស្ត្រសាមញ្ញបំផុត ចំណាយធនធានកុំព្យូទ័រតិច និងល្អសម្រាប់ធ្វើជាគោលដ្ឋាន (Baseline) ប្រៀបធៀប។ | មានដែនកំណត់ខ្ពស់ក្នុងការវិភាគលើប្រព័ន្ធដែលមានភាពស្មុគស្មាញ និងមានភាពអថេរច្រើន ដូចជាទីផ្សារភាគហ៊ុនជាដើម។ | ផ្តល់លទ្ធផលអន់ជាងគេបំផុតក្នុងការសិក្សាប្រៀបធៀបនៃការព្យាករណ៍ទិន្នន័យចរាចរណ៍បណ្តាញ និងស៊េរីពេលវេលាហិរញ្ញវត្ថុ។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តម៉ូដែលព្យាករណ៍ និងក្បួនដោះស្រាយស្តូចាស្ទិកកម្រិតខ្ពស់ (Advanced Stochastic Models) ភាគច្រើនទាមទារនូវធនធានកុំព្យូទ័រ និងទិន្នន័យច្បាស់លាស់ដែលអាចមានតម្លៃខ្ពស់ក្នុងការរៀបចំ។
ការសិក្សាភាគច្រើននៅក្នុងឯកសារនេះ ផ្អែកលើសំណុំទិន្នន័យ (Datasets) មកពីប្រទេសអភិវឌ្ឍន៍ ដូចជាទីផ្សារភាគហ៊ុននៅអឺរ៉ុប ប្រព័ន្ធថែទាំសុខភាពនៅសហរដ្ឋអាមេរិក និងអូស្ត្រាលីជាដើម។ នេះអាចជាចំណុចប្រឈមសម្រាប់ប្រទេសកម្ពុជា ដោយសារកម្ពុជាមានរចនាសម្ព័ន្ធសេដ្ឋកិច្ច ការប្រមូលទិន្នន័យ និងកត្តាប្រជាសាស្ត្រខុសគ្នាឆ្ងាយពីប្រទេសទាំងនោះ ដែលទាមទារឱ្យមានការកែសម្រួលម៉ូដែលមុននឹងយកមកអនុវត្តជាក់ស្តែង។
ទោះបីជាបរិបទនៃទិន្នន័យខុសគ្នាក៏ដោយ ក៏ទ្រឹស្តីគណិតវិទ្យា ស្ថិតិ និងម៉ូដែលស្តូចាស្ទិកទាំងនេះនៅតែមានសក្តានុពលខ្លាំងក្នុងការដោះស្រាយបញ្ហាជាក់ស្តែងនៅកម្ពុជា។
ការសម្រប និងអនុវត្តវិធីសាស្ត្រវិភាគស្ថិតិកម្រិតខ្ពស់ទាំងនេះ នឹងជួយជំរុញឱ្យស្ថាប័នរដ្ឋនិងឯកជននៅកម្ពុជា អាចឈានទៅរកការធ្វើសេចក្តីសម្រេចចិត្តដែលផ្អែកលើទិន្នន័យ (Data-driven decision making) ប្រកបដោយភាពឆ្លាតវៃ និងប្រសិទ្ធភាពខ្ពស់។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Stochastic Modeling | គឺជាការបង្កើតគំរូគណិតវិទ្យាដែលរួមបញ្ចូលអថេរចៃដន្យ (Random variables) ដើម្បីប៉ាន់ស្មាននិងវិភាគប្រូបាប៊ីលីតេនៃលទ្ធផលផ្សេងៗដែលអាចកើតមានក្នុងស្ថានភាពដែលមិនមានភាពប្រាកដប្រជា។ | វាដូចជាការទស្សន៍ទាយលទ្ធផលនៃការបោះកាក់ដោយគិតបញ្ចូលកត្តាខ្យល់បក់ ឬកម្លាំងដៃ ដើម្បីវាយតម្លៃពីឱកាសដែលកាក់នឹងចេញខាងរូប ឬខាងលេខ។ |
| Markov Chains | ជាដំណើរការស្តូចាស្ទិក (Stochastic process) ដែលស្ថានភាពបន្ទាប់នៃប្រព័ន្ធមួយពឹងផ្អែកទាំងស្រុងទៅលើស្ថានភាពបច្ចុប្បន្នរបស់វា ដោយមិនចាំបាច់មានទំនាក់ទំនងជាមួយប្រវត្តិឬស្ថានភាពក្នុងអតីតកាលឡើយ។ | វាដូចជាការលេងហ្គេមប៊ក (Board game) ដែលការដើរទៅមុខពឹងផ្អែកតែលើការបោះគ្រាប់ឡុកឡាក់ក្នុងពេលបច្ចុប្បន្ន មិនមែនពឹងផ្អែកលើការបោះពីលើកមុនៗនោះទេ។ |
| Artificial Neural Networks | គឺជាប្រព័ន្ធកុំព្យូទ័រដែលត្រូវបានរចនាឡើងដោយត្រាប់តាមបណ្ដាញកោសិកាប្រសាទរបស់ខួរក្បាលមនុស្ស ដែលមានសមត្ថភាពរៀនសូត្រពីទិន្នន័យដើម្បីស្វែងរកលំនាំស្មុគស្មាញ និងធ្វើការព្យាករណ៍ដោយស្វ័យប្រវត្តិ។ | វាប្រៀបដូចជាការបង្រៀនកូនក្មេងឱ្យស្គាល់រូបសត្វឆ្កែដោយបង្ហាញរូបភាពសត្វឆ្កែជាច្រើនដង រហូតដល់ក្មេងនោះអាចចំណាំសត្វឆ្កែបានដោយខ្លួនឯងនាពេលក្រោយ។ |
| Survival Analysis | ជាបណ្តុំនៃវិធីសាស្ត្រស្ថិតិដែលប្រើសម្រាប់វិភាគពេលវេលាដែលរំពឹងទុកថានឹងមានព្រឹត្តិការណ៍ណាមួយកើតឡើង ដូចជាការខូចខាតឧបករណ៍ ការបាត់បង់អតិថិជន ឬការស្លាប់របស់អ្នកជំងឺ។ | ដូចជាការតាមដាន និងវិភាគមើលថាតើអំពូលភ្លើងមួយអាចភ្លឺបានរយៈពេលប៉ុន្មានម៉ោងមុនពេលវាដាច់។ |
| Monte Carlo Simulation | គឺជាក្បួនដោះស្រាយតាមកុំព្យូទ័រដែលប្រើប្រាស់ការសាកល្បងដោយជ្រើសរើសលេខចៃដន្យរាប់ពាន់ដង ដើម្បីគណនាប្រូបាប៊ីលីតេនៃលទ្ធផលសម្រាប់បញ្ហាស្មុគស្មាញដែលពិបាកដោះស្រាយតាមរូបមន្តផ្ទាល់។ | វាដូចជាការសាកល្បងបោះព្រួញរាប់ពាន់ដងទៅលើក្តារ ដើម្បីរកមើលថាតើឱកាសបោះចំគោលដៅកណ្តាលមានកម្រិតប៉ុន្មានភាគរយ។ |
| Wavelet Transform | គឺជាបច្ចេកទេសគណិតវិទ្យាសម្រាប់បំបែកសញ្ញា (Signal) ទៅជាសមាសភាគតូចៗ ដែលអនុញ្ញាតឱ្យគេអាចវិភាគទិន្នន័យបានទាំងកម្រិតប្រេកង់ (Frequency) និងកម្រិតពេលវេលា (Time) ក្នុងពេលតែមួយ។ | ដូចជាការបំបែកបទចម្រៀងមួយបទទៅជាសំឡេងឧបករណ៍តន្ត្រីនីមួយៗ ហើយដឹងច្បាស់ថាសំឡេងស្គរវាយនៅវិនាទីណាខ្លះនៃបទចម្រៀងនោះ។ |
| Optimization | គឺជាដំណើរការគណិតវិទ្យាក្នុងការស្វែងរកដំណោះស្រាយដែលល្អបំផុត (ឧទាហរណ៍ ចំណាយតិចបំផុត លឿនបំផុត ឬចំណេញច្រើនបំផុត) ពីក្នុងចំណោមជម្រើសជាច្រើន ក្រោមលក្ខខណ្ឌឬកម្រិតកំណត់ជាក់លាក់ណាមួយ។ | ដូចជាការប្រើប្រាស់ Google Maps ដើម្បីគណនារកមើលថាតើផ្លូវមួយណាដែលខ្លី និងជៀសវាងការស្ទះចរាចរណ៍បានល្អបំផុតដើម្បីទៅដល់គោលដៅ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖