បញ្ហា (The Problem)៖ ការរចនាពេលវេលាភ្លើងសញ្ញាចរាចរណ៍បច្ចុប្បន្នប្រើប្រាស់តម្លៃថេរសម្រាប់ពេលវេលាប្រតិកម្មនៃការយល់ឃើញ (PRT) និងកម្រិតបន្ថយល្បឿន ដោយព្រងើយកន្តើយចំពោះភាពខុសគ្នានៃអ្នកបើកបរម្នាក់ៗនិងលក្ខខណ្ឌអាកាសធាតុ ដែលអាចបណ្តាលឱ្យមានគ្រោះថ្នាក់នៅតំបន់ផ្លូវបំបែក។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រមូលទិន្នន័យពីការពិសោធន៍ផ្ទាល់នៅទីតាំង Smart Road ក្រោមលក្ខខណ្ឌផ្លូវស្ងួតនិងសើម រួចប្រើប្រាស់ក្បួនដោះស្រាយរៀនដោយម៉ាស៊ីន (Machine Learning) ជាច្រើនដើម្បីធ្វើការព្យាករណ៍ប្រៀបធៀប។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Multiple Linear Regression (MLR) តំរែតំរង់លីនេអ៊ែរច្រើន (វិធីសាស្ត្រគោល) |
ងាយស្រួលក្នុងការយល់ និងជាវិធីសាស្ត្រស្តង់ដារដែលគេប្រើប្រាស់ទូទៅ។ | ត្រូវការសន្មត់លើទិន្នន័យ (ដូចជាភាពធម្មតានិងវ៉ារ្យង់ស្មើគ្នា) ដែលមិនសូវជាក់ស្តែង។ | មានកំហុសខ្ពស់ (PRT MAE = 0.1180s, Deceleration MAE = 0.3802 m/s²) ធៀបនឹងម៉ូដែលទំនើបៗ។ |
| Classification and Regression Tree (CART) ដើមឈើចំណាត់ថ្នាក់និងតំរែតំរង់ |
មិនត្រូវការសន្មត់លើទិន្នន័យ (Non-parametric) និងអាចបកស្រាយបានងាយស្រួលតាមរចនាសម្ព័ន្ធដើមឈើ។ | ផ្តល់លទ្ធផលអន់ជាងគេបំផុតសម្រាប់ការទស្សន៍ទាយពេលវេលាប្រតិកម្ម (PRT)។ | PRT MAE = 0.1212s និង Deceleration MAE = 0.3586 m/s²។ |
| Random Forest (RF) ព្រៃចៃដន្យ (ប្រមូលផ្តុំដើមឈើជាច្រើន) |
ជៀសវាងបញ្ហា Overfitting និងមានភាពសុក្រឹតខ្ពស់ក្នុងការចាប់យកទំនាក់ទំនងស្មុគស្មាញ។ | ពិបាកក្នុងការបកស្រាយដំណើរការខាងក្នុង (Black-box) ជាង CART ។ | ផ្តល់លទ្ធផលល្អបំផុតសម្រាប់ PRT (MAE = 0.1070s) និងល្អទី២សម្រាប់កម្រិតបន្ថយល្បឿន (MAE = 0.3406 m/s²)។ |
| Ensemble of Deep Networks បណ្តាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតជ្រៅចម្រុះ |
មានសមត្ថភាពខ្ពស់ក្នុងការស្វែងរកទម្រង់លាក់កំបាំងនិងមិនលីនេអ៊ែរនៅក្នុងទិន្នន័យ។ | ទាមទារទិន្នន័យធំ និងកម្លាំងកុំព្យូទ័រខ្លាំងក្នុងការហ្វឹកហាត់ម៉ូដែល។ | ផ្តល់លទ្ធផលល្អដាច់គេសម្រាប់ទស្សន៍ទាយកម្រិតនៃការបន្ថយល្បឿន (Deceleration MAE = 0.3314 m/s²)។ |
| Adaptive Boosting (AdaBoost) ក្បួនដោះស្រាយជំរុញការបន្សាំ |
ជួយកែលម្អក្បួនដោះស្រាយដែលខ្សោយឱ្យក្លាយជាម៉ូដែលដែលមានភាពសុក្រឹតខ្ពស់។ | អាចមានភាពរសើបខ្លាំងចំពោះទិន្នន័យរំខាន (Noisy data) ឬ Outliers។ | ផ្តល់លទ្ធផលល្អប្រហាក់ប្រហែលនឹង RF ដែរ (PRT MAE = 0.1074s, Deceleration MAE = 0.3397 m/s²)។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារឧបករណ៍ចាប់សញ្ញាដែលមានភាពជាក់លាក់ខ្ពស់បំពាក់លើរថយន្ត និងកម្មវិធីកុំព្យូទ័រសម្រាប់ដំណើរការក្បួនដោះស្រាយ Machine Learning។
ការសិក្សានេះត្រូវបានធ្វើឡើងនៅសហរដ្ឋអាមេរិក ក្នុងទីតាំងផ្លូវសាកល្បងបិទជិត (Smart Road) ដោយមានអ្នកចូលរួមត្រឹមតែ ៥០ នាក់ប៉ុណ្ណោះ។ សម្រាប់ប្រទេសកម្ពុជា ទិន្នន័យនេះមិនអាចឆ្លុះបញ្ចាំងពេញលេញទេ ដោយសារចរាចរណ៍នៅកម្ពុជាមានលក្ខណៈចម្រុះ (មានម៉ូតូ និងកង់បីច្រើន) និងអ្នកបើកបរមានទម្លាប់ខុសគ្នា។
ទោះបីជាទិន្នន័យដើមមិនត្រូវគ្នាបេះបិទ តែវិធីសាស្ត្រប្រើប្រាស់ Machine Learning នេះគឺមានប្រយោជន៍ខ្លាំងណាស់សម្រាប់ការរៀបចំប្រព័ន្ធចរាចរណ៍នៅកម្ពុជា។
សរុបមក ការយកវិធីសាស្ត្រនេះមកប្រមូលទិន្នន័យក្នុងស្រុក នឹងជួយស្ថាប័នពាក់ព័ន្ធរចនាប្រព័ន្ធសុវត្ថិភាពចរាចរណ៍នៅកម្ពុជាបានកាន់តែមានប្រសិទ្ធភាពខ្ពស់។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Perception Reaction Time (PRT) | ពេលវេលាដែលអ្នកបើកបរត្រូវការដើម្បីមើលឃើញសញ្ញាចរាចរណ៍ (ដូចជាភ្លើងលឿង) សម្រេចចិត្តថាត្រូវធ្វើអ្វី និងចាប់ផ្តើមអនុវត្តសកម្មភាព (ដូចជាជាន់ហ្វ្រាំង)។ | ដូចជាពេលដែលយើងឃើញបាល់ហោះមករកមុខ ហើយខួរក្បាលបញ្ជាឱ្យដៃងើបឡើងបាំង ដែលត្រូវចាយពេលមួយប្រិចភ្នែក។ |
| Dilemma zone | តំបន់មួយនៅជិតផ្លូវបំបែកដែលនៅពេលភ្លើងលោតពណ៌លឿង អ្នកបើកបរពិបាកសម្រេចចិត្តថា តើត្រូវជាន់ហ្វ្រាំងបញ្ឈប់រថយន្ត ឬត្រូវបន្ថែមល្បឿនបើកឆ្លងកាត់ ដែលងាយបង្កឱ្យមានគ្រោះថ្នាក់។ | ដូចជាពេលយើងកំពុងរត់ទៅមាត់ទ្វារយន្តហោះដែលកំពុងបិទ ហើយយើងស្ទាក់ស្ទើរថាតើត្រូវឈប់ ឬត្រូវប្រឹងរត់តត្រដាបត្រដួសចូលទៅ។ |
| Random Forest | ក្បួនដោះស្រាយរៀនដោយម៉ាស៊ីន (Machine Learning) ដែលបង្កើត "ដើមឈើការសម្រេចចិត្ត" ជាច្រើនរួមបញ្ចូលគ្នា ដើម្បីធ្វើការព្យាករណ៍ទិន្នន័យបានកាន់តែសុក្រឹត និងជៀសវាងការវង្វេងទិន្នន័យ (Overfitting)។ | ដូចជាការសួរមតិពីមនុស្ស១០០នាក់ផ្សេងៗគ្នា ដើម្បីសម្រេចចិត្តជ្រើសរើសចម្លើយមួយដែលត្រឹមត្រូវបំផុត ជាជាងការជឿលើមតិមនុស្សតែម្នាក់។ |
| Ensemble of Deep Networks | ការប្រមូលផ្តុំបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតជ្រៅ (Deep Learning) ជាច្រើនបញ្ចូលគ្នា ដើម្បីស្វែងរកទំនាក់ទំនងស្មុគស្មាញនៅក្នុងទិន្នន័យ និងធ្វើការព្យាករណ៍ឱ្យបានច្បាស់លាស់បំផុត។ | ដូចជាការប្រមូលអ្នកជំនាញកំពូលៗជាច្រើនរូប មកអង្គុយប្រជុំគ្នាដោះស្រាយលំហាត់គណិតវិទ្យាដ៏លំបាកមួយ។ |
| Classification and Regression Tree (CART) | ក្បួនដោះស្រាយដែលបំបែកទិន្នន័យជាមែកធាងជាបន្តបន្ទាប់ ដោយផ្អែកលើលក្ខខណ្ឌនីមួយៗ ដើម្បីធ្វើការបែងចែកចំណាត់ថ្នាក់ ឬទស្សន៍ទាយតម្លៃអ្វីមួយនៅចុងបញ្ចប់នៃមែកធាង។ | ដូចជាការលេងល្បែងទាយឈ្មោះសត្វ ដែលយើងសួរជាសំនួរ "បាទ/ទេ" បន្តបន្ទាប់គ្នារហូតដល់រកឃើញចម្លើយ។ |
| 10-fold-cross-validation | វិធីសាស្ត្រវាយតម្លៃម៉ូដែល Machine Learning ដោយបែងចែកទិន្នន័យជា ១០ ចំណែក រួចយក ៩ ចំណែកទៅបង្រៀនម៉ូដែល និង ១ ចំណែកទៀតទៅធ្វើតេស្តសាកល្បង ដោយឆ្លាស់គ្នារហូតដល់គ្រប់ទាំង ១០ ដង។ | ដូចជាការរៀនមេរៀន១០ជំពូក ដោយរៀន៩ជំពូក រួចប្រឡងសាកល្បង១ជំពូក ផ្លាស់ប្តូរគ្នារហូតដល់ប្រឡងចេះចាំអស់ទាំង១០ជំពូកដោយស្មើភាព។ |
| Mean Absolute Error (MAE) | រង្វាស់គណិតវិទ្យាសម្រាប់គណនាកំហុសជាមធ្យម ដែលបង្ហាញពីគម្លាតដាច់ខាតរវាងតម្លៃដែលម៉ូដែលបានព្យាករណ៍ និងតម្លៃដែលកើតឡើងជាក់ស្តែង។ | ដូចជាការទាយអាយុមិត្តភក្តិ ហើយយើងទាយខុសជាមធ្យម ២ឆ្នាំ មិនថាទាយលើស ឬទាយខ្វះនោះទេ។ |
| Adaptive Boosting (AdaBoost) | បច្ចេកទេស Machine Learning ដែលយកម៉ូដែលខ្សោយៗមកបង្ហាត់បន្តបន្ទាប់គ្នា ដោយម៉ូដែលក្រោយផ្តោតលើការកែតម្រូវកំហុសរបស់ម៉ូដែលមុន ដើម្បីបង្កើតបានជាម៉ូដែលរួមមួយដ៏ខ្លាំង។ | ដូចជាសិស្សខ្សោយមួយក្រុមជួយបង្រៀនគ្នា ដោយម្នាក់ៗជួយបំពេញចំណុចខ្វះខាតរបស់ម្នាក់ទៀតរហូតក្លាយជាក្រុមដ៏ពូកែមួយ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖