Original Title: Modeling the Perception Reaction Time and Deceleration Level for Different Surface Conditions Using Machine Learning Techniques
Source: doi.org/10.1007/978-3-319-41627-4_13
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការធ្វើគំរូពេលវេលាប្រតិកម្មនៃការយល់ឃើញ និងកម្រិតនៃការបន្ថយល្បឿនសម្រាប់លក្ខខណ្ឌផ្ទៃផ្លូវផ្សេងៗគ្នា ដោយប្រើប្រាស់បច្ចេកទេសរៀនដោយម៉ាស៊ីន (Machine Learning)

ចំណងជើងដើម៖ Modeling the Perception Reaction Time and Deceleration Level for Different Surface Conditions Using Machine Learning Techniques

អ្នកនិពន្ធ៖ Mohammed Elhenawy, Ihab El-Shawarby, Hesham Rakha

ឆ្នាំបោះពុម្ព៖ 2017 (Advances in Intelligent Systems and Computing)

វិស័យសិក្សា៖ Transportation Engineering

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការរចនាពេលវេលាភ្លើងសញ្ញាចរាចរណ៍បច្ចុប្បន្នប្រើប្រាស់តម្លៃថេរសម្រាប់ពេលវេលាប្រតិកម្មនៃការយល់ឃើញ (PRT) និងកម្រិតបន្ថយល្បឿន ដោយព្រងើយកន្តើយចំពោះភាពខុសគ្នានៃអ្នកបើកបរម្នាក់ៗនិងលក្ខខណ្ឌអាកាសធាតុ ដែលអាចបណ្តាលឱ្យមានគ្រោះថ្នាក់នៅតំបន់ផ្លូវបំបែក។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រមូលទិន្នន័យពីការពិសោធន៍ផ្ទាល់នៅទីតាំង Smart Road ក្រោមលក្ខខណ្ឌផ្លូវស្ងួតនិងសើម រួចប្រើប្រាស់ក្បួនដោះស្រាយរៀនដោយម៉ាស៊ីន (Machine Learning) ជាច្រើនដើម្បីធ្វើការព្យាករណ៍ប្រៀបធៀប។

ការប្រមូលទិន្នន័យពីការបើកបរជាក់ស្តែងក្រោមលក្ខខណ្ឌអាកាសធាតុផ្សេងៗ (Controlled field experiments)
ដើមឈើចំណាត់ថ្នាក់និងតំរែតំរង់ (Classification and Regression Tree - CART)
ព្រៃចៃដន្យ (Random Forest - RF)
បណ្តាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតជ្រៅ (Ensemble of Deep Networks)
តំរែតំរង់លីនេអ៊ែរច្រើន (Multiple Linear Regression - MLR)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ក្បួនដោះស្រាយរៀនដោយម៉ាស៊ីន (Machine Learning) ភាគច្រើនបានផ្តល់លទ្ធផលព្យាករណ៍ល្អប្រសើរជាងវិធីសាស្ត្រតំរែតំរង់លីនេអ៊ែរ (MLR) ទាំងទៅលើ PRT និងកម្រិតនៃការបន្ថយល្បឿន។
សម្រាប់ពេលវេលាប្រតិកម្មនៃការយល់ឃើញ (PRT) ម៉ូដែល Random Forest ផ្តល់នូវការទស្សន៍ទាយល្អបំផុតដោយមានកំហុសមធ្យម (MAE) ត្រឹមតែ 0.1070 វិនាទី។
សម្រាប់កម្រិតនៃការបន្ថយល្បឿន ម៉ូដែល Ensemble of Deep Networks ផ្តល់នូវការទស្សន៍ទាយល្អបំផុតជាមួយនឹងកំហុសមធ្យម (MAE) ត្រឹមតែ 0.3314 m/s²។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Multiple Linear Regression (MLR) តំរែតំរង់លីនេអ៊ែរច្រើន (វិធីសាស្ត្រគោល)	ងាយស្រួលក្នុងការយល់ និងជាវិធីសាស្ត្រស្តង់ដារដែលគេប្រើប្រាស់ទូទៅ។	ត្រូវការសន្មត់លើទិន្នន័យ (ដូចជាភាពធម្មតានិងវ៉ារ្យង់ស្មើគ្នា) ដែលមិនសូវជាក់ស្តែង។	មានកំហុសខ្ពស់ (PRT MAE = 0.1180s, Deceleration MAE = 0.3802 m/s²) ធៀបនឹងម៉ូដែលទំនើបៗ។
Classification and Regression Tree (CART) ដើមឈើចំណាត់ថ្នាក់និងតំរែតំរង់	មិនត្រូវការសន្មត់លើទិន្នន័យ (Non-parametric) និងអាចបកស្រាយបានងាយស្រួលតាមរចនាសម្ព័ន្ធដើមឈើ។	ផ្តល់លទ្ធផលអន់ជាងគេបំផុតសម្រាប់ការទស្សន៍ទាយពេលវេលាប្រតិកម្ម (PRT)។	PRT MAE = 0.1212s និង Deceleration MAE = 0.3586 m/s²។
Random Forest (RF) ព្រៃចៃដន្យ (ប្រមូលផ្តុំដើមឈើជាច្រើន)	ជៀសវាងបញ្ហា Overfitting និងមានភាពសុក្រឹតខ្ពស់ក្នុងការចាប់យកទំនាក់ទំនងស្មុគស្មាញ។	ពិបាកក្នុងការបកស្រាយដំណើរការខាងក្នុង (Black-box) ជាង CART ។	ផ្តល់លទ្ធផលល្អបំផុតសម្រាប់ PRT (MAE = 0.1070s) និងល្អទី២សម្រាប់កម្រិតបន្ថយល្បឿន (MAE = 0.3406 m/s²)។
Ensemble of Deep Networks បណ្តាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតជ្រៅចម្រុះ	មានសមត្ថភាពខ្ពស់ក្នុងការស្វែងរកទម្រង់លាក់កំបាំងនិងមិនលីនេអ៊ែរនៅក្នុងទិន្នន័យ។	ទាមទារទិន្នន័យធំ និងកម្លាំងកុំព្យូទ័រខ្លាំងក្នុងការហ្វឹកហាត់ម៉ូដែល។	ផ្តល់លទ្ធផលល្អដាច់គេសម្រាប់ទស្សន៍ទាយកម្រិតនៃការបន្ថយល្បឿន (Deceleration MAE = 0.3314 m/s²)។
Adaptive Boosting (AdaBoost) ក្បួនដោះស្រាយជំរុញការបន្សាំ	ជួយកែលម្អក្បួនដោះស្រាយដែលខ្សោយឱ្យក្លាយជាម៉ូដែលដែលមានភាពសុក្រឹតខ្ពស់។	អាចមានភាពរសើបខ្លាំងចំពោះទិន្នន័យរំខាន (Noisy data) ឬ Outliers។	ផ្តល់លទ្ធផលល្អប្រហាក់ប្រហែលនឹង RF ដែរ (PRT MAE = 0.1074s, Deceleration MAE = 0.3397 m/s²)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារឧបករណ៍ចាប់សញ្ញាដែលមានភាពជាក់លាក់ខ្ពស់បំពាក់លើរថយន្ត និងកម្មវិធីកុំព្យូទ័រសម្រាប់ដំណើរការក្បួនដោះស្រាយ Machine Learning។

Hardware: យានយន្តដែលបំពាក់ដោយប្រព័ន្ធប្រមូលទិន្នន័យ (DAS) ឧបករណ៍ Differential GPS និងឧបករណ៍វាស់ស្ទង់សន្ទុះ (Longitudinal accelerometer)។
Software: កម្មវិធី MATLAB ត្រូវបានប្រើប្រាស់ដើម្បីសរសេរកូដ និងដំណើរការក្បួនដោះស្រាយ Machine Learning ទាំងអស់។
Dataset: ទិន្នន័យដែលប្រមូលបានពីការបើកបរជាក់ស្តែងនៅលើទីតាំងសាកល្បងសុវត្ថិភាព (Smart Road) ក្រោមលក្ខខណ្ឌអាកាសធាតុស្ងួត និងភ្លៀង។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងនៅសហរដ្ឋអាមេរិក ក្នុងទីតាំងផ្លូវសាកល្បងបិទជិត (Smart Road) ដោយមានអ្នកចូលរួមត្រឹមតែ ៥០ នាក់ប៉ុណ្ណោះ។ សម្រាប់ប្រទេសកម្ពុជា ទិន្នន័យនេះមិនអាចឆ្លុះបញ្ចាំងពេញលេញទេ ដោយសារចរាចរណ៍នៅកម្ពុជាមានលក្ខណៈចម្រុះ (មានម៉ូតូ និងកង់បីច្រើន) និងអ្នកបើកបរមានទម្លាប់ខុសគ្នា។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាទិន្នន័យដើមមិនត្រូវគ្នាបេះបិទ តែវិធីសាស្ត្រប្រើប្រាស់ Machine Learning នេះគឺមានប្រយោជន៍ខ្លាំងណាស់សម្រាប់ការរៀបចំប្រព័ន្ធចរាចរណ៍នៅកម្ពុជា។

រាជធានីភ្នំពេញ (Phnom Penh Intersections): ការប្រើប្រាស់ម៉ូដែលនេះដើម្បីគណនា និងកំណត់រយៈពេលភ្លើងពណ៌លឿងឱ្យបានត្រឹមត្រូវនៅតាមផ្លូវបំបែកធំៗ ដើម្បីកាត់បន្ថយគ្រោះថ្នាក់បុកពីក្រោយ ឬបុកចំហៀង ពិសេសក្នុងរដូវភ្លៀងធ្លាក់។
សុវត្ថិភាពផ្លូវជាតិ (National Roads Safety): អនុវត្តលើផ្លូវជាតិសំខាន់ៗ (ដូចជាផ្លូវជាតិលេខ៤ ឬលេខ៦) ដើម្បីសិក្សាពីចម្ងាយនៃការចាប់ហ្វ្រាំង និងកំណត់ល្បឿនអតិបរមាប្រកបដោយសុវត្ថិភាពក្នុងស្ថានភាពផ្លូវសើម។

សរុបមក ការយកវិធីសាស្ត្រនេះមកប្រមូលទិន្នន័យក្នុងស្រុក នឹងជួយស្ថាប័នពាក់ព័ន្ធរចនាប្រព័ន្ធសុវត្ថិភាពចរាចរណ៍នៅកម្ពុជាបានកាន់តែមានប្រសិទ្ធភាពខ្ពស់។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

ស្វែងយល់ពីមូលដ្ឋានគ្រឹះវិស្វកម្មចរាចរណ៍: និស្សិតត្រូវសិក្សាពីគោលការណ៍នៃពេលវេលាប្រតិកម្មនៃការយល់ឃើញ (PRT) កម្រិតនៃការបន្ថយល្បឿន (Deceleration) និងបញ្ហាតំបន់ស្រពិចស្រពិល (Dilemma Zone) នៅផ្លូវបំបែក។
សិក្សាពីជំនាញវិភាគទិន្នន័យ និង Machine Learning: រៀនប្រើប្រាស់ភាសាកម្មវិធី Python (តាមរយៈ Scikit-Learn ឬ TensorFlow) ឬ MATLAB ដើម្បីអនុវត្តក្បួនដោះស្រាយដូចជា Random Forest និង Deep Learning។
ការប្រមូលទិន្នន័យជាក់ស្តែងនៅកម្ពុជា: បំពាក់ឧបករណ៍ Dashcam និង GPS Tracker លើរថយន្តស្ម័គ្រចិត្តដើម្បីប្រមូលទិន្នន័យពីល្បឿន និងការជាន់ហ្វ្រាំងរបស់អ្នកបើកបរខ្មែរនៅពេលភ្លើងលឿងលោត។
ការបង្វឹក និងវាយតម្លៃម៉ូដែល: ប្រើប្រាស់ទិន្នន័យដែលប្រមូលបានដើម្បីបង្វឹកម៉ូដែល ហើយវាយតម្លៃភាពត្រឹមត្រូវដោយប្រើបច្ចេកទេស 10-fold cross-validation ដើម្បីរកមើលតម្លៃលម្អៀង MAE និង MAPE។
ការផ្តល់អនុសាសន៍គោលនយោបាយ: យកលទ្ធផលដែលរកឃើញទៅស្នើជាពេលវេលាភ្លើងពណ៌លឿងថ្មី ជូនដល់មន្ទីរសាធារណការ និងដឹកជញ្ជូនរាជធានីភ្នំពេញ ដើម្បីយកទៅកែសម្រួលប្រព័ន្ធភ្លើងស្តុបជាក់ស្តែង។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Perception Reaction Time (PRT)	ពេលវេលាដែលអ្នកបើកបរត្រូវការដើម្បីមើលឃើញសញ្ញាចរាចរណ៍ (ដូចជាភ្លើងលឿង) សម្រេចចិត្តថាត្រូវធ្វើអ្វី និងចាប់ផ្តើមអនុវត្តសកម្មភាព (ដូចជាជាន់ហ្វ្រាំង)។	ដូចជាពេលដែលយើងឃើញបាល់ហោះមករកមុខ ហើយខួរក្បាលបញ្ជាឱ្យដៃងើបឡើងបាំង ដែលត្រូវចាយពេលមួយប្រិចភ្នែក។
Dilemma zone	តំបន់មួយនៅជិតផ្លូវបំបែកដែលនៅពេលភ្លើងលោតពណ៌លឿង អ្នកបើកបរពិបាកសម្រេចចិត្តថា តើត្រូវជាន់ហ្វ្រាំងបញ្ឈប់រថយន្ត ឬត្រូវបន្ថែមល្បឿនបើកឆ្លងកាត់ ដែលងាយបង្កឱ្យមានគ្រោះថ្នាក់។	ដូចជាពេលយើងកំពុងរត់ទៅមាត់ទ្វារយន្តហោះដែលកំពុងបិទ ហើយយើងស្ទាក់ស្ទើរថាតើត្រូវឈប់ ឬត្រូវប្រឹងរត់តត្រដាបត្រដួសចូលទៅ។
Random Forest	ក្បួនដោះស្រាយរៀនដោយម៉ាស៊ីន (Machine Learning) ដែលបង្កើត "ដើមឈើការសម្រេចចិត្ត" ជាច្រើនរួមបញ្ចូលគ្នា ដើម្បីធ្វើការព្យាករណ៍ទិន្នន័យបានកាន់តែសុក្រឹត និងជៀសវាងការវង្វេងទិន្នន័យ (Overfitting)។	ដូចជាការសួរមតិពីមនុស្ស១០០នាក់ផ្សេងៗគ្នា ដើម្បីសម្រេចចិត្តជ្រើសរើសចម្លើយមួយដែលត្រឹមត្រូវបំផុត ជាជាងការជឿលើមតិមនុស្សតែម្នាក់។
Ensemble of Deep Networks	ការប្រមូលផ្តុំបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតជ្រៅ (Deep Learning) ជាច្រើនបញ្ចូលគ្នា ដើម្បីស្វែងរកទំនាក់ទំនងស្មុគស្មាញនៅក្នុងទិន្នន័យ និងធ្វើការព្យាករណ៍ឱ្យបានច្បាស់លាស់បំផុត។	ដូចជាការប្រមូលអ្នកជំនាញកំពូលៗជាច្រើនរូប មកអង្គុយប្រជុំគ្នាដោះស្រាយលំហាត់គណិតវិទ្យាដ៏លំបាកមួយ។
Classification and Regression Tree (CART)	ក្បួនដោះស្រាយដែលបំបែកទិន្នន័យជាមែកធាងជាបន្តបន្ទាប់ ដោយផ្អែកលើលក្ខខណ្ឌនីមួយៗ ដើម្បីធ្វើការបែងចែកចំណាត់ថ្នាក់ ឬទស្សន៍ទាយតម្លៃអ្វីមួយនៅចុងបញ្ចប់នៃមែកធាង។	ដូចជាការលេងល្បែងទាយឈ្មោះសត្វ ដែលយើងសួរជាសំនួរ "បាទ/ទេ" បន្តបន្ទាប់គ្នារហូតដល់រកឃើញចម្លើយ។
10-fold-cross-validation	វិធីសាស្ត្រវាយតម្លៃម៉ូដែល Machine Learning ដោយបែងចែកទិន្នន័យជា ១០ ចំណែក រួចយក ៩ ចំណែកទៅបង្រៀនម៉ូដែល និង ១ ចំណែកទៀតទៅធ្វើតេស្តសាកល្បង ដោយឆ្លាស់គ្នារហូតដល់គ្រប់ទាំង ១០ ដង។	ដូចជាការរៀនមេរៀន១០ជំពូក ដោយរៀន៩ជំពូក រួចប្រឡងសាកល្បង១ជំពូក ផ្លាស់ប្តូរគ្នារហូតដល់ប្រឡងចេះចាំអស់ទាំង១០ជំពូកដោយស្មើភាព។
Mean Absolute Error (MAE)	រង្វាស់គណិតវិទ្យាសម្រាប់គណនាកំហុសជាមធ្យម ដែលបង្ហាញពីគម្លាតដាច់ខាតរវាងតម្លៃដែលម៉ូដែលបានព្យាករណ៍ និងតម្លៃដែលកើតឡើងជាក់ស្តែង។	ដូចជាការទាយអាយុមិត្តភក្តិ ហើយយើងទាយខុសជាមធ្យម ២ឆ្នាំ មិនថាទាយលើស ឬទាយខ្វះនោះទេ។
Adaptive Boosting (AdaBoost)	បច្ចេកទេស Machine Learning ដែលយកម៉ូដែលខ្សោយៗមកបង្ហាត់បន្តបន្ទាប់គ្នា ដោយម៉ូដែលក្រោយផ្តោតលើការកែតម្រូវកំហុសរបស់ម៉ូដែលមុន ដើម្បីបង្កើតបានជាម៉ូដែលរួមមួយដ៏ខ្លាំង។	ដូចជាសិស្សខ្សោយមួយក្រុមជួយបង្រៀនគ្នា ដោយម្នាក់ៗជួយបំពេញចំណុចខ្វះខាតរបស់ម្នាក់ទៀតរហូតក្លាយជាក្រុមដ៏ពូកែមួយ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖