Original Title: A Comprehensive Survey of Deep Learning-Based Traffic Flow Prediction Models for Intelligent Transportation Systems
Source: dx.doi.org
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការស្ទង់មតិទូលំទូលាយអំពីគំរូព្យាករណ៍លំហូរចរាចរណ៍ផ្អែកលើ Deep Learning សម្រាប់ប្រព័ន្ធដឹកជញ្ជូនឆ្លាតវៃ

ចំណងជើងដើម៖ A Comprehensive Survey of Deep Learning-Based Traffic Flow Prediction Models for Intelligent Transportation Systems

អ្នកនិពន្ធ៖ Riaz Ali (Shenzhen Institute of Advanced Technology, Chinese Academy of Sciences), Ahmad Ali (Shenzhen University), Hafiz Muhammad Yasir Naeem (Shenzhen University), Mujtaba Asad (Shanghai Jiao Tong University), Tamam Alsarhan (The University of Jordan), Md Belal Bin Heyat (Westlake University)

ឆ្នាំបោះពុម្ព៖ 2025, ICCK Transactions on Advanced Computing and Systems

វិស័យសិក្សា៖ Computer Science

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ បញ្ហាចម្បងដែលឯកសារនេះដោះស្រាយគឺការកែលម្អភាពត្រឹមត្រូវនៃការទស្សន៍ទាយលំហូរចរាចរណ៍នៅក្នុងប្រព័ន្ធដឹកជញ្ជូនឆ្លាតវៃ (ITS) ដើម្បីឆ្លើយតបទៅនឹងកំណើនយានយន្ត និងការកកស្ទះចរាចរណ៍នៅក្នុងទីក្រុង។ វាពិនិត្យមើលភាពខ្វះចន្លោះនៃវិធីសាស្ត្រស្ថិតិ និងម៉ាស៊ីនរៀន (Machine Learning) បែបប្រពៃណី ដែលមិនអាចចាប់យកគំរូចរាចរណ៍ដ៏ស្មុគស្មាញបាន។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានធ្វើការត្រួតពិនិត្យ និងប្រៀបធៀបយ៉ាងស៊ីជម្រៅទៅលើគំរូ Deep Learning ទំនើបៗ ដោយផ្តោតលើស្ថាបត្យកម្មដែលប្រើប្រាស់ទំនាក់ទំនងពេលវេលា-លំហ និងយន្តការចំណាប់អារម្មណ៍។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
ASTMGCNet (State-of-the-Art)
គំរូកូនកាត់ប្រើប្រាស់បណ្តាញសរសៃប្រសាទក្រាហ្វ (Dynamic Graph Neural Network) ជាមួយនឹងប្រព័ន្ធចំណាប់អារម្មណ៍ (Attention Mechanism) ទាំងក្នុងលំហ និងពេលវេលា។
មានសមត្ថភាពខ្ពស់ក្នុងការធ្វើបច្ចុប្បន្នភាពទំនាក់ទំនងក្រាហ្វ (Adjacency matrix) តាមពេលវេលាជាក់ស្តែង និងចាប់យកលំនាំចរាចរណ៍ចម្រុះបានយ៉ាងល្អ។ ទាមទារទំហំគណនាធំខ្លាំង (ប៉ារ៉ាម៉ែត្រ 14.2 លាន) និងចំណាយពេលបង្វឹកយូរ (៤.៥ ម៉ោង) ដែលពិបាកក្នុងការដាក់ឱ្យដំណើរការលើឧបករណ៍ខ្នាតតូច (Edge devices)។ សម្រេចបានកម្រិតលម្អៀងទាបបំផុតដោយមាន RMSE ៤.០៦ និង MAPE ១២.៥៦% នៅលើសំណុំទិន្នន័យ TaxiBJ។
Att-DHSTNet
គំរូ Spatio-Temporal Hybrid Network ដែលប្រើប្រាស់ប្រព័ន្ធ Attention សម្រាប់ការទស្សន៍ទាយលំហូរចរាចរណ៍។
អាចចាប់យកទំនាក់ទំនងនៃពេលវេលា និងលំហ ព្រមទាំងកត្តាខាងក្រៅ (ដូចជាអាកាសធាតុ) បានយ៉ាងល្អតាមរយៈ Multi-branch architecture។ នៅមានកម្រិតដោយសារការប្រើប្រាស់ទម្រង់លំហបែប Grid-based ដែលមិនអាចបត់បែនបានល្អដូចការប្រើប្រាស់ក្រាហ្វ (Graph-based) នោះទេ។ ទទួលបានលទ្ធផលល្អជាមួយនឹង RMSE ១៤.២៨ និង MAPE ១៣.៥៦% នៅលើសំណុំទិន្នន័យ TaxiBJ។
ST-ResNet
គំរូប្រើប្រាស់បណ្តាញ Convolutional Neural Network (CNN) ជាមួយនឹងការរៀនបែប Residual (Residual Learning)។
ជាគំរូគោល (Baseline) ដ៏រឹងមាំមួយ ដែលអាចទស្សន៍ទាយបានល្អសម្រាប់ទិន្នន័យមានរចនាសម្ព័ន្ធបែបក្រឡាចត្រង្គ (Grid structures)។ ការបែងចែកពេលវេលាថេរ (Fixed temporal segmentation) ធ្វើឱ្យគំរូនេះពិបាកសម្របខ្លួនទៅនឹងព្រឹត្តិការណ៍ចរាចរណ៍ដែលប្រែប្រួលខុសប្រក្រតី ជាពិសេសនៅម៉ោងកកស្ទះ។ ទទួលបានកម្រិតលម្អៀង RMSE ១៦.៨៩ និង MAPE ១៥.៣៩% នៅលើសំណុំទិន្នន័យ TaxiBJ។
ARIMA
វិធីសាស្ត្រស្ថិតិប្រពៃណី (Traditional Statistical Method) សម្រាប់វិភាគ និងទស្សន៍ទាយទិន្នន័យផ្អែកលើពេលវេលា (Time-series)។
ងាយស្រួលក្នុងការបង្កើត និងមិនទាមទារធនធានកុំព្យូទ័រខ្ពស់សម្រាប់ការគណនា។ មិនអាចចាប់យកទំនាក់ទំនងដ៏ស្មុគស្មាញបែប Spatiotemporal (លំហ និងពេលវេលា) នៃលំហូរចរាចរណ៍ទូទាំងទីក្រុងបានទេ ជាពិសេសការទស្សន៍ទាយរយៈពេលវែង។ កម្រិតលម្អៀង (Error) កើនឡើងយ៉ាងខ្លាំងរហូតដល់ ៣៣.៥% ខ្ពស់ជាងគំរូ LSTM នៅពេលទស្សន៍ទាយសម្រាប់រយៈពេល ៦០ នាទីទៅមុខ។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តគំរូកម្រិតខ្ពស់ទាំងនេះទាមទារថាមពលកុំព្យូទ័រខ្លាំង និងទិន្នន័យចរាចរណ៍ដ៏ធំទូលាយសម្រាប់ការបង្វឹក ដើម្បីទទួលបានលទ្ធផលសុក្រឹត។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់ទិន្នន័យពីទីក្រុងធំៗ និងទំនើបដូចជា ប៉េកាំង (TaxiBJ) និងញូវយ៉ក (BikeNYC) ដែលមានហេដ្ឋារចនាសម្ព័ន្ធច្បាស់លាស់ និងការបែងចែកគន្លងផ្លូវត្រឹមត្រូវ។ សម្រាប់ប្រទេសកម្ពុជា លំហូរចរាចរណ៍មានភាពចម្រុះច្រើន (មានម៉ូតូ រ៉ឺម៉ក) និងខ្វះឧបករណ៍ចាប់សញ្ញា (Sensors) តាមដងផ្លូវ ដែលអាចធ្វើឱ្យគំរូទាំងនេះធ្លាក់ចុះប្រសិទ្ធភាពពី ៣០-៤០% ប្រសិនបើគ្មានការប្រើប្រាស់បច្ចេកទេស Transfer Learning។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ថ្វីត្បិតតែមានភាពខុសគ្នានៃស្ថានភាពចរាចរណ៍ គំរូទាំងនេះនៅតែមានសក្តានុពលខ្ពស់ក្នុងការជួយដោះស្រាយបញ្ហាកកស្ទះនៅក្នុងប្រទេសកម្ពុជា ប្រសិនបើមានទិន្នន័យគ្រប់គ្រាន់។

ទោះបីជាការប្រមូលទិន្នន័យនៅជាបញ្ហាប្រឈមក៏ដោយ ការចាប់ផ្តើមសាកល្បងគំរូកូនកាត់ (Hybrid Models) ជាមួយនឹងបច្ចេកវិទ្យាទីក្រុងឆ្លាតវៃ នឹងក្លាយជាជំហានផ្លាស់ប្តូរដ៏ធំមួយសម្រាប់ប្រព័ន្ធដឹកជញ្ជូននៅកម្ពុជានាពេលអនាគត។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃ Spatio-temporal Models: និស្សិត ឬអ្នកស្រាវជ្រាវគួរចាប់ផ្តើមសិក្សាពីបណ្តាញសរសៃប្រសាទក្រាហ្វ (GNN) និង Attention Mechanisms ដោយអនុវត្តកូដតាមរយៈបណ្ណាល័យ PyTorch Geometric (PyG)
  2. ប្រមូល និងរៀបចំទិន្នន័យចរាចរណ៍ក្នុងស្រុក: ទាញយកទិន្នន័យចរាចរណ៍ពី Google Maps API ឬប្រមូលទិន្នន័យវីដេអូពីកាមេរ៉ាសុវត្ថិភាព (CCTV) ហើយប្រើប្រាស់ YOLOv8 ដើម្បីរាប់ចំនួនយានយន្ត និងទាញយកទិន្នន័យលំហូរចរាចរណ៍។
  3. បង្កើតគំរូសាកល្បង (Baseline Models): សាងសង់គំរូងាយស្រួលដូចជា LSTMSTGCN នៅក្នុង TensorFlow ដើម្បីប្រៀបធៀបជាមួយវិធីសាស្ត្រស្ថិតិប្រពៃណី និងស្វែងយល់ពីទំនាក់ទំនងទិន្នន័យ។
  4. អនុវត្តបច្ចេកទេស Transfer Learning: យកគំរូដែលបានបង្វឹករួចពីសំណុំទិន្នន័យបរទេស (ដូចជាទិន្នន័យ PeMS) មកកែសម្រួល (Fine-tune) ដើម្បីប្រើជាមួយទិន្នន័យចរាចរណ៍ដែលទើបប្រមូលបាននៅទីក្រុងភ្នំពេញ។
  5. កាត់បន្ថយទំហំ និងដាក់ដំណើរការ (Model Optimization & Deployment): ប្រើប្រាស់បច្ចេកទេស Quantization (8-bit) ដើម្បីបង្រួមទំហំគំរូ និងដាក់ឱ្យដំណើរការលើឧបករណ៍ IoT (Edge Devices) ដោយប្រើប្រាស់ TensorRT សម្រាប់ការទស្សន៍ទាយលំហូរចរាចរណ៍ក្នុងពេលជាក់ស្តែង។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Spatiotemporal dependencies ទំនាក់ទំនងដែលពឹងផ្អែកគ្នាទៅវិញទៅមករវាងទីតាំង (លំហ) និងពេលវេលា។ ក្នុងបរិបទចរាចរណ៍ វាមានន័យថាការកកស្ទះនៅផ្លូវមួយនាពេលនេះ នឹងជះឥទ្ធិពលដល់ផ្លូវបន្តបន្ទាប់ ឬតំបន់ក្បែរនោះនៅពេលខាងមុខ។ ដូចជាការចាក់ទឹកលើដីរាបស្មើ ទឹកហូរដល់ទីតាំងណា (លំហ) និងត្រូវចំណាយពេលប៉ុន្មាន (ពេលវេលា) គឺអាស្រ័យលើគ្នាទៅវិញទៅមក។
Graph Neural Networks (GNNs) ជាប្រភេទបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតដែលបង្កើតឡើងពិសេសសម្រាប់រៀនពីទិន្នន័យមានទម្រង់ជាក្រាហ្វ (បណ្ដាញ) ដូចជាបណ្ដាញផ្លូវថ្នល់ ដើម្បីស្វែងយល់ពីទំនាក់ទំនងរវាងចំនុចប្រសព្វនីមួយៗនៅក្នុងប្រព័ន្ធដ៏ស្មុគស្មាញ។ ដូចជាអ្នករៀបចំផែនការទីក្រុងដែលមើលផែនទីផ្លូវថ្នល់ទាំងមូល ហើយអាចដឹងថាបើស្តុបមួយស្ទះ តើស្តុបណាខ្លះទៀតដែលនៅជាប់នោះនឹងរងផលប៉ះពាល់។
Attention Mechanisms បច្ចេកទេសក្នុង Deep Learning ដែលអនុញ្ញាតឱ្យម៉ូដែល AI ផ្ដោតការយកចិត្តទុកដាក់តែទៅលើផ្នែកសំខាន់ៗបំផុតនៃទិន្នន័យ (ដូចជាម៉ោងមានគ្រោះថ្នាក់ ឬទីតាំងកកស្ទះខ្លាំង) ជាជាងកាត់ក្តីលើទិន្នន័យទាំងអស់ស្មើៗគ្នា។ ដូចជាពេលយើងកំពុងស្តាប់មិត្តភក្តិនិយាយក្នុងពិធីជប់លៀងដែលមានសំឡេងរំខាន ខួរក្បាលយើងផ្ដោតតែលើសំឡេងមិត្តភក្តិ ហើយបិទសំឡេងរំខានផ្សេងៗចោល។
Adjacency matrix ម៉ាទ្រីសគណិតវិទ្យាដែលប្រើដើម្បីតំណាងឱ្យទំនាក់ទំនង ឬការតភ្ជាប់រវាងថ្នាំង (nodes) នៅក្នុងក្រាហ្វ។ ក្នុងប្រព័ន្ធចរាចរណ៍ វាជាតារាងទិន្នន័យដែលបង្ហាញថាផ្លូវឬតំបន់ណាខ្លះភ្ជាប់គ្នាដោយផ្ទាល់។ ដូចជាតារាងបញ្ជីឈ្មោះសិស្សក្នុងថ្នាក់ដែលគូសសញ្ញាធីក (Tick) ក្នុងក្រឡា ដើម្បីបង្ហាញថានរណាអង្គុយជាប់នរណា។
ConvLSTM ជាម៉ូដែលកូនកាត់ដែលបូកបញ្ចូលគ្នានូវបណ្ដាញ CNN (សម្រាប់ទាញយកលក្ខណៈរូបរាង/លំហ) និង LSTM (សម្រាប់ចងចាំទិន្នន័យតាមបន្តបន្ទាប់នៃពេលវេលា) ដើម្បីព្យាករណ៍ទិន្នន័យវីដេអូ ឬលំហូរចរាចរណ៍។ ដូចជាអ្នកវិភាគអាកាសធាតុដែលអាចមើលរូបភាពពពក (CNN) ផង និងចងចាំទិសដៅខ្យល់ពីម្សិលមិញ (LSTM) ផង ដើម្បីទស្សន៍ទាយថានឹងមានភ្លៀងនៅកន្លែងណានៅថ្ងៃស្អែក។
Dynamic graph generation សមត្ថភាពរបស់ម៉ូដែល AI ក្នុងការបង្កើត ឬកែប្រែរចនាសម្ព័ន្ធទំនាក់ទំនងនៃបណ្តាញផ្លូវថ្នល់ដោយស្វ័យប្រវត្តិ និងតាមពេលវេលាជាក់ស្តែង ផ្អែកលើស្ថានភាពចរាចរណ៍ជាក់ស្តែង ជំនួសឱ្យការប្រើប្រាស់បណ្តាញទំនាក់ទំនងថេរ។ ដូចជាកម្មវិធី Google Maps ដែលអាចប្តូរគំនូសផ្លូវវាងដោយស្វ័យប្រវត្តិភ្លាមៗ នៅពេលដែលវាដឹងថាមានគ្រោះថ្នាក់ចរាចរណ៍បិទផ្លូវនៅខាងមុខ។
Uncertainty Quantification ដំណើរការនៃការប៉ាន់ស្មាន ឬវាស់វែងកម្រិតនៃភាពមិនច្បាស់លាស់នៅក្នុងលទ្ធផលទស្សន៍ទាយរបស់ម៉ូដែល AI ដើម្បីដឹងថាតើម៉ូដែលនោះមានទំនុកចិត្តប៉ុនណាលើចម្លើយរបស់ខ្លួន មុននឹងយកទៅសម្រេចចិត្តក្នុងកិច្ចការសំខាន់ៗ។ ដូចជាការព្យាករណ៍អាកាសធាតុដែលប្រាប់ថា 'មានឱកាសភ្លៀង ៨០%' ជំនួសឱ្យការនិយាយតែមួយម៉ាត់ថា 'នឹងមានភ្លៀង' ដើម្បីឱ្យយើងដឹងពីកម្រិតនៃភាពប្រាកដប្រជា។
Root Mean Square Error (RMSE) រង្វាស់ស្តង់ដារក្នុងផ្នែកស្ថិតិ និង Machine Learning សម្រាប់វាស់កម្រិតលម្អៀងរវាងទិន្នន័យដែលម៉ូដែលទស្សន៍ទាយបាន និងទិន្នន័យពិតជាក់ស្តែង។ តម្លៃកាន់តែទាប មានន័យថាម៉ូដែលទស្សន៍ទាយកាន់តែសុក្រឹត។ ដូចជាការបាញ់ព្រួញ ការវាស់ចម្ងាយពីចំណុចដែលព្រួញបានបុក ទៅកាន់ចំណុចកណ្តាលនៃផ្ទាំងស៊ីប រួចគណនារកកម្រិតខុសឆ្គងជាមធ្យមនៃព្រួញទាំងអស់។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖