Original Title: Improved Deep Learning-based Approach for Spatial-Temporal Trajectory Planning via Predictive Modeling of Future Location
Source: doi.org/10.3837/tiis.2024.07.002
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

វិធីសាស្ត្រផ្អែកលើ Deep Learning ដែលត្រូវបានកែលម្អសម្រាប់ការរៀបចំផែនការគន្លងផ្លូវក្នុងលំហ និងពេលវេលា តាមរយៈគំរូព្យាករណ៍នៃទីតាំងនាពេលអនាគត

ចំណងជើងដើម៖ Improved Deep Learning-based Approach for Spatial-Temporal Trajectory Planning via Predictive Modeling of Future Location

អ្នកនិពន្ធ៖ Zain Ul Abideen (Jiangsu University), Xiaodong Sun (Jiangsu University), Chao Sun (Jiangsu University), Hafiz Shafiq Ur Rehman Khalil (Xian Jiaotong University)

ឆ្នាំបោះពុម្ព៖ 2024 KSII TRANSACTIONS ON INTERNET AND INFORMATION SYSTEMS

វិស័យសិក្សា៖ Computer Science & Intelligent Transportation Systems

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការរៀបចំផែនការគន្លងផ្លូវ និងការព្យាករណ៍ទីតាំងនាពេលអនាគតជួបប្រទះនឹងបញ្ហាប្រឈមក្នុងការស្វែងយល់ពីទំនាក់ទំនងនៃចម្ងាយឆ្ងាយ និងលក្ខណៈស្មុគស្មាញនៃចរាចរណ៍ទីក្រុង ដើម្បីកាត់បន្ថយការកកស្ទះ និងបង្កើនប្រសិទ្ធភាពសេវាកម្មយានយន្តអគ្គិសនី និងស្វ័យប្រវត្តិ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានបង្កើតក្របខ័ណ្ឌបណ្ដាញសរសៃប្រសាទប្រភេទ STTFFN ដែលរួមបញ្ចូលទិន្នន័យទីតាំង សង្គម និងពេលវេលា ដើម្បីកែលម្អការព្យាករណ៍ទិសដៅដោយជោគជ័យ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
STTFFN (Proposed Model)
បណ្ដាញសរសៃប្រសាទ STTFFN ផ្អែកលើ Spatial-temporal transformer
មានសមត្ថភាពខ្ពស់ក្នុងការចាប់យកទំនាក់ទំនងទីតាំង និងពេលវេលាបានល្អទាំងចម្ងាយជិតនិងឆ្ងាយ។ ការរួមបញ្ចូលទិន្នន័យ POI ពីបណ្តាញសង្គមធ្វើឱ្យការព្យាករណ៍កាន់តែច្បាស់ និងឆ្លាតវៃ។ ទាមទារទិន្នន័យប្រវត្តិធ្វើដំណើរដ៏ធំ និងថាមពលកុំព្យូទ័រខ្ពស់ (GPU) ក្នុងការបង្វឹកគំរូ។ មានកំហុសចម្ងាយ (EDS) ទាបបំផុត៖ ត្រឹមតែ ១,៩០ គ.ម (Porto) និង ១,៣០ គ.ម (Manhattan)។
ST-GCN
បណ្តាញ Spatio-Temporal Graph Convolutional Networks
ពឹងផ្អែកលើសមាសភាគទីតាំងនិងពេលវេលាដោយប្រើទម្ងន់ក្រាហ្វ (graph weights) ដែលជួយរក្សាភាពបន្តបន្ទាប់នៃទិន្នន័យស៊េរីពេលវេលាបានល្អ។ មិនបានរួមបញ្ចូលទិន្នន័យអាកប្បកិរិយាអ្នកបើកបរ និងចំណុចគោលដៅទីតាំង (POI) លម្អិតដូចវិធីសាស្ត្រ STTFFN ឡើយ។ កំហុសចម្ងាយ (EDS): ២,៦៧ គ.ម (Porto) និង ២,០០ គ.ម (Manhattan) ដែលខ្ពស់ជាងគំរូដែលបានស្នើ។
LSTM (BOC+W2V)
បណ្តាញ Long-Short-Term Memory រួមបញ្ចូលជាមួយ BOC និង Word2Vec
ដំណើរការបានល្អដោយប្រើប្រាស់ទិន្នន័យស៊េរីពេលវេលា និងអាចប្រើបច្ចេកទេស Word2Vec ដើម្បីតំណាងឱ្យទីតាំងបានល្អបង្គួរ។ មានកម្រិតក្នុងការចាប់យកទំនាក់ទំនងទីតាំងនៅតំបន់ឆ្ងាយៗ (Long-range spatial dependencies) បើធៀបនឹងការប្រើប្រាស់ Transformer។ កំហុសចម្ងាយ (EDS): ២,៨៨ គ.ម (Porto) និង ២,០៨៨ គ.ម (Manhattan)។
ARIMA
គំរូ Autoregressive Integrated Moving Average
មានប្រសិទ្ធភាពសម្រាប់ការព្យាករណ៍ទិន្នន័យស៊េរីពេលវេលា (time series) ជាមូលដ្ឋាន និងងាយស្រួលក្នុងការអនុវត្តដោយមិនចាំបាច់ប្រើធនធានកុំព្យូទ័រធំ។ មិនមានសមត្ថភាពចាប់យកទំនាក់ទំនងស្មុគស្មាញនៃលំហទីតាំង (Spatial) និងកត្តាខាងក្រៅដូចជាសកម្មភាពសង្គមបានទេ។ ដំណើរការខ្សោយជាងគេ ដោយមានកំហុសចម្ងាយ (EDS) ៦,២២ គ.ម (Porto) និង ៥,៣៨ គ.ម (Manhattan)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារធនធានកុំព្យូទ័រ និងផ្នែករឹងកម្រិតខ្ពស់សម្រាប់ការបង្វឹកគំរូ Deep Learning ព្រមទាំងសំណុំទិន្នន័យទីតាំងនិងគន្លងផ្លូវក្នុងទំហំដ៏ធំ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះពឹងផ្អែកទាំងស្រុងលើទិន្នន័យតាក់ស៊ីពីទីក្រុង Porto នៃប្រទេសព័រទុយហ្គាល់ និង Manhattan នៃសហរដ្ឋអាមេរិក ដែលជាទីក្រុងមានរចនាសម្ព័ន្ធផ្លូវខ្វែង និងលំហូរចរាចរណ៍មានសណ្តាប់ធ្នាប់។ សម្រាប់ប្រទេសកម្ពុជា លំហូរចរាចរណ៍មានភាពចម្រុះ និងស្មុគស្មាញជាង (ដោយមានម៉ូតូ កង់បី និងការកកស្ទះមិនតាមស្តង់ដារ) ដូច្នេះការព្យាករណ៍ដោយយកគំរូដើមមកអនុវត្តផ្ទាល់អាចនឹងមានភាពលម្អៀង ហើយតម្រូវឱ្យមានការកែសម្រួលនិងបង្វឹកឡើងវិញជាមួយទិន្នន័យចរាចរណ៍ក្នុងស្រុកជាមុនសិន។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ថ្វីត្បិតតែមានភាពខុសគ្នានៃប្រព័ន្ធចរាចរណ៍ ប៉ុន្តែវិធីសាស្ត្រ Deep Learning នេះមានសក្តានុពលខ្ពស់ក្នុងការយកមកអភិវឌ្ឍប្រព័ន្ធដឹកជញ្ជូនឆ្លាតវៃនៅទីក្រុងធំៗរបស់កម្ពុជា។

ការអនុវត្តបច្ចេកវិទ្យានេះនឹងជួយពន្លឿនការផ្លាស់ប្តូរទៅជាទីក្រុងឆ្លាតវៃ (Smart City) នៅកម្ពុជា តាមរយៈការធ្វើឱ្យប្រសើរឡើងនូវការរៀបចំផែនការហេដ្ឋារចនាសម្ព័ន្ធ និងប្រព័ន្ធដឹកជញ្ជូន។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ប្រមូលនិងរៀបចំទិន្នន័យចរាចរណ៍ក្នុងស្រុក: ចាប់ផ្តើមដោយការស្វែងរកសំណុំទិន្នន័យគំរូនៃប្រព័ន្ធដឹកជញ្ជូនក្នុងស្រុក ឬប្រើប្រាស់ទិន្នន័យទីតាំងពី OpenStreetMap និងទាញយកទិន្នន័យ POI តាមរយៈ Google Places APIFoursquare API សម្រាប់ទីក្រុងភ្នំពេញ។
  2. រៀបចំរចនាសម្ព័ន្ធទិន្នន័យ និង Map Matching: ប្រើប្រាស់បណ្ណាល័យអនឡាញ Pandas និង GeoPandas ដើម្បីបំប្លែងទិន្នន័យរយៈទទឹង/បណ្តោយ (GPS) ទៅជាទម្រង់ Grid Cells និងសម្អាតទិន្នន័យដែលមានភាពមិនប្រក្រតី (Missing Data/Drifting Sampling)។
  3. អភិវឌ្ឍម៉ូដែលមូលដ្ឋានលើ Word Embeddings សម្រាប់ទីតាំង: សាកល្បងប្រើគំរូ Skip-gram នៃ Word2Vec ដើម្បីរៀនពីទំនាក់ទំនងរវាងទីតាំងភូមិសាស្ត្រនានា និងបម្លែងវាជាទម្រង់ Vector ដើម្បីអោយកុំព្យូទ័រយល់ពីភាពប្រហាក់ប្រហែលគ្នានៃទីតាំងនីមួយៗ។
  4. សាងសង់ និងបង្វឹកគំរូ Spatial-Temporal Transformer: ប្រើប្រាស់ Framework ដូចជា PyTorchTensorFlow ដើម្បីបង្កើត Transformer Encoder-Decoder និង Feed-Forward Network។ និស្សិតអាចប្រើ Google ColabKaggle Notebooks ដើម្បីទទួលបាន GPU ឥតគិតថ្លៃសម្រាប់ការបង្វឹក។
  5. វាស់ស្ទង់ និងបង្កើត API សម្រាប់កម្មវិធីជាក់ស្តែង: វាយតម្លៃគំរូដោយប្រើក្បួនគណនា Haversine distance និង RMSE។ បន្ទាប់មក បង្កើត API តាមរយៈ FastAPI ដើម្បីភ្ជាប់ការទស្សន៍ទាយទៅនឹងផ្ទាំងព័ត៌មាន (Dashboard) ឬកម្មវិធីផែនទីសាមញ្ញសម្រាប់ការធ្វើតេស្ត។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Spatial-Temporal Trajectory ដំណើរនៃទីតាំងបន្តបន្ទាប់គ្នារបស់យានយន្តឬវត្ថុ ដែលត្រូវបានរៀបចំតាមលំដាប់លំដោយពេលវេលាក្នុងលំហភូមិសាស្ត្រ ដោយបង្ហាញពីកន្លែងដែលវត្ថុនោះបានទៅ និងម៉ោងដែលវាទៅដល់។ ដូចជាការគូសខ្សែបន្ទាត់តាមដានជើងក្មេងរត់លេងក្នុងសួនច្បារ ដោយកត់ត្រាទាំងកន្លែង និងម៉ោងដែលគេរត់ដល់ជាក់លាក់។
Feed-Forward Neural Network (FFN) ជាទម្រង់នៃបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតដែលទិន្នន័យធ្វើដំណើរតែទៅមុខ (ពី input ទៅ output) ដោយមិនមានការត្រឡប់ក្រោយ ដែលក្នុងឯកសារនេះវាជួយគណនារកទំនាក់ទំនងនៃទីតាំងនៅចម្ងាយឆ្ងាយ។ ប្រៀបដូចជាខ្សែសង្វាក់ផលិតកម្មរោងចក្រ ដែលវត្ថុធាតុដើមត្រូវបញ្ជូនទៅមុខជារហូតពីផ្នែកមួយទៅផ្នែកមួយទៀតរហូតចេញជាផលិតផលសម្រេច មិនមានការបញ្ជូនថយក្រោយឡើយ។
Skip-gram model ជាបច្ចេកទេសមួយនៃម៉ូដែល Word2Vec (ម៉ូដែលរៀនពាក្យ) ដែលក្នុងបរិបទនេះ ត្រូវបានប្រើដើម្បីស្វែងយល់ពីទំនាក់ទំនងនៃតំបន់ជិតៗគ្នា ដោយប្រើប្រាស់ទីតាំងកណ្តាលដើម្បីទស្សន៍ទាយទីតាំងដែលនៅជុំវិញវា។ ដូចជាពេលយើងឃើញអគារមន្ទីរពេទ្យមួយ យើងអាចទាយបានថាជុំវិញនោះប្រហែលជាមានឱសថស្ថាន ឬគ្លីនិកក្បែរៗនោះ។
Location-Based Social Networks (LBSN) ជាបណ្តាញសង្គមដែលភ្ជាប់ជាមួយទីតាំងភូមិសាស្ត្រ (ដូចជា Foursquare) ដែលអនុញ្ញាតឱ្យប្រព័ន្ធប្រមូលទិន្នន័យអំពីប្រភេទសកម្មភាពនានា ដើម្បីស្វែងយល់ពីអត្ថន័យនៃទីតាំងនីមួយៗ និងទម្លាប់អ្នកធ្វើដំណើរ។ ដូចជាមុខងារ Check-in លើ Facebook ដែលប្រាប់គេឯងថាអ្នកកំពុងញ៉ាំកាហ្វេនៅទីតាំងណាមួយ ជួយឱ្យប្រព័ន្ធដឹងពីប្រភេទនៃកន្លែងនោះ។
Point of Interest (POI) ចំណុចទីតាំងជាក់លាក់នៅលើផែនទីដែលមានអត្ថន័យនិងសារៈសំខាន់ ដូចជា សាលារៀន មន្ទីរពេទ្យ ភោជនីយដ្ឋាន ជាដើម ដែលជួយឱ្យប្រព័ន្ធកុំព្យូទ័រយល់ពីគោលបំណងនៃការធ្វើដំណើររបស់អ្នកដំណើរ។ ដូចជាស្លាកសញ្ញាសម្គាល់កន្លែងសំខាន់ៗនៅលើ Google Maps ដែលប្រាប់យើងថានេះជាហាងកាហ្វេ ឬជាស្ថានីយ៍ប្រេងឥន្ធនៈ។
Haversine distance ជារូបមន្តគណិតវិទ្យាប្រើសម្រាប់វាស់ចម្ងាយផ្ទាល់រវាងចំណុចពីរនៅលើផែនដី ដោយគិតបញ្ចូលនូវភាពកោងនៃផែនដី (តាមរយៈបណ្តោយនិងទទឹង) ជំនួសឱ្យការវាស់ជាបន្ទាត់ត្រង់លើប្លង់រាបស្មើ ដែលទីនេះប្រើសម្រាប់វាស់កំហុសក្នុងការទស្សន៍ទាយទីតាំង។ ដូចជាការវាស់ចម្ងាយដោយយកខ្សែទៅវាស់ផ្ទាល់នៅលើកូនលោកីយ៍មូល ជំនួសឱ្យការវាស់លើផែនទីក្រដាសរាបស្មើដែលមិនសុក្រឹត។
Map Decomposition បច្ចេកទេសបែងចែកផែនទីទីក្រុងទាំងមូលទៅជាក្រឡាចត្រង្គតូចៗ (Grid cells) ជាច្រើន ដើម្បីងាយស្រួលក្នុងការវិភាគ និងដំណើរការទិន្នន័យទំហំធំនៃទីតាំងយានយន្ត។ ដូចជាការគូសបន្ទាត់ក្រឡាអុកនៅលើផែនទីទីក្រុង ដើម្បីងាយស្រួលចំណាំថាកន្លែងណាស្ថិតនៅជួរណា។
Geographical Zone Embedding ការបំប្លែងព័ត៌មានលក្ខណៈភូមិសាស្ត្រ និងទម្លាប់នៃការធ្វើដំណើរក្នុងតំបន់មួយ ទៅជាទម្រង់វ៉ិចទ័រលេខ (Vector representations) ដែលម៉ូដែលកុំព្យូទ័រអាចអានយល់ និងប្រើប្រាស់ដើម្បីគណនាភាពស្រដៀងគ្នានៃតំបន់នានា។ ដូចជាការប្រែក្លាយព័ត៌មានលម្អិតរបស់សង្កាត់នីមួយៗ (មានផ្សារ មានសាលា) ទៅជាលេខកូដសម្គាល់ខ្លីៗដើម្បីឱ្យកុំព្យូទ័រងាយស្រួលប្រៀបធៀប។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖