បញ្ហា (The Problem)៖ ការព្យាករណ៍កម្រិតទឹកភ្លៀងរយៈពេលខ្លី (Precipitation Nowcasting) មានសារៈសំខាន់សម្រាប់ការគ្រប់គ្រងគ្រោះមហន្តរាយ ប៉ុន្តែម៉ូដែលបច្ចុប្បន្នភាគច្រើនមិនបានសិក្សាពីទំនាក់ទំនងរវាងតំបន់ភូមិសាស្ត្រផ្សេងៗគ្នាដែលនៅដាច់ពីគ្នាឡើយ។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានស្នើឡើងនូវម៉ូដែលថ្មី GD-CAF ដែលប្រើប្រាស់បណ្ដាញសរសៃប្រសាទក្រាហ្វិកដើម្បីវិភាគទិន្នន័យទឹកភ្លៀងក្នុងទម្រង់ជាលំហ និងពេលវេលា។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Graph Dual-stream Convolutional Attention Fusion (GD-CAF) បណ្ដាញកុងវ៉ុលលូស្យុងនិងការយកចិត្តទុកដាក់ចរន្តទ្វេជាក្រាហ្វិក (GD-CAF) |
អាចចាប់យកទំនាក់ទំនងអន្តរតំបន់ (spatial) និងពេលវេលា (temporal) បានយ៉ាងល្អ ទោះបីជាតំបន់ទាំងនោះនៅដាច់ពីគ្នាក៏ដោយ។ មានល្បឿនលឿន និងប្រសិទ្ធភាពខ្ពស់នៅពេលចំនួនតំបន់កើនឡើង ដោយសារការប្រើប្រាស់បច្ចេកទេស Pooling។ | ទាមទារការពង្រីកទំហំទិន្នន័យនៅដំណាក់កាលប្រើប្រាស់ Attention Heads ដែលអាចធ្វើឱ្យមានភាពស្មុគស្មាញក្នុងការគណនាបើសិនគ្មានការកាត់បន្ថយតាមរយៈប្រព័ន្ធ Pooling។ | ទទួលបានកម្រិតលម្អៀង (MSE) ទាបបំផុត ០.០០۰១០៨៧៤ លើការធ្វើតេស្តក្រាហ្វិកចំនួន ១៦ តំបន់។ |
| SmaAt-UNet បណ្ដាញ SmaAt-UNet (ម៉ូដែលផ្អែកលើ UNet រួមជាមួយ Attention) |
ជាម៉ូដែលដែលត្រូវបានប្រើប្រាស់យ៉ាងទូលំទូលាយសម្រាប់ការទស្សន៍ទាយអាកាសធាតុ ដែលមានប្រសិទ្ធភាពក្នុងការកាត់បន្ថយចំនួនប៉ារ៉ាម៉ែត្របានច្រើនបើធៀបនឹងម៉ូដែល UNet ដើម។ | ប្រសិទ្ធភាពនៃភាពសុក្រឹតចាប់ផ្តើមថយចុះ (MSE កើនឡើង) នៅពេលដែលចំនួនតំបន់គោលដៅនៅក្នុងក្រាហ្វិកកើនឡើងលើសពី ៤ តំបន់។ | ទទួលបានកម្រិតលម្អៀង (MSE) ប្រមាណ ០.០០០១៣០៣១ លើការធ្វើតេស្តក្រាហ្វិកចំនួន ១៦ តំបន់ ដែលទាបជាងម៉ូដែល GD-CAF។ |
| Persistence Model ម៉ូដែល Persistence (ការព្យាករណ៍ដោយផ្អែកលើទិន្នន័យចុងក្រោយបំផុតជានិច្ច) |
ងាយស្រួលបំផុតក្នុងការអនុវត្តដោយមិនចាំបាច់មានការបណ្តុះបណ្តាល (training) នោះទេ។ មានភាពត្រឹមត្រូវគួរសមសម្រាប់ការទស្សន៍ទាយក្នុងរយៈពេលខ្លីមែនទែន (១ម៉ោង)។ | មិនមានសមត្ថភាពចាប់យកបម្រែបម្រួលអាកាសធាតុស្មុគស្មាញ ឬទំនាក់ទំនងឆ្លងតំបន់នោះទេ ហើយប្រសិទ្ធភាពធ្លាក់ចុះយ៉ាងខ្លាំងនៅពេលព្យាករណ៍លើសពី១ម៉ោង។ | ទទួលបានកម្រិតលម្អៀង (MSE) ខ្ពស់បំផុត ០.០០០២២៤៤០ និងមិនមានការកែលម្អសោះទោះបីទំហំនៃក្រាហ្វិកកើនឡើងក៏ដោយ។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះប្រើប្រាស់ធនធានកុំព្យូទ័រ និងទិន្នន័យកម្រិតមធ្យម ដែលនិស្សិត ឬអ្នកស្រាវជ្រាវអាចចូលដំណើរការបានយ៉ាងងាយស្រួលតាមរយៈប្រព័ន្ធ Cloud ដោយមិនចាំបាច់វិនិយោគលើកុំព្យូទ័រថ្លៃៗឡើយ។
ការសិក្សានេះផ្តោតលើទិន្នន័យទឹកភ្លៀងនៅតំបន់អឺរ៉ុប និងអាស៊ី-អឺរ៉ុប (Euro-Asian Region) ដែលមានលក្ខណៈអាកាសធាតុខុសពីតំបន់ត្រូពិច។ សម្រាប់ប្រទេសកម្ពុជា ការយកម៉ូដែលនេះមកអនុវត្តទាមទារឱ្យមានការបង្វឹកឡើងវិញ (retrain) ដោយប្រើប្រាស់ទិន្នន័យទឹកភ្លៀងក្នុងស្រុក ព្រោះរបបទឹកភ្លៀងនៅកម្ពុជាទទួលឥទ្ធិពលពីខ្យល់មូសុង ដែលមានលក្ខណៈបម្រែបម្រួលលឿននិងខ្លាំងជាងតំបន់អឺរ៉ុប។
ទោះបីជាទិន្នន័យសាកល្បងដើមស្ថិតនៅតំបន់ផ្សេង ប៉ុន្តែវិធីសាស្ត្រ GD-CAF នេះមានសក្តានុពលខ្ពស់ខ្លាំងណាស់សម្រាប់កម្ពុជា ក្នុងការដោះស្រាយបញ្ហាគ្រោះទឹកជំនន់ និងការគាំទ្រដល់វិស័យកសិកម្ម។
សរុបមក ការអនុវត្តវិធីសាស្ត្រនេះដោយពឹងផ្អែកលើទិន្នន័យស្ថានីយឧតុនិយមក្នុងស្រុក នឹងជួយលើកកម្ពស់ប្រព័ន្ធប្រកាសអាសន្នទឹកជំនន់ និងការសម្រេចចិត្តក្នុងវិស័យផ្សេងៗនៅកម្ពុជាបានយ៉ាងមានប្រសិទ្ធភាព។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Precipitation nowcasting | ដំណើរការនៃការទស្សន៍ទាយកម្រិតទឹកភ្លៀងក្នុងរយៈពេលខ្លីមែនទែន (ពីប៉ុន្មាននាទី ទៅពីរបីម៉ោងខាងមុខ) ដោយផ្អែកលើទិន្នន័យអាកាសធាតុបច្ចុប្បន្ន និងអតីតកាលថ្មីៗ។ | ដូចជាការមើលពពកខ្មៅលើមេឃ ហើយអាចប្រាប់បានថានឹងមានភ្លៀងធ្លាក់នៅកន្លែងណាក្នុងរយៈពេល១ម៉ោងទៀត។ |
| Spatiotemporal graph | ទម្រង់ទិន្នន័យដែលភ្ជាប់ទំនាក់ទំនងរវាងទីតាំងភូមិសាស្ត្រផ្សេងៗគ្នា (លំហ/Spatial) និងការប្រែប្រួលរបស់វាតាមពេលវេលា (Temporal) ក្នុងទម្រង់ជាបណ្ដាញក្រាហ្វិក (Graph)។ | ដូចជាផែនទីចរាចរណ៍ដែលបង្ហាញពីការកកស្ទះផ្លូវឆ្លងកាត់ខេត្តក្រុងនានា ដែលអាចប្រែប្រួលពីមួយម៉ោងទៅមួយម៉ោង។ |
| Graph Attention Networks | ប្រភេទនៃបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតដែលអាចគណនា និងផ្តល់ទម្ងន់ភាពសំខាន់ (Attention) ទៅលើទំនាក់ទំនងរវាងចំណុច (Nodes) នីមួយៗនៅក្នុងក្រាហ្វិក។ | ដូចជាសិស្សម្នាក់ដែលដឹងថាត្រូវប្រមូលអារម្មណ៍ស្តាប់មេរៀនពីគ្រូម្នាក់ណាជាងគេ ដើម្បីឱ្យប្រលងជាប់ ពេលដែលមានគ្រូច្រើននាក់កំពុងនិយាយព្រមគ្នា។ |
| Depthwise-separable convolution | បច្ចេកទេសក្នុង Deep Learning ដែលបំបែកការធ្វើប្រមាណវិធី Convolution ជាពីរដំណាក់កាល ដើម្បីកាត់បន្ថយទំហំនៃការគណនា និងធ្វើឱ្យម៉ូដែលដំណើរការបានលឿនជាងមុន ដោយប្រើប្រាស់ប៉ារ៉ាម៉ែត្រតិច។ | ជំនួសឱ្យការចម្អិនម្ហូបគ្រប់មុខព្រមគ្នាក្នុងឆ្នាំងតែមួយ យើងបែងចែកវាជាការចម្អិនសាច់ដាច់ដោយឡែក រួចទើបយកមកលាយជាមួយបន្លែតាមក្រោយដើម្បីចំណេញកម្លាំង។ |
| Mean Squared Error (MSE) | រង្វាស់សម្រាប់វាយតម្លៃភាពសុក្រឹតរបស់ម៉ូដែល ដោយវាស់មធ្យមភាគនៃផលបូកការ៉េនៃគម្លាតរវាងតម្លៃដែលកុំព្យូទ័របានទស្សន៍ទាយ និងតម្លៃពិតប្រាកដ។ | ដូចជាការវាស់ចម្ងាយមើលថាជាមធ្យម គ្រាប់ធ្នូនីមួយៗដែលអ្នកបាញ់នោះ ឃ្លាតពីចំណុចកណ្ដាលនៃផ្ទាំងគោលដៅប៉ុន្មានសង់ទីម៉ែត្រ។ |
| Gated Fusion | យន្តការសម្រាប់សម្រេចចិត្តថាតើព័ត៌មានពីប្រភពផ្សេងៗគ្នា (ដូចជាព័ត៌មានពីលំហ និងពេលវេលា) គួរត្រូវបានច្របាច់បញ្ចូលគ្នាក្នុងកម្រិតណាខ្លះ ដើម្បីបង្កើតជាលទ្ធផលចុងក្រោយ។ | ដូចជាប៉ូលីសចរាចរណ៍ដែលសម្រេចចិត្តថាត្រូវបើកឬបិទច្រកផ្លូវណាមួយ ដើម្បីបញ្ចេញចរាចរណ៍ឱ្យហូរទៅមុខបានលឿនបំផុត។ |
| Pooling | វិធីសាស្ត្រកាត់បន្ថយទំហំនៃទិន្នន័យបញ្ជូនចូល ដោយរក្សាទុកតែព័ត៌មានសំខាន់ៗ ដើម្បីសន្សំទំហំអង្គចងចាំ និងបង្កើនល្បឿននៃការគណនារបស់ម៉ូដែល។ | ដូចជាការសង្ខេបសៀវភៅ១០០ទំព័រ ឱ្យមកសល់ត្រឹម១ទំព័រ ដោយដកស្រង់យកតែចំណុចស្នូលសំខាន់ៗប៉ុណ្ណោះ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖