បញ្ហា (The Problem)៖ ការព្យាករណ៍ទិន្នន័យស៊េរីពេលវេលា (Time-series forecasting) ដែលមានប្រវត្តិទិន្នន័យហ្វឹកហាត់តិចតួច ជារឿយៗតែងតែផ្តល់លទ្ធផលមិនច្បាស់លាស់ និងទាមទារធនធានកុំព្យូទ័រខ្ពស់ក្នុងការបង្កើតម៉ូដែលសម្រាប់ទិន្នន័យនីមួយៗដាច់ដោយឡែកពីគ្នា។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានស្នើឡើងនូវស្ថាបត្យកម្មបណ្តាញសរសៃប្រសាទ (Deep LSTM) និងអនុគមន៍បាត់បង់ថ្មី (Novel loss function) ដើម្បីអនុវត្តបច្ចេកទេសរៀនផ្ទេរ (Transfer Learning) លើទិន្នន័យស៊េរីពេលវេលា។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Deep LSTM with Transfer Learning (AnB) ម៉ូដែល Deep LSTM ប្រើប្រាស់ការរៀនផ្ទេរ (Transfer Learning) ដោយបង្កកស្រទាប់ n |
ដំណើរការល្អខ្លាំងលើទិន្នន័យហ្វឹកហាត់តិចតួច សន្សំសំចៃធនធានកុំព្យូទ័របានច្រើន និងមានប្រសិទ្ធភាពខ្ពស់លើទិន្នន័យរំខាន (noisy) ព្រមទាំងទិន្នន័យរង្វើល (sparse)។ | អត្ថប្រយោជន៍នៃការព្យាករណ៍ធៀបនឹងម៉ូដែលធម្មតានឹងថយចុះនៅពេលទំហំទិន្នន័យហ្វឹកហាត់គោលដៅមានទំហំធំខ្លាំង។ | បន្ថយកំហុស SMAPE ពីប្រមាណ ២០០% មកនៅក្រោម ៧៥% សម្រាប់កម្រិតទិន្នន័យហ្វឹកហាត់តូចបំផុត។ |
| Standard Deep LSTM (Single) ម៉ូដែល Deep LSTM ធម្មតា (ហ្វឹកហាត់ដាច់ដោយឡែក) |
ងាយស្រួលយល់ និងមិនស្មុគស្មាញក្នុងការរៀបចំសម្រាប់ទិន្នន័យនីមួយៗដាច់ដោយឡែក ប្រសិនបើមានទិន្នន័យហ្វឹកហាត់គ្រប់គ្រាន់។ | ទាមទារទិន្នន័យហ្វឹកហាត់ច្រើន និងត្រូវការពេលវេលា ព្រមទាំងធនធានកុំព្យូទ័រខ្ពស់ដើម្បីហ្វឹកហាត់ម៉ូដែលរាប់ពាន់ដាច់ដោយឡែកពីគ្នា។ | មានកំហុស SMAPE ខ្ពស់ (ប្រមាណ ២០០%) នៅពេលហ្វឹកហាត់ជាមួយនឹងទិន្នន័យដែលមានប្រវត្តិខ្លី (limited history)។ |
| HoltWinters វិធីសាស្ត្រស្ថិតិ HoltWinters (Classical baseline) |
ជាវិធីសាស្ត្រព្យាករណ៍បែបប្រពៃណីដែលងាយស្រួលប្រើ និងមិនទាមទារធនធានកុំព្យូទ័រខ្ពស់សម្រាប់ដំណើរការ។ | មិនមានសមត្ថភាពចាប់យកទំនាក់ទំនងស្មុគស្មាញនៃទិន្នន័យ (non-linearities) និងមានកម្រិតកំហុសខ្ពស់ធៀបនឹងម៉ូដែល Deep Learning ជាពិសេសលើទិន្នន័យមិនប្រក្រតី។ | មានកំហុសព្យាករណ៍ខ្ពស់ជាងម៉ូដែល Transfer Learning ជាពិសេសនៅពេលអនុវត្តលើទិន្នន័យដែលមានលក្ខណៈ Noisy ឬ Sparse។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការប្រើប្រាស់បច្ចេកទេសរៀនផ្ទេរ (Transfer Learning) ជួយកាត់បន្ថយតម្រូវការធនធានយ៉ាងច្រើនសន្ធឹកសន្ធាប់ ទាំងការហ្វឹកហាត់ និងការធ្វើអនុមាន (inference) ដោយអនុញ្ញាតឱ្យប្រើម៉ូដែលតែមួយសម្រាប់ទិន្នន័យរាប់ពាន់។
ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យអគ្គិសនីពីសហរដ្ឋអាមេរិក (PG&E នៅរដ្ឋកាលីហ្វ័រញ៉ា និង Pecan Street នៅរដ្ឋតិចសាស់) ព្រមទាំងទិន្នន័យស្តង់ដារ M3 ដែលមានបរិបទខុសពីកម្ពុជា។ ទោះបីជាលំនាំនៃការប្រើប្រាស់អាចខុសគ្នា ប៉ុន្តែបញ្ហា 'កង្វះខាតទិន្នន័យប្រវត្តិយូរអង្វែង' គឺជាបញ្ហាទូទៅនៅកម្ពុជា ដូច្នេះវិធីសាស្ត្រនេះមានសារៈសំខាន់ខ្លាំងណាស់ក្នុងការដោះស្រាយបញ្ហានេះ។
វិធីសាស្ត្រ Transfer Learning សម្រាប់ទិន្នន័យស៊េរីពេលវេលានេះ មានសក្តានុពលខ្ពស់ខ្លាំងសម្រាប់ការអនុវត្តនៅប្រទេសកម្ពុជា ជាពិសេសក្នុងវិស័យដែលទើបចាប់ផ្តើមប្រមូលទិន្នន័យតាមប្រព័ន្ធឌីជីថល។
សរុបមក ការប្រើប្រាស់ Transfer Learning គឺជាដំណោះស្រាយដ៏ឆ្លាតវៃសម្រាប់បរិបទប្រទេសកម្ពុជា ព្រោះវាអនុញ្ញាតឱ្យយើងបង្កើតប្រព័ន្ធព្យាករណ៍ដែលមានភាពត្រឹមត្រូវខ្ពស់ ទោះបីជាយើងស្ថិតក្នុងដំណាក់កាលខ្វះខាតទិន្នន័យ (Data-scarce environment) ក៏ដោយ។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Transfer Learning | ដំណើរការនៃការយកចំណេះដឹង (ទម្ងន់នៃបណ្តាញសរសៃប្រសាទ) ដែលម៉ូដែលមួយបានរៀនពីសំណុំទិន្នន័យដ៏ធំមួយ ទៅប្រើប្រាស់ដើម្បីដោះស្រាយបញ្ហាថ្មីមួយទៀតដែលមានទិន្នន័យតិចតួច។ | ដូចជាមនុស្សម្នាក់ដែលចេះជិះកង់រួចហើយ យកជំនាញរក្សាតុល្យភាពនោះទៅរៀនជិះម៉ូតូដោយប្រើពេលតិចជាងអ្នកដែលមិនធ្លាប់ជិះកង់សោះ។ |
| LSTM (Long Short-Term Memory) | ប្រភេទនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (RNN) ដែលមានសមត្ថភាពចងចាំព័ត៌មានពីអតីតកាលក្នុងរយៈពេលយូរ ដើម្បីទាញយកទំនាក់ទំនង និងទស្សន៍ទាយទិន្នន័យដែលមានលក្ខណៈជាស៊េរីបន្តបន្ទាប់គ្នាដូចជាពេលវេលាជាដើម។ | ដូចជាសៀវភៅកំណត់ហេតុដែលជួយចងចាំព្រឹត្តិការណ៍សំខាន់ៗកាលពីមុន ដើម្បីសម្រេចចិត្តថានឹងមានអ្វីកើតឡើងនៅថ្ងៃស្អែក។ |
| Reconstruction Loss | ទំហំនៃកំហុសនៅពេលដែលម៉ូដែលព្យាយាមបង្កើតទិន្នន័យដើមឡើងវិញចេញពីលក្ខណៈពិសេសដែលវាបានបង្រួម (Compressed features) ដែលជួយធានាថាម៉ូដែលយល់ច្បាស់ពីទម្រង់ទូទៅនៃទិន្នន័យមុននឹងធ្វើការព្យាករណ៍។ | ដូចជាការគូររូបភាពសង្ខេបពីការចងចាំរបស់អ្នក ហើយប្រៀបធៀបវាទៅនឹងរូបភាពដើមថាតើវាមានភាពខុសគ្នា ឬបាត់បង់ព័ត៌មានប៉ុណ្ណា។ |
| Regression Loss | ទំហំនៃកំហុសរវាងតម្លៃដែលម៉ូដែលបានទស្សន៍ទាយសម្រាប់អនាគត និងតម្លៃជាក់ស្តែងដែលកើតឡើងពិតប្រាកដ (ប្រើសម្រាប់វាយតម្លៃ និងកែតម្រូវសមត្ថភាពការព្យាករណ៍របស់ម៉ូដែល)។ | ដូចជាការទស្សន៍ទាយថាថ្ងៃស្អែកនឹងមានភ្លៀងធ្លាក់ ៨០ មីលីម៉ែត្រ តែជាក់ស្តែងធ្លាក់ត្រឹម ៥០ មីលីម៉ែត្រ នោះកំហុសចំនួន ៣០ គឺជា Regression Loss។ |
| SMAPE (Symmetric Mean Absolute Percentage Error) | រង្វាស់ស្ថិតិមួយប្រភេទដែលប្រើសម្រាប់គណនាកម្រិតកំហុសជាភាគរយនៃម៉ូដែលការព្យាករណ៍ ដោយបែងចែកភាពខុសគ្នារវាងតម្លៃទស្សន៍ទាយ និងតម្លៃពិត ជាមួយនឹងមធ្យមភាគនៃតម្លៃទាំងពីរ។ | ជាពិន្ទុដែលប្រាប់យើងថាការទស្សន៍ទាយរបស់យើងខុសពីការពិតប៉ុន្មានភាគរយ ដើម្បីបញ្ជាក់ថាម៉ូដែលនោះពូកែកម្រិតណា។ |
| Bottleneck layer | ស្រទាប់កណ្តាលនៃបណ្តាញសរសៃប្រសាទដែលមានចំនួនណឺរ៉ូន (Neurons) តិចជាងស្រទាប់ផ្សេងៗ ដែលបង្ខំឱ្យម៉ូដែលត្រូវបង្រួមទិន្នន័យ និងទាញយកតែលក្ខណៈពិសេសដែលសំខាន់បំផុត ដើម្បីយកទៅផ្ទេរចំណេះដឹង។ | ដូចជាកញ្ច្រែងរែងយកតែកំទេចមាសសុទ្ធចេញពីខ្សាច់និងថ្មរាប់តោន ដោយរក្សាទុកតែរបស់ដែលមានតម្លៃនិងតំណាងឱ្យទិន្នន័យទាំងមូលបំផុត។ |
| Fine-tuning | ដំណើរការនៃការយកម៉ូដែលដែលបានហ្វឹកហាត់រួចជាស្រេច (Pre-trained model) មកហ្វឹកហាត់បន្ថែមតែបន្តិចបន្តួច (ជាពិសេសស្រទាប់ចុងក្រោយ) នៅលើសំណុំទិន្នន័យថ្មី ដើម្បីឱ្យវាមានភាពសុក្រឹតនិងស័ក្តិសមបំផុតសម្រាប់បរិបទថ្មីនោះ។ | ដូចជាការទិញអាវធំដែលគេកាត់ស្រេចមកកែតម្រូវទំហំបន្តិចបន្តួចនៅត្រង់ចង្កេះនិងដៃ ដើម្បីឱ្យស្លៀកត្រូវពិតប្រាកដជាមួយរាងកាយរបស់អ្នក។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖