បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហានៃការធ្វើចំណាត់ថ្នាក់ស៊េរីទិន្នន័យពេលវេលា (Time Series Classification) ដោយព្យាយាមប្រើប្រាស់បច្ចេកវិទ្យា Computer Vision ដ៏មានប្រសិទ្ធភាព ដើម្បីវិភាគទិន្នន័យដែលមិនមែនជារូបភាពពីធម្មជាតិ។
វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានស្នើក្របខ័ណ្ឌថ្មីមួយដើម្បីបំប្លែងទិន្នន័យពេលវេលាទៅជាប្រភេទរូបភាពផ្សេងៗគ្នា រួចប្រើប្រាស់បច្ចេកទេស Deep Learning ដើម្បីធ្វើចំណាត់ថ្នាក់។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| GAF-MTF + Tiled CNN (Proposed Method) វិធីសាស្ត្រស្នើឡើងដែលរួមបញ្ចូល GAF និង MTF ជាមួយ Tiled CNN |
អាចចាប់យកទំនាក់ទំនងរវាងទិន្នន័យថេរ (Static) និងទិន្នន័យផ្លាស់ប្តូរ (Dynamic) បានល្អ ហើយដំណើរការមានប្រសិទ្ធភាពលើសំណុំទិន្នន័យតូចៗ។ | ទាមទារការបំប្លែងទិន្នន័យជាមុន (Preprocessing) ទៅជារូបភាព ដែលអាចស្មុគស្មាញជាងការប្រើប្រាស់ទិន្នន័យ Raw Time Series ផ្ទាល់។ | ទទួលបានអត្រាមានកំហុស (Error Rate) ទាបបំផុតលើសំណុំទិន្នន័យចំនួន ១០ ក្នុងចំណោម ១២ ដែលបានសាកល្បង ប្រៀបធៀបនឹងការប្រើ GAF ឬ MTF តែឯង។ |
| 1NN-DTW (Dynamic Time Warping) វិធីសាស្ត្រ 1-Nearest Neighbor ជាមួយ Dynamic Time Warping |
ជាវិធីសាស្ត្រស្តង់ដារដែលមានប្រសិទ្ធភាពខ្ពស់ក្នុងការដោះស្រាយបញ្ហាការផ្លាស់ប្តូរពេលវេលា (Temporal Shifts) នៃទិន្នន័យ។ | ចំណាយពេលគណនាយូរ (Computationally Expensive) ពិសេសលើទិន្នន័យដែលមានទំហំធំ។ | មានប្រសិទ្ធភាពខ្ពស់ ប៉ុន្តែត្រូវបានវ៉ាដាច់ដោយវិធីសាស្ត្រ Tiled CNN លើសំណុំទិន្នន័យមួយចំនួនដូចជា ECG200 និង FaceAll។ |
| SAX-VSM វិធីសាស្ត្រ Symbolic Aggregate approXimation - Vector Space Model |
មានល្បឿនលឿន និងមានប្រសិទ្ធភាពក្នុងការតំណាងទិន្នន័យជាទម្រង់និមិត្តសញ្ញា (Symbolic)។ | អាចបាត់បង់ព័ត៌មានលម្អិតមួយចំនួននៅពេលធ្វើការបង្រួមទិន្នន័យ (Discretization)។ | ជាគូប្រជែងដ៏ខ្លាំងក្លា ប៉ុន្តែវិធីសាស្ត្រ GAF-MTF នៅតែមានប្រៀបជាងលើទិន្នន័យស្មុគស្មាញមួយចំនួន។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះអាចអនុវត្តបានដោយប្រើប្រាស់ធនធានកុំព្យូទ័រកម្រិតមធ្យម មិនចាំបាច់មានបច្ចេកវិទ្យាទំនើបពេកនោះទេ ដែលសមស្របសម្រាប់បរិបទនៅកម្ពុជា។
ការសិក្សានេះប្រើប្រាស់ UCR Time Series Repository ដែលជាសំណុំទិន្នន័យស្តង់ដារអន្តរជាតិ (លោកខាងលិច) រួមមានទិន្នន័យវេជ្ជសាស្ត្រ រូបភាព និងចលនា។ វាមិនមានទិន្នន័យជាក់លាក់ពីតំបន់អាស៊ីអាគ្នេយ៍ ឬកម្ពុជាទេ ដែលអាចធ្វើឱ្យម៉ូដែលត្រូវការការបង្វឹកបន្ថែម (Fine-tuning) ពេលយកមកប្រើលើទិន្នន័យជាក់ស្តែងក្នុងស្រុក។
វិធីសាស្ត្រនេះមានប្រយោជន៍យ៉ាងខ្លាំងសម្រាប់កម្ពុជា ជាពិសេសក្នុងវិស័យដែលទើបចាប់ផ្តើមប្រមូលទិន្នន័យ និងមិនទាន់មានទិន្នន័យច្រើនសន្ធឹកសន្ធាប់។
បច្ចេកទេសនេះផ្តល់លទ្ធភាពឱ្យអ្នកស្រាវជ្រាវខ្មែរប្រើប្រាស់ម៉ូដែល Deep Learning ដ៏មានអានុភាព (CNN) លើទិន្នន័យស៊េរីពេលវេលា ដោយមិនចាំបាច់មានទិន្នន័យរាប់លានដូចការសម្គាល់រូបភាពធម្មតា។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Gramian Angular Field (GAF) | បច្ចេកទេសបំប្លែងស៊េរីទិន្នន័យពេលវេលា (Time Series) ទៅជារូបភាពដោយប្រើប្រព័ន្ធកូអរដោនេប៉ូលែរ (Polar Coordinates)។ វាគណនាកម្រិតនៃទំនាក់ទំនងរវាងចំណុចពេលវេលានីមួយៗ ដើម្បីបង្កើតជាតារាងមួយដែលអាចឱ្យកុំព្យូទ័រវិភាគបានដូចរូបភាព។ | ដូចជាការបំប្លែងសំឡេងតន្ត្រីទៅជាក្រាហ្វិកដែលមានពណ៌ចម្រុះ ដើម្បីឱ្យយើងអាចមើលឃើញលំនាំនៃបទចម្រៀងនោះតាមរយៈភ្នែក។ |
| Markov Transition Field (MTF) | វិធីសាស្ត្របង្កើតរូបភាពដោយផ្អែកលើប្រូបាប៊ីលីតេនៃការផ្លាស់ប្តូរតម្លៃពីកម្រិតមួយទៅកម្រិតមួយទៀតតាមពេលវេលា។ វាចាប់យកព័ត៌មានអំពីសក្ដានុពល (Dynamics) ឬរបៀបដែលទិន្នន័យផ្លាស់ទីពីស្ថានភាពមួយទៅស្ថានភាពមួយទៀត។ | ប្រៀបដូចជាការគូរផែនទីបង្ហាញផ្លូវរបស់សត្វមួយ ដោយកត់ត្រាថាវាទំនងជានឹងលោតពីទីតាំង A ទៅទីតាំង B ញឹកញាប់ប៉ុណ្ណា។ |
| Tiled Convolutional Neural Networks (Tiled CNNs) | ប្រភេទបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត (Neural Network) ដែលរៀនលក្ខណៈសម្បត្តិរបស់រូបភាពដោយបែងចែកជារូបភាពតូចៗ (Tiles) និងមិនចែករំលែកទម្ងន់ (Weights) គ្រប់កន្លែងដូច CNN ធម្មតា។ វាជួយឱ្យម៉ូដែលរៀនពីទិន្នន័យដែលមានលក្ខណៈប្រែប្រួលបន្តិចបន្តួច (Invariance) បានល្អ។ | ដូចជាការពិនិត្យមើលរូបភាពធំមួយដោយប្រើកែវយុត្ដតូចៗជាច្រើនដាច់ដោយឡែកពីគ្នា ដើម្បីចាប់យកចំណុចលម្អិតពិសេសៗនៅកន្លែងផ្សេងៗគ្នា។ |
| Dynamic Time Warping (DTW) | ក្បួនដោះស្រាយសម្រាប់វាស់វែងភាពស្រដៀងគ្នារវាងស៊េរីពេលវេលាពីរ ដែលអាចមានល្បឿនមិនស្មើគ្នា។ វា 'ពត់' (Warp) អ័ក្សពេលវេលាដើម្បីឱ្យចំណុចខ្ពស់និងទាបនៃក្រាហ្វទាំងពីរត្រូវគ្នាសម្រាប់ការប្រៀបធៀប។ | ដូចជាការប្រៀបធៀបសំឡេងមនុស្សពីរនាក់និយាយពាក្យ 'សួស្តី' ទោះបីជាម្នាក់និយាយលឿន ហើយម្នាក់ទៀតនិយាយយឺតក៏ដោយ ក៏កុំព្យូទ័រនៅតែដឹងថាជាពាក្យតែមួយ។ |
| Topographic ICA (TICA) | បច្ចេកទេសរៀនដោយគ្មានការត្រួតពិនិត្យ (Unsupervised Learning) ដែលប្រើដើម្បីបង្វឹកបណ្ដាញសរសៃប្រសាទជាមុន។ វាជួយបង្កើតលក្ខណៈពិសេស (Features) ដែលមានលក្ខណៈស្មុគស្មាញ និងមានទំនាក់ទំនងគ្នាតាមលំដាប់លំដោយ។ | ដូចជាការរៀនសម្គាល់ប្រភេទស្លឹកឈើផ្សេងៗគ្នាដោយខ្លួនឯង ដោយគ្រាន់តែដើរមើលក្នុងព្រៃ មុនពេលមានគ្រូប្រាប់ឈ្មោះស្លឹកឈើទាំងនោះ។ |
| Piecewise Aggregation Approximation (PAA) | វិធីសាស្ត្រកាត់បន្ថយទំហំទិន្នន័យដោយបែងចែកស៊េរីពេលវេលាជាផ្នែកស្មើៗគ្នា រួចយកតម្លៃមធ្យមនៃផ្នែកនីមួយៗមកតំណាង។ វាកាត់បន្ថយភាពស្មុគស្មាញនៃទិន្នន័យមុននឹងបំប្លែងទៅជា GAF។ | ដូចជាការសង្ខេបសាច់រឿងភាពយន្តរយៈពេល ២ម៉ោង មកនៅត្រឹម ១០នាទី ដោយរក្សានូវចំណុចសំខាន់ៗ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖