Original Title: Encoding Time Series as Images for Visual Inspection and Classification Using Tiled Convolutional Neural Networks
Source: www.aaai.org
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការបំប្លែងស៊េរីទិន្នន័យពេលវេលាជាទម្រង់រូបភាពសម្រាប់ការត្រួតពិនិត្យ និងចំណាត់ថ្នាក់ដោយប្រើបណ្ដាញសរសៃប្រសាទ Tiled Convolutional Neural Networks

ចំណងជើងដើម៖ Encoding Time Series as Images for Visual Inspection and Classification Using Tiled Convolutional Neural Networks

អ្នកនិពន្ធ៖ Zhiguang Wang (University of Maryland Baltimore County), Tim Oates (University of Maryland Baltimore County)

ឆ្នាំបោះពុម្ព៖ 2015 AAAI Workshop

វិស័យសិក្សា៖ Computer Science

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហានៃការធ្វើចំណាត់ថ្នាក់ស៊េរីទិន្នន័យពេលវេលា (Time Series Classification) ដោយព្យាយាមប្រើប្រាស់បច្ចេកវិទ្យា Computer Vision ដ៏មានប្រសិទ្ធភាព ដើម្បីវិភាគទិន្នន័យដែលមិនមែនជារូបភាពពីធម្មជាតិ។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានស្នើក្របខ័ណ្ឌថ្មីមួយដើម្បីបំប្លែងទិន្នន័យពេលវេលាទៅជាប្រភេទរូបភាពផ្សេងៗគ្នា រួចប្រើប្រាស់បច្ចេកទេស Deep Learning ដើម្បីធ្វើចំណាត់ថ្នាក់។

ការបង្កើត Gramian Angular Fields (GAF) ដោយបំប្លែងស៊េរីពេលវេលាទៅជាប្រព័ន្ធកូអរដោនេប៉ូលែរ (Polar Coordinate System)
ការបង្កើត Markov Transition Fields (MTF) ដើម្បីតំណាងឱ្យប្រូបាប៊ីលីតេនៃការផ្លាស់ប្ដូរ (Transition Probability) តាមលំដាប់លំដោយ
ការប្រើប្រាស់ Tiled Convolutional Neural Networks (Tiled CNNs) ដើម្បីរៀនលក្ខណៈពិសេសកម្រិតខ្ពស់ពីរូបភាព GAF និង MTF

លទ្ធផលសំខាន់ៗ (The Verdict)៖

លទ្ធផលនៃការធ្វើចំណាត់ថ្នាក់បង្ហាញថា វិធីសាស្ត្រនេះមានសមត្ថភាពប្រកួតប្រជែងជាមួយបច្ចេកទេសឈានមុខគេបច្ចុប្បន្នដូចជា 1NN-DTW និង Fast-Shapelets។
ការរួមបញ្ចូលគ្នារវាងរូបភាព GAF និង MTF (GAF-MTF) ជួយកាត់បន្ថយហានិភ័យនៃការរៀនសូត្រលើសកម្រិត (Overfitting) និងបង្កើនភាពត្រឹមត្រូវនៃការធ្វើចំណាត់ថ្នាក់លើសំណុំទិន្នន័យចំនួន ១០ ក្នុងចំណោម ១២ ដែលបានសាកល្បង។
បណ្ដាញ Tiled CNNs ដំណើរការបានល្អជាមួយទិន្នន័យដែលមានចំនួនកំណត់ (Limited Labeled Data) ដោយសារការចែករំលែកទម្ងន់ (Weight Sharing) និងរចនាសម្ព័ន្ធ Tiling។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
GAF-MTF + Tiled CNN (Proposed Method) វិធីសាស្ត្រស្នើឡើងដែលរួមបញ្ចូល GAF និង MTF ជាមួយ Tiled CNN	អាចចាប់យកទំនាក់ទំនងរវាងទិន្នន័យថេរ (Static) និងទិន្នន័យផ្លាស់ប្តូរ (Dynamic) បានល្អ ហើយដំណើរការមានប្រសិទ្ធភាពលើសំណុំទិន្នន័យតូចៗ។	ទាមទារការបំប្លែងទិន្នន័យជាមុន (Preprocessing) ទៅជារូបភាព ដែលអាចស្មុគស្មាញជាងការប្រើប្រាស់ទិន្នន័យ Raw Time Series ផ្ទាល់។	ទទួលបានអត្រាមានកំហុស (Error Rate) ទាបបំផុតលើសំណុំទិន្នន័យចំនួន ១០ ក្នុងចំណោម ១២ ដែលបានសាកល្បង ប្រៀបធៀបនឹងការប្រើ GAF ឬ MTF តែឯង។
1NN-DTW (Dynamic Time Warping) វិធីសាស្ត្រ 1-Nearest Neighbor ជាមួយ Dynamic Time Warping	ជាវិធីសាស្ត្រស្តង់ដារដែលមានប្រសិទ្ធភាពខ្ពស់ក្នុងការដោះស្រាយបញ្ហាការផ្លាស់ប្តូរពេលវេលា (Temporal Shifts) នៃទិន្នន័យ។	ចំណាយពេលគណនាយូរ (Computationally Expensive) ពិសេសលើទិន្នន័យដែលមានទំហំធំ។	មានប្រសិទ្ធភាពខ្ពស់ ប៉ុន្តែត្រូវបានវ៉ាដាច់ដោយវិធីសាស្ត្រ Tiled CNN លើសំណុំទិន្នន័យមួយចំនួនដូចជា ECG200 និង FaceAll។
SAX-VSM វិធីសាស្ត្រ Symbolic Aggregate approXimation - Vector Space Model	មានល្បឿនលឿន និងមានប្រសិទ្ធភាពក្នុងការតំណាងទិន្នន័យជាទម្រង់និមិត្តសញ្ញា (Symbolic)។	អាចបាត់បង់ព័ត៌មានលម្អិតមួយចំនួននៅពេលធ្វើការបង្រួមទិន្នន័យ (Discretization)។	ជាគូប្រជែងដ៏ខ្លាំងក្លា ប៉ុន្តែវិធីសាស្ត្រ GAF-MTF នៅតែមានប្រៀបជាងលើទិន្នន័យស្មុគស្មាញមួយចំនួន។

ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះអាចអនុវត្តបានដោយប្រើប្រាស់ធនធានកុំព្យូទ័រកម្រិតមធ្យម មិនចាំបាច់មានបច្ចេកវិទ្យាទំនើបពេកនោះទេ ដែលសមស្របសម្រាប់បរិបទនៅកម្ពុជា។

Hardware: កុំព្យូទ័រយួរដៃដែលមាន CPU Intel i7 និង RAM 8GB គឺគ្រប់គ្រាន់សម្រាប់ការពិសោធន៍លើ Dataset ចំនួន ១២ ដោយចំណាយពេលត្រឹមមួយថ្ងៃ។
Software: ភាសា Python និងបណ្ណាល័យសម្រាប់ Deep Learning (ដូចជា TensorFlow ឬ PyTorch) និងបណ្ណាល័យ pyts សម្រាប់ការបំប្លែង Time Series។
Data Requirements: វិធីសាស្ត្រ Tiled CNN នេះត្រូវបានរចនាឡើងដើម្បីដំណើរការល្អជាមួយសំណុំទិន្នន័យដែលមានការដាក់ស្លាក (Labeled Data) មានកំណត់។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់ UCR Time Series Repository ដែលជាសំណុំទិន្នន័យស្តង់ដារអន្តរជាតិ (លោកខាងលិច) រួមមានទិន្នន័យវេជ្ជសាស្ត្រ រូបភាព និងចលនា។ វាមិនមានទិន្នន័យជាក់លាក់ពីតំបន់អាស៊ីអាគ្នេយ៍ ឬកម្ពុជាទេ ដែលអាចធ្វើឱ្យម៉ូដែលត្រូវការការបង្វឹកបន្ថែម (Fine-tuning) ពេលយកមកប្រើលើទិន្នន័យជាក់ស្តែងក្នុងស្រុក។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានប្រយោជន៍យ៉ាងខ្លាំងសម្រាប់កម្ពុជា ជាពិសេសក្នុងវិស័យដែលទើបចាប់ផ្តើមប្រមូលទិន្នន័យ និងមិនទាន់មានទិន្នន័យច្រើនសន្ធឹកសន្ធាប់។

វិស័យកសិកម្ម (Smart Agriculture): ការប្រើប្រាស់ដើម្បីវិភាគទិន្នន័យពីសេនស័រ (Sensors) តាមដានសំណើមដី ឬសីតុណ្ហភាពក្នុងចំការដំណាំ ដើម្បីព្យាករណ៍ពីជំងឺ ឬតម្រូវការទឹក ដោយបំប្លែងទិន្នន័យសេនស័រទៅជារូបភាពសម្រាប់វិភាគ។
វិស័យសុខាភិបាល (Healthcare): ការវិភាគទិន្នន័យ ECG (ចង្វាក់បេះដូង) នៅតាមមន្ទីរពេទ្យនានា ដោយវិធីសាស្ត្រនេះបានបង្ហាញប្រសិទ្ធភាពខ្ពស់លើទិន្នន័យ ECG200 ក្នុងការពិសោធន៍។
វិស័យថាមពល (Energy Sector - EDC): ការត្រួតពិនិត្យភាពមិនប្រក្រតី (Anomaly Detection) នៅក្នុងបណ្តាញចែកចាយអគ្គិសនី ដោយវិភាគលើស៊េរីទិន្នន័យនៃការប្រើប្រាស់ថាមពល។

បច្ចេកទេសនេះផ្តល់លទ្ធភាពឱ្យអ្នកស្រាវជ្រាវខ្មែរប្រើប្រាស់ម៉ូដែល Deep Learning ដ៏មានអានុភាព (CNN) លើទិន្នន័យស៊េរីពេលវេលា ដោយមិនចាំបាច់មានទិន្នន័យរាប់លានដូចការសម្គាល់រូបភាពធម្មតា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះនៃការបំប្លែងទិន្នន័យ: និស្សិតគួរចាប់ផ្តើមសិក្សាពីទ្រឹស្តីនៃ Gramian Angular Fields (GAF) និង Markov Transition Fields (MTF) ដោយប្រើប្រាស់បណ្ណាល័យ Python ឈ្មោះ pyts ដើម្បីសាកល្បងបំប្លែងទិន្នន័យសាមញ្ញទៅជារូបភាព។
អនុវត្ត Tiled CNN លើទិន្នន័យបើកចំហ: ទាញយកសំណុំទិន្នន័យពី UCR Archive (ដូចជា ECG200) ហើយអនុវត្តការបង្កើតម៉ូដែល CNN សាមញ្ញដោយប្រើ TensorFlow ឬ Keras ដើម្បីធ្វើចំណាត់ថ្នាក់រូបភាពដែលបានបំប្លែងរួច។
ប្រមូលទិន្នន័យជាក់ស្តែងក្នុងស្រុក: សហការជាមួយដេប៉ាតឺម៉ង់កសិកម្ម ឬវិស្វកម្ម ដើម្បីប្រមូលទិន្នន័យ Time Series (ឧទាហរណ៍៖ ទិន្នន័យអាកាសធាតុប្រចាំម៉ោង ឬទិន្នន័យចរាចរណ៍) ដើម្បីបង្កើតជា Dataset ផ្ទាល់ខ្លួន។
ការប្រៀបធៀបប្រសិទ្ធភាព: ធ្វើការប្រៀបធៀបលទ្ធផលរវាងការប្រើប្រាស់ 1NN-DTW និងវិធីសាស្ត្រ GAF-CNN លើទិន្នន័យក្នុងស្រុក ដើម្បីវាយតម្លៃថាវិធីសាស្ត្រមួយណាផ្តល់ភាពត្រឹមត្រូវជាងសម្រាប់បរិបទកម្ពុជា។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Gramian Angular Field (GAF)	បច្ចេកទេសបំប្លែងស៊េរីទិន្នន័យពេលវេលា (Time Series) ទៅជារូបភាពដោយប្រើប្រព័ន្ធកូអរដោនេប៉ូលែរ (Polar Coordinates)។ វាគណនាកម្រិតនៃទំនាក់ទំនងរវាងចំណុចពេលវេលានីមួយៗ ដើម្បីបង្កើតជាតារាងមួយដែលអាចឱ្យកុំព្យូទ័រវិភាគបានដូចរូបភាព។	ដូចជាការបំប្លែងសំឡេងតន្ត្រីទៅជាក្រាហ្វិកដែលមានពណ៌ចម្រុះ ដើម្បីឱ្យយើងអាចមើលឃើញលំនាំនៃបទចម្រៀងនោះតាមរយៈភ្នែក។
Markov Transition Field (MTF)	វិធីសាស្ត្របង្កើតរូបភាពដោយផ្អែកលើប្រូបាប៊ីលីតេនៃការផ្លាស់ប្តូរតម្លៃពីកម្រិតមួយទៅកម្រិតមួយទៀតតាមពេលវេលា។ វាចាប់យកព័ត៌មានអំពីសក្ដានុពល (Dynamics) ឬរបៀបដែលទិន្នន័យផ្លាស់ទីពីស្ថានភាពមួយទៅស្ថានភាពមួយទៀត។	ប្រៀបដូចជាការគូរផែនទីបង្ហាញផ្លូវរបស់សត្វមួយ ដោយកត់ត្រាថាវាទំនងជានឹងលោតពីទីតាំង A ទៅទីតាំង B ញឹកញាប់ប៉ុណ្ណា។
Tiled Convolutional Neural Networks (Tiled CNNs)	ប្រភេទបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត (Neural Network) ដែលរៀនលក្ខណៈសម្បត្តិរបស់រូបភាពដោយបែងចែកជារូបភាពតូចៗ (Tiles) និងមិនចែករំលែកទម្ងន់ (Weights) គ្រប់កន្លែងដូច CNN ធម្មតា។ វាជួយឱ្យម៉ូដែលរៀនពីទិន្នន័យដែលមានលក្ខណៈប្រែប្រួលបន្តិចបន្តួច (Invariance) បានល្អ។	ដូចជាការពិនិត្យមើលរូបភាពធំមួយដោយប្រើកែវយុត្ដតូចៗជាច្រើនដាច់ដោយឡែកពីគ្នា ដើម្បីចាប់យកចំណុចលម្អិតពិសេសៗនៅកន្លែងផ្សេងៗគ្នា។
Dynamic Time Warping (DTW)	ក្បួនដោះស្រាយសម្រាប់វាស់វែងភាពស្រដៀងគ្នារវាងស៊េរីពេលវេលាពីរ ដែលអាចមានល្បឿនមិនស្មើគ្នា។ វា 'ពត់' (Warp) អ័ក្សពេលវេលាដើម្បីឱ្យចំណុចខ្ពស់និងទាបនៃក្រាហ្វទាំងពីរត្រូវគ្នាសម្រាប់ការប្រៀបធៀប។	ដូចជាការប្រៀបធៀបសំឡេងមនុស្សពីរនាក់និយាយពាក្យ 'សួស្តី' ទោះបីជាម្នាក់និយាយលឿន ហើយម្នាក់ទៀតនិយាយយឺតក៏ដោយ ក៏កុំព្យូទ័រនៅតែដឹងថាជាពាក្យតែមួយ។
Topographic ICA (TICA)	បច្ចេកទេសរៀនដោយគ្មានការត្រួតពិនិត្យ (Unsupervised Learning) ដែលប្រើដើម្បីបង្វឹកបណ្ដាញសរសៃប្រសាទជាមុន។ វាជួយបង្កើតលក្ខណៈពិសេស (Features) ដែលមានលក្ខណៈស្មុគស្មាញ និងមានទំនាក់ទំនងគ្នាតាមលំដាប់លំដោយ។	ដូចជាការរៀនសម្គាល់ប្រភេទស្លឹកឈើផ្សេងៗគ្នាដោយខ្លួនឯង ដោយគ្រាន់តែដើរមើលក្នុងព្រៃ មុនពេលមានគ្រូប្រាប់ឈ្មោះស្លឹកឈើទាំងនោះ។
Piecewise Aggregation Approximation (PAA)	វិធីសាស្ត្រកាត់បន្ថយទំហំទិន្នន័យដោយបែងចែកស៊េរីពេលវេលាជាផ្នែកស្មើៗគ្នា រួចយកតម្លៃមធ្យមនៃផ្នែកនីមួយៗមកតំណាង។ វាកាត់បន្ថយភាពស្មុគស្មាញនៃទិន្នន័យមុននឹងបំប្លែងទៅជា GAF។	ដូចជាការសង្ខេបសាច់រឿងភាពយន្តរយៈពេល ២ម៉ោង មកនៅត្រឹម ១០នាទី ដោយរក្សានូវចំណុចសំខាន់ៗ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖