បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហាប្រឈមក្នុងការត្រួតពិនិត្យ និងការរកឃើញភាពខុសប្រក្រតីនៃទួរប៊ីនខ្យល់ (Wind Turbines) ដោយសារតែទិន្នន័យ SCADA មានការពឹងផ្អែកខ្លាំងទៅលើលក្ខខណ្ឌប្រតិបត្តិការ និងអាកាសធាតុ។
វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានប្រមូលទិន្នន័យ SCADA ពីកសិដ្ឋានខ្យល់ រួចធ្វើការសម្អាត និងអនុវត្តម៉ូដែល Deep Learning ចំនួនបីដើម្បីប្រៀបធៀបក្នុងការទស្សន៍ទាយភាពខុសប្រក្រតី។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| GRU (Gated Recurrent Unit) បណ្ដាញសរសៃប្រសាទ GRU (Gated Recurrent Unit) |
មានសមត្ថភាពខ្ពស់ក្នុងការចាប់យកទំនាក់ទំនងទិន្នន័យរយៈពេលវែង (Long-term dependencies) និងមានល្បឿនហ្វឹកហាត់លឿនជាង LSTM ដោយសារមានរចនាសម្ព័ន្ធសាមញ្ញជាង។ | នៅតែទាមទារធនធានគណនាខ្ពស់បើប្រៀបធៀបនឹងម៉ូដែលសាមញ្ញ (Classical Machine Learning) ហើយអាចងាយរងគ្រោះពីបញ្ហា Overfitting ប្រសិនបើទិន្នន័យមិនគ្រប់គ្រាន់។ | ទទួលបានលទ្ធផលល្អបំផុត ដោយមានតម្លៃ R² កម្រិត ៨២,៤%, MSE កម្រិត ០,០២៤ និងភាពត្រឹមត្រូវ ៩៦,៩%។ |
| LSTM (Long Short-Term Memory) បណ្ដាញសរសៃប្រសាទ LSTM (Long Short-Term Memory) |
ដោះស្រាយបញ្ហា Gradient Vanishing បានយ៉ាងល្អ និងពូកែក្នុងការទាញយកលក្ខណៈពិសេសពីទិន្នន័យស៊េរីពេលវេលា (Time-series) ដែលមិនមែនជាបន្ទាត់ត្រង់។ | មានរចនាសម្ព័ន្ធស្មុគស្មាញ និងទាមទារពេលវេលាយូរក្នុងការហ្វឹកហាត់ម៉ូដែលបើប្រៀបធៀបទៅនឹង GRU និង CNN។ | ទទួលបានលទ្ធផលល្អបង្គួរ ដោយមានតម្លៃ R² កម្រិត ៧៣,៤% និង MSE កម្រិត ០,០៣៧។ |
| CNN (Convolutional Neural Network) បណ្ដាញសរសៃប្រសាទ CNN (Convolutional Neural Network) |
មានភាពលេចធ្លោក្នុងការទាញយកលក្ខណៈពិសេស (Feature extraction) ការចែករំលែកទម្ងន់ទិន្នន័យ និងកាត់បន្ថយពេលវេលាសម្រាប់ការធ្វើ Preprocessing។ | មិនសូវមានប្រសិទ្ធភាពក្នុងការចាប់យកការផ្លាស់ប្តូរនៃទិន្នន័យដែលពឹងផ្អែកលើពេលវេលា (Time-dependent) ដូចជាទិន្នន័យល្បឿនខ្យល់។ | ទទួលបានលទ្ធផលទាបជាងគេបន្តិច ដោយមានតម្លៃ R² កម្រិត ៧២,៧% និង MSE កម្រិត ០,១៧៥។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារធនធានកុំព្យូទ័រដែលមានកម្លាំងខ្លាំង ជាពិសេសក្រាហ្វិកកាត (GPU) ដើម្បីធានាដល់ល្បឿន និងប្រសិទ្ធភាពក្នុងការហ្វឹកហាត់ម៉ូដែល Deep Learning លើទិន្នន័យដ៏ធំ។
ការសិក្សានេះត្រូវបានធ្វើឡើងដោយប្រើប្រាស់ទិន្នន័យពីកសិដ្ឋានខ្យល់មួយនៅតំបន់ Yalova ប្រទេសទួរគី ក្នុងឆ្នាំ២០១៨។ ទិន្នន័យនេះឆ្លុះបញ្ចាំងពីលក្ខខណ្ឌអាកាសធាតុ ល្បឿនខ្យល់ និងប្រភេទម៉ាស៊ីនជាក់លាក់ប្រចាំតំបន់អឺរ៉ុប-អាស៊ី ដែលមានភាពខុសគ្នាពីតំបន់ត្រូពិច។ សម្រាប់កម្ពុជា ការយកម៉ូដែលនេះមកប្រើប្រាស់ដោយផ្ទាល់អាចមិនទទួលបានភាពត្រឹមត្រូវ១០០% ទេ ដោយសារយើងមានរបបខ្យល់មូសុង និងសីតុណ្ហភាពខុសគ្នា ដែលទាមទារឱ្យមានការប្រមូលទិន្នន័យក្នុងស្រុកបន្ថែមដើម្បីហ្វឹកហាត់ម៉ូដែលឡើងវិញ (Fine-tuning)។
វិធីសាស្ត្រនៃការតាមដាន និងទស្សន៍ទាយភាពខុសប្រក្រតីនេះ មានសក្តានុពលខ្ពស់សម្រាប់ជួយគាំទ្រដល់គម្រោងអភិវឌ្ឍន៍ថាមពលកកើតឡើងវិញរបស់កម្ពុជា។
សរុបមក បច្ចេកទេសនេះគឺជាគន្លឹះដ៏សំខាន់សម្រាប់ជួយឱ្យស្ថាប័នថាមពលកម្ពុជា អាចផ្លាស់ប្តូរពីការថែទាំតាមបែបប្រពៃណី ទៅជាការថែទាំបែបប្រមើលមើលទុកជាមុន (Predictive Maintenance) ប្រកបដោយភាពវៃឆ្លាត។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Supervisory Control and Data Acquisition (SCADA) | ជាប្រព័ន្ធកុំព្យូទ័រឧស្សាហកម្មដែលប្រើសម្រាប់ប្រមូលទិន្នន័យ ត្រួតពិនិត្យ និងគ្រប់គ្រងប្រតិបត្តិការរបស់ម៉ាស៊ីនខ្នាតធំ (ដូចជាទួរប៊ីនខ្យល់) ពីចម្ងាយក្នុងពេលវេលាជាក់ស្តែង។ | ដូចជាកាមេរ៉ាសុវត្ថិភាព និងប្រព័ន្ធបញ្ជាចង្កូតបញ្ចូលគ្នាតែមួយ ដែលអនុញ្ញាតឱ្យយើងមើលឃើញពីចម្ងាយផង និងអាចបញ្ជាម៉ាស៊ីនបានផង។ |
| Gated Recurrent Unit (GRU) | ជាប្រភេទបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតខ្ពស់ ដែលមានសមត្ថភាពចងចាំទិន្នន័យស៊េរីពេលវេលាពីអតីតកាលបានយូរ ហើយមានរចនាសម្ព័ន្ធសាមញ្ញជាង LSTM ដែលធ្វើឱ្យវាដំណើរការគណនាបានលឿនជាង។ | ដូចជាសៀវភៅកំណត់ហេតុឆ្លាតវៃមួយ ដែលចេះសម្រេចចិត្តដោយស្វ័យប្រវត្តិថា ព័ត៌មានចាស់ណាមួយគួររក្សាទុក ហើយព័ត៌មានណាមួយគួរបោះចោលដើម្បីកុំឱ្យធ្ងន់ខួរក្បាល។ |
| Long Short-Term Memory (LSTM) | ជាម៉ូដែល Deep Learning ដែលពូកែខាងវិភាគទិន្នន័យដែលមានលំដាប់លំដោយ (Sequence data) ដោយដោះស្រាយបញ្ហាភ្លេចព័ត៌មានចាស់ៗរបស់បណ្តាញ RNN ធម្មតា និងអាចចាប់យកទំនាក់ទំនងរយៈពេលវែងនៃទិន្នន័យបានល្អ។ | ដូចជាមនុស្សចាស់ដែលមានការចងចាំពិសេស អាចចងចាំរឿងរ៉ាវសំខាន់ៗដែលបានកើតឡើងតាំងពីយូរណាស់មកហើយ ដើម្បីយកមកធ្វើការសម្រេចចិត្តនៅថ្ងៃនេះ។ |
| Convolutional Neural Network (CNN) | ជាក្បួនដោះស្រាយដ៏មានប្រសិទ្ធភាពក្នុងការទាញយកលក្ខណៈពិសេស (Feature extraction) ពីទិន្នន័យ ដែលជាទូទៅប្រើប្រាស់ខ្លាំងក្នុងការសម្គាល់រូបភាព ប៉ុន្តែនៅក្នុងការសិក្សានេះវាត្រូវបានប្រើសម្រាប់ទាញយកលំនាំនៃទិន្នន័យល្បឿនខ្យល់។ | ដូចជាកែវពង្រីកដែលស្កេនមើលរូបភាព ឬទិន្នន័យម្តងមួយផ្នែកៗ ដើម្បីស្វែងរកចំណុចលេចធ្លោ ឬភាពមិនប្រក្រតីដែលលាក់កំបាំង។ |
| predictive maintenance | គឺជាការប្រើប្រាស់ទិន្នន័យ និងម៉ូដែលបញ្ញាសិប្បនិម្មិតដើម្បីវិភាគ និងទស្សន៍ទាយទុកជាមុនថាតើម៉ាស៊ីន ឬឧបករណ៍ណាមួយនឹងជិតខូចនៅពេលណា ដើម្បីអាចចូលទៅជួសជុលទាន់ពេលវេលា។ | ដូចជាការយកឡានទៅជាងជួសជុលនៅពេលដែលកុំព្យូទ័រឡានលោតសញ្ញាប្រាប់ថាគ្រឿងបន្លាស់ជិតខូច ជាជាងចាំដល់ពេលឡានដាច់ម៉ាស៊ីនខូចតាមផ្លូវ។ |
| Mean-Square Error (MSE) | ជារង្វាស់ស្ថិតិដែលប្រើសម្រាប់វាស់ស្ទង់ភាពខុសគ្នារវាងតម្លៃដែលម៉ូដែលកុំព្យូទ័រទស្សន៍ទាយបាន និងតម្លៃការពិតជាក់ស្តែង ដោយយកភាពខុសគ្នានោះមកលើកជាការ៉េដើម្បីពិន័យចំពោះកំហុសធំៗ។ | ដូចជាច្បាប់ពិន័យកំហុស គឺបើអ្នកធ្វើខុសតិចតួចត្រូវពិន័យតិច តែបើធ្វើខុសធំគឺត្រូវពិន័យធ្ងន់ធ្ងរមែនទែន (លើកជាការ៉េ)។ |
| overfitting | គឺជាបញ្ហាមួយនៅក្នុង Machine Learning ដែលម៉ូដែលមួយបានរៀនទន្ទេញចាំទិន្នន័យហ្វឹកហាត់ខ្លាំងពេក រហូតដល់ពេលយកវាទៅប្រើជាមួយទិន្នន័យថ្មីដែលវាមិនធ្លាប់ឃើញ បែរជាវាទស្សន៍ទាយមិនបានត្រឹមត្រូវ។ | ដូចជាសិស្សដែលទន្ទេញចាំចម្លើយលំហាត់ក្នុងសៀវភៅបានយ៉ាងស្ទាត់ ប៉ុន្តែមិនចេះធ្វើលំហាត់ពេលប្រឡងព្រោះគ្រូដូរលេខតិចតួច។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖