Original Title: Explainable AI-Based Anomaly Detection for Municipal Flood Pump Maintenance: Transfer Learning from Industrial Systems
Source: doi.org/10.62225/2583049X.2024.4.4.5215
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការរកឃើញភាពមិនប្រក្រតីដោយផ្អែកលើបញ្ញាសិប្បនិម្មិតដែលអាចពន្យល់បាន (Explainable AI) សម្រាប់ការថែទាំម៉ាស៊ីនបូមទឹកជំនន់ក្រុង៖ ការរៀនផ្ទេរពីប្រព័ន្ធឧស្សាហកម្ម

ចំណងជើងដើម៖ Explainable AI-Based Anomaly Detection for Municipal Flood Pump Maintenance: Transfer Learning from Industrial Systems

អ្នកនិពន្ធ៖ Sabastine Obum Aniebonam (Department of Environmental Science, Thai Nguyen University of Agriculture and Forestry, Vietnam), Sadat Itohan Ihwughwavwe (Independent Researcher, Nigeria)

ឆ្នាំបោះពុម្ព៖ 2024, International Journal of Advanced Multidisciplinary Research and Studies

វិស័យសិក្សា៖ Artificial Intelligence / Infrastructure Management

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការកើនឡើងនៃគ្រោះទឹកជំនន់នៅទីក្រុងបានគូសបញ្ជាក់ពីតម្រូវការបន្ទាន់សម្រាប់ប្រព័ន្ធថែទាំឆ្លាតវៃ និងទស្សន៍ទាយទុកជាមុន (Predictive maintenance) សម្រាប់ហេដ្ឋារចនាសម្ព័ន្ធម៉ាស៊ីនបូមទឹកក្រុង ស្របពេលដែលម៉ូដែល AI បច្ចុប្បន្នភាគច្រើនខ្វះតម្លាភាពក្នុងការបកស្រាយ (Black-box models)។

វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះបានវិភាគលើការធ្វើសមាហរណកម្មនៃបញ្ញាសិប្បនិម្មិតដែលអាចពន្យល់បាន (Explainable AI - XAI) និងបច្ចេកទេសផ្ទេរការរៀនសូត្រ (Transfer Learning) ដើម្បីស្វែងរកភាពមិនប្រក្រតីរបស់ម៉ាស៊ីនបូមទឹក។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Convolutional and Recurrent Neural Networks (CNNs & RNNs)
បណ្តាញសរសៃប្រសាទសិប្បនិម្មិត CNNs និង RNNs
CNNs មានប្រសិទ្ធភាពខ្ពស់ក្នុងការចាប់យកលក្ខណៈពិសេសក្នុងលំហ (Spatial features) ពីទិន្នន័យឧបករណ៍ចាប់សញ្ញា ចំណែក RNNs ល្អសម្រាប់ការកត់ត្រាការពឹងផ្អែកតាមពេលវេលា (Temporal dependencies) នៃវដ្តប្រតិបត្តិការម៉ាស៊ីនបូម។ ទាមទារទិន្នន័យហ្វឹកហាត់ច្រើនដើម្បីដំណើរការបានល្អ ហើយមានលក្ខណៈជាប្រអប់ខ្មៅ (Black-box) ដែលធ្វើឱ្យពិបាកដល់ប្រតិបត្តិករក្នុងការយល់ពីមូលហេតុនៃការទស្សន៍ទាយ។ ជួយរកឃើញគំរូនៃភាពមិនប្រក្រតីដូចជា ការរំញ័រ ឬភាពមិនប្រក្រតីនៃលំហូរទឹកបានយ៉ាងមានប្រសិទ្ធភាពនៅក្នុងប្រព័ន្ធ SCADA។
Transformer-based Architectures
ស្ថាបត្យកម្មផ្អែកលើ Transformer
អាចចាប់យកទំនាក់ទំនងទិន្នន័យតាមពេលវេលាបានទូលំទូលាយជាង RNNs (Global temporal dependencies) និងអាចពន្យល់បានតាមរយៈទម្ងន់នៃការយកចិត្តទុកដាក់ (Attention weights)។ ត្រូវការថាមពលកុំព្យូទ័រខ្ពស់ និងភាពស្មុគស្មាញក្នុងការគណនា ដែលអាចជាឧបសគ្គសម្រាប់ការដាក់ពង្រាយលើឧបករណ៍ Edge (Edge devices) ដែលមានថាមពលទាប។ ផ្តល់ការព្យាករណ៍ល្អប្រសើរជាងមុនចំពោះការបរាជ័យនៃប្រព័ន្ធធារាសាស្ត្រក្រោមលក្ខខណ្ឌអាកាសធាតុប្រែប្រួលខ្លាំង។
Explainable AI (SHAP, LIME, Grad-CAM)
បញ្ញាសិប្បនិម្មិតដែលអាចពន្យល់បាន (XAI)
ជួយពន្យល់ពីទិន្នផលនៃម៉ូដែល Black-box ដោយបង្ហាញពីកត្តាដែលរួមចំណែកដល់ភាពមិនប្រក្រតី បង្កើនតម្លាភាព និងសម្រួលដល់ការរកឃើញមូលហេតុដើម (Root-cause diagnostics)។ ការពន្យល់អាចមានភាពប្រែប្រួលឬមិនស្ថិតស្ថេរ (Explanation instability) នៅពេលមានការផ្លាស់ប្តូរទិន្នន័យបន្តិចបន្តួច ហើយទាមទារការគណនាបន្ថែម។ ធ្វើឱ្យប្រសើរឡើងនូវការចាត់អាទិភាពការថែទាំដល់ទៅ ២២ ភាគរយ និងបង្កើនទំនុកចិត្តរបស់ប្រតិបត្តិករលើការសម្រេចចិត្តរបស់ AI។

ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះបង្ហាញថាការដាក់ពង្រាយប្រព័ន្ធ AI សម្រាប់ការថែទាំម៉ាស៊ីនបូមទឹកទាមទារឱ្យមានការរៀបចំហេដ្ឋារចនាសម្ព័ន្ធទិន្នន័យ កុំព្យូទ័រចម្រុះ និងធនធានមនុស្សដែលមានជំនាញ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះផ្តោតលើការប្រឈមនៃការពឹងផ្អែកលើទិន្នន័យដែលមានភាពមិនស៊ីសង្វាក់គ្នា (Sensor Heterogeneity) និងភាពលំអៀងដោយសារបញ្ហាខូចខាតកើតឡើងកម្រ (Data imbalance) បើធៀបនឹងប្រតិបត្តិការធម្មតា។ សម្រាប់ប្រទេសកម្ពុជា ដែលប្រព័ន្ធហេដ្ឋារចនាសម្ព័ន្ធទិន្នន័យក្រុងនៅមានកម្រិត និងខ្វះខាតទិន្នន័យប្រវត្តិសាស្រ្តថែទាំច្បាស់លាស់ ការប្រើប្រាស់បច្ចេកទេសផ្ទេរការរៀនសូត្រ (Transfer Learning) ពីប្រព័ន្ធឧស្សាហកម្មប្រទេសអភិវឌ្ឍន៍មកប្រើប្រាស់ គឺជារឿងចាំបាច់បំផុត។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់ និងអាចអនុវត្តបានសម្រាប់ប្រទេសកម្ពុជា ពិសេសក្នុងការដោះស្រាយបញ្ហាទឹកជំនន់ទីក្រុង និងការគ្រប់គ្រងហេដ្ឋារចនាសម្ព័ន្ធឆ្លាតវៃ។

សរុបមក ការអនុវត្ត XAI និងផ្ទេរការរៀនសូត្រ (Transfer Learning) នឹងជួយប្រែក្លាយការថែទាំហេដ្ឋារចនាសម្ព័ន្ធទឹកនៅកម្ពុជា ពីការអន្តរាគមន៍ក្រោយពេលខូចខាត (Reactive) ទៅជាការការពារទុកជាមុនប្រកបដោយភាពធន់និងនិរន្តរភាព (Proactive)។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាពីមូលដ្ឋានគ្រឹះនៃឧបករណ៍ចាប់សញ្ញា និង IoT: និស្សិតគួរសិក្សាពីរបៀបប្រមូលទិន្នន័យរំញ័រនិងសម្ពាធដោយប្រើឧបករណ៍ផ្នែករឹងដូចជា Raspberry PiArduino រួចសាកល្បងបញ្ចូលទិន្នន័យទាំងនោះទៅក្នុង SCADA systems ខ្នាតតូចសម្រាប់ការយល់ដឹងពី Sensor fusion។
  2. អនុវត្តការផ្ទេរការរៀនសូត្រ (Transfer Learning Application): ប្រើប្រាស់បណ្ណាល័យកូដដូចជា TensorFlowPyTorch ដើម្បីទាញយកម៉ូដែល CNN ឬ Transformer ដែលបានហ្វឹកហាត់រួច (Pre-trained models ពីទិន្នន័យឧស្សាហកម្ម) មកកែសម្រួល (Fine-tune) ជាមួយសំណុំទិន្នន័យបូមទឹកខ្នាតតូច។
  3. បញ្ចូលប្រព័ន្ធពន្យល់ AI (Implementing Explainable AI): រៀនសរសេរកូដដើម្បីបញ្ចូលបណ្ណាល័យពន្យល់ដូចជា SHAP និង LIME នៅក្នុង Python ដើម្បីបង្កើតក្រាហ្វិកវិភាគថាហេតុអ្វីបានជាម៉ូដែលរបស់អ្នកទស្សន៍ទាយថាមានភាពមិនប្រក្រតី (ឧទាហរណ៍៖ សម្ពាធទឹកធ្លាក់ចុះ ឬចរន្តភ្លើងកើនឡើង)។
  4. អភិវឌ្ឍផ្ទាំងគ្រប់គ្រងទិន្នន័យ (Dashboard Development): បង្កើតផ្ទាំងគ្រប់គ្រងអន្តរកម្មសម្រាប់អ្នកប្រើប្រាស់ចុងក្រោយ (វិស្វករថែទាំ) ដោយប្រើប្រាស់ GrafanaStreamlit ដើម្បីបង្ហាញពីសូចនាករសុខភាពម៉ាស៊ីន ការព្រមាន និងលទ្ធផល XAI តាមពេលវេលាជាក់ស្តែង។
  5. ការដាក់ពង្រាយលើប្រព័ន្ធ Edge-AI (Edge Deployment): សាកល្បងដាក់ឱ្យដំណើរការម៉ូដែល AI របស់អ្នកនៅលើឧបករណ៍ Edge ដែលប្រើប្រាស់ថាមពលទាប ដូចជា NVIDIA Jetson Nano ដើម្បីធានាថាប្រព័ន្ធអាចចាប់យកភាពមិនប្រក្រតីបានលឿន ទោះបីជាការតភ្ជាប់អ៊ីនធឺណិតមានភាពរអាក់រអួលក៏ដោយ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Explainable AI (XAI) បច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិតដែលមិនត្រឹមតែផ្តល់លទ្ធផល ឬការសម្រេចចិត្តប៉ុណ្ណោះទេ ប៉ុន្តែវាអាចបកស្រាយប្រាប់មនុស្សពីមូលហេតុ និងដំណើរការនៅពីក្រោយការសម្រេចចិត្តទាំងនោះដោយប្រើក្រាហ្វិកនិងទិន្នន័យ ដើម្បីធានាបាននូវតម្លាភាព និងទំនុកចិត្តក្នុងប្រតិបត្តិការ។ ដូចជាគ្រូពេទ្យដែលមិនត្រឹមតែប្រាប់ថាអ្នកមានជំងឺអ្វីទេ តែពន្យល់ពីមូលហេតុនិងរោគសញ្ញាដែលធ្វើឱ្យគាត់សន្និដ្ឋានបែបនេះយ៉ាងច្បាស់លាស់។
Transfer Learning វិធីសាស្ត្រក្នុងម៉ាស៊ីនរៀន (Machine Learning) ដែលយកចំណេះដឹងពីម៉ូដែលដែលបានហ្វឹកហាត់រួចលើកិច្ចការមួយ (ឧទាហរណ៍៖ ទិន្នន័យម៉ាស៊ីនរោងចក្រខ្នាតធំ) មកកែសម្រួលប្រើប្រាស់បន្តសម្រាប់កិច្ចការថ្មីមួយទៀតដែលមានទិន្នន័យតិចជាង (ឧទាហរណ៍៖ ម៉ាស៊ីនបូមទឹកក្រុង) ដើម្បីចំណេញពេលវេលា និងថាមពលកុំព្យូទ័រ។ ដូចជាអ្នកចេះជិះកង់រួចហើយ ពេលមកហាត់ជិះម៉ូតូ អ្នកនឹងឆាប់ចេះជាងអ្នកដែលមិនធ្លាប់ជិះកង់សោះ ព្រោះអ្នកមានមូលដ្ឋានទប់លំនឹងរួចទៅហើយ។
Predictive Maintenance ការប្រើប្រាស់ទិន្នន័យពីឧបករណ៍ចាប់សញ្ញា និងម៉ូដែល AI ដើម្បីវិភាគទម្លាប់ដំណើរការ និងទស្សន៍ទាយទុកជាមុនពីពេលវេលាដែលម៉ាស៊ីនអាចនឹងខូចខាត ដើម្បីឱ្យក្រុមការងារអាចធ្វើការថែទាំនិងជួសជុលមុនពេលម៉ាស៊ីនគាំងដំណើរការទាំងស្រុង។ ដូចជាការប្តូរប្រេងម៉ាស៊ីនឡានមុនពេលម៉ាស៊ីនខូច ដោយផ្អែកលើការគណនាចម្ងាយគីឡូម៉ែត្រដែលបានបើកបរ ជាជាងរង់ចាំឱ្យឡានខូចសិនទើបយកទៅហៅជាង។
Anomaly Detection ដំណើរការនៃការវិភាគក្បួនទិន្នន័យដើម្បីស្វែងរកព្រឹត្តិការណ៍ ឬសញ្ញាណដែលខុសប្រក្រតីពីទម្រង់ធម្មតា ដែលភាគច្រើនវាជាសញ្ញាព្រមានពីបញ្ហាខាងបច្ចេកទេស ការខូចខាតឧបករណ៍ ឬការវាយប្រហារសន្តិសុខណាមួយចូលក្នុងប្រព័ន្ធ។ ដូចជាសត្វឆ្កែយាមផ្ទះដែលព្រុសនៅពេលមានមនុស្សប្លែកមុខដើរចូល ខណៈពេលដែលវាស្ងៀមស្ងាត់នៅពេលឃើញម្ចាស់ផ្ទះ។
Covariate Shift បាតុភូតនៅក្នុងការវិភាគទិន្នន័យ នៅពេលដែលទម្រង់នៃទិន្នន័យនៅក្នុងបរិស្ថានប្រើប្រាស់ជាក់ស្តែង (Testing data) មានលក្ខណៈខុសប្លែកពីទិន្នន័យដែលបានប្រើសម្រាប់ហ្វឹកហាត់ម៉ូដែល (Training data) ដែលធ្វើឱ្យម៉ូដែលគណនាខុស ឬធ្លាក់ចុះប្រសិទ្ធភាពពេលយកទៅអនុវត្ត។ ដូចជាសិស្សដែលខំរៀនទន្ទេញមេរៀនប្រវត្តិសាស្ត្រសម្រាប់ការប្រឡង តែដល់ពេលប្រឡងពិតប្រាកដ វិញ្ញាសាចេញជាសំណួរភូមិវិទ្យា ធ្វើឱ្យសិស្សនោះប្រឡងធ្លាក់ទោះខំរៀនយ៉ាងណាក្តី។
Edge-AI ការដាក់ពង្រាយប្រព័ន្ធបញ្ញាសិប្បនិម្មិតឱ្យដំណើរការនិងគណនាទិន្នន័យផ្ទាល់នៅលើឧបករណ៍តែម្តង (ឧទាហរណ៍៖ ឧបករណ៍ចាប់សញ្ញា ឬកាមេរ៉ា) ដោយមិនចាំបាច់បញ្ជូនទិន្នន័យទៅកាន់ម៉ាស៊ីនមេ (Cloud) ដែលជួយឱ្យការរកឃើញនិងឆ្លើយតបមានភាពរហ័សបំផុត និងមិនពឹងផ្អែកលើអ៊ីនធឺណិតខ្លាំង។ ដូចជាការគិតលេខក្នុងខួរក្បាលខ្លួនឯងភ្លាមៗនៅកន្លែងទិញឥវ៉ាន់ ដោយមិនចាំបាច់ទូរស័ព្ទសួរគ្រូគណិតវិទ្យាដែលនៅឯផ្ទះឡើយ។
Digital twins ការបង្កើតច្បាប់ចម្លងជាទម្រង់ឌីជីថល (Virtual Model) នៃប្រព័ន្ធរូបវន្ត ឬម៉ាស៊ីនពិតប្រាកដមួយ ដើម្បីធ្វើការត្រាប់តាម (Simulate) វិភាគ និងព្យាករណ៍ពីដំណើរការរបស់វានៅក្នុងពិភពពិត ដោយប្រើប្រាស់ទិន្នន័យជាក់ស្តែង។ ដូចជាការលេងហ្គេមសាងសង់ទីក្រុង (SimCity) ដែលអ្នកអាចសាកល្បងមើលថានឹងមានអ្វីកើតឡើងបើអ្នកបិទផ្លូវមួយ ខណៈដែលហ្គេមនោះតំណាងឱ្យទីក្រុងដែលអ្នកកំពុងរស់នៅផ្ទាល់។
SHAP Values វិធីសាស្ត្រគណនាក្នុងបច្ចេកវិទ្យា XAI ដែលប្រើទ្រឹស្តីហ្គេម (Game theory) ដើម្បីវាយតម្លៃនិងផ្តល់ពិន្ទុថាតើអថេរនីមួយៗនៃទិន្នន័យ (ឧទាហរណ៍៖ កម្រិតរំញ័រ ឬសម្ពាធទឹក) បានចូលរួមចំណែកប៉ុន្មានភាគរយក្នុងការធ្វើឱ្យម៉ូដែលសម្រេចចិត្តទស្សន៍ទាយលទ្ធផលណាមួយចេញមក។ ដូចជាការបែងចែកប្រាក់រង្វាន់ដល់កីឡាករក្នុងក្រុមបាល់ទាត់ម្នាក់ៗ ដោយផ្អែកលើកម្រិតនៃការប្រឹងប្រែងនិងចំនួនគ្រាប់បាល់ដែលពួកគេរកបាន ដើម្បីធានាភាពយុត្តិធម៌។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖