Original Title: An IoT and Machine Learning-Based Predictive Maintenance System for Electrical Motors
Source: doi.org/10.18280/jesa.560414
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ប្រព័ន្ធថែទាំព្យាករណ៍ផ្អែកលើ IoT និងការរៀនរបស់ម៉ាស៊ីន (Machine Learning) សម្រាប់ម៉ូទ័រអគ្គិសនី

ចំណងជើងដើម៖ An IoT and Machine Learning-Based Predictive Maintenance System for Electrical Motors

អ្នកនិពន្ធ៖ Noor A. Mohammed (Automated Manufacturing Eng. Dept., AlKhwarizmi College of Engineering, University of Baghdad), Osamah F. Abdulateef (Information and Communication Eng. Dept., AlKhwarizmi College of Engineering, University of Baghdad), Ali H. Hamad (Information and Communication Eng. Dept., AlKhwarizmi College of Engineering, University of Baghdad)

ឆ្នាំបោះពុម្ព៖ 2023, Journal Européen des Systèmes Automatisés

វិស័យសិក្សា៖ Industrial Internet of Things (IIoT) and Machine Learning

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការស្រាវជ្រាវនេះដោះស្រាយបញ្ហានៃការខូចខាតម៉ាស៊ីនឧស្សាហកម្ម (ម៉ូទ័រអគ្គិសនី) ដោយមិនបានរំពឹងទុក ដែលបណ្តាលឱ្យខាតបង់ពេលវេលានិងថវិកា ដោយស្នើឡើងនូវប្រព័ន្ធថែទាំព្យាករណ៍ (Predictive Maintenance) ដើម្បីកំណត់បញ្ហាមុនពេលម៉ាស៊ីនឈានដល់ដំណាក់កាលធ្ងន់ធ្ងរ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់វិធីសាស្ត្ររួមបញ្ចូលគ្នារវាងឧបករណ៍សេនស័រ (Sensors) ពិធីការទំនាក់ទំនង (MQTT) និងក្បួនដោះស្រាយការរៀនរបស់ម៉ាស៊ីន (Machine Learning) ដើម្បីប្រមូលនិងវិភាគទិន្នន័យក្នុងពេលជាក់ស្តែងពីម៉ូទ័រអគ្គិសនី។

ការប្រមូលទិន្នន័យពីសេនស័ររំញ័រ ចរន្តអគ្គិសនី និងសីតុណ្ហភាព (Vibration, Current, and Temperature Sensors)
ការប្រើប្រាស់ពិធីការទំនាក់ទំនង (MQTT Protocol) សម្រាប់បញ្ជូនទិន្នន័យពី Raspberry Pi ទៅកាន់ប្រព័ន្ធក្លោដ (Cloud Server) ប្រកបដោយប្រសិទ្ធភាពខ្ពស់
ការប្រើប្រាស់ក្បួនដោះស្រាយការរៀនរបស់ម៉ាស៊ីនចំនួន ៥ ម៉ូដែលដូចជា KNN, SVM, RF, LR, និង NB (Machine Learning Algorithms) ដើម្បីវិភាគ និងព្យាករណ៍ពីកំហុស

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ម៉ូដែល Random Forest (RF) ទទួលបានភាពត្រឹមត្រូវខ្ពស់ជាងគេបំផុត (០.៩៩ ឬ ៩៩%) ក្នុងការវាយតម្លៃ និងព្យាករណ៍ពីការខូចខាតរបស់ម៉ូទ័រ។
ប្រព័ន្ធទំនាក់ទំនងតាមរយៈពិធីការ MQTT បានផ្តល់នូវប្រសិទ្ធភាពខ្ពស់និងភាពជឿជាក់ក្នុងការបញ្ជូនទិន្នន័យនៅក្នុងប្រព័ន្ធ IoT ។
ម៉ូដែល Naive Bayes (NB) ផ្តល់ល្បឿនឆ្លើយតបលឿនបំផុត ចំណែកឯ SVM ត្រូវការពេលវេលាបង្វឹក (Training time) យូរជាងម៉ូដែលដទៃប្រមាណ ២០ ដង។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Random Forest (RF) ម៉ូដែលរ៉េនដុមហ្វ័ររ៉េស (Random Forest)	ផ្តល់ភាពត្រឹមត្រូវខ្ពស់បំផុត និងមានសមត្ថភាពអាចគ្រប់គ្រងទិន្នន័យដែលមានវិមាត្រខ្ពស់ (High dimensionality data) បានយ៉ាងល្អ។	ត្រូវការពេលវេលាបង្វឹក (Training time) និងធនធានគណនាច្រើនជាងម៉ូដែលសាមញ្ញមួយចំនួន។	ទទួលបានភាពត្រឹមត្រូវខ្ពស់បំផុតរហូតដល់ ០.៩៩ (៩៩%) ក្នុងការទស្សន៍ទាយកំហុសរបស់ម៉ូទ័រ។
Support Vector Machine (SVM) ម៉ូដែលសាប់ផតវេទ័រម៉ាស៊ីន (Support Vector Machine)	ផ្តល់ភាពត្រឹមត្រូវខ្ពស់ក្នុងការចំណាត់ថ្នាក់ទិន្នន័យ ស្មើនឹងម៉ូដែល Random Forest ដែរ។	ចំណាយពេលក្នុងការបង្វឹក (Training time) យូរជាងម៉ូដែលដទៃប្រមាណ ២០ ដង ដែលធ្វើឱ្យយឺតក្នុងការអនុវត្តផ្ទាល់។	ទទួលបានភាពត្រឹមត្រូវស្មើនឹង ០.៩៩ ប៉ុន្តែស៊ីពេលបង្វឹកយូរជាងគេ។
Naive Bayes (NB) ម៉ូដែលណាយបេយេស (Naive Bayes)	មានល្បឿនឆ្លើយតបលឿនភ្លាមៗ (Instant) ស័ក្តិសមបំផុតសម្រាប់កម្មវិធីដែលត្រូវការល្បឿននៃការឆ្លើយតបរហ័ស។	មានភាពត្រឹមត្រូវទាបជាងម៉ូដែល RF និង SVM ហើយសន្មតថាទិន្នន័យឯករាជ្យពីគ្នាទាំងស្រុង។	ទទួលបានភាពត្រឹមត្រូវត្រឹមតែ ០.៨៤ ប៉ុន្តែមានល្បឿនលឿនជាងគេ។
Linear Regression (LR) តំរែតំរង់លីនេអ៊ែរ (Linear Regression)	ងាយស្រួលក្នុងការស្វែងរកទំនាក់ទំនងរវាងអថេរផ្សេងៗនៅក្នុងទិន្នន័យ។	មិនសូវមានប្រសិទ្ធភាពក្នុងការទស្សន៍ទាយទិន្នន័យដែលមានភាពស្មុគស្មាញ និងមានភាពមិនលីនេអ៊ែរ (Non-linear)។	ទទួលបានភាពត្រឹមត្រូវទាបជាងគេបំផុតគឺ ០.៨២។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តប្រព័ន្ធនេះទាមទារនូវការរួមបញ្ចូលគ្នារវាងឧបករណ៍ផ្នែករឹងសេនស័រ (Hardware Devices) ប្រព័ន្ធក្លោដ និងចំណេះដឹងផ្នែកក្បួនដោះស្រាយការរៀនរបស់ម៉ាស៊ីន។

Hardware: ម៉ូទ័រអគ្គិសនី (AC motor), ក្តារ Raspberry Pi សម្រាប់ធ្វើជាម៉ាស៊ីនមេ (Local Server), និងសេនស័រ (ADXL345 សម្រាប់រំញ័រ, ACS712 សម្រាប់ចរន្តអគ្គិសនី, MLX90614 សម្រាប់សីតុណ្ហភាព)។
Software & Protocols: ពិធីការ MQTT សម្រាប់បញ្ជូនទិន្នន័យ ប្រព័ន្ធក្លោដ (Cloud Server) និងភាសាកម្មវិធី (ជាទូទៅ Python) សម្រាប់បង្កើតម៉ូដែល Machine Learning។
Dataset: ទិន្នន័យដែលប្រមូលបានរៀងរាល់ ១ វិនាទី (ប្រមាណ ៣៥,៥០០ គំរូទិន្នន័យ) ដោយត្រូវបែងចែកជា ៨០% សម្រាប់បង្វឹក (Training), ១០% សម្រាប់វាយតម្លៃ (Validation), និង ១០% សម្រាប់ធ្វើតេស្ត (Testing)។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងមន្ទីរពិសោធន៍នៃសាកលវិទ្យាល័យបាកដាដ (ប្រទេសអ៊ីរ៉ាក់) ដោយប្រើប្រាស់ទិន្នន័យក្លែងធ្វើពីការខូចខាតម៉ូទ័រអគ្គិសនីតែមួយម៉ាស៊ីនប៉ុណ្ណោះ។ ទិន្នន័យមានទំហំតូច និងមិនមែនជាទិន្នន័យដែលប្រមូលបានពីបរិយាកាសរោងចក្រពិតប្រាកដនោះទេ។ សម្រាប់ប្រទេសកម្ពុជា ចំណុចនេះមានសារៈសំខាន់ណាស់ ព្រោះបរិយាកាសរោងចក្រពិត (ដូចជាកម្តៅ សំណើមខ្ពស់ និងធូលី) អាចធ្វើឱ្យលទ្ធផលជាក់ស្តែងនៃការទស្សន៍ទាយមានការប្រែប្រួលពីការពិសោធន៍នេះ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ប្រព័ន្ធថែទាំព្យាករណ៍នេះពិតជាមានអត្ថប្រយោជន៍ខ្ពស់សម្រាប់ការធ្វើទំនើបកម្ម និងដោះស្រាយបញ្ហាការខូចខាតម៉ាស៊ីនភ្លាមៗនៅក្នុងវិស័យឧស្សាហកម្មនៅកម្ពុជា។

រោងចក្រកាត់ដេរ និងវាយនភ័ណ្ឌ (Garment & Textile Factories): អាចប្រើប្រាស់បច្ចេកវិទ្យានេះដើម្បីត្រួតពិនិត្យម៉ូទ័រដេរ និងម៉ាស៊ីនតម្បាញ រារាំងការផ្អាកខ្សែសង្វាក់ផលិតកម្មភ្លាមៗ ដែលជាកត្តាជួយសន្សំសំចៃពេលវេលានិងថវិកាយ៉ាងច្រើន។
វិស័យកសិកម្ម និងរោងម៉ាស៊ីនកិនស្រូវ (Agriculture & Rice Mills): ជួយតាមដានសុខភាពម៉ូទ័រម៉ាស៊ីនបូមទឹកខ្នាតធំ ឬម៉ាស៊ីនកិនស្រូវទំនើបៗនៅតាមខេត្តសក្តានុពល (ដូចជា បាត់ដំបង និងកំពង់ធំ) ដើម្បីកាត់បន្ថយថ្លៃដើមថែទាំ។
តំបន់សេដ្ឋកិច្ចពិសេស (Special Economic Zones - SEZ): អាចអនុវត្តនៅក្នុងតំបន់សេដ្ឋកិច្ចពិសេសភ្នំពេញ (PPSEZ) ឬក្រុងព្រះសីហនុ ក្នុងរោងចក្រផលិតគ្រឿងបន្លាស់រថយន្ត ឬអេឡិចត្រូនិក ដើម្បីបង្កើនស្ថិរភាពផលិតកម្ម។

ជារួម ការប្រើប្រាស់បច្ចេកវិទ្យា IoT រួមជាមួយក្បួនដោះស្រាយការរៀនរបស់ម៉ាស៊ីន គឺជាដំណោះស្រាយដែលមានសក្តានុពលក្នុងការជួយឱ្យរោងចក្រនៅកម្ពុជាផ្លាស់ប្តូរពីការជួសជុលពេលខូច (Reactive Maintenance) ទៅជាការការពារជាមុន (Predictive Maintenance)។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

ជំហានទី ១៖ សិក្សាមូលដ្ឋានគ្រឹះឧបករណ៍ IoT និងសេនស័រ: ចាប់ផ្តើមដោយការស្វែងយល់អំពីការភ្ជាប់សេនស័រដូចជា ADXL345 (វាស់រំញ័រ) ឬ ACS712 (វាស់ចរន្ត) ទៅកាន់មីក្រូកុងត្រូល័រ Raspberry Pi ឬ Arduino ដើម្បីអនុវត្តការប្រមូលទិន្នន័យបឋម។
ជំហានទី ២៖ រៀបចំប្រព័ន្ធបញ្ជូនទិន្នន័យ (Data Transmission Setup): សិក្សាពីរបៀបដំឡើង និងប្រើប្រាស់ពិធីការ MQTT Protocol ដោយប្រើប្រាស់ Mosquitto Broker ដើម្បីអាចបញ្ជូនទិន្នន័យពីសេនស័រទៅកាន់ប្រព័ន្ធ Cloud Server បានលឿននិងមិនសូវស៊ីអ៊ីនធឺណិត។
ជំហានទី ៣៖ ការប្រមូល និងសម្អាតទិន្នន័យ (Data Collection & Preprocessing): បង្កើតឈុតទិន្នន័យផ្ទាល់ខ្លួនដោយប្រមូលទិន្នន័យពីម៉ូទ័រក្នុងស្ថានភាពធម្មតានិងពេលមានបញ្ហា ហើយប្រើប្រាស់បណ្ណាល័យ Pandas និង NumPy នៅក្នុង Python ដើម្បីសម្អាតទិន្នន័យ (Data Cleaning)។
ជំហានទី ៤៖ ការបង្វឹកម៉ូដែល Machine Learning (Model Training): ប្រើប្រាស់បណ្ណាល័យ Scikit-Learn ក្នុង Python ដើម្បីសាកល្បងបង្វឹកម៉ូដែលដូចជា Random Forest (RF) និង Support Vector Machine (SVM) រួចប្រៀបធៀបភាពត្រឹមត្រូវនៃម៉ូដែលទាំងនោះដោយប្រើឈុតទិន្នន័យរបស់អ្នក។
ជំហានទី ៥៖ ការដាក់ឱ្យដំណើរការប្រព័ន្ធជាក់ស្តែងនិងតាមដាន (System Deployment): អភិវឌ្ឍផ្ទាំងគ្រប់គ្រង (Dashboard) ដោយប្រើប្រាស់កម្មវិធី Grafana ឬ Streamlit ដើម្បីបង្ហាញទិន្នន័យជាក់ស្តែង និងប្រកាសអាសន្ន (Alerts) ពេលមានការទស្សន៍ទាយថាម៉ូទ័រមានហានិភ័យខូចខាត។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
predictive maintenance	គឺជាវិធីសាស្ត្រថែទាំដែលប្រើប្រាស់ទិន្នន័យជាក់ស្តែង និងការវិភាគកម្រិតខ្ពស់ ដើម្បីទស្សន៍ទាយទុកជាមុនថាពេលណាម៉ាស៊ីនមួយនឹងខូចខាត ដែលអនុញ្ញាតឱ្យគេអាចជួសជុលវាបានទាន់ពេលវេលាមុនពេលការខូចខាតធ្ងន់ធ្ងរកើតឡើង។	ដូចជាការស្តាប់សំឡេងម៉ាស៊ីនឡានដែលរាងខុសប្រក្រតី ហើយយើងដឹងមុនថាត្រូវយកវាទៅជាង មុនពេលវាគាំងងាប់តាមផ្លូវ។
Industrial IoT (IIoT)	គឺជាការតភ្ជាប់បណ្តាញសេនស័រ ឧបករណ៍ និងម៉ាស៊ីននៅក្នុងរោងចក្រឧស្សាហកម្មទៅកាន់ប្រព័ន្ធអ៊ីនធឺណិត ដើម្បីប្រមូលទិន្នន័យរួមគ្នា និងបញ្ជាម៉ាស៊ីនទាំងនោះដោយស្វ័យប្រវត្តិប្រកបដោយភាពឆ្លាតវៃ។	ដូចជាការបំពាក់នាឡិកាសុខភាព (Smartwatch) ទៅឱ្យម៉ាស៊ីននីមួយៗក្នុងរោងចក្រ ដើម្បីឱ្យវាចេះរាយការណ៍ប្រាប់មេកានិកពីអាការៈរបស់វា។
MQTT protocol	គឺជាវិន័យ ឬភាសាទំនាក់ទំនងតាមបណ្តាញអ៊ីនធឺណិតដែលមានទំហំស្រាលបំផុត ដែលត្រូវបានប្រើប្រាស់សម្រាប់បញ្ជូនទិន្នន័យពីសេនស័រតូចៗទៅកាន់ម៉ាស៊ីនមេ (Cloud Server) ដោយមិនស៊ីទិន្នន័យអ៊ីនធឺណិតច្រើន និងដំណើរការបានលឿន។	ដូចជាប្រព័ន្ធផ្ញើសារតេឡេក្រាម (Telegram) ប៉ុន្តែវាប្រើសម្រាប់តែម៉ាស៊ីននិងម៉ាស៊ីនផ្ញើសារខ្សឹបប្រាប់គ្នាដោយសន្សំសំចៃអ៉ីនធឺណិតបំផុត។
random forest	គឺជាក្បួនដោះស្រាយផ្នែក Machine Learning ដែលបង្កើតឡើងដោយការប្រមូលផ្តុំ "ដើមឈើសម្រេចចិត្ត" (Decision Trees) ជាច្រើនបញ្ចូលគ្នា ដើម្បីធ្វើការបោះឆ្នោតរួមគ្នាថាតើទិន្នន័យមួយគួរតែត្រូវបានចាត់ថ្នាក់ជាអ្វី ដែលធ្វើឱ្យលទ្ធផលមានភាពសុក្រឹតខ្ពស់។	ដូចជាការសួរសំណួរទៅកាន់ក្រុមអ្នកជំនាញ ១០០ នាក់ ហើយយកចម្លើយដែលអ្នកជំនាញភាគច្រើនឆ្លើយដូចគ្នា ដើម្បីធ្វើជាសេចក្តីសម្រេចចិត្តចុងក្រោយ។
supported vector machine (SVM)	គឺជាក្បួនដោះស្រាយចំណាត់ថ្នាក់ទិន្នន័យ ដែលព្យាយាមគូសបន្ទាត់ ឬបង្កើតប្លង់កាត់ខណ្ឌចែកក្រុមទិន្នន័យឱ្យនៅដាច់ពីគ្នាតាមដែលអាចធ្វើទៅបាន ដើម្បីងាយស្រួលក្នុងការទស្សន៍ទាយទិន្នន័យថ្មីដែលនឹងចូលមក។	ដូចជាការគូសបន្ទាត់ព្រំដែនដ៏ធំមួយនៅកណ្តាលទីលាន ដើម្បីបំបែកក្រុមសិស្សពាក់អាវក្រហម និងសិស្សពាក់អាវខៀវឱ្យនៅដាច់ពីគ្នា។
outliers	គឺជាទិន្នន័យដែលមានតម្លៃខុសប្លែកដាច់ពីគេឆ្ងាយបើប្រៀបធៀបទៅនឹងក្រុមទិន្នន័យភាគច្រើន ដែលវាអាចជាសញ្ញាបញ្ជាក់ពីកំហុសរបស់ម៉ាស៊ីន ឬគ្រាន់តែជាការចាប់ទិន្នន័យខុសរបស់សេនស័រ។	ដូចជាសិស្សម្នាក់ដែលប្រលងបានពិន្ទុ ១០០ ពេញ ខណៈដែលសិស្សមួយថ្នាក់ទៀតប្រលងបានពិន្ទុត្រឹមតែ ៤០ ទៅ ៥០ ដែលជារឿងគួរឱ្យសង្ស័យ។
oversampling	គឺជាបច្ចេកទេសក្នុងការបង្កើតទិន្នន័យបន្ថែមសម្រាប់ក្រុមទិន្នន័យដែលមានចំនួនតិចតួច (ឧទាហរណ៍៖ ទិន្នន័យពេលម៉ាស៊ីនខូច) ដើម្បីធ្វើឱ្យវាមានចំនួនប្រហាក់ប្រហែលនឹងក្រុមទិន្នន័យធម្មតា ដែលជួយឱ្យម៉ូដែល AI រៀនបានស្មើភាពគ្នា។	ដូចជាការថតចម្លង (Copy) សន្លឹកកិច្ចការរបស់សិស្សខ្សោយឱ្យបានច្រើនសន្លឹក ដើម្បីឱ្យគ្រូមានឱកាសសិក្សាពីចំណុចខ្សោយរបស់ពួកគេបានស្មើនឹងសិស្សពូកែដែលមានគ្នាច្រើន។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖