Original Title: Machine Learning Based Predictive Maintenance Model
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ម៉ូដែលថែទាំព្យាករណ៍ផ្អែកលើការរៀនរបស់ម៉ាស៊ីន

ចំណងជើងដើម៖ Machine Learning Based Predictive Maintenance Model

អ្នកនិពន្ធ៖ Ashok K Pundir (NITIE, Mumbai), Pratik Maheshwari (IIM Jammu), Pradeep Prajapati (NITIE, Mumbai)

ឆ្នាំបោះពុម្ព៖ 2022 Proceedings of the 2nd Indian International Conference on Industrial Engineering and Operations Management

វិស័យសិក្សា៖ Industrial Engineering

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហានៃការចុះខ្សោយ និងការខូចខាតឧបករណ៍នៅក្នុងប្រព័ន្ធផលិតកម្ម (ជាពិសេសម៉ាស៊ីនយន្តហោះ) ដោយសារកង្វះខាតប្រព័ន្ធថែទាំដែលអាចព្យាករណ៍ទុកជាមុនបានច្បាស់លាស់ ដែលបណ្តាលឱ្យខាតបង់ផលិតភាពនិងកើនឡើងការចំណាយ។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានបង្កើតក្របខ័ណ្ឌថែទាំព្យាករណ៍ (PdM) ឆ្លាតវៃ ដោយប្រើប្រាស់ទិន្នន័យពេលវេលាជាក់ស្តែងពីបណ្តាញអ៊ីនធឺណិតនៃវត្ថុសម្រាប់ឧស្សាហកម្ម (IIoT) និងក្បួនដោះស្រាយការរៀនរបស់ម៉ាស៊ីនដើម្បីទស្សន៍ទាយពីការខូចខាត។

ការប្រមូលនិងរៀបចំទិន្នន័យ (Data Wrangling and Feature Extraction)
ការវិភាគទិន្នន័យតាមរយៈបណ្តាញសេនស័រ IIoT (IIoT Sensor Data Analysis)
ការបណ្តុះបណ្តាលម៉ូដែលតំរែតំរង់ (Regression Modeling) រួមមាន SARIMA, LSTM, និង Random Forest

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ម៉ូដែល Random Forest ទទួលបានលទ្ធផលល្អជាងគេ ជាមួយនឹងកម្រិតលម្អៀងមធ្យម (RMSE) ចំនួន ±28.63 ជុំ (cycles) ក្នុងការទស្សន៍ទាយពេលវេលាមុនពេលខូច (Time-To-Failure) របស់ម៉ាស៊ីនយន្តហោះ។
ការធ្វើសមាហរណកម្មសេនស័រ IIoT ផ្តល់នូវសមត្ថភាពក្នុងការប្រមូលទិន្នន័យបានជាបន្តបន្ទាប់ ដែលអនុញ្ញាតឱ្យមានការត្រួតពិនិត្យសុខភាពឧបករណ៍ពីចម្ងាយយ៉ាងមានប្រសិទ្ធភាព។
ប្រព័ន្ធដែលបានស្នើឡើងអាចជួយក្រុមហ៊ុនអាកាសចរណ៍កាត់បន្ថយការចំណាយលើការថែទាំដែលមិនចាំបាច់ និងការពារការខូចខាតឧបករណ៍ដោយចៃដន្យតាមរយៈការផ្តល់ដំណឹងជាមុន។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Random Forest Regression ម៉ូដែលតំរែតំរង់ Random Forest (Random Forest Regression)	មានសមត្ថភាពខ្ពស់ក្នុងការទស្សន៍ទាយពេលវេលាមុនពេលខូច (TTF) បានយ៉ាងច្បាស់លាស់ និងមានកម្រិតលម្អៀងទាបជាងម៉ូដែលដទៃ។	ត្រូវការទិន្នន័យច្រើនសម្រាប់ការបណ្តុះបណ្តាល ហើយអាចមានភាពស្មុគស្មាញក្នុងការបកស្រាយលទ្ធផលធៀបនឹងម៉ូដែលសាមញ្ញ។	ទទួលបានកម្រិតលម្អៀងមធ្យម (RMSE) ±២៨.៦៣ ជុំ (cycles) ក្នុងការទស្សន៍ទាយ TTF ។
LSTM (Long Short-Term Memory) បណ្តាញសរសៃប្រសាទសិប្បនិម្មិត LSTM	ដំណើរការបានយ៉ាងល្អជាមួយនឹងទិន្នន័យប្រភេទស៊េរីពេលវេលា (Time-series data) ដែលមានការពឹងផ្អែកគ្នាក្នុងរយៈពេលវែង។	ទាមទារថាមពលកុំព្យូទ័រខ្ពស់ និងចំណាយពេលយូរក្នុងការបណ្តុះបណ្តាលម៉ូដែល។	ទទួលបានកម្រិតលម្អៀង RMSE ២២.៨៩ និង ២.៩ សម្រាប់ទិន្នន័យអថេរទោលនៃសមាសធាតុផ្សេងៗ ដែលបង្ហាញពីភាពសុក្រឹតខ្ពស់។
SARIMA (Seasonal Autoregressive Integrated Moving Average) ម៉ូដែល SARIMA	ស័ក្តិសមសម្រាប់ទិន្នន័យដែលមានលក្ខណៈតាមរដូវកាល ឬវដ្តប្រែប្រួលច្បាស់លាស់។	មានប្រសិទ្ធភាពទាបជាងម៉ូដែល LSTM ក្នុងការស្វែងរកលំនាំស្មុគស្មាញនៃភាពចុះខ្សោយរបស់ឧបករណ៍។	ទទួលបានកម្រិតលម្អៀង RMSE ២៩.៩៧ និង ៣.៦៨ ដែលខ្ពស់ជាង (មិនសូវសុក្រឹត) បើធៀបនឹង LSTM ។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តប្រព័ន្ធនេះទាមទារការវិនិយោគទាំងលើផ្នែករឹង (សេនស័រ IIoT) ផ្នែកទន់ (ប្រព័ន្ធវិភាគនិងផ្ទុកលើពពក) និងធនធានមនុស្សដែលមានជំនាញ។

Hardware: ទាមទារឧបករណ៍សេនស័រ IIoT (វាស់សីតុណ្ហភាព រំញ័រ សម្ពាធ), Microcontroller (Arduino, Raspberry PI, ESP32) និងម៉ូឌុលបណ្តាញ GSM/Wi-Fi/BLE សម្រាប់ការបញ្ជូនទិន្នន័យ។
Software: ត្រូវការភាសា Python (បណ្ណាល័យ Pandas, SciPy), កម្មវិធី MATLAB/Simulink សម្រាប់បង្កើតទិន្នន័យក្លែងធ្វើ និងប្រព័ន្ធផ្ទុកទិន្នន័យ Cloud/Fog Computing ។
Dataset: ត្រូវការទិន្នន័យប្រវត្តិប្រតិបត្តិការម៉ាស៊ីន និងទិន្នន័យដំណើរការរហូតដល់ខូច (Run-to-failure data) ក្នុងបរិមាណច្រើន (ឧទាហរណ៍ កំណត់ត្រាជាង ២ម៉ឺនជុំប្រតិបត្តិការពីម៉ាស៊ីន ១០០គ្រឿង)។
Expertise: ត្រូវការអ្នកវិទ្យាសាស្ត្រទិន្នន័យ (Data Scientists) និងវិស្វករដែលមានជំនាញខាង Machine Learning, Data Wrangling និងប្រព័ន្ធ IIoT ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់ទិន្នន័យដែលបានមកពីម៉ាស៊ីនយន្តហោះ (Aircraft engines) ចំនួន ១០០គ្រឿង ដែលផ្តោតជាសំខាន់លើវិស័យអាកាសចរណ៍។ ដោយសារទិន្នន័យនេះមានលក្ខណៈជាក់លាក់ វាអាចមានភាពលម្អៀង និងពិបាកយកមកអនុវត្តដោយផ្ទាល់លើម៉ាស៊ីនក្នុងរោងចក្រធម្មតានៅកម្ពុជា ប្រសិនបើមិនមានការប្រមូលទិន្នន័យថ្មីក្នុងស្រុក។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាការសិក្សានេះផ្តោតលើអាកាសចរណ៍ក៏ដោយ វិធីសាស្ត្រនៃការថែទាំព្យាករណ៍ (Predictive Maintenance) នេះមានសក្តានុពលខ្ពស់សម្រាប់អនុវត្តក្នុងវិស័យឧស្សាហកម្មសំខាន់ៗនៅកម្ពុជា។

វិស័យផលិតកម្មនិងរោងចក្រកាត់ដេរ (Garment and Manufacturing): អាចប្រើដើម្បីតាមដានសុខភាពម៉ាស៊ីនដេរ ម៉ាស៊ីនតម្បាញ និងម៉ាស៊ីនភ្លើង ដើម្បីកាត់បន្ថយការផ្អាកដំណើរការរោងចក្រដោយចៃដន្យ (Unplanned Downtime) និងកាត់បន្ថយការខាតបង់ផលិតភាព។
វិស័យអាកាសចរណ៍ក្នុងស្រុក (Domestic Aviation): ក្រុមហ៊ុនអាកាសចរណ៍ក្នុងស្រុកដូចជា Cambodia Angkor Air អាចអនុវត្តប្រព័ន្ធនេះដើម្បីតាមដានម៉ាស៊ីនយន្តហោះ កាត់បន្ថយការយឺតយ៉ាវជើងហោះហើរ និងសន្សំសំចៃថ្លៃថែទាំ។
វិស័យកសិ-ឧស្សាហកម្ម (Agro-industry & Food Processing): អាចជួយត្រួតពិនិត្យប្រព័ន្ធម៉ាស៊ីនត្រជាក់ (Cold chain) និងម៉ាស៊ីនកែច្នៃម្ហូបអាហារ ដើម្បីធានាគុណភាពផលិតផល និងជៀសវាងការខូចខាតទំនិញស្តុកទុកដោយសារប្រព័ន្ធខូច។

សរុបមក ការចាប់ផ្តើមអនុវត្តបច្ចេកវិទ្យាថែទាំព្យាករណ៍ផ្អែកលើទិន្នន័យ IIoT នឹងជួយលើកកម្ពស់ប្រសិទ្ធភាព និងភាពប្រកួតប្រជែងនៃហេដ្ឋារចនាសម្ព័ន្ធឧស្សាហកម្មកម្ពុជាឱ្យស្របតាមស្តង់ដារឧស្សាហកម្ម ៤.០ (Industry 4.0)។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

ជំហានទី១៖ ការសាងសង់ប្រព័ន្ធ IIoT សាកល្បង (Prototyping IIoT System): និស្សិតគប្បីចាប់ផ្តើមបង្កើតប្រព័ន្ធប្រមូលទិន្នន័យដោយប្រើប្រាស់ឧបករណ៍ Raspberry Pi ឬ Arduino តភ្ជាប់ជាមួយសេនស័រវាស់រំញ័រនិងសីតុណ្ហភាព ដើម្បីចាប់យកទិន្នន័យពេលវេលាជាក់ស្តែង (Real-time data) ពីម៉ាស៊ីនប្រតិបត្តិការណាមួយ។
ជំហានទី២៖ ការសម្អាតនិងរៀបចំទិន្នន័យ (Data Wrangling): អនុវត្តការរៀបចំទិន្នន័យនិងទាញយកលក្ខណៈសំខាន់ៗ (Feature extraction) ដូចជាមធ្យមភាគវិល (Rolling mean) ដោយប្រើប្រាស់បណ្ណាល័យ Pandas និង SciPy នៅក្នុងភាសា Python ដើម្បីលុបបំបាត់ទិន្នន័យខុសប្រក្រតី (Outliers)។
ជំហានទី៣៖ ការបណ្តុះបណ្តាលម៉ូដែលវិភាគ (ML Modeling): សាកល្បងបង្កើតនិងបណ្តុះបណ្តាលម៉ូដែល Random Forest Regression និង LSTM ដោយប្រើប្រាស់ឧបករណ៍ Scikit-Learn ឬ TensorFlow ដើម្បីទស្សន៍ទាយពេលវេលាមុនពេលខូច (Time-To-Failure) ។
ជំហានទី៤៖ ការក្លែងធ្វើនិងវាយតម្លៃសុក្រឹតភាព (Simulation and Validation): ប្រើប្រាស់កម្មវិធី MATLAB និង Simulink ដើម្បីបង្កើតទិន្នន័យក្លែងធ្វើសម្រាប់ករណីម៉ាស៊ីនខូច (Simulated failure data) ដើម្បីជួយបង្កើន និងវាយតម្លៃប្រសិទ្ធភាពនៃម៉ូដែលមុននឹងយកទៅអនុវត្តផ្ទាល់នៅក្នុងរោងចក្រពិតប្រាកដ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Predictive Maintenance	យុទ្ធសាស្ត្រថែទាំដែលប្រើប្រាស់ទិន្នន័យនិងបច្ចេកវិទ្យាវិភាគ ដើម្បីទស្សន៍ទាយពីពេលវេលាដែលម៉ាស៊ីនអាចនឹងមានបញ្ហា ឬខូចខាត ដើម្បីអនុញ្ញាតឱ្យមានការជួសជុលជាមុន និងបញ្ចៀសការរំខានដល់ប្រតិបត្តិការ។	ដូចជាការព្យាករណ៍អាកាសធាតុដែលប្រាប់យើងឱ្យយកឆ័ត្រតាមខ្លួនមុនពេលភ្លៀងធ្លាក់ ដើម្បីកុំឱ្យទទឹក។
Random Forest Regression	ក្បួនដោះស្រាយម៉ាស៊ីនរៀន (Machine Learning) ដែលបង្កើតមែកធាងសម្រេចចិត្ត (Decision Trees) ជាច្រើនដើម្បីធ្វើការទស្សន៍ទាយតម្លៃលេខបន្តបន្ទាប់ ហើយយកមធ្យមភាគនៃលទ្ធផលទាំងអស់នោះមកបូកបញ្ចូលគ្នាដើម្បីបង្កើនភាពសុក្រឹត។	ដូចជាការសួរយោបល់ពីគ្រូពេទ្យជំនាញជាច្រើននាក់ រួចយកចម្លើយដែលភាគច្រើនឯកភាពគ្នា ដើម្បីធ្វើរោគវិនិច្ឆ័យឱ្យបានត្រឹមត្រូវបំផុត។
Time-To-Failure (TTF)	រង្វាស់នៃរយៈពេល ឬចំនួនជុំនៃប្រតិបត្តិការ (Cycles) ដែលនៅសល់របស់ម៉ាស៊ីន ឬគ្រឿងបន្លាស់ណាមួយ មុនពេលវាឈានដល់ការខូចខាតមិនអាចដំណើរការបានទាំងស្រុង។	ដូចជាការមើលនាឡិការាប់ថយក្រោយ ដែលប្រាប់យើងពីពេលវេលាជាក់លាក់ដែលគ្រាប់បែកនឹងផ្ទុះ។
Industrial Internet of Things (IIoT)	បណ្តាញឧបករណ៍ សេនស័រ និងគ្រឿងម៉ាស៊ីនក្នុងវិស័យឧស្សាហកម្មដែលតភ្ជាប់គ្នាទៅវិញទៅមកតាមរយៈប្រព័ន្ធអ៊ីនធឺណិត ដើម្បីប្រមូល ផ្លាស់ប្តូរ និងវិភាគទិន្នន័យក្នុងគោលបំណងគ្រប់គ្រងដំណើរការដោយស្វ័យប្រវត្តិ។	ដូចជាប្រព័ន្ធសរសៃប្រសាទនៅក្នុងរាងកាយមនុស្ស ដែលបញ្ជូនព័ត៌មានពីសរីរាង្គផ្សេងៗ (ម៉ាស៊ីន) ទៅកាន់ខួរក្បាល (ប្រព័ន្ធកុំព្យូទ័រ) ដើម្បីចាត់វិធានការ។
Data wrangling	ដំណើរការនៃការសម្អាត រៀបចំ និងបំលែងទិន្នន័យឆៅ (Raw data) ដែលមានភាពរញ៉េរញ៉ៃ ឬមានកំហុស ឱ្យទៅជាទម្រង់រៀបរយនិងមានលក្ខណៈស្តង់ដារ ដែលងាយស្រួលសម្រាប់ការវិភាគ។	ដូចជាការលាងសម្អាត បកសំបក និងហាន់បន្លែសាច់ឱ្យបានស្អាតល្អនិងត្រឹមត្រូវ មុននឹងយកទៅចម្អិនជាម្ហូប។
Feature extraction	ដំណើរការជ្រើសរើស ទាញយក ឬបង្កើតលក្ខណៈសម្បត្តិសំខាន់ៗ (Features) ពីទិន្នន័យឆៅ ដើម្បីកាត់បន្ថយទំហំទិន្នន័យដែលមិនចាំបាច់ និងជួយឱ្យម៉ូដែលវិភាគដំណើរការបានកាន់តែរហ័សនិងមានប្រសិទ្ធភាព។	ដូចជាការអានសៀវភៅក្រាស់ៗរួចកត់ត្រាយកតែចំណុចសំខាន់ៗ ដើម្បីងាយស្រួលទន្ទេញប្រឡង។
Root-mean-square deviation (RMSE)	រង្វាស់គណិតវិទ្យាដែលប្រើដើម្បីវាស់ពីកម្រិតលម្អៀង (Error) រវាងតម្លៃដែលម៉ូដែលបានទស្សន៍ទាយ និងតម្លៃពិតប្រាកដ ដោយវាស់ពីគម្លាតជាមធ្យម។ តម្លៃកាន់តែតូច បង្ហាញថាម៉ូដែលកាន់តែមានភាពសុក្រឹត។	ដូចជាការពិន័យអ្នកបាញ់ធ្នូ ដោយវាស់ចម្ងាយជាមធ្យមពីគ្រាប់ព្រួញនីមួយៗទៅកាន់ចំណុចកណ្តាលនៃផ្ទាំងស៊ីប (កាន់តែជិត កាន់តែល្អ)។
LSTM	ប្រភេទនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (Neural Network) ដែលមានសមត្ថភាពចងចាំព័ត៌មានពីអតីតកាលក្នុងរយៈពេលយូរ ដែលស័ក្តិសមបំផុតសម្រាប់វិភាគទិន្នន័យប្រភេទស៊េរីពេលវេលា (Time-series data) និងស្វែងរកលំនាំស្មុគស្មាញ។	ដូចជាសិស្សពូកែដែលមិនត្រឹមតែយល់មេរៀនថ្ងៃនេះទេ តែនៅចាំមេរៀនដែលគ្រូធ្លាប់បង្រៀនកាលពីខែមុនយ៉ាងច្បាស់ ដើម្បីយកមកដោះស្រាយលំហាត់ថ្មី។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖