Original Title: Machine Learning based Predictive Maintenance in Manufacturing Industry
Source: doi.org/10.5220/0011537300003329
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការថែទាំបែបព្យាករណ៍ផ្អែកលើម៉ាស៊ីនរៀននៅក្នុងឧស្សាហកម្មផលិតកម្ម

ចំណងជើងដើម៖ Machine Learning based Predictive Maintenance in Manufacturing Industry

អ្នកនិពន្ធ៖ Nadeem Iftikhar (Department of Computer Science, University College of Northern Denmark), Yi-Chen Lin (Department of Computer Science, University College of Northern Denmark), Finn Ebertsen Nordbjerg (Department of Computer Science, University College of Northern Denmark)

ឆ្នាំបោះពុម្ព៖ 2022, Proceedings of the 3rd International Conference on Innovative Intelligent Industrial Production and Logistics (IN4PL 2022)

វិស័យសិក្សា៖ Computer Science

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ នៅក្នុងឧស្សាហកម្មផលិតកម្ម ការខូចខាតម៉ាស៊ីនដោយមិនបានព្រាងទុកបណ្តាលឱ្យមានការកើនឡើងនូវថ្លៃដើមថែទាំ និងពេលវេលាផ្អាកដំណើរការ (Downtime) យ៉ាងច្រើន។ ការស្រាវជ្រាវនេះដោះស្រាយបញ្ហាដោយប្រើប្រាស់ម៉ាស៊ីនរៀន (Machine Learning) ដើម្បីព្យាករណ៍ពីការខូចខាតទាំងនោះមុនពេលវាអូសបន្លាយដល់ការបញ្ឈប់សង្វាក់ផលិតកម្ម។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះអនុវត្តតាមវិធីសាស្រ្តវិទ្យាសាស្ត្រទិន្នន័យ CRISP-DM ដោយប្រើប្រាស់ម៉ូដែលរៀនមានការត្រួតពិនិត្យ (Supervised Learning) សម្រាប់ការវិភាគអាយុកាលប្រើប្រាស់ម៉ាស៊ីន និងម៉ូដែលគ្មានការត្រួតពិនិត្យ (Unsupervised Learning) សម្រាប់ការរកឃើញភាពមិនប្រក្រតី។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Stochastic Gradient Descent Regressor (SGDRegressor*)
ម៉ូដែលតំរែតំរង់ SGD ប្រើប្រាស់ជាមួយការកាត់បន្ថយទំហំទិន្នន័យ
មានល្បឿនលឿនខ្លាំងក្នុងការគណនា និងមានភាពសុក្រឹតខ្ពស់បំផុតក្នុងការប៉ាន់ស្មានអាយុកាលដែលនៅសល់ (RUL) បើធៀបនឹងម៉ូដែលដទៃ។ ទាមទារការកាត់បន្ថយទំហំទិន្នន័យ (Dimensionality Reduction) ជាមុនដើម្បីទទួលបានលទ្ធផលល្អ ដែលអាចធ្វើឱ្យបាត់បង់ព័ត៌មានលម្អិតមួយចំនួន។ ទទួលបានពិន្ទុ R2-score 0.39 និងកម្រិតលម្អៀង RMSE ទាបបំផុតត្រឹម 0.017 ហើយចំណាយពេលត្រឹមតែ 0.4 វិនាទីប៉ុណ្ណោះ។
Support Vector Regression (SVR)
ម៉ូដែលតំរែតំរង់វ៉ិចទ័រគាំទ្រ (គ្មានការកាត់បន្ថយទំហំទិន្នន័យ)
អាចដោះស្រាយបញ្ហាដែលមានលក្ខណៈមិនលីនេអ៊ែរ (Non-linear) បានល្អ និងមានសមត្ថភាពការពារការរៀនទន្ទេញ (Over-fitting) ដោយស្វ័យប្រវត្តិ។ ត្រូវការពេលវេលាគណនាយូរខ្លាំងនៅពេលប្រឈមមុខនឹងទិន្នន័យមានទំហំធំ ឬមានលក្ខណៈពិសេស (Features) ច្រើន។ ទទួលបានពិន្ទុ R2-score អវិជ្ជមាន (-4.02) និង RMSE 0.048 ដោយចំណាយពេលដល់ទៅ ៣នាទី។
Decision Tree
ម៉ូដែលចាត់ថ្នាក់មែកធាងសេចក្តីសម្រេចចិត្ត
ងាយស្រួលយល់ និងបកស្រាយ ព្រមទាំងផ្តល់លទ្ធផលល្អបំផុតក្នុងការទស្សន៍ទាយពេលវេលាមុនពេលខូច (TTF)។ អាចប្រឈមនឹងបញ្ហា Over-fitting ប្រសិនបើមែកធាងមានជម្រៅជ្រៅពេក ហើយត្រូវការទិន្នន័យប្រវត្តិខូចខាត (Labelled Data) ដែលពិបាករក។ ទទួលបានពិន្ទុ F1-score ខ្ពស់ជាងគេគឺ 0.88 និងភាពត្រឹមត្រូវ (Accuracy) 87.51% ។
Isolation Forest
ម៉ូដែលរកឃើញភាពមិនប្រក្រតីបែបព្រៃឯកោ
មិនត្រូវការទិន្នន័យដែលបានបិទស្លាក (Unlabelled Data) ឡើយ ដែលស័ក្តិសមបំផុតសម្រាប់កន្លែងដែលមិនសូវមានកំណត់ត្រាខូចខាតម៉ាស៊ីន និងដំណើរការល្អលើទិន្នន័យពហុវិមាត្រ។ អាចផ្តល់សញ្ញាព្រមានខុស (False Positives) មួយចំនួន ប្រសិនបើទិន្នន័យមានភាពរអាក់រអួលខ្លាំង។ ទទួលបានពិន្ទុ F1-score 0.75 ដែលជាលទ្ធផលល្អបំផុតក្នុងចំណោមម៉ូដែល Anomaly Detection ទាំងអស់ដែលបានសាកល្បង។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះមិនបានបញ្ជាក់ពីតម្លៃជាទឹកប្រាក់ផ្ទាល់ទេ ប៉ុន្តែបានសង្កត់ធ្ងន់លើការសន្សំសំចៃពេលវេលាគណនាបាន ៩៩% តាមរយៈការប្រើប្រាស់ឧបករណ៍ស្វ័យប្រវត្តិកម្ម និងការកាត់បន្ថយទំហំទិន្នន័យ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យស្តង់ដារពីមន្ទីរពិសោធន៍ពិតប្រាកដរួមមាន ថ្មលីចូម-អ៊ីយ៉ុងរបស់អង្គការ NASA និងទិន្នន័យដុំទ្រវិល (Bearing) របស់សាកលវិទ្យាល័យ CWRU ដែលមានបរិស្ថានគ្រប់គ្រងបានយ៉ាងល្អ។ សម្រាប់ប្រទេសកម្ពុជា ទិន្នន័យជាក់ស្តែងពីរោងចក្រអាចមានភាពរអាក់រអួល (Noise) ខ្លាំង និងខ្វះខាតទិន្នន័យប្រវត្តិខូចខាត (Historical Labelled Data)។ លើសពីនេះ បរិយាកាសក្ដៅ និងសំណើមខ្ពស់នៅកម្ពុជាអាចជះឥទ្ធិពលដល់អាយុកាលម៉ាស៊ីនខុសពីទិន្នន័យដើម ដែលតម្រូវឱ្យមានការប្រមូលទិន្នន័យផ្ទាល់ក្នុងស្រុក។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកទេសថែទាំបែបព្យាករណ៍នេះ មានសារៈសំខាន់ខ្លាំង និងអាចអនុវត្តបានយ៉ាងមានសក្តានុពលសម្រាប់វិស័យឧស្សាហកម្មដែលកំពុងរីកចម្រើននៅកម្ពុជា។

ការចាប់ផ្តើមអនុវត្តពីម៉ូដែលគ្មានការត្រួតពិនិត្យ (Unsupervised Learning) ដូចជា Isolation Forest គឺជាជំហានដ៏សមស្រប និងចំណាយដើមទុនតិចបំផុតសម្រាប់រោងចក្រកម្ពុជា ដែលភាគច្រើនពុំទាន់មានកំណត់ត្រាប្រព័ន្ធទិន្នន័យខូចខាតម៉ាស៊ីនច្បាស់លាស់នៅឡើយ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. អនុវត្តវដ្តជីវិតវិទ្យាសាស្ត្រទិន្នន័យ (CRISP-DM): ចាប់ផ្តើមដោយការស្វែងយល់ពីគោលដៅអាជីវកម្ម និងប្រមូលទិន្នន័យ (Data Gathering) ពីម៉ាស៊ីន ដោយបំពាក់សេនស័រ IoT (ដូចជាសេនស័ររំញ័រ និងកម្ដៅ) រួចកត់ត្រាចូលទៅក្នុងប្រព័ន្ធផ្ទុកទិន្នន័យកណ្តាល។
  2. សម្អាត និងវិភាគទិន្នន័យបឋម (EDA): ប្រើប្រាស់បណ្ណាល័យ Pandas និង Matplotlib ដើម្បីវិភាគស្វែងយល់ពីរចនាសម្ព័ន្ធទិន្នន័យ ដកចេញនូវទិន្នន័យស្ទួន (Duplicates) និងកំណត់សូចនាករដែលប៉ះពាល់ដល់អាយុកាលម៉ាស៊ីនតាមរយៈ Random Forest Feature Importance
  3. សាកល្បងម៉ូដែលគ្មានការត្រួតពិនិត្យ (Unsupervised Learning): ដោយសារទិន្នន័យភាគច្រើននៅកម្ពុជាមិនមានបិទស្លាកបញ្ជាក់ការខូចខាត សូមចាប់ផ្តើមសរសេរកូដប្រើប្រាស់ Isolation Forest នៅក្នុង Scikit-Learn ដើម្បីស្វែងរកចំណុចទិន្នន័យមិនប្រក្រតី (Anomalies) និងផ្តល់សញ្ញាព្រមានបឋម។
  4. ប្រើប្រាស់ប្រព័ន្ធបំពាក់ស្វ័យប្រវត្តិកម្ម (AutoML): ដើម្បីសន្សំសំចៃពេលវេលាសាកល្បងម៉ូដែល សូមប្រើប្រាស់ឧបករណ៍ TPOT ដើម្បីស្វែងរកដោយស្វ័យប្រវត្តិនូវម៉ូដែលតំរែតំរង់ (Regression) ដ៏ល្អបំផុត សម្រាប់ទស្សន៍ទាយអាយុកាលដែលនៅសល់ (RUL) របស់ម៉ាស៊ីន។
  5. ដាក់ពង្រាយផ្ទាំងគ្រប់គ្រង (Deployment & Dashboarding): បង្កើតផ្ទាំងគ្រប់គ្រងទិន្នន័យផ្ទាល់ (Real-time Dashboard) ដោយប្រើប្រាស់ StreamlitGrafana ដើម្បីបង្ហាញលទ្ធផលទស្សន៍ទាយ និងអនុញ្ញាតឱ្យក្រុមជាងថែទាំអាចចាត់វិធានការបានទាន់ពេលវេលាមុនពេលម៉ាស៊ីនខូច។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Predictive Maintenance (PdM) យុទ្ធសាស្ត្រថែទាំម៉ាស៊ីនដែលប្រើប្រាស់ទិន្នន័យ និងក្បួនម៉ាស៊ីនរៀនដើម្បីតាមដានសុខភាពម៉ាស៊ីន និងទស្សន៍ទាយទុកជាមុនថាពេលណាម៉ាស៊ីននឹងខូច ដើម្បីអាចជួសជុលបានទាន់ពេលវេលា និងកាត់បន្ថយការផ្អាកដំណើរការរោងចក្រដោយមិនបានព្រាងទុក។ ដូចជាការស្តាប់សំឡេងម៉ាស៊ីនឡានដែលប្លែកពីធម្មតា ហើយប្រញាប់យកទៅជាងមុនពេលឡានងាប់តាមផ្លូវ។
Remaining Useful Life (RUL) ការគណនាប៉ាន់ស្មានរយៈពេល ឬចំនួនជុំដំណើរការដែលនៅសល់របស់ម៉ាស៊ីន ឬគ្រឿងបន្លាស់ មុនពេលវាធ្លាក់ចុះដល់កម្រិតមួយដែលមិនអាចប្រើការបាន (ឧទាហរណ៍ ថាមពលថ្មធ្លាក់ចុះសល់ត្រឹម ៧០%)។ ដូចជាការមើលទ្រនិចសាំងម៉ូតូដើម្បីដឹងថាអាចជិះបានប៉ុន្មានគីឡូម៉ែត្រទៀតមុនពេលអស់សាំងរលីង។
Time-To-Failure (TTF) ការទស្សន៍ទាយពីរយៈពេលជាក់លាក់ណាមួយដែលម៉ាស៊ីននឹងឈប់ដំណើរការភ្លាមៗ (ខូចកម្រិតធ្ងន់) ដើម្បីផ្តល់សញ្ញាអាសន្ន និងបញ្ឈប់ប្រតិបត្តិការមុនពេលមានគ្រោះថ្នាក់។ ដូចជាការដាក់ម៉ោងរោទ៍ប្រាប់ថាគ្រាប់បែកម៉ោងនឹងផ្ទុះនៅប៉ុន្មានវិនាទីទៀត ដើម្បីឱ្យយើងអាចដោះវាទាន់ពេល។
Anomaly Detection ដំណើរការវិភាគទិន្នន័យដើម្បីស្វែងរកចំណុច ឬសកម្មភាពណាមួយដែលមានលក្ខណៈខុសប្លែកទាំងស្រុងពីទម្រង់ទិន្នន័យធម្មតា ដែលវាជាសញ្ញាបញ្ជាក់ពីបញ្ហាលាក់កំបាំង ឬការចាប់ផ្តើមខូចខាតឧបករណ៍។ ដូចជាការសង្កេតឃើញមនុស្សម្នាក់ពាក់អាវរងាក្រាស់ឃ្មឹកដើរក្រោមកម្តៅថ្ងៃ៣៥អង្សា ដែលមើលទៅខុសប្លែកពីគេឯងទាំងស្រុង។
Supervised Learning វិធីសាស្ត្របង្រៀនកុំព្យូទ័រដោយប្រើទិន្នន័យប្រវត្តិដែលមានចម្លើយ ឬបិទស្លាករួចជាស្រេច (ឧទាហរណ៍ ទិន្នន័យម៉ាស៊ីនដើរធម្មតា និងទិន្នន័យពេលខូច) ដើម្បីឱ្យវាអាចទស្សន៍ទាយលទ្ធផលនាពេលអនាគតបានយ៉ាងច្បាស់លាស់។ ដូចជាគ្រូបង្រៀនសិស្សដោយបង្ហាញលំហាត់ព្រមទាំងចម្លើយត្រឹមត្រូវ ដើម្បីឱ្យសិស្សចេះធ្វើលំហាត់ស្រដៀងគ្នានៅពេលប្រឡង។
Unsupervised Learning បច្ចេកទេសឱ្យកុំព្យូទ័ររៀនស្វែងរកគំរូទម្រង់ដែលលាក់កំបាំង ឬប្រមូលផ្តុំទិន្នន័យដោយខ្លួនឯង ដោយមិនចាំបាច់មានមនុស្សប្រាប់ចម្លើយ ឬបិទស្លាកទិន្នន័យជាមុនឡើយ ដែលប្រើប្រាស់ច្រើនក្នុងការរកភាពមិនប្រក្រតីពេលអត់មានទិន្នន័យប្រវត្តិខូចខាតម៉ាស៊ីន។ ដូចជាការឱ្យក្មេងតូចម្នាក់រៀបចំប្រដាប់ក្មេងលេងទៅតាមពណ៌ ឬរូបរាងដោយខ្លួនឯង ដោយមិនមានអ្នកប្រាប់ពីរបៀបរៀបជាមុន។
CRISP-DM ក្របខ័ណ្ឌស្តង់ដារមួយដែលមាន ៦ ជំហានសម្រាប់ដឹកនាំគម្រោងវិទ្យាសាស្ត្រទិន្នន័យ ចាប់ពីការស្វែងយល់ពីបញ្ហាអាជីវកម្ម ការរៀបចំទិន្នន័យ រហូតដល់ការបង្កើតម៉ូដែល និងការដាក់ឱ្យប្រើប្រាស់ជាក់ស្តែងក្នុងរោងចក្រ។ ដូចជាសៀវភៅរូបមន្តចម្អិនអាហារដែលប្រាប់ពីជំហានរៀបចំគ្រឿងផ្សំ រហូតដល់ការរៀបចំម្ហូបដាក់លើតុជូនភ្ញៀវ។
Dimensionality Reduction ការកាត់បន្ថយចំនួនអថេរ ឬលក្ខណៈពិសេសនៃទិន្នន័យដែលមិនសូវសំខាន់ចោល ដើម្បីជួយឱ្យកុំព្យូទ័រអាចទាញយកទិន្នន័យទៅគណនាបានលឿនជាងមុន ដោយមិនធ្វើឱ្យប៉ះពាល់ដល់ភាពត្រឹមត្រូវនៃលទ្ធផលរួម (ដូចដែលបានប្រើលើម៉ូដែល SGDRegressor)។ ដូចជាការសង្ខេបសាច់រឿងមួយសៀវភៅឱ្យមកសល់ត្រឹមមួយទំព័រ ដែលនៅតែរក្សាអត្ថន័យសំខាន់ៗដដែល។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖