Original Title: Machine Learning-Driven Predictive Maintenance for Early Fault Prediction and Detection in Smart Manufacturing Systems
Source: doi.org/10.56472/25832646/JETA-V4I1P120
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការថែទាំបែបព្យាករណ៍ដោយប្រើប្រាស់ម៉ាស៊ីនរៀន (Machine Learning) សម្រាប់ការទស្សន៍ទាយ និងការរកឃើញកំហុសឆ្គងដំបូងនៅក្នុងប្រព័ន្ធផលិតកម្មឆ្លាតវៃ

ចំណងជើងដើម៖ Machine Learning-Driven Predictive Maintenance for Early Fault Prediction and Detection in Smart Manufacturing Systems

អ្នកនិពន្ធ៖ Ruchi Patel (Independent Researcher), Prit Patel (Independent Researcher)

ឆ្នាំបោះពុម្ព៖ 2024, ESP Journal of Engineering & Technology Advancements

វិស័យសិក្សា៖ Machine Learning / Industrial Automation

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះផ្តោតលើការដោះស្រាយបញ្ហាការខូចខាតគ្រឿងម៉ាស៊ីនដោយមិនបានរំពឹងទុកនៅក្នុងប្រព័ន្ធផលិតកម្មឧស្សាហកម្ម ដែលបណ្តាលឱ្យមានការផ្អាកដំណើរការ និងខាតបង់ថវិកា ដោយជំនួសវិធីសាស្ត្រថែទាំប្រពៃណីជាមួយនឹងប្រព័ន្ធថែទាំបែបព្យាករណ៍ (Predictive Maintenance)។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់វិធីសាស្ត្រផ្អែកលើទិន្នន័យ ដោយអនុវត្តម៉ូដែលបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតជ្រៅ (Deep Learning Model) ដើម្បីវិភាគទិន្នន័យរំញ័រ និងកំណត់អត្តសញ្ញាណកំហុសឆ្គង។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
DenseNet
បណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតជ្រៅ (DenseNet)
មានរចនាសម្ព័ន្ធតភ្ជាប់យ៉ាងជិតស្និទ្ធដែលជួយពង្រឹងការបញ្ជូនលក្ខណៈពិសេស (Feature Propagation) និងដោះស្រាយបញ្ហា Vanishing Gradient បានល្អ។ វាមានសមត្ថភាពខ្ពស់ក្នុងការរៀនលក្ខណៈពិសេសស្មុគស្មាញនៃសញ្ញារំញ័រ។ ទាមទារការពង្រីកការសិក្សាទៅលើទិន្នន័យចម្រុះបន្ថែមទៀត និងនៅមានកម្រិតក្នុងការបែងចែកកំហុសឆ្គងម៉ាស៊ីនដែលមានភាពខុសគ្នាតិចតួច។ ទទួលបានភាពត្រឹមត្រូវខ្ពស់បំផុតរហូតដល់ ៩៨.៥៧%
MobileNetV2
បណ្ដាញសរសៃប្រសាទខ្នាតតូច (MobileNetV2)
មានទំហំតូច និងស៊ីកម្លាំងម៉ាស៊ីន (Computational load) តិច ដែលស័ក្តិសមបំផុតសម្រាប់ការដាក់ឱ្យដំណើរការលើឧបករណ៍ដែលមានធនធានមានកំណត់ (Edge devices)។ បាត់បង់សមត្ថភាពតំណាងទិន្នន័យ (Representational power) មួយចំនួនដោយសារការកាត់បន្ថយបន្ទុកគណនា ដែលធ្វើឱ្យការចាត់ថ្នាក់កំហុសស្មុគស្មាញមិនសូវបានល្អ។ ទទួលបានភាពត្រឹមត្រូវក្នុងកម្រិត ៩៧.៩%
Traditional CNN
បណ្ដាញសរសៃប្រសាទ Convolutional ជាមូលដ្ឋាន
ងាយស្រួលក្នុងការអនុវត្ត និងជានិមិត្តរូបទូទៅសម្រាប់ការវិភាគរូបភាព ឬសញ្ញាដោយស្វ័យប្រវត្តិ។ ប្រឈមនឹងការបាត់បង់ព័ត៌មាន (Information loss) នៅពេលបណ្តាញមានស្រទាប់កាន់តែជ្រៅ ធ្វើឱ្យសមត្ថភាពទស្សន៍ទាយថយចុះ។ ទទួលបានភាពត្រឹមត្រូវត្រឹម ៩៦.៤%

ការចំណាយលើធនធាន (Resource Cost)៖ ឯកសារនេះបានបញ្ជាក់យ៉ាងច្បាស់អំពីតម្រូវការផ្នែករឹង និងផ្នែកទន់សម្រាប់ការពិសោធន៍នេះ ដោយមិនទាមទារកុំព្យូទ័រកម្រិតកំពូលពេកនោះទេ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះពឹងផ្អែកទាំងស្រុងទៅលើទិន្នន័យ CWRU Bearing Dataset ដែលជាទិន្នន័យរំញ័រម៉ាស៊ីនពីមន្ទីរពិសោធន៍។ ការប្រើប្រាស់ទិន្នន័យតែមួយប្រភពនេះ អាចកម្រិតសមត្ថភាពរបស់ម៉ូដែលនៅពេលយកទៅអនុវត្តជាក់ស្តែងក្នុងរោងចក្រនៅកម្ពុជា ដែលមានបរិស្ថាន សីតុណ្ហភាព និងប្រភេទម៉ាស៊ីនខុសប្លែកពីលក្ខខណ្ឌពិសោធន៍។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រថែទាំបែបព្យាករណ៍នេះ មានសក្តានុពលខ្ពស់សម្រាប់វិស័យឧស្សាហកម្មនៅកម្ពុជា ក្នុងការកាត់បន្ថយការខាតបង់ថវិកាដោយសារការខូចម៉ាស៊ីនដោយចៃដន្យ។

ការចាប់ផ្តើមធ្វើសមាហរណកម្មបច្ចេកវិទ្យា Machine Learning ជាមួយប្រព័ន្ធ IoT សាមញ្ញ នឹងជួយលើកកម្ពស់ស្តង់ដាររោងចក្រកម្ពុជាឱ្យស្របតាមបរិបទឧស្សាហកម្ម ៤.០ (Industry 4.0)។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃទិន្នន័យរំញ័រ និងបញ្ហាម៉ាស៊ីន: ចាប់ផ្តើមស្វែងយល់ពីរបៀបដែលម៉ាស៊ីនដំណើរការ និងសញ្ញានៃការខូចខាត ដោយទាញយកទិន្នន័យ CWRU Bearing Dataset មកវិភាគមើលលក្ខណៈនៃរំញ័រ (Vibration signals) និង Spectrograms
  2. អនុវត្តការរៀបចំទិន្នន័យ (Data Preprocessing): រៀនពីវិធីសាស្ត្រសម្អាតទិន្នន័យ ការកាត់បន្ថយសម្លេងរំខាន (Noise filtering) ការធ្វើប្រក្រតីកម្មកម្រិតពណ៌ប្រផេះ (Gray Level Normalization) និងការប្រើប្រាស់ PCA (Principal Component Analysis) ដោយប្រើប្រាស់ Scikit-Learn ក្នុងភាសា Python
  3. អភិវឌ្ឍ និងបង្ហាត់ម៉ូដែល Deep Learning: ប្រើប្រាស់ TensorFlowKeras ដើម្បីបង្កើតម៉ូដែល Traditional CNN និង DenseNet-121 សម្រាប់ការចាត់ថ្នាក់ទិន្នន័យកំហុសឆ្គង រួចធ្វើការវាស់ស្ទង់លទ្ធផល (Accuracy, Precision, Recall, F1-Score)។
  4. សាកល្បងជាមួយសេនស័រជាក់ស្តែង (Hardware Integration): ភ្ជាប់សេនស័ររំញ័រ (ឧទាហរណ៍ MPU6050ADXL335) ជាមួយ Raspberry PiESP32 ដើម្បីប្រមូលទិន្នន័យពីម៉ូទ័រខ្នាតតូច រួចបញ្ជូនទិន្នន័យទៅកាន់ម៉ូដែល។
  5. បង្កើតប្រព័ន្ធតាមដានពេលវេលាជាក់ស្តែង (Real-time Dashboard): អភិវឌ្ឍផ្ទាំងគ្រប់គ្រងទិន្នន័យ (Dashboard) តាមរយៈ StreamlitGrafana ដើម្បីបង្ហាញពីស្ថានភាពសុខភាពរបស់ម៉ាស៊ីន និងផ្តល់សញ្ញាព្រមាន (Alerts) ពេលមានភាពមិនប្រក្រតី។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Predictive Maintenance (PdM) វាគឺជាវិធីសាស្ត្រថែទាំទម្រង់ថ្មីដែលប្រើប្រាស់ទិន្នន័យប្រវត្តិសាស្ត្រ និងទិន្នន័យសេនស័រជាក់ស្តែងរួមជាមួយម៉ាស៊ីនរៀន (Machine Learning) ដើម្បីទស្សន៍ទាយ និងដឹងមុនពីពេលដែលម៉ាស៊ីនអាចនឹងខូចខាត។ វាជួយឱ្យគេអាចធ្វើការជួសជុលបានមុនពេលបញ្ហាធំកើតឡើង ដែលជួយកាត់បន្ថយការផ្អាកដំណើរការផលិតកម្ម។ ដូចជាការទៅជួបពេទ្យដើម្បីពិនិត្យសុខភាពជាប្រចាំនិងព្យាបាលរោគសញ្ញាតូចតាច មុនពេលឈឺធ្ងន់ធ្ងរចូលដេកពេទ្យ។
DenseNet វាគឺជាទម្រង់ស្ថាបត្យកម្មនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតជ្រៅ (Deep Learning) ដែលស្រទាប់នីមួយៗ (Layers) ទទួលបានព័ត៌មានពីគ្រប់ស្រទាប់មុនៗទាំងអស់។ ការតភ្ជាប់ខ្វាត់ខ្វែងនេះជួយរក្សាព័ត៌មានមិនឱ្យបាត់បង់ និងធ្វើឱ្យម៉ូដែលរៀនពីទិន្នន័យកំហុសឆ្គងស្មុគស្មាញបានល្អប្រសើរជាងបណ្តាញធម្មតា។ ដូចជាក្រុមការងារមួយដែលសមាជិកម្នាក់ៗតែងតែចែករំលែកព័ត៌មានលម្អិតទាំងអស់ទៅសមាជិកផ្សេងទៀតដោយផ្ទាល់ ដើម្បីកុំឱ្យមានការបាត់បង់ឬយល់ខុសពេលបញ្ជូនសារបន្តគ្នា។
Principal Component Analysis (PCA) ជាបច្ចេកទេសកាត់បន្ថយវិមាត្រទិន្នន័យ (Dimensionality Reduction) ដោយបំប្លែងទិន្នន័យធំៗដែលមានភាពស្មុគស្មាញឱ្យទៅជាទិន្នន័យតូចជាងមុន ប៉ុន្តែនៅតែរក្សាបាននូវលក្ខណៈសំខាន់ៗបំផុតរបស់ទិន្នន័យដើម។ វាជួយកាត់បន្ថយទំហំគណនារបស់កុំព្យូទ័រ និងសម្លេងរំខាន (Noise) នៅក្នុងទិន្នន័យ។ ដូចជាការសង្ខេបសៀវភៅក្រាស់មួយក្បាលឱ្យនៅសល់ត្រឹមមួយទំព័រ ដោយយកតែអត្ថន័យសំខាន់ៗបំផុតដែលគេអាចយល់សាច់រឿងទាំងមូលបាន។
Spectrograms វាជារូបភាពតំណាងឱ្យរលកសញ្ញា (Signal) ដែលបង្ហាញពីបម្រែបម្រួលនៃថាមពលប្រេកង់ (Frequency) ទៅតាមពេលវេលា។ នៅក្នុងឯកសារនេះ វាត្រូវបានប្រើដើម្បីប្រៀបធៀបរូបភាពរំញ័ររបស់ម៉ាស៊ីនធម្មតា និងម៉ាស៊ីនដែលមានបញ្ហា តាមរយៈការប្រមូលផ្តុំថាមពលនៃរំញ័រ។ ដូចជាការថតរូបកាំរស្មីអ៊ិច (X-ray) ដែលបង្ហាញឱ្យឃើញពីចំណុចខុសប្រក្រតីនៅខាងក្នុងរាងកាយដែលយើងមិនអាចមើលឃើញដោយភ្នែកទទេ។
False Positive (FP) នៅក្នុងប្រព័ន្ធវាយតម្លៃម៉ូដែល វាសំដៅលើករណីដែលប្រព័ន្ធបានព្យាករណ៍ខុសថាមានបញ្ហា ឬមានកំហុសឆ្គងកើតឡើង (Positive) ទាំងដែលការពិតម៉ាស៊ីនកំពុងដំណើរការជាធម្មតាសោះ។ ការមាន FP ច្រើនធ្វើឱ្យខាតបង់ពេលវេលាក្នុងការផ្អាកម៉ាស៊ីនដើម្បីត្រួតពិនិត្យឥតប្រយោជន៍។ ដូចជាសំឡេងរោទិ៍បន្លាចចោរលោតបន្លឺឡើងដោយសារសត្វឆ្មាលោតកាត់ ទាំងដែលគ្មានចោរចូលផ្ទះពិតប្រាកដមែន។
vanishing gradient problems គឺជាបញ្ហាមួយនៅក្នុងការបង្ហាត់ម៉ូដែល Deep Learning ដែលមានស្រទាប់ច្រើន ធ្វើឱ្យតម្លៃនៃការកែតម្រូវ (Gradient) ធ្លាក់ចុះខ្សោយខ្លាំងរហូតដល់ជិតសូន្យនៅពេលបញ្ជូនត្រឡប់មកស្រទាប់ដើមវិញ។ បញ្ហានេះធ្វើឱ្យស្រទាប់ដំបូងៗមិនអាចរៀនសូត្រ និងកែតម្រូវកំហុសបាន។ ដូចជាការលេងល្បែងខ្សឹបប្រាប់រឿងតៗគ្នាពីមនុស្សទី១ ដល់មនុស្សទី១០០ ដែលធ្វើឱ្យអ្នកចុងក្រោយស្តាប់លែងឮ ឬបាត់បង់អត្ថន័យដើមទាំងស្រុង។
Dimensionality Reduction គឺជាដំណើរការនៃការកាត់បន្ថយចំនួននៃអញ្ញាត (Variables) ឬលក្ខណៈពិសេស (Features) ដែលមិនសូវសំខាន់នៅក្នុងសំណុំទិន្នន័យដ៏ធំ ដោយរក្សាទុកតែអញ្ញាតណាដែលរួមចំណែកធំបំផុតក្នុងការវាយតម្លៃ និងជួយពន្លឿនការគណនារបស់កុំព្យូទ័រ។ ដូចជាការរៀបចំវ៉ាលីធ្វើដំណើរដោយដកយកតែខោអាវចាំបាច់បំផុត ហើយទុកចោលរបស់របរដែលមិនសូវត្រូវការ ដើម្បីឱ្យស្រាលនិងងាយស្រួលយួរ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖