Original Title: Machine Learning-Driven Predictive Maintenance for Early Fault Prediction and Detection in Smart Manufacturing Systems
Source: doi.org/10.56472/25832646/JETA-V4I1P120
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការថែទាំបែបព្យាករណ៍ដោយប្រើប្រាស់ម៉ាស៊ីនរៀន (Machine Learning) សម្រាប់ការទស្សន៍ទាយ និងការរកឃើញកំហុសឆ្គងដំបូងនៅក្នុងប្រព័ន្ធផលិតកម្មឆ្លាតវៃ

ចំណងជើងដើម៖ Machine Learning-Driven Predictive Maintenance for Early Fault Prediction and Detection in Smart Manufacturing Systems

អ្នកនិពន្ធ៖ Ruchi Patel (Independent Researcher), Prit Patel (Independent Researcher)

ឆ្នាំបោះពុម្ព៖ 2024, ESP Journal of Engineering & Technology Advancements

វិស័យសិក្សា៖ Machine Learning / Industrial Automation

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះផ្តោតលើការដោះស្រាយបញ្ហាការខូចខាតគ្រឿងម៉ាស៊ីនដោយមិនបានរំពឹងទុកនៅក្នុងប្រព័ន្ធផលិតកម្មឧស្សាហកម្ម ដែលបណ្តាលឱ្យមានការផ្អាកដំណើរការ និងខាតបង់ថវិកា ដោយជំនួសវិធីសាស្ត្រថែទាំប្រពៃណីជាមួយនឹងប្រព័ន្ធថែទាំបែបព្យាករណ៍ (Predictive Maintenance)។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់វិធីសាស្ត្រផ្អែកលើទិន្នន័យ ដោយអនុវត្តម៉ូដែលបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតជ្រៅ (Deep Learning Model) ដើម្បីវិភាគទិន្នន័យរំញ័រ និងកំណត់អត្តសញ្ញាណកំហុសឆ្គង។

ការប្រមូល និងរៀបចំទិន្នន័យជាមុន (Data Preprocessing) ដោយប្រើប្រាស់ទិន្នន័យ CWRU Bearing Dataset រួមមានការច្រោះសំឡេងរំខាន ការធ្វើប្រក្រតីកម្មទិន្នន័យ និងការដកចេញទិន្នន័យខុសប្រក្រតី (Outlier Removal)។
ការកាត់បន្ថយវិមាត្រទិន្នន័យដោយប្រើប្រាស់វិធីសាស្ត្រ Principal Component Analysis (PCA) ដើម្បីទាញយកសូចនាករកំហុសឆ្គងសំខាន់ៗ។
ការបង្កើត និងបង្ហាត់ម៉ូដែលសិក្សាជ្រៅជ្រះ DenseNet (DenseNet Deep Learning Model) សម្រាប់ការចាត់ថ្នាក់លក្ខខណ្ឌម៉ាស៊ីនធម្មតា និងមានកំហុសឆ្គង។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ម៉ូដែល DenseNet សម្រេចបានភាពត្រឹមត្រូវ (Accuracy) រហូតដល់ ៩៨.៥៧% ដែលដំណើរការល្អជាងម៉ូដែលប្រពៃណីផ្សេងៗដូចជា MLP, CNN, Bi-LSTM និង MobileNetV2 (ដែលទទួលបានត្រឹម ៩៧.៩%)។
ម៉ូដែលនេះបង្ហាញពីភាពសុក្រឹតខ្ពស់ក្នុងការកាត់បន្ថយសញ្ញាព្រមានខុស (False Positives) ដោយទទួលបានអត្រា Precision ៩៨.៥៤%, Recall ៩៨.៥៥% និង F1-score ៩៨.៥៦%។
ការអនុវត្ត DenseNet អាចជួយចាប់យកគំរូកំហុសឆ្គងស្មុគស្មាញបានតាំងពីដំណាក់កាលដំបូង ដែលអនុញ្ញាតឱ្យមានការថែទាំទាន់ពេលវេលា និងកាត់បន្ថយការចំណាយលើការជួសជុលនៅក្នុងប្រព័ន្ធផលិតកម្មឆ្លាតវៃ។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
DenseNet បណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតជ្រៅ (DenseNet)	មានរចនាសម្ព័ន្ធតភ្ជាប់យ៉ាងជិតស្និទ្ធដែលជួយពង្រឹងការបញ្ជូនលក្ខណៈពិសេស (Feature Propagation) និងដោះស្រាយបញ្ហា Vanishing Gradient បានល្អ។ វាមានសមត្ថភាពខ្ពស់ក្នុងការរៀនលក្ខណៈពិសេសស្មុគស្មាញនៃសញ្ញារំញ័រ។	ទាមទារការពង្រីកការសិក្សាទៅលើទិន្នន័យចម្រុះបន្ថែមទៀត និងនៅមានកម្រិតក្នុងការបែងចែកកំហុសឆ្គងម៉ាស៊ីនដែលមានភាពខុសគ្នាតិចតួច។	ទទួលបានភាពត្រឹមត្រូវខ្ពស់បំផុតរហូតដល់ ៩៨.៥៧%
MobileNetV2 បណ្ដាញសរសៃប្រសាទខ្នាតតូច (MobileNetV2)	មានទំហំតូច និងស៊ីកម្លាំងម៉ាស៊ីន (Computational load) តិច ដែលស័ក្តិសមបំផុតសម្រាប់ការដាក់ឱ្យដំណើរការលើឧបករណ៍ដែលមានធនធានមានកំណត់ (Edge devices)។	បាត់បង់សមត្ថភាពតំណាងទិន្នន័យ (Representational power) មួយចំនួនដោយសារការកាត់បន្ថយបន្ទុកគណនា ដែលធ្វើឱ្យការចាត់ថ្នាក់កំហុសស្មុគស្មាញមិនសូវបានល្អ។	ទទួលបានភាពត្រឹមត្រូវក្នុងកម្រិត ៩៧.៩%
Traditional CNN បណ្ដាញសរសៃប្រសាទ Convolutional ជាមូលដ្ឋាន	ងាយស្រួលក្នុងការអនុវត្ត និងជានិមិត្តរូបទូទៅសម្រាប់ការវិភាគរូបភាព ឬសញ្ញាដោយស្វ័យប្រវត្តិ។	ប្រឈមនឹងការបាត់បង់ព័ត៌មាន (Information loss) នៅពេលបណ្តាញមានស្រទាប់កាន់តែជ្រៅ ធ្វើឱ្យសមត្ថភាពទស្សន៍ទាយថយចុះ។	ទទួលបានភាពត្រឹមត្រូវត្រឹម ៩៦.៤%

ការចំណាយលើធនធាន (Resource Cost)៖ ឯកសារនេះបានបញ្ជាក់យ៉ាងច្បាស់អំពីតម្រូវការផ្នែករឹង និងផ្នែកទន់សម្រាប់ការពិសោធន៍នេះ ដោយមិនទាមទារកុំព្យូទ័រកម្រិតកំពូលពេកនោះទេ។

Hardware: កុំព្យូទ័រដើរដោយប្រព័ន្ធប្រតិបត្តិការ Windows 10 (64-bit) ប្រើប្រាស់អង្គគណនា Intel i7 (3.60 GHz, 4-core) និងអង្គចងចាំ RAM ទំហំ 16 GB។
Software: ភាសាការសរសេរកូដ Python 3 ដោយប្រើប្រាស់បណ្ណាល័យ TensorFlow សម្រាប់ការបង្កើតម៉ូដែល Deep Learning និង Scikit-Learn សម្រាប់ការវិភាគនិងរៀបចំទិន្នន័យ។
Dataset: ទិន្នន័យប្រភពបើកចំហ CWRU Bearing Dataset ពីសាកលវិទ្យាល័យ Case Western Reserve University ដែលមានផ្ទុកទិន្នន័យសេនស័ររំញ័ររបស់ម៉ាស៊ីនក្នុងស្ថានភាពធម្មតា និងខូចខាត។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះពឹងផ្អែកទាំងស្រុងទៅលើទិន្នន័យ CWRU Bearing Dataset ដែលជាទិន្នន័យរំញ័រម៉ាស៊ីនពីមន្ទីរពិសោធន៍។ ការប្រើប្រាស់ទិន្នន័យតែមួយប្រភពនេះ អាចកម្រិតសមត្ថភាពរបស់ម៉ូដែលនៅពេលយកទៅអនុវត្តជាក់ស្តែងក្នុងរោងចក្រនៅកម្ពុជា ដែលមានបរិស្ថាន សីតុណ្ហភាព និងប្រភេទម៉ាស៊ីនខុសប្លែកពីលក្ខខណ្ឌពិសោធន៍។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រថែទាំបែបព្យាករណ៍នេះ មានសក្តានុពលខ្ពស់សម្រាប់វិស័យឧស្សាហកម្មនៅកម្ពុជា ក្នុងការកាត់បន្ថយការខាតបង់ថវិកាដោយសារការខូចម៉ាស៊ីនដោយចៃដន្យ។

រោងចក្រកាត់ដេរ និងផលិតស្បែកជើង (Garment & Footwear Manufacturing): អាចប្រើប្រាស់ដើម្បីតាមដានរំញ័ររបស់ម៉ាស៊ីនដេរ ម៉ាស៊ីនកាត់ និងប្រព័ន្ធខ្សែក្រវាត់បញ្ជូន ដើម្បីកំណត់រោគសញ្ញាខូចខាតមុនពេលម៉ាស៊ីនគាំង ដែលជួយកុំឱ្យរាំងស្ទះខ្សែសង្វាក់ផលិតកម្ម។
រោងម៉ាស៊ីនកិនស្រូវខ្នាតធំ (Large-scale Rice Mills): ការបំពាក់សេនស័ររំញ័រលើម៉ាស៊ីនកិន និងម៉ូទ័រធំៗនៅតាមរោងម៉ាស៊ីនក្នុងខេត្តបាត់ដំបង និងកំពង់ធំ អាចជួយឱ្យម្ចាស់រោងចក្រដឹងមុនពីបញ្ហាប្រដាប់ទ្រនាប់ម៉ាស៊ីន (Bearings) និងអាចត្រៀមគ្រឿងបន្លាស់បានទាន់ពេល។
រោងចក្រផលិតចំណីអាហារ និងភេសជ្ជៈ (Food & Beverage Industry): ជួយតាមដានសុខភាពម៉ាស៊ីនវេចខ្ចប់ និងប្រព័ន្ធបូមទឹកឬវត្ថុរាវ ដោយធានាថាមិនមានការផ្អាកដំណើរការភ្លាមៗដែលធ្វើឱ្យខូចគុណភាពផលិតផល។

ការចាប់ផ្តើមធ្វើសមាហរណកម្មបច្ចេកវិទ្យា Machine Learning ជាមួយប្រព័ន្ធ IoT សាមញ្ញ នឹងជួយលើកកម្ពស់ស្តង់ដាររោងចក្រកម្ពុជាឱ្យស្របតាមបរិបទឧស្សាហកម្ម ៤.០ (Industry 4.0)។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះនៃទិន្នន័យរំញ័រ និងបញ្ហាម៉ាស៊ីន: ចាប់ផ្តើមស្វែងយល់ពីរបៀបដែលម៉ាស៊ីនដំណើរការ និងសញ្ញានៃការខូចខាត ដោយទាញយកទិន្នន័យ CWRU Bearing Dataset មកវិភាគមើលលក្ខណៈនៃរំញ័រ (Vibration signals) និង Spectrograms។
អនុវត្តការរៀបចំទិន្នន័យ (Data Preprocessing): រៀនពីវិធីសាស្ត្រសម្អាតទិន្នន័យ ការកាត់បន្ថយសម្លេងរំខាន (Noise filtering) ការធ្វើប្រក្រតីកម្មកម្រិតពណ៌ប្រផេះ (Gray Level Normalization) និងការប្រើប្រាស់ PCA (Principal Component Analysis) ដោយប្រើប្រាស់ Scikit-Learn ក្នុងភាសា Python។
អភិវឌ្ឍ និងបង្ហាត់ម៉ូដែល Deep Learning: ប្រើប្រាស់ TensorFlow ឬ Keras ដើម្បីបង្កើតម៉ូដែល Traditional CNN និង DenseNet-121 សម្រាប់ការចាត់ថ្នាក់ទិន្នន័យកំហុសឆ្គង រួចធ្វើការវាស់ស្ទង់លទ្ធផល (Accuracy, Precision, Recall, F1-Score)។
សាកល្បងជាមួយសេនស័រជាក់ស្តែង (Hardware Integration): ភ្ជាប់សេនស័ររំញ័រ (ឧទាហរណ៍ MPU6050 ឬ ADXL335) ជាមួយ Raspberry Pi ឬ ESP32 ដើម្បីប្រមូលទិន្នន័យពីម៉ូទ័រខ្នាតតូច រួចបញ្ជូនទិន្នន័យទៅកាន់ម៉ូដែល។
បង្កើតប្រព័ន្ធតាមដានពេលវេលាជាក់ស្តែង (Real-time Dashboard): អភិវឌ្ឍផ្ទាំងគ្រប់គ្រងទិន្នន័យ (Dashboard) តាមរយៈ Streamlit ឬ Grafana ដើម្បីបង្ហាញពីស្ថានភាពសុខភាពរបស់ម៉ាស៊ីន និងផ្តល់សញ្ញាព្រមាន (Alerts) ពេលមានភាពមិនប្រក្រតី។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Predictive Maintenance (PdM)	វាគឺជាវិធីសាស្ត្រថែទាំទម្រង់ថ្មីដែលប្រើប្រាស់ទិន្នន័យប្រវត្តិសាស្ត្រ និងទិន្នន័យសេនស័រជាក់ស្តែងរួមជាមួយម៉ាស៊ីនរៀន (Machine Learning) ដើម្បីទស្សន៍ទាយ និងដឹងមុនពីពេលដែលម៉ាស៊ីនអាចនឹងខូចខាត។ វាជួយឱ្យគេអាចធ្វើការជួសជុលបានមុនពេលបញ្ហាធំកើតឡើង ដែលជួយកាត់បន្ថយការផ្អាកដំណើរការផលិតកម្ម។	ដូចជាការទៅជួបពេទ្យដើម្បីពិនិត្យសុខភាពជាប្រចាំនិងព្យាបាលរោគសញ្ញាតូចតាច មុនពេលឈឺធ្ងន់ធ្ងរចូលដេកពេទ្យ។
DenseNet	វាគឺជាទម្រង់ស្ថាបត្យកម្មនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតជ្រៅ (Deep Learning) ដែលស្រទាប់នីមួយៗ (Layers) ទទួលបានព័ត៌មានពីគ្រប់ស្រទាប់មុនៗទាំងអស់។ ការតភ្ជាប់ខ្វាត់ខ្វែងនេះជួយរក្សាព័ត៌មានមិនឱ្យបាត់បង់ និងធ្វើឱ្យម៉ូដែលរៀនពីទិន្នន័យកំហុសឆ្គងស្មុគស្មាញបានល្អប្រសើរជាងបណ្តាញធម្មតា។	ដូចជាក្រុមការងារមួយដែលសមាជិកម្នាក់ៗតែងតែចែករំលែកព័ត៌មានលម្អិតទាំងអស់ទៅសមាជិកផ្សេងទៀតដោយផ្ទាល់ ដើម្បីកុំឱ្យមានការបាត់បង់ឬយល់ខុសពេលបញ្ជូនសារបន្តគ្នា។
Principal Component Analysis (PCA)	ជាបច្ចេកទេសកាត់បន្ថយវិមាត្រទិន្នន័យ (Dimensionality Reduction) ដោយបំប្លែងទិន្នន័យធំៗដែលមានភាពស្មុគស្មាញឱ្យទៅជាទិន្នន័យតូចជាងមុន ប៉ុន្តែនៅតែរក្សាបាននូវលក្ខណៈសំខាន់ៗបំផុតរបស់ទិន្នន័យដើម។ វាជួយកាត់បន្ថយទំហំគណនារបស់កុំព្យូទ័រ និងសម្លេងរំខាន (Noise) នៅក្នុងទិន្នន័យ។	ដូចជាការសង្ខេបសៀវភៅក្រាស់មួយក្បាលឱ្យនៅសល់ត្រឹមមួយទំព័រ ដោយយកតែអត្ថន័យសំខាន់ៗបំផុតដែលគេអាចយល់សាច់រឿងទាំងមូលបាន។
Spectrograms	វាជារូបភាពតំណាងឱ្យរលកសញ្ញា (Signal) ដែលបង្ហាញពីបម្រែបម្រួលនៃថាមពលប្រេកង់ (Frequency) ទៅតាមពេលវេលា។ នៅក្នុងឯកសារនេះ វាត្រូវបានប្រើដើម្បីប្រៀបធៀបរូបភាពរំញ័ររបស់ម៉ាស៊ីនធម្មតា និងម៉ាស៊ីនដែលមានបញ្ហា តាមរយៈការប្រមូលផ្តុំថាមពលនៃរំញ័រ។	ដូចជាការថតរូបកាំរស្មីអ៊ិច (X-ray) ដែលបង្ហាញឱ្យឃើញពីចំណុចខុសប្រក្រតីនៅខាងក្នុងរាងកាយដែលយើងមិនអាចមើលឃើញដោយភ្នែកទទេ។
False Positive (FP)	នៅក្នុងប្រព័ន្ធវាយតម្លៃម៉ូដែល វាសំដៅលើករណីដែលប្រព័ន្ធបានព្យាករណ៍ខុសថាមានបញ្ហា ឬមានកំហុសឆ្គងកើតឡើង (Positive) ទាំងដែលការពិតម៉ាស៊ីនកំពុងដំណើរការជាធម្មតាសោះ។ ការមាន FP ច្រើនធ្វើឱ្យខាតបង់ពេលវេលាក្នុងការផ្អាកម៉ាស៊ីនដើម្បីត្រួតពិនិត្យឥតប្រយោជន៍។	ដូចជាសំឡេងរោទិ៍បន្លាចចោរលោតបន្លឺឡើងដោយសារសត្វឆ្មាលោតកាត់ ទាំងដែលគ្មានចោរចូលផ្ទះពិតប្រាកដមែន។
vanishing gradient problems	គឺជាបញ្ហាមួយនៅក្នុងការបង្ហាត់ម៉ូដែល Deep Learning ដែលមានស្រទាប់ច្រើន ធ្វើឱ្យតម្លៃនៃការកែតម្រូវ (Gradient) ធ្លាក់ចុះខ្សោយខ្លាំងរហូតដល់ជិតសូន្យនៅពេលបញ្ជូនត្រឡប់មកស្រទាប់ដើមវិញ។ បញ្ហានេះធ្វើឱ្យស្រទាប់ដំបូងៗមិនអាចរៀនសូត្រ និងកែតម្រូវកំហុសបាន។	ដូចជាការលេងល្បែងខ្សឹបប្រាប់រឿងតៗគ្នាពីមនុស្សទី១ ដល់មនុស្សទី១០០ ដែលធ្វើឱ្យអ្នកចុងក្រោយស្តាប់លែងឮ ឬបាត់បង់អត្ថន័យដើមទាំងស្រុង។
Dimensionality Reduction	គឺជាដំណើរការនៃការកាត់បន្ថយចំនួននៃអញ្ញាត (Variables) ឬលក្ខណៈពិសេស (Features) ដែលមិនសូវសំខាន់នៅក្នុងសំណុំទិន្នន័យដ៏ធំ ដោយរក្សាទុកតែអញ្ញាតណាដែលរួមចំណែកធំបំផុតក្នុងការវាយតម្លៃ និងជួយពន្លឿនការគណនារបស់កុំព្យូទ័រ។	ដូចជាការរៀបចំវ៉ាលីធ្វើដំណើរដោយដកយកតែខោអាវចាំបាច់បំផុត ហើយទុកចោលរបស់របរដែលមិនសូវត្រូវការ ដើម្បីឱ្យស្រាលនិងងាយស្រួលយួរ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖