បញ្ហា (The Problem)៖ ការស្រាវជ្រាវនេះដោះស្រាយបញ្ហានៃការខូចខាតម៉ាស៊ីនឧស្សាហកម្ម (ម៉ូទ័រអគ្គិសនី) ដោយមិនបានរំពឹងទុក ដែលបណ្តាលឱ្យខាតបង់ពេលវេលានិងថវិកា ដោយស្នើឡើងនូវប្រព័ន្ធថែទាំព្យាករណ៍ (Predictive Maintenance) ដើម្បីកំណត់បញ្ហាមុនពេលម៉ាស៊ីនឈានដល់ដំណាក់កាលធ្ងន់ធ្ងរ។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់វិធីសាស្ត្ររួមបញ្ចូលគ្នារវាងឧបករណ៍សេនស័រ (Sensors) ពិធីការទំនាក់ទំនង (MQTT) និងក្បួនដោះស្រាយការរៀនរបស់ម៉ាស៊ីន (Machine Learning) ដើម្បីប្រមូលនិងវិភាគទិន្នន័យក្នុងពេលជាក់ស្តែងពីម៉ូទ័រអគ្គិសនី។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Random Forest (RF) ម៉ូដែលរ៉េនដុមហ្វ័ររ៉េស (Random Forest) |
ផ្តល់ភាពត្រឹមត្រូវខ្ពស់បំផុត និងមានសមត្ថភាពអាចគ្រប់គ្រងទិន្នន័យដែលមានវិមាត្រខ្ពស់ (High dimensionality data) បានយ៉ាងល្អ។ | ត្រូវការពេលវេលាបង្វឹក (Training time) និងធនធានគណនាច្រើនជាងម៉ូដែលសាមញ្ញមួយចំនួន។ | ទទួលបានភាពត្រឹមត្រូវខ្ពស់បំផុតរហូតដល់ ០.៩៩ (៩៩%) ក្នុងការទស្សន៍ទាយកំហុសរបស់ម៉ូទ័រ។ |
| Support Vector Machine (SVM) ម៉ូដែលសាប់ផតវេទ័រម៉ាស៊ីន (Support Vector Machine) |
ផ្តល់ភាពត្រឹមត្រូវខ្ពស់ក្នុងការចំណាត់ថ្នាក់ទិន្នន័យ ស្មើនឹងម៉ូដែល Random Forest ដែរ។ | ចំណាយពេលក្នុងការបង្វឹក (Training time) យូរជាងម៉ូដែលដទៃប្រមាណ ២០ ដង ដែលធ្វើឱ្យយឺតក្នុងការអនុវត្តផ្ទាល់។ | ទទួលបានភាពត្រឹមត្រូវស្មើនឹង ០.៩៩ ប៉ុន្តែស៊ីពេលបង្វឹកយូរជាងគេ។ |
| Naive Bayes (NB) ម៉ូដែលណាយបេយេស (Naive Bayes) |
មានល្បឿនឆ្លើយតបលឿនភ្លាមៗ (Instant) ស័ក្តិសមបំផុតសម្រាប់កម្មវិធីដែលត្រូវការល្បឿននៃការឆ្លើយតបរហ័ស។ | មានភាពត្រឹមត្រូវទាបជាងម៉ូដែល RF និង SVM ហើយសន្មតថាទិន្នន័យឯករាជ្យពីគ្នាទាំងស្រុង។ | ទទួលបានភាពត្រឹមត្រូវត្រឹមតែ ០.៨៤ ប៉ុន្តែមានល្បឿនលឿនជាងគេ។ |
| Linear Regression (LR) តំរែតំរង់លីនេអ៊ែរ (Linear Regression) |
ងាយស្រួលក្នុងការស្វែងរកទំនាក់ទំនងរវាងអថេរផ្សេងៗនៅក្នុងទិន្នន័យ។ | មិនសូវមានប្រសិទ្ធភាពក្នុងការទស្សន៍ទាយទិន្នន័យដែលមានភាពស្មុគស្មាញ និងមានភាពមិនលីនេអ៊ែរ (Non-linear)។ | ទទួលបានភាពត្រឹមត្រូវទាបជាងគេបំផុតគឺ ០.៨២។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តប្រព័ន្ធនេះទាមទារនូវការរួមបញ្ចូលគ្នារវាងឧបករណ៍ផ្នែករឹងសេនស័រ (Hardware Devices) ប្រព័ន្ធក្លោដ និងចំណេះដឹងផ្នែកក្បួនដោះស្រាយការរៀនរបស់ម៉ាស៊ីន។
ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងមន្ទីរពិសោធន៍នៃសាកលវិទ្យាល័យបាកដាដ (ប្រទេសអ៊ីរ៉ាក់) ដោយប្រើប្រាស់ទិន្នន័យក្លែងធ្វើពីការខូចខាតម៉ូទ័រអគ្គិសនីតែមួយម៉ាស៊ីនប៉ុណ្ណោះ។ ទិន្នន័យមានទំហំតូច និងមិនមែនជាទិន្នន័យដែលប្រមូលបានពីបរិយាកាសរោងចក្រពិតប្រាកដនោះទេ។ សម្រាប់ប្រទេសកម្ពុជា ចំណុចនេះមានសារៈសំខាន់ណាស់ ព្រោះបរិយាកាសរោងចក្រពិត (ដូចជាកម្តៅ សំណើមខ្ពស់ និងធូលី) អាចធ្វើឱ្យលទ្ធផលជាក់ស្តែងនៃការទស្សន៍ទាយមានការប្រែប្រួលពីការពិសោធន៍នេះ។
ប្រព័ន្ធថែទាំព្យាករណ៍នេះពិតជាមានអត្ថប្រយោជន៍ខ្ពស់សម្រាប់ការធ្វើទំនើបកម្ម និងដោះស្រាយបញ្ហាការខូចខាតម៉ាស៊ីនភ្លាមៗនៅក្នុងវិស័យឧស្សាហកម្មនៅកម្ពុជា។
ជារួម ការប្រើប្រាស់បច្ចេកវិទ្យា IoT រួមជាមួយក្បួនដោះស្រាយការរៀនរបស់ម៉ាស៊ីន គឺជាដំណោះស្រាយដែលមានសក្តានុពលក្នុងការជួយឱ្យរោងចក្រនៅកម្ពុជាផ្លាស់ប្តូរពីការជួសជុលពេលខូច (Reactive Maintenance) ទៅជាការការពារជាមុន (Predictive Maintenance)។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| predictive maintenance | គឺជាវិធីសាស្ត្រថែទាំដែលប្រើប្រាស់ទិន្នន័យជាក់ស្តែង និងការវិភាគកម្រិតខ្ពស់ ដើម្បីទស្សន៍ទាយទុកជាមុនថាពេលណាម៉ាស៊ីនមួយនឹងខូចខាត ដែលអនុញ្ញាតឱ្យគេអាចជួសជុលវាបានទាន់ពេលវេលាមុនពេលការខូចខាតធ្ងន់ធ្ងរកើតឡើង។ | ដូចជាការស្តាប់សំឡេងម៉ាស៊ីនឡានដែលរាងខុសប្រក្រតី ហើយយើងដឹងមុនថាត្រូវយកវាទៅជាង មុនពេលវាគាំងងាប់តាមផ្លូវ។ |
| Industrial IoT (IIoT) | គឺជាការតភ្ជាប់បណ្តាញសេនស័រ ឧបករណ៍ និងម៉ាស៊ីននៅក្នុងរោងចក្រឧស្សាហកម្មទៅកាន់ប្រព័ន្ធអ៊ីនធឺណិត ដើម្បីប្រមូលទិន្នន័យរួមគ្នា និងបញ្ជាម៉ាស៊ីនទាំងនោះដោយស្វ័យប្រវត្តិប្រកបដោយភាពឆ្លាតវៃ។ | ដូចជាការបំពាក់នាឡិកាសុខភាព (Smartwatch) ទៅឱ្យម៉ាស៊ីននីមួយៗក្នុងរោងចក្រ ដើម្បីឱ្យវាចេះរាយការណ៍ប្រាប់មេកានិកពីអាការៈរបស់វា។ |
| MQTT protocol | គឺជាវិន័យ ឬភាសាទំនាក់ទំនងតាមបណ្តាញអ៊ីនធឺណិតដែលមានទំហំស្រាលបំផុត ដែលត្រូវបានប្រើប្រាស់សម្រាប់បញ្ជូនទិន្នន័យពីសេនស័រតូចៗទៅកាន់ម៉ាស៊ីនមេ (Cloud Server) ដោយមិនស៊ីទិន្នន័យអ៊ីនធឺណិតច្រើន និងដំណើរការបានលឿន។ | ដូចជាប្រព័ន្ធផ្ញើសារតេឡេក្រាម (Telegram) ប៉ុន្តែវាប្រើសម្រាប់តែម៉ាស៊ីននិងម៉ាស៊ីនផ្ញើសារខ្សឹបប្រាប់គ្នាដោយសន្សំសំចៃអ៉ីនធឺណិតបំផុត។ |
| random forest | គឺជាក្បួនដោះស្រាយផ្នែក Machine Learning ដែលបង្កើតឡើងដោយការប្រមូលផ្តុំ "ដើមឈើសម្រេចចិត្ត" (Decision Trees) ជាច្រើនបញ្ចូលគ្នា ដើម្បីធ្វើការបោះឆ្នោតរួមគ្នាថាតើទិន្នន័យមួយគួរតែត្រូវបានចាត់ថ្នាក់ជាអ្វី ដែលធ្វើឱ្យលទ្ធផលមានភាពសុក្រឹតខ្ពស់។ | ដូចជាការសួរសំណួរទៅកាន់ក្រុមអ្នកជំនាញ ១០០ នាក់ ហើយយកចម្លើយដែលអ្នកជំនាញភាគច្រើនឆ្លើយដូចគ្នា ដើម្បីធ្វើជាសេចក្តីសម្រេចចិត្តចុងក្រោយ។ |
| supported vector machine (SVM) | គឺជាក្បួនដោះស្រាយចំណាត់ថ្នាក់ទិន្នន័យ ដែលព្យាយាមគូសបន្ទាត់ ឬបង្កើតប្លង់កាត់ខណ្ឌចែកក្រុមទិន្នន័យឱ្យនៅដាច់ពីគ្នាតាមដែលអាចធ្វើទៅបាន ដើម្បីងាយស្រួលក្នុងការទស្សន៍ទាយទិន្នន័យថ្មីដែលនឹងចូលមក។ | ដូចជាការគូសបន្ទាត់ព្រំដែនដ៏ធំមួយនៅកណ្តាលទីលាន ដើម្បីបំបែកក្រុមសិស្សពាក់អាវក្រហម និងសិស្សពាក់អាវខៀវឱ្យនៅដាច់ពីគ្នា។ |
| outliers | គឺជាទិន្នន័យដែលមានតម្លៃខុសប្លែកដាច់ពីគេឆ្ងាយបើប្រៀបធៀបទៅនឹងក្រុមទិន្នន័យភាគច្រើន ដែលវាអាចជាសញ្ញាបញ្ជាក់ពីកំហុសរបស់ម៉ាស៊ីន ឬគ្រាន់តែជាការចាប់ទិន្នន័យខុសរបស់សេនស័រ។ | ដូចជាសិស្សម្នាក់ដែលប្រលងបានពិន្ទុ ១០០ ពេញ ខណៈដែលសិស្សមួយថ្នាក់ទៀតប្រលងបានពិន្ទុត្រឹមតែ ៤០ ទៅ ៥០ ដែលជារឿងគួរឱ្យសង្ស័យ។ |
| oversampling | គឺជាបច្ចេកទេសក្នុងការបង្កើតទិន្នន័យបន្ថែមសម្រាប់ក្រុមទិន្នន័យដែលមានចំនួនតិចតួច (ឧទាហរណ៍៖ ទិន្នន័យពេលម៉ាស៊ីនខូច) ដើម្បីធ្វើឱ្យវាមានចំនួនប្រហាក់ប្រហែលនឹងក្រុមទិន្នន័យធម្មតា ដែលជួយឱ្យម៉ូដែល AI រៀនបានស្មើភាពគ្នា។ | ដូចជាការថតចម្លង (Copy) សន្លឹកកិច្ចការរបស់សិស្សខ្សោយឱ្យបានច្រើនសន្លឹក ដើម្បីឱ្យគ្រូមានឱកាសសិក្សាពីចំណុចខ្សោយរបស់ពួកគេបានស្មើនឹងសិស្សពូកែដែលមានគ្នាច្រើន។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖