បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហានៃការលំបាកក្នុងការវិនិច្ឆ័យកំហុសរបស់ប៊ីរ៉ូឡូ (Rolling Bearings) ដោយសារតែភាពស្មុគស្មាញនៃទិន្នន័យរំញ័រ និងបញ្ហាកង្វះទិន្នន័យគំរូ (Insufficient samples) នៅក្នុងប្រព័ន្ធអគ្គិសនីមេកានិច។
វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានស្នើវិធីសាស្ត្រថ្មីមួយដោយរួមបញ្ចូលគ្នានូវបច្ចេកទេសបំប្លែងទិន្នន័យ និងបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតខ្ពស់ ដើម្បីបង្កើនប្រសិទ្ធភាពនៃការវិភាគ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Standard CNN (Basic Convolutional Neural Network) បណ្តាញសរសៃប្រសាទ CNN ធម្មតា ដោយគ្មានការបំប្លែងទិន្នន័យកម្រិតខ្ពស់ |
ងាយស្រួលក្នុងការបង្កើត និងមិនត្រូវការធនធានកុំព្យូទ័រខ្លាំងពេក។ | មានភាពត្រឹមត្រូវទាប (ប្រហែល ៨៣-៨៦%) នៅពេលមានទិន្នន័យគំរូតិចតួច និងងាយរងផលប៉ះពាល់ដោយសំឡេងរំខាន។ | ទទួលបានភាពត្រឹមត្រូវត្រឹមតែ ៨៦.៤៤% ជាមួយនឹងទំហំ Batch ស្មើ ២។ |
| ResNet18 + Transfer Learning ការប្រើប្រាស់បណ្តាញ ResNet18 រួមជាមួយបច្ចេកទេសរៀនផ្ទេរ (Transfer Learning) |
មានសមត្ថភាពខ្ពស់ក្នុងការរៀនលក្ខណៈពិសេសជ្រៅ (Deep features) និងផ្តល់លទ្ធផលល្អប្រសើរជាង CNN ធម្មតា។ | នៅមានកម្រិតការបាត់បង់ (Loss value) ខ្ពស់ជាង DenseNet បន្តិច។ | ទទួលបានភាពត្រឹមត្រូវ ៩៩.៦៩% និងតម្លៃបាត់បង់ ០.០១៣។ |
| DenseNet121 + Transfer Learning (Proposed Method) វិធីសាស្ត្រដែលស្នើឡើង៖ ការប្រើប្រាស់ DenseNet121 ជាមួយរូបភាព GADF និងការរៀនផ្ទេរ |
អាចប្រើប្រាស់ទិន្នន័យឡើងវិញបានល្អ (Feature reuse) កាត់បន្ថយបញ្ហា Gradient vanishing និងដំណើរការបានល្អបំផុតទោះបីទិន្នន័យតិច។ | ត្រូវការធនធានកុំព្យូទ័រខ្លាំង (GPU) សម្រាប់ការបណ្តុះបណ្តាលដោយសាររចនាសម្ព័ន្ធបណ្តាញស្មុគស្មាញ។ | ទទួលបានភាពត្រឹមត្រូវខ្ពស់បំផុត ៩៩.៨៣% និងតម្លៃបាត់បង់ទាបបំផុត ០.០០៥។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តវិធីសាស្ត្រនេះតម្រូវឱ្យមានធនធានផ្នែករឹងកម្រិតខ្ពស់ដើម្បីគណនាទិន្នន័យរូបភាព និងបណ្តុះបណ្តាលបណ្តាញសរសៃប្រសាទ។
ការសិក្សានេះប្រើប្រាស់ទិន្នន័យពី CWRU (Case Western Reserve University) ដែលជាទិន្នន័យប្រមូលក្នុងបន្ទប់ពិសោធន៍ដែលមានការគ្រប់គ្រងបរិស្ថានបានល្អ។ នេះអាចជាបញ្ហាសម្រាប់កម្ពុជា ដែលម៉ាស៊ីនក្នុងរោងចក្រជាក់ស្តែងមានសំឡេងរំខានបរិស្ថាន (Environmental Noise) ខ្ពស់ កំដៅ និងធូលី ដែលអាចធ្វើឱ្យទិន្នន័យមានភាពស្មុគស្មាញជាងទិន្នន័យពិសោធន៍។
វិធីសាស្ត្រនេះមានប្រយោជន៍ខ្លាំងសម្រាប់វិស័យឧស្សាហកម្មនៅកម្ពុជាដែលកំពុងវិវឌ្ឍទៅរកស្វ័យប្រវត្តិកម្ម។
បច្ចេកវិទ្យានេះអាចជួយកាត់បន្ថយការចំណាយលើការថែទាំ និងបង្កើនប្រសិទ្ធភាពផលិតកម្ម ប៉ុន្តែត្រូវការការកែសម្រួលម៉ូដែលជាមួយទិន្នន័យជាក់ស្តែងក្នុងស្រុកបន្ថែមទៀត។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Gramian Angular Field (GAF) | គឺជាបច្ចេកទេសគណិតវិទ្យាសម្រាប់បំប្លែងទិន្នន័យស៊េរីពេលវេលា (Time Series) ដូចជាសញ្ញារំញ័រ ឱ្យទៅជារូបភាព ២វិមាត្រ ដើម្បីរក្សានូវទំនាក់ទំនងនៃពេលវេលា និងធ្វើឱ្យប្រព័ន្ធកុំព្យូទ័រងាយស្រួលវិភាគលក្ខណៈពិសេសតាមរយៈការមើលឃើញ។ | ប្រៀបដូចជាការបំប្លែងសំឡេងតន្ត្រី (ដែលឮតាមលំដាប់) ឱ្យទៅជាក្រដាសណោតភ្លេង (ជារូបភាព) ដើម្បីឱ្យយើងអាចមើលឃើញលំនាំបទចម្រៀងទាំងមូលបានក្នុងពេលតែមួយ។ |
| DenseNet (Densely Connected Convolutional Networks) | ជារចនាសម្ព័ន្ធនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (Deep Learning) ដែលស្រទាប់នីមួយៗ (Layer) ត្រូវបានតភ្ជាប់ទៅគ្រប់ស្រទាប់ផ្សេងទៀតដែលនៅខាងក្រោយវា ដើម្បីធានាថាព័ត៌មានសំខាន់ៗត្រូវបានប្រើប្រាស់ឡើងវិញ និងមិនបាត់បង់កំឡុងពេលបណ្តុះបណ្តាល។ | ដូចជាការប្រជុំក្រុមដែលសមាជិកម្នាក់ៗបានស្តាប់ឮយោបល់របស់អ្នកមុនៗទាំងអស់គ្នាមុននឹងនិយាយ មិនមែនស្តាប់តែពីអ្នកដែលអង្គុយក្បែរខ្លួននោះទេ ដែលធ្វើឱ្យការសន្និដ្ឋានមានប្រសិទ្ធភាពខ្ពស់។ |
| Transfer Learning (TL) | ជាវិធីសាស្ត្រក្នុងការយកចំណេះដឹងដែលម៉ូដែលកុំព្យូទ័របានរៀនពីទិន្នន័យដ៏ធំមួយ (Source) មកអនុវត្តបន្តលើបញ្ហាថ្មីដែលមានទិន្នន័យតិចតួច (Target) ដើម្បីកាត់បន្ថយពេលវេលា និងតម្រូវការទិន្នន័យ។ | ប្រៀបដូចជាអ្នកដែលចេះលេងហ្គីតាស្រាប់ ហើយទៅរៀនលេងឧបករណ៍តន្ត្រីថ្មី (ដូចជា Ukulele) គាត់នឹងរៀនឆាប់ចេះជាងអ្នកមិនដែលចេះសោះ ព្រោះគាត់មានមូលដ្ឋានតន្ត្រីរួចហើយ។ |
| Convolutional Neural Network (CNN) | ជាប្រភេទនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតដែលត្រូវបានរចនាឡើងយ៉ាងពិសេសសម្រាប់វិភាគទិន្នន័យជារូបភាព ដោយវាមានសមត្ថភាពក្នុងការស្កេនរកលក្ខណៈពិសេស (ដូចជា ខ្សែ គែម ឬទ្រង់ទ្រាយ) ដោយស្វ័យប្រវត្តិ។ | ដូចជាការប្រើវ៉ែនតាពិនិត្យមើលរូបភាពមួយចំណែកម្តងៗ ដើម្បីស្វែងរកកំហុស ឬលក្ខណៈពិសេស រួចយកមកផ្គុំគ្នាដើម្បីស្គាល់ថាជារូបអ្វី។ |
| Time Series | ជាសំណុំទិន្នន័យដែលត្រូវបានកត់ត្រាជាបន្តបន្ទាប់តាមលំដាប់ពេលវេលាជាក់លាក់មួយ។ ក្នុងឯកសារនេះ វាសំដៅលើទិន្នន័យរំញ័ររបស់ប៊ីរ៉ូឡូដែលប្រែប្រួលរាល់វិនាទី។ | ដូចជាខ្សែក្រាហ្វវាស់ចង្វាក់បេះដូងនៅលើម៉ាស៊ីនពេទ្យ ដែលគូសជាខ្សែឡើងចុះបន្តបន្ទាប់តាមពេលវេលា។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖