បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហានៃការកែលម្អប្រសិទ្ធភាពក្នុងការទទួលស្គាល់ និងចាត់ថ្នាក់ជំងឺស្លឹកស្រូវ ដោយសារតែការស្រាវជ្រាវកន្លងមកមិនទាន់បានវាយតម្លៃលម្អិតលើការរួមបញ្ចូលគ្នារវាងម៉ូដែល Transfer Learning និងក្បួនដោះស្រាយអុបទិមម្កម្ម (Optimization Algorithms) ដើម្បីទទួលបានលទ្ធផលជាក់លាក់នៅឡើយ។
វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានអនុវត្តការពិសោធន៍ដោយផ្គូផ្គងក្បួនដោះស្រាយអុបទិមម្កម្មចំនួន ៥ ជាមួយម៉ូដែល Deep Learning ចំនួន ៦ លើទិន្នន័យរូបភាពស្លឹកស្រូវ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Xception + RMSprop ម៉ូដែល Xception ជាមួយក្បួនដោះស្រាយ RMSprop |
មានស្ថេរភាពក្នុងការរៀន និងផ្តល់នូវភាពត្រឹមត្រូវខ្ពស់បំផុតក្នុងការធ្វើតេស្តជាក់ស្តែង។ | ត្រូវការធនធានកុំព្យូទ័រខ្លាំងជាងម៉ូដែលតូចៗដូចជា MobileNet បន្តិច។ | ទទួលបានពិន្ទុ F1-Score ៨១% និងភាពត្រឹមត្រូវ (Accuracy) ៨៨%។ |
| ResNet50V2 + Adam ម៉ូដែល ResNet50V2 ជាមួយក្បួនដោះស្រាយ Adam |
មានល្បឿននៃការរៀនលឿន (Fast convergence) និងផ្តល់លទ្ធផលល្អប្រសើរជិតស្មើនឹង RMSprop។ | មានកំហុសខ្លះក្នុងការកំណត់អត្តសញ្ញាណស្លឹកស្រូវដែលមានសុខភាពល្អ (Healthy leaves)។ | ទទួលបានពិន្ទុ F1-Score ៨៧% និងភាពត្រឹមត្រូវ (Accuracy) ៧៨%។ |
| MobileNet + Adadelta ម៉ូដែល MobileNet ជាមួយក្បួនដោះស្រាយ Adadelta |
មិនត្រូវការកំណត់ Learning Rate ដោយដៃ (Manually) ព្រោះវាប្រែប្រួលដោយស្វ័យប្រវត្តិ។ | អត្រានៃការរៀន (Learning rate) ថយចុះលឿនពេក ធ្វើឱ្យម៉ូដែលឈប់រៀនមុនពេលកំណត់ ដែលនាំឱ្យប្រសិទ្ធភាពទាបបំផុត។ | ទទួលបានភាពត្រឹមត្រូវ (Accuracy) ទាបបំផុតត្រឹមតែ ៤៩% ប៉ុណ្ណោះ។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការពិសោធន៍នេះប្រើប្រាស់ធនធានកុំព្យូទ័រក្នុងកម្រិតមធ្យម ដែលអាចអនុវត្តបានក្នុងបរិបទសាកលវិទ្យាល័យនៅកម្ពុជា។
ទិន្នន័យត្រូវបានប្រមូលពីវិទ្យាស្ថានស្រូវនៅតំបន់ដីសណ្តទន្លេមេគង្គ (ប្រទេសវៀតណាម) ដែលមានលក្ខណៈភូមិសាស្ត្រ និងប្រភេទជំងឺស្រូវ (ដូចជា Brown Spot, Blast) ស្រដៀងគ្នាខ្លាំងទៅនឹងប្រទេសកម្ពុជា។ ទោះជាយ៉ាងណាក៏ដោយ រូបភាពត្រូវបានកាត់ផ្ទៃខាងក្រោយ (Background removed) ដែលអាចធ្វើឱ្យម៉ូដែលជួបការលំបាកនៅពេលអនុវត្តលើរូបភាពថតផ្ទាល់នៅវាលស្រែដែលមានផ្ទៃខាងក្រោយរញ៉េរញ៉ៃ។
វិធីសាស្ត្រនេះមានប្រយោជន៍ និងអាចអនុវត្តបានខ្ពស់នៅក្នុងវិស័យកសិកម្មរបស់ប្រទេសកម្ពុជា ជាពិសេសសម្រាប់ការអភិវឌ្ឍប្រព័ន្ធកសិកម្មឆ្លាតវៃ។
ការរកឃើញថា RMSprop ដំណើរការល្អជាមួយ Xception គឺជាចំណុចសំខាន់សម្រាប់អ្នកអភិវឌ្ឍន៍នៅកម្ពុជា ដោយមិនចាំបាច់ចំណាយពេលសាកល្បងក្បួនដោះស្រាយផ្សេងទៀតឡើងវិញ។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Transfer Learning | ជាបច្ចេកទេសក្នុងវិទ្យាសាស្ត្រកុំព្យូទ័រ ដែលយកចំណេះដឹងពីម៉ូដែលដែលបានបង្វឹករួច (Pre-trained model) លើទិន្នន័យធំៗ (ដូចជា ImageNet) មកអនុវត្តបន្តលើបញ្ហាថ្មី (ដូចជាជំងឺស្រូវ) ដើម្បីចំណេញពេល និងធនធាន។ | ដូចជាអ្នកចេះជិះកង់ហើយ ទៅរៀនជិះម៉ូតូ គឺងាយស្រួលនិងរហ័សជាងអ្នកមិនចេះសោះ ព្រោះមានមូលដ្ឋានលំនឹងស្រាប់។ |
| Optimization Algorithm | ជាក្បួនគណិតវិទ្យាដែលប្រើសម្រាប់កែតម្រូវប៉ារ៉ាម៉ែត្រ (Weights) នៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត ដើម្បីកាត់បន្ថយកំហុស (Loss) និងធ្វើឱ្យម៉ូដែលកាន់តែមានភាពឆ្លាតវៃក្នុងការទស្សន៍ទាយ។ | ប្រៀបដូចជាការបង្វិលគន្លឹះរលកវិទ្យុចុះឡើង ដើម្បីស្វែងរកប៉ុស្តិ៍ដែលមានសំឡេងច្បាស់បំផុត។ |
| RMSprop | មកពីពាក្យ Root Mean Squared Propagation ជាក្បួនអុបទិមម្កម្មដែលកែសម្រួលល្បឿននៃការរៀន (Learning rate) ដោយស្វ័យប្រវត្តិសម្រាប់ប៉ារ៉ាម៉ែត្រនីមួយៗ ដោយផ្អែកលើមធ្យមភាគនៃជម្រាល (Gradient) ពីមុនៗ ដើម្បីការពារកុំឱ្យការរៀនប្រែប្រួលខ្លាំងពេក។ | ដូចជាការបើកបររថយន្តដែលចេះបន្ថយល្បឿនដោយខ្លួនឯងនៅផ្លូវកោង និងបន្ថែមល្បឿននៅផ្លូវត្រង់ដើម្បីសុវត្ថិភាព។ |
| Learning Rate | ជាចំនួនតួលេខ (Hyperparameter) ដែលកំណត់ថាតើម៉ូដែលគួរកែប្រែចំណេះដឹងរបស់ខ្លួនខ្លាំងប៉ុណ្ណា រាល់ពេលដែលវាជួបកំហុស។ បើកំណត់ធំពេកម៉ូដែលអាចរៀនខុស បើកំណត់តូចពេកម៉ូដែលរៀនយឺត។ | ដូចជាជំហាននៃការដើរ បើដើរជំហានវែងពេកអាចហួសគោលដៅ បើដើរជំហានខ្លីពេកអាចប្រើពេលយូរទើបដល់។ |
| Confusion Matrix | ជាតារាងដែលប្រើដើម្បីវាយតម្លៃសមត្ថភាពម៉ូដែល ដោយបង្ហាញលម្អិតថា តើម៉ូដែលទាយត្រូវប៉ុន្មាន និងទាយខុសជាអ្វីខ្លះ (ឧទាហរណ៍៖ ទាយថា 'ជំងឺត្នោត' តែការពិតជា 'ជំងឺបាក់តេរី')។ | ដូចជាតារាងពិន្ទុរបស់គ្រូដែលមិនត្រឹមតែដាក់ពិន្ទុសរុបទេ តែប្រាប់លម្អិតថាខុសត្រង់សំណួរណាខ្លះ និងខុសព្រោះអ្វី។ |
| F1-Score | ជាខ្នាតរង្វាស់ប្រសិទ្ធភាពម៉ូដែលដែលគណនាចេញពីមធ្យមភាគរវាងភាពជាក់លាក់ (Precision) និងភាពគ្របដណ្តប់ (Recall)។ វាសំខាន់ណាស់នៅពេលដែលទិន្នន័យមិនមានតុល្យភាព (Imbalanced Data)។ | ដូចជាការវាយតម្លៃកីឡាករបាល់ទាត់ម្នាក់ថាល្អ មិនមែនមើលតែលើចំនួនគ្រាប់បាល់ដែលស៊ុតចូលទេ តែត្រូវមើលទាំងចំនួនដែលស៊ុតខុស និងការបញ្ជូនបាល់ឱ្យគេផងដែរ។ |
| Epoch | ជាវដ្តនៃការបង្វឹកម៉ូដែល ដែលរាប់នៅពេលដែលទិន្នន័យទាំងអស់ (Entire Dataset) ត្រូវបានបញ្ជូនចូលទៅក្នុងម៉ូដែលដើម្បីរៀន និងត្រឡប់មកវិញ (Forward and Backward pass) បានម្តង។ | ដូចជាការអានសៀវភៅសិក្សាមួយក្បាលចប់ពីដើមដល់ចប់ បានមួយចប់ (១ ជុំ)។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖