Original Title: Evaluation of the Efficiency of the Optimization Algorithms for Transfer Learning on the Rice Leaf Disease Dataset
Source: www.ijacsa.thesai.org
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការវាយតម្លៃប្រសិទ្ធភាពនៃក្បួនដោះស្រាយអុបទិមម្កម្មសម្រាប់ការរៀនបញ្ជូន (Transfer Learning) លើសំណុំទិន្នន័យជំងឺស្លឹកស្រូវ

ចំណងជើងដើម៖ Evaluation of the Efficiency of the Optimization Algorithms for Transfer Learning on the Rice Leaf Disease Dataset

អ្នកនិពន្ធ៖ Luyl-Da Quach (FPT University, Vietnam), Khang Nguyen Quoc (FPT University, Vietnam), Anh Nguyen Quynh (FPT University, Vietnam), Hoang Tran Ngoc (FPT University, Vietnam)

ឆ្នាំបោះពុម្ព៖ 2022 (International Journal of Advanced Computer Science and Applications)

វិស័យសិក្សា៖ Computer Science / Agricultural Technology

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហានៃការកែលម្អប្រសិទ្ធភាពក្នុងការទទួលស្គាល់ និងចាត់ថ្នាក់ជំងឺស្លឹកស្រូវ ដោយសារតែការស្រាវជ្រាវកន្លងមកមិនទាន់បានវាយតម្លៃលម្អិតលើការរួមបញ្ចូលគ្នារវាងម៉ូដែល Transfer Learning និងក្បួនដោះស្រាយអុបទិមម្កម្ម (Optimization Algorithms) ដើម្បីទទួលបានលទ្ធផលជាក់លាក់នៅឡើយ។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានអនុវត្តការពិសោធន៍ដោយផ្គូផ្គងក្បួនដោះស្រាយអុបទិមម្កម្មចំនួន ៥ ជាមួយម៉ូដែល Deep Learning ចំនួន ៦ លើទិន្នន័យរូបភាពស្លឹកស្រូវ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Xception + RMSprop
ម៉ូដែល Xception ជាមួយក្បួនដោះស្រាយ RMSprop
មានស្ថេរភាពក្នុងការរៀន និងផ្តល់នូវភាពត្រឹមត្រូវខ្ពស់បំផុតក្នុងការធ្វើតេស្តជាក់ស្តែង។ ត្រូវការធនធានកុំព្យូទ័រខ្លាំងជាងម៉ូដែលតូចៗដូចជា MobileNet បន្តិច។ ទទួលបានពិន្ទុ F1-Score ៨១% និងភាពត្រឹមត្រូវ (Accuracy) ៨៨%។
ResNet50V2 + Adam
ម៉ូដែល ResNet50V2 ជាមួយក្បួនដោះស្រាយ Adam
មានល្បឿននៃការរៀនលឿន (Fast convergence) និងផ្តល់លទ្ធផលល្អប្រសើរជិតស្មើនឹង RMSprop។ មានកំហុសខ្លះក្នុងការកំណត់អត្តសញ្ញាណស្លឹកស្រូវដែលមានសុខភាពល្អ (Healthy leaves)។ ទទួលបានពិន្ទុ F1-Score ៨៧% និងភាពត្រឹមត្រូវ (Accuracy) ៧៨%។
MobileNet + Adadelta
ម៉ូដែល MobileNet ជាមួយក្បួនដោះស្រាយ Adadelta
មិនត្រូវការកំណត់ Learning Rate ដោយដៃ (Manually) ព្រោះវាប្រែប្រួលដោយស្វ័យប្រវត្តិ។ អត្រានៃការរៀន (Learning rate) ថយចុះលឿនពេក ធ្វើឱ្យម៉ូដែលឈប់រៀនមុនពេលកំណត់ ដែលនាំឱ្យប្រសិទ្ធភាពទាបបំផុត។ ទទួលបានភាពត្រឹមត្រូវ (Accuracy) ទាបបំផុតត្រឹមតែ ៤៩% ប៉ុណ្ណោះ។

ការចំណាយលើធនធាន (Resource Cost)៖ ការពិសោធន៍នេះប្រើប្រាស់ធនធានកុំព្យូទ័រក្នុងកម្រិតមធ្យម ដែលអាចអនុវត្តបានក្នុងបរិបទសាកលវិទ្យាល័យនៅកម្ពុជា។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ទិន្នន័យត្រូវបានប្រមូលពីវិទ្យាស្ថានស្រូវនៅតំបន់ដីសណ្តទន្លេមេគង្គ (ប្រទេសវៀតណាម) ដែលមានលក្ខណៈភូមិសាស្ត្រ និងប្រភេទជំងឺស្រូវ (ដូចជា Brown Spot, Blast) ស្រដៀងគ្នាខ្លាំងទៅនឹងប្រទេសកម្ពុជា។ ទោះជាយ៉ាងណាក៏ដោយ រូបភាពត្រូវបានកាត់ផ្ទៃខាងក្រោយ (Background removed) ដែលអាចធ្វើឱ្យម៉ូដែលជួបការលំបាកនៅពេលអនុវត្តលើរូបភាពថតផ្ទាល់នៅវាលស្រែដែលមានផ្ទៃខាងក្រោយរញ៉េរញ៉ៃ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានប្រយោជន៍ និងអាចអនុវត្តបានខ្ពស់នៅក្នុងវិស័យកសិកម្មរបស់ប្រទេសកម្ពុជា ជាពិសេសសម្រាប់ការអភិវឌ្ឍប្រព័ន្ធកសិកម្មឆ្លាតវៃ។

ការរកឃើញថា RMSprop ដំណើរការល្អជាមួយ Xception គឺជាចំណុចសំខាន់សម្រាប់អ្នកអភិវឌ្ឍន៍នៅកម្ពុជា ដោយមិនចាំបាច់ចំណាយពេលសាកល្បងក្បួនដោះស្រាយផ្សេងទៀតឡើងវិញ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ការប្រមូល និងរៀបចំទិន្នន័យក្នុងស្រុក: និស្សិតគួរចុះទៅថតរូបភាពជំងឺស្រូវនៅតាមវាលស្រែក្នុងស្រុក ដើម្បីបន្ថែមលើ Dataset របស់វៀតណាម ដោយប្រើប្រាស់បច្ចេកទេស Augmentation និង Background Removal ដូចការសិក្សានេះ។
  2. ការជ្រើសរើស និងបង្វឹកម៉ូដែល: ចាប់ផ្តើមអនុវត្តដោយប្រើបណ្ណាល័យ TensorFlow ឬ Keras ដើម្បីសាកល្បងម៉ូដែល Transfer Learning (Xception) រួមជាមួយ RMSprop optimizer ដោយកំណត់ Learning rate 0.001 ដូចក្នុងឯកសារ។
  3. ការវាយតម្លៃ និងកែលម្អ: ប្រើប្រាស់ Confusion Matrix និង F1-Score ដើម្បីវាស់វែងប្រសិទ្ធភាព ជាពិសេសលើជំងឺស្រូវដែលពិបាកបែងចែក (ដូចជា Bacterial blight vs Leaf streak)។
  4. ការបង្កើតប្រព័ន្ធសាកល្បង (Prototype): បង្កើត Web Application សាមញ្ញមួយដែលអនុញ្ញាតឱ្យកសិករថតរូប និងទទួលបានការវិនិច្ឆ័យភ្លាមៗ ដោយភ្ជាប់ជាមួយអនុសាសន៍ការព្យាបាលជាភាសាខ្មែរ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Transfer Learning ជាបច្ចេកទេសក្នុងវិទ្យាសាស្ត្រកុំព្យូទ័រ ដែលយកចំណេះដឹងពីម៉ូដែលដែលបានបង្វឹករួច (Pre-trained model) លើទិន្នន័យធំៗ (ដូចជា ImageNet) មកអនុវត្តបន្តលើបញ្ហាថ្មី (ដូចជាជំងឺស្រូវ) ដើម្បីចំណេញពេល និងធនធាន។ ដូចជាអ្នកចេះជិះកង់ហើយ ទៅរៀនជិះម៉ូតូ គឺងាយស្រួលនិងរហ័សជាងអ្នកមិនចេះសោះ ព្រោះមានមូលដ្ឋានលំនឹងស្រាប់។
Optimization Algorithm ជាក្បួនគណិតវិទ្យាដែលប្រើសម្រាប់កែតម្រូវប៉ារ៉ាម៉ែត្រ (Weights) នៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត ដើម្បីកាត់បន្ថយកំហុស (Loss) និងធ្វើឱ្យម៉ូដែលកាន់តែមានភាពឆ្លាតវៃក្នុងការទស្សន៍ទាយ។ ប្រៀបដូចជាការបង្វិលគន្លឹះរលកវិទ្យុចុះឡើង ដើម្បីស្វែងរកប៉ុស្តិ៍ដែលមានសំឡេងច្បាស់បំផុត។
RMSprop មកពីពាក្យ Root Mean Squared Propagation ជាក្បួនអុបទិមម្កម្មដែលកែសម្រួលល្បឿននៃការរៀន (Learning rate) ដោយស្វ័យប្រវត្តិសម្រាប់ប៉ារ៉ាម៉ែត្រនីមួយៗ ដោយផ្អែកលើមធ្យមភាគនៃជម្រាល (Gradient) ពីមុនៗ ដើម្បីការពារកុំឱ្យការរៀនប្រែប្រួលខ្លាំងពេក។ ដូចជាការបើកបររថយន្តដែលចេះបន្ថយល្បឿនដោយខ្លួនឯងនៅផ្លូវកោង និងបន្ថែមល្បឿននៅផ្លូវត្រង់ដើម្បីសុវត្ថិភាព។
Learning Rate ជាចំនួនតួលេខ (Hyperparameter) ដែលកំណត់ថាតើម៉ូដែលគួរកែប្រែចំណេះដឹងរបស់ខ្លួនខ្លាំងប៉ុណ្ណា រាល់ពេលដែលវាជួបកំហុស។ បើកំណត់ធំពេកម៉ូដែលអាចរៀនខុស បើកំណត់តូចពេកម៉ូដែលរៀនយឺត។ ដូចជាជំហាននៃការដើរ បើដើរជំហានវែងពេកអាចហួសគោលដៅ បើដើរជំហានខ្លីពេកអាចប្រើពេលយូរទើបដល់។
Confusion Matrix ជាតារាងដែលប្រើដើម្បីវាយតម្លៃសមត្ថភាពម៉ូដែល ដោយបង្ហាញលម្អិតថា តើម៉ូដែលទាយត្រូវប៉ុន្មាន និងទាយខុសជាអ្វីខ្លះ (ឧទាហរណ៍៖ ទាយថា 'ជំងឺត្នោត' តែការពិតជា 'ជំងឺបាក់តេរី')។ ដូចជាតារាងពិន្ទុរបស់គ្រូដែលមិនត្រឹមតែដាក់ពិន្ទុសរុបទេ តែប្រាប់លម្អិតថាខុសត្រង់សំណួរណាខ្លះ និងខុសព្រោះអ្វី។
F1-Score ជាខ្នាតរង្វាស់ប្រសិទ្ធភាពម៉ូដែលដែលគណនាចេញពីមធ្យមភាគរវាងភាពជាក់លាក់ (Precision) និងភាពគ្របដណ្តប់ (Recall)។ វាសំខាន់ណាស់នៅពេលដែលទិន្នន័យមិនមានតុល្យភាព (Imbalanced Data)។ ដូចជាការវាយតម្លៃកីឡាករបាល់ទាត់ម្នាក់ថាល្អ មិនមែនមើលតែលើចំនួនគ្រាប់បាល់ដែលស៊ុតចូលទេ តែត្រូវមើលទាំងចំនួនដែលស៊ុតខុស និងការបញ្ជូនបាល់ឱ្យគេផងដែរ។
Epoch ជាវដ្តនៃការបង្វឹកម៉ូដែល ដែលរាប់នៅពេលដែលទិន្នន័យទាំងអស់ (Entire Dataset) ត្រូវបានបញ្ជូនចូលទៅក្នុងម៉ូដែលដើម្បីរៀន និងត្រឡប់មកវិញ (Forward and Backward pass) បានម្តង។ ដូចជាការអានសៀវភៅសិក្សាមួយក្បាលចប់ពីដើមដល់ចប់ បានមួយចប់ (១ ជុំ)។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖