បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយពីបញ្ហាប្រឈមនៃវិធីសាស្ត្រប្រពៃណី និងការរៀនដោយម៉ាស៊ីន (Machine learning) ក្នុងការរកឃើញជំងឺ និងសត្វល្អិតចង្រៃលើរុក្ខជាតិ ដែលចំណាយពេលយូរ និងទាមទារកម្លាំងពលកម្មច្រើន ដោយធ្វើការវាយតម្លៃលើភាពសុក្រឹត និងប្រសិទ្ធភាពខ្ពស់នៃបច្ចេកវិទ្យាសិក្សាស៊ីជម្រៅ (Deep learning) ជំនួសវិញ។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះផ្តល់នូវការត្រួតពិនិត្យឡើងវិញជាប្រព័ន្ធយ៉ាងទូលំទូលាយអំពីក្បួនដោះស្រាយនៃការសិក្សាស៊ីជម្រៅ (Deep learning algorithms) និងការប្រើប្រាស់តេឡេស្កុប (Remote sensing) ក្នុងការរកឃើញជំងឺ និងសត្វល្អិតកសិកម្ម។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Traditional Machine Learning (SVM, Random Forest) ការរៀនដោយម៉ាស៊ីនតាមបែបប្រពៃណី (ប្រើក្បួនដោះស្រាយ SVM និង Random Forest) |
ត្រូវការធនធានកុំព្យូទ័រតិចជាង និងដំណើរការបានលឿនជាងនៅលើម៉ាស៊ីនធម្មតា។ | ពឹងផ្អែកខ្លាំងលើការទាញយកលក្ខណៈពិសេសពីរូបភាពដោយដៃ ដែលងាយនឹងមានកំហុសពេលជួបបរិស្ថានស្មុគស្មាញ។ | ភាពសុក្រឹតប្រែប្រួលខ្ពស់ ឧទាហរណ៍ ៨៨.៨៩% ឬ ៩៦% ប៉ុន្តែមិនសូវមានស្ថិរភាពក្នុងលក្ខខណ្ឌពិតប្រាកដទេ។ |
| Convolutional Neural Networks (CNNs - VGG16, ResNet) បណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (ការចាត់ថ្នាក់រូបភាព) |
អាចទាញយកលក្ខណៈពិសេសនៃរូបភាពដោយស្វ័យប្រវត្តិ និងមានភាពសុក្រឹតខ្ពស់បំផុតក្នុងការចាត់ថ្នាក់ជំងឺ។ | ត្រូវការទិន្នន័យបណ្តុះបណ្តាលទំហំធំ និងប្រើប្រាស់ថាមពលកុំព្យូទ័រខ្លាំង (GPU) សម្រាប់ដំណើរការបណ្តុះបណ្តាល។ | សម្រេចបានភាពសុក្រឹតខ្ពស់រហូតដល់ចន្លោះ ៩៥% ទៅ ៩៩% លើសំណុំទិន្នន័យដូចជា PlantVillage។ |
| Object Detection Models (YOLO, Faster R-CNN) ម៉ូដែលកំណត់ទីតាំងវត្ថុគោលដៅ (YOLO ជំនាន់ផ្សេងៗ និង Faster R-CNN) |
អាចចាប់ទីតាំង និងកំណត់អត្តសញ្ញាណសត្វល្អិត ឬស្នាមជំងឺបានក្នុងពេលដំណាលគ្នាយ៉ាងឆាប់រហ័ស (Real-time)។ | នៅតែជួបការលំបាកក្នុងការកំណត់អត្តសញ្ញាណវត្ថុដែលមានទំហំតូចពេក ឬគោលដៅដែលនៅកៀកៗគ្នាខ្លាំង។ | ភាពសុក្រឹតនៃការចាប់គោលដៅ (mAP) ស្ថិតក្នុងរង្វង់ ៧១.៦% ដល់ ៩៥.៧% អាស្រ័យលើការកែលម្អម៉ូដែល។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការប្រើប្រាស់បច្ចេកវិទ្យាសិក្សាស៊ីជម្រៅ (Deep learning) សម្រាប់ការរកឃើញជំងឺរុក្ខជាតិទាមទារការវិនិយោគច្រើនលើទិន្នន័យ ធនធានកុំព្យូទ័រ និងអ្នកជំនាញបច្ចេកទេស។
ការសិក្សាភាគច្រើនប្រើប្រាស់សំណុំទិន្នន័យជាសកល (ដូចជា PlantVillage) ឬរូបភាពដែលថតក្នុងមន្ទីរពិសោធន៍ ដែលមានផ្ទៃខាងក្រោយសាមញ្ញ និងមិនតំណាងឱ្យភាពស្មុគស្មាញនៃបរិស្ថានកសិកម្មជាក់ស្តែង។ សម្រាប់ប្រទេសកម្ពុជា នេះគឺជាបញ្ហាប្រឈមធំ ព្រោះលក្ខខណ្ឌអាកាសធាតុ ពន្លឺ ស្មៅសៅក្បែរដំណាំ និងប្រភេទពូជដំណាំក្នុងស្រុក អាចមានលក្ខណៈខុសប្លែកទាំងស្រុងពីទិន្នន័យបើកចំហរទាំងនោះ។
បច្ចេកវិទ្យានេះមានសក្តានុពលដ៏ធំធេង និងអាចយកមកអនុវត្តប្រកបដោយប្រសិទ្ធភាពសម្រាប់ជំរុញវិស័យកសិកម្មឆ្លាតវៃ (Smart Agriculture) នៅប្រទេសកម្ពុជា។
ការបំប្លែងម៉ូដែលសិក្សាស៊ីជម្រៅទៅជាទម្រង់ស្រាល (Lightweight models) ដែលអាចដំណើរការលើទូរស័ព្ទដៃ និងដ្រូន នឹងជួយកសិករកម្ពុជាឱ្យចាត់វិធានការការពារទាន់ពេលវេលា ទប់ស្កាត់ការខាតបង់ទិន្នផល និងកាត់បន្ថយការប្រើប្រាស់ថ្នាំគីមីហួសកម្រិត។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Convolutional Neural Network (CNN) | ជាប្រភេទបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតដែលត្រូវបានរចនាឡើងយ៉ាងពិសេសសម្រាប់វិភាគ និងទាញយកលក្ខណៈសម្បត្តិពីរូបភាព (ដូចជាពណ៌ រាង និងសរសៃស្លឹក) ដោយស្វ័យប្រវត្តិ ដើម្បីចំណាត់ថ្នាក់ថាតើរុក្ខជាតិនោះមានជំងឺអ្វី។ | ដូចជាភ្នែក និងខួរក្បាលរបស់កសិករដែលមានបទពិសោធន៍ គ្រាន់តែក្រឡេកមើលស្លឹកឈើ ក៏ដឹងថាវាមានសភាពខុសប្រក្រតីត្រង់ចំណុចណាខ្លះ។ |
| Semantic Segmentation | ជាបច្ចេកទេសបែងចែករូបភាពក្នុងកម្រិតភីកសែល (Pixel) នីមួយៗ ដើម្បីកំណត់ទីតាំងជាក់លាក់នៃស្នាមជំងឺ ឬសត្វល្អិតនៅលើស្លឹកឈើ ដែលជួយក្នុងការវាស់ស្ទង់កម្រិតធ្ងន់ធ្ងរនៃជំងឺបានយ៉ាងច្បាស់លាស់។ | ដូចជាការយកប៊ិចមកផាត់ពណ៌ពីលើតែផ្នែកដែលខូចខាតលើរូបភាពស្លឹកឈើ ដើម្បីគណនាថាជំងឺស៊ីអស់ប៉ុន្មានភាគរយនៃស្លឹកទាំងមូល។ |
| Transfer Learning | ជាវិធីសាស្ត្រយកម៉ូដែលបញ្ញាសិប្បនិម្មិតដែលត្រូវបានបណ្តុះបណ្តាលរួចជាស្រេចលើទិន្នន័យទូទៅរាប់លានរូបភាព មកបន្តបង្ហាត់បន្ថែមលើទិន្នន័យកសិកម្មជាក់លាក់ ដើម្បីចំណេញពេលវេលា និងថាមពលកុំព្យូទ័រ។ | ដូចជាការយកសិស្សដែលចេះអាននិងសរសេរអក្សរយ៉ាងស្ទាត់ជំនាញរួចហើយ មកបង្រៀនបន្ថែមនូវវាក្យសព្ទពេទ្យ វាងាយស្រួលនិងលឿនជាងការបង្រៀនក្មេងដែលមិនទាន់ចេះអក្សរសោះ។ |
| Long Short-Term Memory (LSTM) | ជាប្រភេទបណ្តាញសរសៃប្រសាទដែលមានសមត្ថភាពចងចាំទិន្នន័យជាបន្តបន្ទាប់តាមពេលវេលា (Time-series) ដែលត្រូវបានគេប្រើប្រាស់រួមជាមួយទិន្នន័យអាកាសធាតុ ដើម្បីទស្សន៍ទាយពីការផ្ទុះឡើងនៃសត្វល្អិតចង្រៃនាពេលអនាគត។ | ដូចជាការកត់ត្រាអាកាសធាតុ និងការលេចឡើងនៃសត្វល្អិតរៀងរាល់ថ្ងៃក្នុងសៀវភៅ រួចយកទិន្នន័យចាស់ៗទាំងនោះមកទាយថាខែក្រោយអាកាសធាតុបែបនេះ សត្វល្អិតនឹងកើនឡើងឬអត់។ |
| Object Detection | ជាដំណើរការដែលកុំព្យូទ័រមិនត្រឹមតែប្រាប់ថាក្នុងរូបភាពមានសត្វល្អិតឬជំងឺនោះទេ តែវាថែមទាំងអាចគូសប្រអប់ហ៊ុមព័ទ្ធទីតាំងជាក់លាក់ និងរាប់ចំនួនសត្វល្អិតទាំងនោះក្នុងពេលតែមួយ (ឧទាហរណ៍ដូចជាម៉ូដែល YOLO)។ | ដូចជាការយកកែវយឺតឆ្លុះរកមើលសត្វល្អិតនៅលើដើមឈើ ហើយយកដីសគូសរង្វង់ចំណាំទុកទីតាំងរបស់សត្វល្អិតនីមួយៗដែលបានឃើញ។ |
| Remote Sensing | ជាការប្រមូលទិន្នន័យពីចម្ងាយ ដោយប្រើប្រាស់ឧបករណ៍ដូចជា ដ្រូន (UAVs) ឬផ្កាយរណប ដែលបំពាក់កាមេរ៉ាពិសេសៗ ដើម្បីតាមដានសុខភាពដំណាំលើផ្ទៃដីកសិកម្មធំៗដោយមិនបាច់ចុះផ្ទាល់។ | ដូចជាការឈរលើប៉មខ្ពស់មួយ ហើយប្រើកែវយឺតឆ្លុះមើលសភាពការណ៍ចម្ការទាំងមូលពីលើអាកាស។ |
| Multimodal Data | ជាការរួមបញ្ចូលប្រភេទទិន្នន័យច្រើនទម្រង់ខុសៗគ្នា (ដូចជារូបភាពធម្មតា រូបភាពកាំរស្មីអុបទិក ទិន្នន័យអាកាសធាតុ និងទិន្នន័យដី) ដើម្បីជួយឲ្យម៉ូដែលបញ្ញាសិប្បនិម្មិតធ្វើការវិភាគបានកាន់តែសុក្រឹតនិងត្រឹមត្រូវ។ | ដូចជាការធ្វើរោគវិនិច្ឆ័យរបស់អ្នកគ្រូពេទ្យ ដែលទាមទារទាំងការស្ទាបស្ទង់កម្តៅ ការមើលពណ៌ស្បែក និងការយកឈាមទៅពិនិត្យ ដើម្បីឲ្យដឹងច្បាស់ថាអ្នកជំងឺកើតអីពិតប្រាកដ។ |
| Lightweight Models | ជាការកែច្នៃម៉ូដែលបញ្ញាសិប្បនិម្មិតឲ្យមានទំហំតូច និងប្រើប្រាស់ធនធានកុំព្យូទ័រតិចបំផុត ដើម្បីអាចដំឡើងនិងដំណើរការបានយ៉ាងរលូននៅលើឧបករណ៍ចល័ត ស្មាតហ្វូន ឬដ្រូននៅតាមទីវាលដោយមិនបាច់មានអ៊ីនធឺណិត។ | ដូចជាការវេចខ្ចប់សៀវភៅក្បួនខ្នាតក្រាស់ៗ រួចសង្ខេបយកតែចំណុចសំខាន់ៗបំផុតដាក់ចូលក្នុងសៀវភៅហោប៉ៅតូចមួយ ដើម្បីងាយស្រួលយួរតាមខ្លួនចូលទៅក្នុងចម្ការ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖