បញ្ហា (The Problem)៖ ជំងឺរុក្ខជាតិបង្កការគំរាមកំហែងដល់សន្តិសុខស្បៀង ខណៈពេលដែលម៉ូដែលបញ្ញាសិប្បនិម្មិត (AI) បច្ចុប្បន្នភាគច្រើនមានទំហំធំ ទាមទារថាមពលកុំព្យូទ័រខ្ពស់ និងពិបាកយកទៅប្រើប្រាស់ក្នុងឧបករណ៍ដែលមានធនធានកម្រិតទាប។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានអភិវឌ្ឍម៉ូដែលបណ្ដាញសរសៃប្រសាទខុនវ៉ូលូសិន (CNN) ថ្មីមួយដែលស៊ីធនធានតិច ដោយប្រើប្រាស់ទិន្នន័យរូបភាពស្លឹករុក្ខជាតិពីចម្ការផ្ទាល់នៅក្នុងប្រទេសអ៊ីរ៉ាក់។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Proposed CNN Model (Lightweight) ម៉ូដែល CNN ស្រាលដែលបានស្នើឡើង |
មានភាពត្រឹមត្រូវខ្ពស់បំផុត និងប្រើប្រាស់ទំហំគណនាតិចតួចបំផុត ដែលស័ក្តិសមឥតខ្ចោះសម្រាប់ឧបករណ៍ដែលមានធនធានខ្សោយ។ មានសមត្ថភាពចាប់យកលក្ខណៈពិសេសបានល្អតាមរយៈប្លុក Squeeze-Excitation និង Global Context។ | ដោយសារតែមានប៉ារ៉ាម៉ែត្រតិចតួច ម៉ូដែលនេះអាចប្រឈមនឹងការពិបាកក្នុងការវិភាគលើប្រភេទជំងឺដែលស្មុគស្មាញខ្លាំង ឬទិន្នន័យដែលមានភាពចម្រុះលើសពីកម្រិតដែលបានហ្វឹកហាត់។ | ភាពត្រឹមត្រូវ ៩៩%, FLOPs ៣៣៥ លាន, ប៉ារ៉ាម៉ែត្រ ១៧២,៣១៤ |
| EfficientNet_b0 ម៉ូដែល EfficientNet_b0 |
មានតុល្យភាពល្អរវាងភាពត្រឹមត្រូវ និងទំហំគណនា ដែលស៊ីធនធានតិចជាងម៉ូដែលធំៗដូចជា VGG16 និង ResNet។ | ទោះជាមានទំហំតូចជាងម៉ូដែលជំនាន់មុន ក៏នៅតែទាមទារប៉ារ៉ាម៉ែត្រច្រើនជាងម៉ូដែលស្នើឡើងរហូតដល់ជាង ៣០ដង។ | ភាពត្រឹមត្រូវ ៩២%, FLOPs ៧៤៦ លាន, ប៉ារ៉ាម៉ែត្រ ៥.២ លាន |
| ResNet50 ម៉ូដែល ResNet50 |
អាចរៀនពីលក្ខណៈពិសេសនៃរូបភាពដ៏ស្មុគស្មាញបានល្អ និងមានភាពត្រឹមត្រូវខ្ពស់ដោយសារស្ថាបត្យកម្មដ៏ជ្រៅរបស់វា។ | ទាមទារថាមពលគណនា និងមេម៉ូរីខ្ពស់ខ្លាំង ដែលមិនស័ក្តិសមទាល់តែសោះសម្រាប់ឧបករណ៍ចល័ត ឬ Edge devices តូចៗ។ | ភាពត្រឹមត្រូវ ៩៣%, FLOPs ៧.៦ ពាន់លាន, ប៉ារ៉ាម៉ែត្រ ២៥.៥ លាន |
| VGG16 ម៉ូដែល VGG16 |
មានរចនាសម្ព័ន្ធសាមញ្ញ និងងាយស្រួលយល់ ដែលអាចចាប់យកទម្រង់រាងនៃស្លឹកឈើបានល្អ។ | ស៊ីមេម៉ូរី និងថាមពលគណនាច្រើនមហាសាល (FLOPs ជាង ២៧ ពាន់លាន) ព្រមទាំងងាយរងបញ្ហា Overfitting ។ | ភាពត្រឹមត្រូវ ៩២%, FLOPs ២៧.២ ពាន់លាន, ប៉ារ៉ាម៉ែត្រ ១៣៨ លាន |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះផ្ដោតសំខាន់លើការរចនាម៉ូដែលដែលប្រើប្រាស់ធនធានកុំព្យូទ័រ (RAM, GPU, CPU) ក្នុងកម្រិតអប្បបរមាបំផុត ដើម្បីឱ្យអាចដំណើរការបានលើឧបករណ៍ចុងស្រវាយ (Edge devices)។
ទិន្នន័យដែលប្រើក្នុងការសិក្សានេះ ត្រូវបានប្រមូលផ្តាច់មុខពីចម្ការនៅក្នុងប្រទេសអ៊ីរ៉ាក់ (Iraqi orchards) លើផ្លែក្រូច ល្វា និងទំពាំងបាយជូរ។ ការណ៍នេះអាចបណ្តាលឱ្យមានភាពលម្អៀង (Data Bias) ព្រោះអាកាសធាតុ ពន្លឺ និងពូជដំណាំនៅទីនោះអាចខុសគ្នាពីប្រទេសផ្សេងៗ។ សម្រាប់ប្រទេសកម្ពុជា ម៉ូដែលនេះចាំបាច់ត្រូវមានការហ្វឹកហាត់បន្ថែមជាមួយទិន្នន័យក្នុងស្រុក ដើម្បីអាចស្គាល់រោគសញ្ញាជំងឺរុក្ខជាតិដែលកើតមានក្នុងតំបន់ត្រូពិចបានត្រឹមត្រូវ។
ទោះបីជាប្រភពទិន្នន័យស្ថិតនៅតំបន់ផ្សេងក៏ដោយ ក៏ស្ថាបត្យកម្ម CNN ដ៏ស្រាលនេះមានសក្តានុពល និងអត្ថប្រយោជន៍ខ្ពស់បំផុតសម្រាប់ការយកមកកែច្នៃអនុវត្តក្នុងវិស័យកសិកម្មនៅកម្ពុជា។
ជារួម ការសិក្សានេះបានផ្តល់នូវដំណោះស្រាយបច្ចេកវិទ្យាដ៏សមស្របមួយសម្រាប់ប្រទេសកំពុងអភិវឌ្ឍន៍ដូចជាកម្ពុជា ក្នុងការនាំយកបច្ចេកវិទ្យា AI ដែលមានតម្លៃថោក និងប្រសិទ្ធភាពខ្ពស់ ទៅដល់ដៃកសិករនៅទីវាលដោយផ្ទាល់។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Convolutional Neural Network (CNN) | បណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតដែលត្រូវបានរចនាឡើងយ៉ាងពិសេសសម្រាប់វិភាគ និងទាញយកលក្ខណៈសម្បត្តិពីរូបភាព ដោយឆ្លងកាត់ស្រទាប់ចម្រោះ (Filters) ជាច្រើនតំណាក់កាលដើម្បីស្គាល់ទម្រង់ ឬវត្ថុផ្សេងៗ។ | ដូចជាភ្នែក និងខួរក្បាលរបស់មនុស្សដែលសម្លឹងមើលរូបភាពមួយ រួចវិភាគពីពណ៌ រូបរាង និងលំនាំ ដើម្បីដឹងថារូបនោះជារូបអ្វីពិតប្រាកដ។ |
| FLOPs | រង្វាស់នៃចំនួនប្រតិបត្តិការគណនាទសភាគ (Floating-Point Operations) ដែលម៉ូដែល AI ត្រូវធ្វើការ។ វាតំណាងឱ្យកម្រិតនៃទំហំការងារ និងថាមពលកុំព្យូទ័រដែលម៉ូដែលត្រូវការដើម្បីដំណើរការការទស្សន៍ទាយមួយ។ | ដូចជាចំនួនជំហាននៃការគណនាលេខបូកដកគុណចែក ដែលសិស្សម្នាក់ត្រូវសរសេរដើម្បីរកចម្លើយលំហាត់គណិតវិទ្យាមួយអញ្ចឹង (កាន់តែច្រើន គឺកាន់តែហត់ និងស៊ីពេល)។ |
| Squeeze-Excitation (SE) | ប្លុកស្ថាបត្យកម្មនៅក្នុង CNN ដែលជួយឱ្យម៉ូដែលចេះថ្លឹងថ្លែងពីសារៈសំខាន់នៃលក្ខណៈពិសេសនីមួយៗ (Channels) ដោយសង្កត់ធ្ងន់លើព័ត៌មានដែលសំខាន់បំផុត និងទម្លាក់ចោលព័ត៌មានដែលមិនសូវមានប្រយោជន៍។ | ដូចជាការពាក់វ៉ែនតាដែលជួយកាត់ចំណាំងផ្លាត និងផ្តោតពន្លឺតែទៅលើចំណុចដែលយើងចង់មើលឱ្យបានច្បាស់ ខណៈពេលព្រិលផ្ទៃខាងក្រោយចោល។ |
| Depthwise Separable Convolutions | បច្ចេកទេសបំបែកការគណនា Convolution ជាពីរដំណាក់កាលដាច់ដោយឡែកពីគ្នា (តាមជម្រៅ និងតាមចំណុច) ដើម្បីកាត់បន្ថយទំហំនៃការគណនា និងចំនួនប៉ារ៉ាម៉ែត្ររបស់ម៉ូដែលយ៉ាងសន្ធឹកសន្ធាប់ ដោយមិនធ្វើឱ្យបាត់បង់ភាពត្រឹមត្រូវ។ | ជំនួសឱ្យការធ្វើការងារស្មុគស្មាញមួយដោយកម្លាំងមនុស្សម្នាក់ វាដូចជាការបែងចែកការងារនោះជាពីរដំណាក់កាលតូចៗឱ្យមនុស្សពីរនាក់ធ្វើ ដែលលឿនជាង និងចំណាយកម្លាំងតិចជាង។ |
| Data Augmentation | បច្ចេកទេសក្នុងការបង្កើតទិន្នន័យហ្វឹកហាត់ថ្មីៗបន្ថែមពីទិន្នន័យដើមដែលមានស្រាប់ (ដូចជាការបង្វិលរូប ផ្លាស់ប្តូរពន្លឺ ឬពង្រីកបង្រួម) ដើម្បីជួយឱ្យម៉ូដែល AI រៀនបានកាន់តែច្រើន និងកាត់បន្ថយបញ្ហា Overfitting។ | ដូចជាការឱ្យសិស្សហាត់ធ្វើលំហាត់ដដែលៗ ប៉ុន្តែគ្រូប្តូរតួលេខ និងរបៀបសួរ ដើម្បីឱ្យសិស្សចេះដោះស្រាយគ្រប់កាលៈទេសៈ មិនមែនគ្រាន់តែទន្ទេញចាំមាត់។ |
| OneCycleLR | យុទ្ធសាស្ត្រក្នុងការកែតម្រូវល្បឿននៃការរៀនសូត្រ (Learning Rate) របស់ម៉ូដែល AI អំឡុងពេលហ្វឹកហាត់ ដោយចាប់ផ្តើមពីល្បឿនយឺត រួចបង្កើនដល់ចំណុចកំពូល និងបន្ថយមកវិញ ដើម្បីជួយឱ្យម៉ូដែលរៀនបានលឿន និងចៀសផុតពីការជាប់គាំង។ | ដូចជាការធាក់កង់ប្រណាំងអញ្ចឹង ចាប់ផ្តើមធាក់មួយៗសិនដើម្បីសន្សំកម្លាំង រួចបញ្ចេញកម្លាំងធាក់ឱ្យលឿនបំផុតនៅកណ្តាលទី និងបន្ថយល្បឿនបន្តិចម្តងៗវិញពេលជិតដល់ទីដៅ។ |
| Adaptive-Average Pool | ស្រទាប់នៅក្នុងបណ្ដាញសរសៃប្រសាទដែលបង្រួញទំហំផ្ទៃនៃទិន្នន័យរូបភាពឱ្យមកនៅទំហំថេរមួយដែលចង់បាន ដោយយកតម្លៃមធ្យមនៃតំបន់នីមួយៗ ដែលជួយកាត់បន្ថយប៉ារ៉ាម៉ែត្រមុននឹងបញ្ជូនទៅស្រទាប់ចុងក្រោយ។ | ដូចជាការសង្ខេបសៀវភៅអត្ថបទដ៏វែងមួយឱ្យនៅសល់តែខ្លឹមសារសំខាន់ៗមួយទំព័រ ដើម្បីងាយស្រួលយល់ និងរហ័សក្នុងការអាន។ |
| overfitting | បញ្ហាដែលម៉ូដែល AI រៀនទន្ទេញចាំតែទិន្នន័យហ្វឹកហាត់បានល្អឥតខ្ចោះ ប៉ុន្តែមិនអាចធ្វើការទស្សន៍ទាយបានត្រឹមត្រូវទេនៅពេលវាជួបប្រទះទិន្នន័យថ្មីៗដែលវាមិនធ្លាប់ឃើញពីមុនមកក្នុងពិភពពិត។ | ដូចជាសិស្សដែលទន្ទេញវិញ្ញាសាប្រឡងចាស់ចាំយ៉ាងស្ទាត់ ប៉ុន្តែពេលប្រឡងពិតប្រាកដចេញខុសពីវិញ្ញាសាចាស់បន្តិច ក៏ធ្វើមិនចេះតែម្តង។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖