បញ្ហា (The Problem)៖ ការថ្លឹងម៉ាសត្រីរស់ដោយផ្ទាល់ដោយប្រើជញ្ជីងឌីជីថលត្រូវចំណាយពេលយូរ ប្រើកម្លាំងពលកម្មច្រើន និងអាចធ្វើឱ្យត្រីមានភាពតានតឹង (Stress) ដែលប៉ះពាល់យ៉ាងខ្លាំងដល់សុខភាពត្រីសម្រាប់ការបង្កាត់ពូជ។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានបង្កើតនិងកែច្នៃបណ្ដាញសរសៃប្រសាទកុងវ៉ុលជ្រៅ (Deep Convolutional Neural Networks) ចំនួន ៨ ប្រភេទ ដោយប្រើប្រាស់បច្ចេកទេសរៀនផ្ទេរចំណេះដឹង (Transfer Learning) ដើម្បីប៉ាន់ស្មានម៉ាសត្រីពីក្នុងរូបភាព។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Modified VGG-19 (Deep Learning) ម៉ូដែល VGG-19 ដែលបានកែច្នៃ (បណ្ដាញសរសៃប្រសាទកុងវ៉ុលជ្រៅ) |
ផ្តល់ភាពសុក្រឹតខ្ពស់បំផុត និងមានសមត្ថភាពចាប់យកលក្ខណៈលម្អិតនៃរូបរាងត្រីបានយ៉ាងល្អ ដោយចំណាយពេលទស្សន៍ទាយលឿនបំផុត។ | ទាមទារការបង្វឹកដោយប្រើកុំព្យូទ័រដែលមានកម្លាំង GPU ខ្លាំង និងងាយរងឥទ្ធិពលអវិជ្ជមានពីពន្លឺចាំងលើទឹក។ | កំហុសមធ្យមការ៉េឫស (RMSE) ទាបបំផុតត្រឹម ៣.៥៩ ក្រាម និងល្បឿនដំណើរការ ០.០៥៣ វិនាទី/រូបភាព (លើ GPU)។ |
| Modified GoogLeNet (Deep Learning) ម៉ូដែល GoogLeNet ដែលបានកែច្នៃ |
មានទំហំម៉ូដែលតូចខ្លាំង និងមានល្បឿនដំណើរការលឿនជាងគេនៅលើកុំព្យូទ័រធម្មតា (CPU)។ | មានភាពសុក្រឹតទាបជាងម៉ូដែល VGG-19 បន្តិច ដោយសារការកែប្រែទម្រង់រូបភាពស្មុគស្មាញពេក។ | RMSE ស្មើនឹង ៣.៩២ ក្រាម, ទំហំម៉ូដែលត្រឹមតែ ២២.២ MB។ |
| Traditional Power Curve Model (using area) គំរូខ្សែកោងថាមពលប្រពៃណី (ប្រើប្រាស់ផ្ទៃក្រឡា) |
សាមញ្ញ ងាយស្រួលគណនាដោយមិនចាំបាច់ប្រើប្រាស់បច្ចេកវិទ្យាបញ្ញាសិប្បនិម្មិតកម្រិតខ្ពស់។ | មានកំហុសខ្ពស់ជាង និងទាមទារឱ្យមានការប្រើប្រាស់កម្មវិធីកាត់ផ្ទៃកន្ទុយនិងព្រុយចេញពីរូបរាងដងខ្លួនត្រីជាមុនសិន។ | RMSE ខ្ពស់រហូតដល់ ១៨.៦០ ក្រាម សម្រាប់ការប្រើផ្ទៃរូបរាងទូទៅ ឬ ៧៧.៥២ ក្រាម បើប្រើតែផ្ទៃដងខ្លួនសុទ្ធ។ |
| Modified InceptionResNetV2 ម៉ូដែល InceptionResNetV2 ដែលបានកែច្នៃ |
មានសក្តានុពលសម្រាប់កិច្ចការវិភាគរូបភាពដែលមានភាពស្មុគស្មាញ និងមានស្រទាប់វិភាគច្រើន។ | មិនស័ក្តិសមសម្រាប់ការងារតំរែតំរង់ (Regression) សាមញ្ញទេ ដោយវាបង្កើតឱ្យមានកំហុសខ្ពស់ (Overfitting)។ | មានកំហុសធំបំផុត ដោយតម្លៃ RMSE ស្មើនឹង ១៤.៣៦ ក្រាម និងកំហុសជាភាគរយ (MAPE) រហូតដល់ ៣៩.០១%។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តការសិក្សានេះទាមទារនូវឧបករណ៍កុំព្យូទ័រដែលមានកម្លាំងម៉ាស៊ីនខ្លាំងសម្រាប់ការបង្វឹកម៉ូដែល និងប្រព័ន្ធថតរូបភាពដែលមានការគ្រប់គ្រងបរិស្ថានពន្លឺបានល្អ។
ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងប្រទេសថៃ ដោយប្រើប្រាស់រូបភាពត្រីទីឡាព្យា (Oreochromis niloticus) ចំនួន ៣.៨៣២ ក្បាល ក្នុងលក្ខខណ្ឌថតរូបដែលមានប្រអប់ទប់ពន្លឺយ៉ាងត្រឹមត្រូវ។ ការណ៍នេះជារឿងសំខាន់ដែលត្រូវពិចារណាសម្រាប់កម្ពុជា ព្រោះលក្ខខណ្ឌជាក់ស្តែងនៅតាមកសិដ្ឋានវារីវប្បកម្មនៅកម្ពុជាអាចមានភាពខុសគ្នាទាំងពន្លឺ ប្រភេទពូជត្រី និងបរិយាកាសទឹក ដែលទាមទារឱ្យមានការប្រមូលទិន្នន័យក្នុងស្រុកបន្ថែមដើម្បីបង្វឹកម៉ូដែលឱ្យស្របតាមស្ថានភាពជាក់ស្តែង។
បច្ចេកវិទ្យានេះមានសក្តានុពលខ្ពស់ខ្លាំងសម្រាប់ការអភិវឌ្ឍវិស័យវារីវប្បកម្មទំនើបនៅកម្ពុជា ជាពិសេសសម្រាប់ការបង្កាត់ពូជ និងគ្រប់គ្រងកសិដ្ឋាន។
ជារួម ការប្រើប្រាស់បច្ចេកទេសរៀនផ្ទេរចំណេះដឹង (Transfer Learning) ជួយកាត់បន្ថយពេលវេលានិងធនធានក្នុងការបង្កើតម៉ូដែល AI ថ្មី ដែលធ្វើឱ្យបច្ចេកវិទ្យានេះងាយស្រួលនឹងត្រូវបានសម្របយកមកប្រើប្រាស់ជាក់ស្តែងក្នុងវិស័យកសិកម្មកម្ពុជា។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Transfer learning (ការរៀនផ្ទេរចំណេះដឹង) | ជាបច្ចេកទេសក្នុងបញ្ញាសិប្បនិម្មិត (AI) ដែលគេយកម៉ូដែលដែលបានបង្វឹកនិងរៀនរួចរាល់ពីទិន្នន័យដ៏ធំមួយ (ឧទាហរណ៍ រូបភាពទូទៅ) មកកែច្នៃនិងបង្វឹកបន្តបន្តិចបន្តួច ដើម្បីដោះស្រាយបញ្ហាថ្មីមួយទៀត (ឧទាហរណ៍ ការប៉ាន់ស្មានទម្ងន់ត្រី) ដែលជួយសន្សំសំចៃពេលវេលានិងទិន្នន័យក្នុងការបង្វឹក។ | ដូចជាមនុស្សដែលចេះជិះកង់រួចហើយ យកជំនាញទប់លំនឹងនោះទៅរៀនជិះម៉ូតូ ដោយមិនបាច់ចាប់ផ្តើមរៀនពីសូន្យ។ |
| Convolutional Neural Networks (បណ្ដាញសរសៃប្រសាទកុងវ៉ុល) | ជាប្រភេទម៉ូដែលបញ្ញាសិប្បនិម្មិតដ៏មានប្រសិទ្ធភាពបំផុតសម្រាប់ការវិភាគរូបភាព ដោយវាប្រើប្រាស់ស្រទាប់តម្រង (Filters) ជាច្រើនជាន់ដើម្បីទាញយកលក្ខណៈពិសេសៗពីរូបភាព ដូចជា គែម ទ្រង់ទ្រាយ និងលំនាំផ្សេងៗដោយស្វ័យប្រវត្តិ ដោយមិនចាំបាច់មានមនុស្សបញ្ជាប្រាប់។ | ដូចជាភ្នែកនិងខួរក្បាលមនុស្សដែលសម្លឹងមើលវត្ថុមួយ ដោយផ្តើមពីការចាប់អារម្មណ៍លើវណ្ឌវង្កខាងក្រៅ រហូតដល់អាចចំណាំបានលម្អិតថាវាជារបស់អ្វីមួយច្បាស់លាស់។ |
| VGG-19 (ម៉ូដែល VGG-19) | ជាប្រភេទបណ្ដាញសរសៃប្រសាទកុងវ៉ុល (CNN) ដ៏ល្បីមួយនិងមានជម្រៅជ្រៅរហូតដល់ ១៩ ស្រទាប់ (Layers) ដែលមានសមត្ថភាពខ្ពស់ក្នុងការវិភាគលក្ខណៈលម្អិតៗនៃរូបភាព ប៉ុន្តែវាទាមទារកម្លាំងម៉ាស៊ីនកុំព្យូទ័រខ្លាំងដើម្បីដំណើរការ។ | ដូចជាកែវពង្រីកដែលមានឡង់ទី ១៩ ជាន់ត្រួតស៊ីគ្នា ដែលជួយឱ្យយើងមើលឃើញភាពលម្អិតនៃវត្ថុមួយកាន់តែច្បាស់។ |
| Regression output layer (ស្រទាប់លទ្ធផលតំរែតំរង់) | ជាស្រទាប់ចុងក្រោយបង្អស់នៃបណ្ដាញសរសៃប្រសាទកុងវ៉ុល ដែលត្រូវបានកែច្នៃពីការប្រើសម្រាប់ធ្វើចំណាត់ថ្នាក់រូបភាព (ឧទាហរណ៍ ប្រាប់ថាជារូបត្រី ឬឆ្កែ) មកជាការទស្សន៍ទាយចេញជាតម្លៃលេខពិតប្រាកដ (ឧទាហរណ៍ ប្រាប់ថាត្រីមានទម្ងន់ ៣០០ ក្រាម)។ | ដូចជាអ្នកជំនាញម្នាក់ដែលមិនត្រឹមតែអាចប្រាប់ថានេះជា "ផ្លែឪឡឹក" ទេ តែថែមទាំងអាចស្មានដឹងថាវាមានទម្ងន់ "៣ គីឡូក្រាម" ទៀតផង។ |
| Root Mean Square Error (កំហុសមធ្យមការ៉េឫស) | ជារង្វាស់គណិតវិទ្យាសម្រាប់វាយតម្លៃភាពសុក្រឹតនៃម៉ូដែលទស្សន៍ទាយ ដោយវាវាស់វែងពីគម្លាតរវាងតម្លៃដែលម៉ូដែលទស្សន៍ទាយបាន និងតម្លៃពិតប្រាកដជាក់ស្តែង តម្លៃ RMSE កាន់តែតូច បញ្ជាក់ថាម៉ូដែលកាន់តែមានភាពសុក្រឹតនិងត្រឹមត្រូវខ្ពស់។ | ដូចជាការបាញ់ព្រួញទៅកាន់ផ្ទាំងស៊ីប បើគ្រាប់ព្រួញភាគច្រើនដោតចំក្បែរៗចំណុចកណ្តាល នោះកំហុស (RMSE) គឺមានទំហំតូច។ |
| Passive integrated transponder (បន្ទះឈីបបញ្ជូនសញ្ញាអកម្ម) | ហៅកាត់ថា PIT ជាបន្ទះឈីបអេឡិចត្រូនិចទំហំតូចដែលត្រូវបានចាក់បញ្ចូលទៅក្នុងខ្លួនត្រីនីមួយៗ ដើម្បីផ្ទុកលេខកូដសម្គាល់អត្តសញ្ញាណ (ID) ធ្វើឱ្យគេអាចតាមដានប្រវត្តិទម្ងន់ ការលូតលាស់ និងពូជអម្បូររបស់ត្រីមួយក្បាលៗបានយ៉ាងច្បាស់លាស់។ | ដូចជាអត្តសញ្ញាណប័ណ្ណទំហំប៉ុនគ្រាប់អង្ករដែលផ្សាំក្នុងខ្លួនត្រី សម្រាប់ឱ្យម៉ាស៊ីនស្កេនដឹងថាត្រីនេះឈ្មោះអ្វីនិងមកពីពូជណា។ |
| Fully connected layer (ស្រទាប់តភ្ជាប់ពេញលេញ) | ជាស្រទាប់នៅក្នុងបណ្ដាញសរសៃប្រសាទ ដែលតភ្ជាប់គ្រប់ណឺរ៉ូន (Neurons) ពីស្រទាប់មុនទៅកាន់ណឺរ៉ូននៃស្រទាប់បន្ទាប់ ដើម្បីប្រមូលផ្តុំរាល់ព័ត៌មានលក្ខណៈពិសេសៗដែលបានវិភាគរួចរាល់ យកមកធ្វើការសម្រេចចិត្តឬទស្សន៍ទាយលទ្ធផលចុងក្រោយ។ | ដូចជាក្រុមប្រឹក្សាភិបាលដែលប្រមូលរបាយការណ៍សង្ខេបពីគ្រប់ផ្នែកទាំងអស់នៃក្រុមហ៊ុន ដើម្បីយកមកធ្វើការសម្រេចចិត្តរួមមួយចុងក្រោយ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖