បញ្ហា (The Problem)៖ ការសិក្សានេះមានគោលបំណងវាយតម្លៃវិធីសាស្ត្រគំរូផ្សេងៗគ្នាដើម្បីទស្សន៍ទាយទម្ងន់សាច់មាន់ (Carcass weight) នៃពូជមាន់ស្រុកនីហ្សេរីយ៉ា ដោយប្រើអថេរជីវមាត្រចំនួន ១៩ ដើម្បីរកឲ្យឃើញនូវលក្ខណៈដំបូងដែលអាចប្រើក្នុងការជ្រើសរើសពូជ។
វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានប្រៀបធៀបគំរូស្ថិតិ និងម៉ាស៊ីនរៀន (Machine learning) ចំនួនបីប្រភេទដើម្បីវិភាគលើទិន្នន័យមាន់ចំនួន ៣២០ ក្បាល។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Multiple Linear Regression (MLR) តម្រែតម្រង់លីនេអ៊ែរពហុគុណ |
មានភាពសាមញ្ញ ងាយស្រួលយល់ និងត្រូវបានប្រើប្រាស់ទូទៅសម្រាប់ការវិភាគទិន្នន័យកសិកម្មជាមូលដ្ឋាន។ | មិនអាចចាប់យកទំនាក់ទំនងស្មុគស្មាញ (Non-linear) រវាងអថេរបានទេ ដែលធ្វើឱ្យការទស្សន៍ទាយមានកំហុសខ្ពស់។ | មានប្រសិទ្ធភាពទាបបំផុត (r=0.157, ភាគរយកំហុស MAPE=93.244%)។ |
| Stepwise Regression (SWREG) តម្រែតម្រង់ជាជំហាន |
អាចជ្រើសរើសអថេរដែលសំខាន់ៗបានដោយស្វ័យប្រវត្តិ (រក្សាទុកតែ ៧ អថេរសំខាន់ក្នុងចំណោម ១៩)។ | នៅតែមានកម្រិតក្នុងការទស្សន៍ទាយទំនាក់ទំនងមិនលីនេអ៊ែរ និងអាចមានភាពលម្អៀងក្នុងការប៉ាន់ស្មានប៉ារ៉ាម៉ែត្រ។ | មានប្រសិទ្ធភាពមធ្យម (r=0.645, R²=0.578) ល្អជាង MLR តែខ្សោយជាងម៉ូដែល AI។ |
| Artificial Neural Networks (ANN1, ANN3) បណ្តាញសរសៃប្រសាទសិប្បនិម្មិត |
អាចរៀន និងចាប់យកទំនាក់ទំនងស្មុគស្មាញ (Non-linear) និងអន្តរកម្មរវាងអថេរបានយ៉ាងល្អ។ | ពិបាកបកស្រាយពីទំនាក់ទំនងច្បាស់លាស់រវាងអថេរ (Black box) មិនអាចប្រើជាក្បួនសម្រាប់ជ្រើសរើសអថេរផ្ទាល់បាន។ | មានប្រសិទ្ធភាពខ្ពស់ និងភាពត្រឹមត្រូវល្អ (r=0.987, RMSE=0.101 សម្រាប់ម៉ូដែល ANN3)។ |
| Bayesian Networks (MMHC, RSMAX2) បណ្តាញបេស៊ីន (Bayesian Networks) |
អាចបង្ហាញពីទំនាក់ទំនងប្រូបាប៊ីលីតេច្បាស់លាស់រវាងលក្ខណៈជីវមាត្រ (Directed Acyclic Graph) ផ្តល់ភាពងាយស្រួលក្នុងការធ្វើសេចក្តីសម្រេច។ | ទាមទារការយល់ដឹងស៊ីជម្រៅពីក្បួនដោះស្រាយកូនកាត់ (Hybrid algorithms) និងការរៀបចំរចនាសម្ព័ន្ធក្រាហ្វ។ | មានប្រសិទ្ធភាពល្អបំផុត និងត្រឹមត្រូវជាងគេបំផុត (r=0.989 សម្រាប់ម៉ូដែល MMHC)។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះមិនបានបញ្ជាក់លម្អិតពីតម្លៃធនធានកុំព្យូទ័រនោះទេ ប៉ុន្តែផ្អែកលើទំហំទិន្នន័យ និងវិធីសាស្ត្រ វាទាមទារកម្មវិធីស្ថិតិ និងទិន្នន័យជាក់លាក់ដែលមានគុណភាព។
ការសិក្សានេះត្រូវបានធ្វើឡើងដោយប្រើប្រាស់ទិន្នន័យពូជមាន់ស្រុកនីហ្សេរីយ៉ាចំនួន ៣២០ក្បាល និងចិញ្ចឹមក្នុងលក្ខខណ្ឌអាកាសធាតុនៅទ្វីបអាហ្វ្រិក។ ដោយសារកត្តាសេនេទិច (Genetics) និងអាកាសធាតុខុសគ្នា លទ្ធផលនៃមេគុណក្នុងសមីការប្រហែលជាមិនអាចយកមកប្រើផ្ទាល់លើពូជមាន់ស្រុកនៅកម្ពុជា (ដូចជាមាន់ស្រែ ឬមាន់បីសាសន៍) បានទេ ប៉ុន្តែវិធីសាស្ត្រនៃការបង្កើតម៉ូដែលនេះគឺមានតម្លៃខ្ពស់ណាស់ក្នុងការអនុវត្ត។
វិធីសាស្ត្រក្នុងការស្រាវជ្រាវនេះមានសក្តានុពលខ្ពស់សម្រាប់ជួយជំរុញវិស័យកសិកម្ម និងការចិញ្ចឹមសត្វនៅប្រទេសកម្ពុជាឱ្យកាន់តែមានលក្ខណៈវិទ្យាសាស្ត្រ។
សរុបមក ការប្រើប្រាស់បច្ចេកវិទ្យា Machine Learning សម្រាប់ការទស្សន៍ទាយទិន្នផលសត្វ អាចជួយកសិករកម្ពុជាកាត់បន្ថយចំណាយលើចំណី និងបង្កើនប្រសិទ្ធភាពក្នុងការជ្រើសរើសពូជសត្វបានយ៉ាងប្រសើរ។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Bayesian network (BN) (បណ្តាញបេស៊ីន) | ម៉ូដែលប្រូបាប៊ីលីតេក្រាហ្វិកដែលបង្ហាញពីទំនាក់ទំនងរវាងអថេរផ្សេងៗ។ ក្នុងការសិក្សានេះ វាត្រូវបានប្រើដើម្បីវិភាគនិងរកមើលថាតើលក្ខណៈរូបរាងដំបូងមួយណា (ឧទាហរណ៍ ទម្ងន់ពេលញាស់) ដែលមានឥទ្ធិពលផ្ទាល់ទៅលើការកំណត់ទម្ងន់សាច់មាន់។ | ដូចជាផែនទីខ្សែចង្វាក់ហេតុនិងផល ដែលប្រាប់យើងថាបើមានព្រឹត្តិការណ៍ "ក" កើតឡើង តើមានឱកាសប៉ុន្មានភាគរយដែលព្រឹត្តិការណ៍ "ខ" នឹងកើតឡើងបន្តទៀត។ |
| Artificial neural network (ANN) (បណ្តាញសរសៃប្រសាទសិប្បនិម្មិត) | ប្រព័ន្ធកុំព្យូទ័រ (Machine Learning) ដែលត្រាប់តាមរបៀបធ្វើការនៃខួរក្បាលមនុស្ស។ វាអាចរៀនពីទិន្នន័យស្មុគស្មាញ និងទស្សន៍ទាយលទ្ធផល ដោយស្វែងរកទំនាក់ទំនងមិនលីនេអ៊ែរ (Non-linear) រវាងកត្តាបញ្ចូលច្រើនមុខក្នុងពេលតែមួយ។ | ដូចជាសិស្សដែលរៀនតាមរយៈបទពិសោធន៍ផ្ទាល់ ដោយសង្កេតមើលលំហាត់ចាស់ៗរាប់រយដង រហូតអាចទាយដឹងពីចម្លើយនៃលំហាត់ថ្មីបានយ៉ាងច្បាស់។ |
| Phenotypic traits (លក្ខណៈរូបរាងដែលបញ្ចេញមក) | លក្ខណៈជីវមាត្រ ឬរាងកាយរបស់សត្វដែលអាចមើលឃើញ និងវាស់វែងបានជាក់ស្តែង ដូចជា ទម្ងន់ខ្លួន ប្រវែងជើង ឬទំហំទ្រូង ដែលជាលទ្ធផលបណ្ដាលមកពីកត្តាសេនេទិចផ្សំជាមួយកត្តាបរិស្ថានជុំវិញ។ | ដូចជារូបរាងខាងក្រៅរបស់មនុស្សយើង (កម្ពស់ ទម្ងន់ ពណ៌សក់) ដែលគេអាចវាស់វែង និងមើលឃើញដោយផ្ទាល់ភ្នែកបាន។ |
| Multiple linear regression (MLR) (តម្រែតម្រង់លីនេអ៊ែរពហុគុណ) | វិធីសាស្ត្រស្ថិតិដែលប្រើអថេរឯករាជ្យពីរ ឬច្រើន (ឧទាហរណ៍ ទម្ងន់កូនមាន់ ទំហំទ្រូង ប្រវែងជើង) ដើម្បីទស្សន៍ទាយអថេរអាស្រ័យមួយ (ទម្ងន់សាច់មាន់) ដោយផ្អែកលើការសន្មតថាពួកវាមានទំនាក់ទំនងជាបន្ទាត់ត្រង់។ | ដូចជាការគណនាពិន្ទុសរុបប្រចាំឆ្នាំរបស់សិស្ស ដោយយកពិន្ទុមុខវិជ្ជានីមួយៗមកបូកបញ្ចូលគ្នា រួចគុណនឹងទម្ងន់ឬកម្រិតសំខាន់នៃមុខវិជ្ជានោះ។ |
| Stepwise regression (SWREG) (តម្រែតម្រង់ជាជំហាន) | វិធីសាស្ត្រវិភាគស្ថិតិដែលបន្ថែម ឬដកអថេរចេញពីម៉ូដែលម្តងមួយៗដោយស្វ័យប្រវត្តិ ដើម្បីស្វែងរកបណ្តុំនៃអថេរ (លក្ខណៈសត្វ) ដែលសំខាន់បំផុត និងស័ក្តិសមបំផុតសម្រាប់ការទស្សន៍ទាយលទ្ធផល ដោយច្រានចោលនូវអថេរដែលមិនចាំបាច់។ | ដូចជាការសាកល្បងរើសកីឡាករចូលក្រុម ដោយដាក់បញ្ចូលកីឡាករម្តងម្នាក់ៗ រួចដកអ្នកមិនសូវពូកែចេញ រហូតសល់តែបណ្តុំកីឡាករដែលបង្កើតបានជាក្រុមខ្លាំងបំផុតមួយ។ |
| Markov blanket (ភួយម៉ាកូវ / សំណុំម៉ាកូវ) | នៅក្នុងប្រព័ន្ធបណ្តាញ Bayesian វាគឺជាសំណុំនៃថ្នាំង (Nodes) ដែលរួមមាន អថេរដើមទង (Parents) អថេរបែកខ្នែង (Children) និងអថេរដើមទងផ្សេងទៀតរបស់វា។ ក្រៅពីសំណុំអថេរទាំងនេះ អថេរផ្សេងៗទៀតលែងមានឥទ្ធិពលលើការទស្សន៍ទាយទៀតហើយ។ | ដូចជាមនុស្សជំនិតបំផុតរបស់អ្នក (ឪពុកម្តាយ កូន និងមិត្តរួមការងារជិតស្និទ្ធ) ដែលស្គាល់អ្នកច្បាស់រហូតដល់គេមិនចាំបាច់ទៅសួរអ្នកដទៃទាល់តែសោះដើម្បីដឹងពីចរិតរបស់អ្នក។ |
| Directed acyclic graph (DAG) (ក្រាហ្វមានទិសដៅគ្មានវដ្ត) | រចនាសម្ព័ន្ធបណ្តាញដែលប្រើក្នុង Bayesian Networks ដែលមានសញ្ញាព្រួញចង្អុលបង្ហាញពីឥទ្ធិពលពីអថេរមួយទៅអថេរមួយទៀត (មានទិសដៅ) ប៉ុន្តែខ្សែព្រួញទាំងនោះមិនអាចវិលត្រឡប់ក្រោយមកបង្កើតជារង្វង់បិទជិតវិញឡើយ (គ្មានវដ្ត)។ | ដូចជាខ្សែទឹកធ្លាក់ដែលហូរពីលើភ្នំចុះមកក្រោមបែកជាដៃទន្លេ វាតែងតែហូរទៅមុខជានិច្ច ហើយមិនអាចហូរត្រឡប់បញ្ច្រាសទិសឡើងលើភ្នំវិញបានទេ។ |
| Root mean square error (RMSE) (កំហុសការេមធ្យមឬស) | រង្វាស់រង្វាល់ស្ថិតិសម្រាប់វាស់ស្ទង់ពីកម្រិតលម្អៀង ឬភាពខុសគ្នារវាងតម្លៃដែលម៉ូដែលកុំព្យូទ័របានទាយទុក ធៀបនឹងតម្លៃជាក់ស្តែងពិតប្រាកដ។ ប្រសិនបើតម្លៃ RMSE កាន់តែតូច មានន័យថាម៉ូដែលនោះទស្សន៍ទាយបានកាន់តែត្រឹមត្រូវ។ | ដូចជាការបាញ់ព្រួញទៅកាន់ផ្ទាំងស៊ីប ប្រសិនបើព្រួញរបស់អ្នកបាញ់ចាក់ចំកាន់តែជិតចំណុចកណ្តាល នោះកម្រិតកំហុសនៃការវាស់វែងរបស់អ្នកគឺកាន់តែតូច។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖