Original Title: Prediction of carcass weight using multiple regression, Bayesian networks and artificial neural networks in Nigerian indigenous chickens based on earlier expressed phenotypic traits
Source: li01.tci-thaijo.org
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការទស្សន៍ទាយទម្ងន់សាច់មាន់ដោយប្រើប្រាស់តម្រែតម្រង់ពហុគុណ បណ្តាញបេស៊ីន (Bayesian networks) និងបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត លើមាន់ស្រុកនីហ្សេរីយ៉ាដោយផ្អែកលើលក្ខណៈរូបរាងដែលបានបញ្ចេញមុន

ចំណងជើងដើម៖ Prediction of carcass weight using multiple regression, Bayesian networks and artificial neural networks in Nigerian indigenous chickens based on earlier expressed phenotypic traits

អ្នកនិពន្ធ៖ A.S. Adenaike, O.S. Oloye, M.A. Opoola, H.O. Emmanuel, C.O.N. Ikeobi

ឆ្នាំបោះពុម្ព៖ 2022, Thai Journal of Agricultural Science

វិស័យសិក្សា៖ Animal Breeding and Genetics

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះមានគោលបំណងវាយតម្លៃវិធីសាស្ត្រគំរូផ្សេងៗគ្នាដើម្បីទស្សន៍ទាយទម្ងន់សាច់មាន់ (Carcass weight) នៃពូជមាន់ស្រុកនីហ្សេរីយ៉ា ដោយប្រើអថេរជីវមាត្រចំនួន ១៩ ដើម្បីរកឲ្យឃើញនូវលក្ខណៈដំបូងដែលអាចប្រើក្នុងការជ្រើសរើសពូជ។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានប្រៀបធៀបគំរូស្ថិតិ និងម៉ាស៊ីនរៀន (Machine learning) ចំនួនបីប្រភេទដើម្បីវិភាគលើទិន្នន័យមាន់ចំនួន ៣២០ ក្បាល។

តម្រែតម្រង់លីនេអ៊ែរពហុគុណ និងតម្រែតម្រង់ជាជំហាន (Multiple Linear and Stepwise Regression)
បណ្តាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតលាក់មួយ និងបី (Single and Three Hidden-Layered ANNs)
បណ្តាញ Bayesian (Bayesian Networks ប្រើប្រាស់ក្បួនដោះស្រាយ MMHC និង RSMAX2)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ម៉ូដែលបណ្តាញ Bayesian (BN) បង្ហាញសមត្ថភាពទស្សន៍ទាយល្អបំផុតដោយមានប្រៀបជាងម៉ូដែលដទៃទៀត ជាមួយនឹងមេគុណកំហុសទាប និងកម្រិតសហសម្ព័ន្ធខ្ពស់បំផុត (r=0.989 សម្រាប់ម៉ូដែល MMHC)។
ម៉ូដែលតម្រែតម្រង់លីនេអ៊ែរពហុគុណ (MLR) មានសមត្ថភាពខ្សោយជាងគេក្នុងការទស្សន៍ទាយ ដោយមានកំហុសភាគរយដាច់ខាតមធ្យម (MAPE) រហូតដល់ ៩៣.២៤%។
ទម្ងន់ពេលញាស់ (Hatched weight) ទម្ងន់កូនមាន់អាយុមួយថ្ងៃ (Day-old chick weight) ទម្ងន់រស់មុនសម្លាប់ (Live weight) និងទម្ងន់ខ្លួននៅអាយុ ៨សប្តាហ៍ គឺជាសូចនាករដំបូងដ៏ល្អបំផុតសម្រាប់ការទស្សន៍ទាយទម្ងន់សាច់មាន់។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Multiple Linear Regression (MLR) តម្រែតម្រង់លីនេអ៊ែរពហុគុណ	មានភាពសាមញ្ញ ងាយស្រួលយល់ និងត្រូវបានប្រើប្រាស់ទូទៅសម្រាប់ការវិភាគទិន្នន័យកសិកម្មជាមូលដ្ឋាន។	មិនអាចចាប់យកទំនាក់ទំនងស្មុគស្មាញ (Non-linear) រវាងអថេរបានទេ ដែលធ្វើឱ្យការទស្សន៍ទាយមានកំហុសខ្ពស់។	មានប្រសិទ្ធភាពទាបបំផុត (r=0.157, ភាគរយកំហុស MAPE=93.244%)។
Stepwise Regression (SWREG) តម្រែតម្រង់ជាជំហាន	អាចជ្រើសរើសអថេរដែលសំខាន់ៗបានដោយស្វ័យប្រវត្តិ (រក្សាទុកតែ ៧ អថេរសំខាន់ក្នុងចំណោម ១៩)។	នៅតែមានកម្រិតក្នុងការទស្សន៍ទាយទំនាក់ទំនងមិនលីនេអ៊ែរ និងអាចមានភាពលម្អៀងក្នុងការប៉ាន់ស្មានប៉ារ៉ាម៉ែត្រ។	មានប្រសិទ្ធភាពមធ្យម (r=0.645, R²=0.578) ល្អជាង MLR តែខ្សោយជាងម៉ូដែល AI។
Artificial Neural Networks (ANN1, ANN3) បណ្តាញសរសៃប្រសាទសិប្បនិម្មិត	អាចរៀន និងចាប់យកទំនាក់ទំនងស្មុគស្មាញ (Non-linear) និងអន្តរកម្មរវាងអថេរបានយ៉ាងល្អ។	ពិបាកបកស្រាយពីទំនាក់ទំនងច្បាស់លាស់រវាងអថេរ (Black box) មិនអាចប្រើជាក្បួនសម្រាប់ជ្រើសរើសអថេរផ្ទាល់បាន។	មានប្រសិទ្ធភាពខ្ពស់ និងភាពត្រឹមត្រូវល្អ (r=0.987, RMSE=0.101 សម្រាប់ម៉ូដែល ANN3)។
Bayesian Networks (MMHC, RSMAX2) បណ្តាញបេស៊ីន (Bayesian Networks)	អាចបង្ហាញពីទំនាក់ទំនងប្រូបាប៊ីលីតេច្បាស់លាស់រវាងលក្ខណៈជីវមាត្រ (Directed Acyclic Graph) ផ្តល់ភាពងាយស្រួលក្នុងការធ្វើសេចក្តីសម្រេច។	ទាមទារការយល់ដឹងស៊ីជម្រៅពីក្បួនដោះស្រាយកូនកាត់ (Hybrid algorithms) និងការរៀបចំរចនាសម្ព័ន្ធក្រាហ្វ។	មានប្រសិទ្ធភាពល្អបំផុត និងត្រឹមត្រូវជាងគេបំផុត (r=0.989 សម្រាប់ម៉ូដែល MMHC)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះមិនបានបញ្ជាក់លម្អិតពីតម្លៃធនធានកុំព្យូទ័រនោះទេ ប៉ុន្តែផ្អែកលើទំហំទិន្នន័យ និងវិធីសាស្ត្រ វាទាមទារកម្មវិធីស្ថិតិ និងទិន្នន័យជាក់លាក់ដែលមានគុណភាព។

Software: ត្រូវការកម្មវិធី R (ជំនាន់ឆ្នាំ ២០២១) ដោយប្រើប្រាស់កញ្ចប់កូដ R packages ដូចជា 'bnlearn' សម្រាប់ Bayesian Networks និង 'neuralnet' សម្រាប់ ANNs។
Dataset: ទិន្នន័យជីវមាត្រកូនមាន់ដែលបានកត់ត្រាយ៉ាងហ្មត់ចត់ ចាប់ពីពេលញាស់រហូតដល់អាយុ ៨ សប្តាហ៍ (៣២០ ក្បាល និង ១៩ អថេរ)។
Hardware: កុំព្យូទ័រដែលមានកម្លាំងមធ្យម (CPU ស្តង់ដារ និង RAM 8GB+) គឺគ្រប់គ្រាន់សម្រាប់ដំណើរការម៉ូដែលលើទិន្នន័យខ្នាតតូចនេះ ដោយមិនតម្រូវឱ្យមាន GPU នោះទេ។
Expertise: អ្នកវិភាគទាមទារចំណេះដឹងផ្នែកវិទ្យាសាស្ត្រទិន្នន័យ (Data Science) ស្ថិតិប្រូបាប៊ីលីតេ និងចំណេះដឹងផ្នែកបង្កាត់ពូជសត្វ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងដោយប្រើប្រាស់ទិន្នន័យពូជមាន់ស្រុកនីហ្សេរីយ៉ាចំនួន ៣២០ក្បាល និងចិញ្ចឹមក្នុងលក្ខខណ្ឌអាកាសធាតុនៅទ្វីបអាហ្វ្រិក។ ដោយសារកត្តាសេនេទិច (Genetics) និងអាកាសធាតុខុសគ្នា លទ្ធផលនៃមេគុណក្នុងសមីការប្រហែលជាមិនអាចយកមកប្រើផ្ទាល់លើពូជមាន់ស្រុកនៅកម្ពុជា (ដូចជាមាន់ស្រែ ឬមាន់បីសាសន៍) បានទេ ប៉ុន្តែវិធីសាស្ត្រនៃការបង្កើតម៉ូដែលនេះគឺមានតម្លៃខ្ពស់ណាស់ក្នុងការអនុវត្ត។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រក្នុងការស្រាវជ្រាវនេះមានសក្តានុពលខ្ពស់សម្រាប់ជួយជំរុញវិស័យកសិកម្ម និងការចិញ្ចឹមសត្វនៅប្រទេសកម្ពុជាឱ្យកាន់តែមានលក្ខណៈវិទ្យាសាស្ត្រ។

កសិដ្ឋានចិញ្ចឹមមាន់យកសាច់ (ឧទាហរណ៍៖ នៅខេត្តកំពង់ស្ពឺ ឬតាកែវ): ម្ចាស់កសិដ្ឋានអាចយកវិធីនេះទៅទស្សន៍ទាយទម្ងន់មាន់ពេលលក់ ដោយថ្លឹងត្រឹមទម្ងន់កូនមាន់ពេលញាស់ ឬអាយុមួយថ្ងៃ ដើម្បីរៀបចំផែនការចំណី ឬជម្រុះមាន់ដែលខ្សោយៗចេញតាំងពីតូច ដែលជួយសន្សំសំចៃចំណាយ។
វិទ្យាស្ថានស្រាវជ្រាវ និងអភិវឌ្ឍន៍កសិកម្មកម្ពុជា (CARDI) ឬសាកលវិទ្យាល័យភូមិន្ទកសិកម្ម (RUA): អ្នកស្រាវជ្រាវអាចអនុវត្តម៉ូដែល Bayesian Networks លើទិន្នន័យពូជមាន់កម្ពុជា ដើម្បីបង្កើតកម្មវិធីកែលម្អពូជសត្វ ដោយពឹងផ្អែកលើទិន្នន័យរូបរាង (Phenotypes) ជំនួសឱ្យការធ្វើតេស្ដសេនេទិច (Genetic markers) ដែលមានតម្លៃថ្លៃ និងលំបាក។

សរុបមក ការប្រើប្រាស់បច្ចេកវិទ្យា Machine Learning សម្រាប់ការទស្សន៍ទាយទិន្នផលសត្វ អាចជួយកសិករកម្ពុជាកាត់បន្ថយចំណាយលើចំណី និងបង្កើនប្រសិទ្ធភាពក្នុងការជ្រើសរើសពូជសត្វបានយ៉ាងប្រសើរ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

ប្រមូល និងរៀបចំទិន្នន័យ (Data Collection & Preprocessing): ចាប់ផ្តើមប្រមូលទិន្នន័យជីវមាត្ររបស់មាន់នៅកសិដ្ឋានក្នុងស្រុក ដោយផ្តោតលើទម្ងន់ពេលញាស់ (Hatched weight) ទម្ងន់អាយុមួយថ្ងៃ និងទម្ងន់រស់មុនសម្លាប់ ហើយកត់ត្រាឱ្យបានត្រឹមត្រូវទៅក្នុងកម្មវិធី Microsoft Excel។
សិក្សា និងដំឡើងកម្មវិធីវិភាគទិន្នន័យ: ដំឡើងកម្មវិធី R software ឬ Python និងរៀនប្រើប្រាស់កញ្ចប់កូដកម្រិតខ្ពស់ដូចជា bnlearn សម្រាប់បង្កើតគំរូ Bayesian និង neuralnet សម្រាប់ការវិភាគ ANNs។
សាងសង់ និងបង្ហាត់ម៉ូដែល (Model Training): បែងចែកទិន្នន័យជាពីរផ្នែក (70% សម្រាប់ Train និង 30% សម្រាប់ Test) បន្ទាប់មកសាកល្បងរត់ម៉ូដែលទាំង តម្រែតម្រង់ (Regression) និង Bayesian Networks ដើម្បីស្វែងរកកត្តាដែលជះឥទ្ធិពលខ្លាំងបំផុត។
វាយតម្លៃសមត្ថភាពម៉ូដែល (Model Evaluation): ប្រើប្រាស់រង្វាស់រង្វាល់ស្ថិតិដូចជា RMSE, MAE, និងមេគុណ R² ដើម្បីប្រៀបធៀបថាតើម៉ូដែលណាមួយអាចទស្សន៍ទាយទម្ងន់សាច់មាន់បានត្រឹមត្រូវ និងមានកំហុសតិចជាងគេ។
អនុវត្តផ្ទាល់ក្នុងកសិដ្ឋាន (Farm Application & Decision Making): ផ្អែកលើលទ្ធផលម៉ូដែល បង្កើតគោលការណ៍ជ្រើសរើសពូជសត្វ ដោយរក្សាទុកតែកូនមាន់ដែលមានសក្តានុពលលូតលាស់ល្អ (ផ្អែកលើទម្ងន់នៅសប្តាហ៍ទី១) និងជម្រុះមាន់ខ្សោយៗចោលទាន់ពេល។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Bayesian network (BN) (បណ្តាញបេស៊ីន)	ម៉ូដែលប្រូបាប៊ីលីតេក្រាហ្វិកដែលបង្ហាញពីទំនាក់ទំនងរវាងអថេរផ្សេងៗ។ ក្នុងការសិក្សានេះ វាត្រូវបានប្រើដើម្បីវិភាគនិងរកមើលថាតើលក្ខណៈរូបរាងដំបូងមួយណា (ឧទាហរណ៍ ទម្ងន់ពេលញាស់) ដែលមានឥទ្ធិពលផ្ទាល់ទៅលើការកំណត់ទម្ងន់សាច់មាន់។	ដូចជាផែនទីខ្សែចង្វាក់ហេតុនិងផល ដែលប្រាប់យើងថាបើមានព្រឹត្តិការណ៍ "ក" កើតឡើង តើមានឱកាសប៉ុន្មានភាគរយដែលព្រឹត្តិការណ៍ "ខ" នឹងកើតឡើងបន្តទៀត។
Artificial neural network (ANN) (បណ្តាញសរសៃប្រសាទសិប្បនិម្មិត)	ប្រព័ន្ធកុំព្យូទ័រ (Machine Learning) ដែលត្រាប់តាមរបៀបធ្វើការនៃខួរក្បាលមនុស្ស។ វាអាចរៀនពីទិន្នន័យស្មុគស្មាញ និងទស្សន៍ទាយលទ្ធផល ដោយស្វែងរកទំនាក់ទំនងមិនលីនេអ៊ែរ (Non-linear) រវាងកត្តាបញ្ចូលច្រើនមុខក្នុងពេលតែមួយ។	ដូចជាសិស្សដែលរៀនតាមរយៈបទពិសោធន៍ផ្ទាល់ ដោយសង្កេតមើលលំហាត់ចាស់ៗរាប់រយដង រហូតអាចទាយដឹងពីចម្លើយនៃលំហាត់ថ្មីបានយ៉ាងច្បាស់។
Phenotypic traits (លក្ខណៈរូបរាងដែលបញ្ចេញមក)	លក្ខណៈជីវមាត្រ ឬរាងកាយរបស់សត្វដែលអាចមើលឃើញ និងវាស់វែងបានជាក់ស្តែង ដូចជា ទម្ងន់ខ្លួន ប្រវែងជើង ឬទំហំទ្រូង ដែលជាលទ្ធផលបណ្ដាលមកពីកត្តាសេនេទិចផ្សំជាមួយកត្តាបរិស្ថានជុំវិញ។	ដូចជារូបរាងខាងក្រៅរបស់មនុស្សយើង (កម្ពស់ ទម្ងន់ ពណ៌សក់) ដែលគេអាចវាស់វែង និងមើលឃើញដោយផ្ទាល់ភ្នែកបាន។
Multiple linear regression (MLR) (តម្រែតម្រង់លីនេអ៊ែរពហុគុណ)	វិធីសាស្ត្រស្ថិតិដែលប្រើអថេរឯករាជ្យពីរ ឬច្រើន (ឧទាហរណ៍ ទម្ងន់កូនមាន់ ទំហំទ្រូង ប្រវែងជើង) ដើម្បីទស្សន៍ទាយអថេរអាស្រ័យមួយ (ទម្ងន់សាច់មាន់) ដោយផ្អែកលើការសន្មតថាពួកវាមានទំនាក់ទំនងជាបន្ទាត់ត្រង់។	ដូចជាការគណនាពិន្ទុសរុបប្រចាំឆ្នាំរបស់សិស្ស ដោយយកពិន្ទុមុខវិជ្ជានីមួយៗមកបូកបញ្ចូលគ្នា រួចគុណនឹងទម្ងន់ឬកម្រិតសំខាន់នៃមុខវិជ្ជានោះ។
Stepwise regression (SWREG) (តម្រែតម្រង់ជាជំហាន)	វិធីសាស្ត្រវិភាគស្ថិតិដែលបន្ថែម ឬដកអថេរចេញពីម៉ូដែលម្តងមួយៗដោយស្វ័យប្រវត្តិ ដើម្បីស្វែងរកបណ្តុំនៃអថេរ (លក្ខណៈសត្វ) ដែលសំខាន់បំផុត និងស័ក្តិសមបំផុតសម្រាប់ការទស្សន៍ទាយលទ្ធផល ដោយច្រានចោលនូវអថេរដែលមិនចាំបាច់។	ដូចជាការសាកល្បងរើសកីឡាករចូលក្រុម ដោយដាក់បញ្ចូលកីឡាករម្តងម្នាក់ៗ រួចដកអ្នកមិនសូវពូកែចេញ រហូតសល់តែបណ្តុំកីឡាករដែលបង្កើតបានជាក្រុមខ្លាំងបំផុតមួយ។
Markov blanket (ភួយម៉ាកូវ / សំណុំម៉ាកូវ)	នៅក្នុងប្រព័ន្ធបណ្តាញ Bayesian វាគឺជាសំណុំនៃថ្នាំង (Nodes) ដែលរួមមាន អថេរដើមទង (Parents) អថេរបែកខ្នែង (Children) និងអថេរដើមទងផ្សេងទៀតរបស់វា។ ក្រៅពីសំណុំអថេរទាំងនេះ អថេរផ្សេងៗទៀតលែងមានឥទ្ធិពលលើការទស្សន៍ទាយទៀតហើយ។	ដូចជាមនុស្សជំនិតបំផុតរបស់អ្នក (ឪពុកម្តាយ កូន និងមិត្តរួមការងារជិតស្និទ្ធ) ដែលស្គាល់អ្នកច្បាស់រហូតដល់គេមិនចាំបាច់ទៅសួរអ្នកដទៃទាល់តែសោះដើម្បីដឹងពីចរិតរបស់អ្នក។
Directed acyclic graph (DAG) (ក្រាហ្វមានទិសដៅគ្មានវដ្ត)	រចនាសម្ព័ន្ធបណ្តាញដែលប្រើក្នុង Bayesian Networks ដែលមានសញ្ញាព្រួញចង្អុលបង្ហាញពីឥទ្ធិពលពីអថេរមួយទៅអថេរមួយទៀត (មានទិសដៅ) ប៉ុន្តែខ្សែព្រួញទាំងនោះមិនអាចវិលត្រឡប់ក្រោយមកបង្កើតជារង្វង់បិទជិតវិញឡើយ (គ្មានវដ្ត)។	ដូចជាខ្សែទឹកធ្លាក់ដែលហូរពីលើភ្នំចុះមកក្រោមបែកជាដៃទន្លេ វាតែងតែហូរទៅមុខជានិច្ច ហើយមិនអាចហូរត្រឡប់បញ្ច្រាសទិសឡើងលើភ្នំវិញបានទេ។
Root mean square error (RMSE) (កំហុសការេមធ្យមឬស)	រង្វាស់រង្វាល់ស្ថិតិសម្រាប់វាស់ស្ទង់ពីកម្រិតលម្អៀង ឬភាពខុសគ្នារវាងតម្លៃដែលម៉ូដែលកុំព្យូទ័របានទាយទុក ធៀបនឹងតម្លៃជាក់ស្តែងពិតប្រាកដ។ ប្រសិនបើតម្លៃ RMSE កាន់តែតូច មានន័យថាម៉ូដែលនោះទស្សន៍ទាយបានកាន់តែត្រឹមត្រូវ។	ដូចជាការបាញ់ព្រួញទៅកាន់ផ្ទាំងស៊ីប ប្រសិនបើព្រួញរបស់អ្នកបាញ់ចាក់ចំកាន់តែជិតចំណុចកណ្តាល នោះកម្រិតកំហុសនៃការវាស់វែងរបស់អ្នកគឺកាន់តែតូច។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖