Original Title: Improving Accuracy in Agricultural Forecasts: Evaluation of SARIMA and Forecast Models for Artichoke Prices
Source: doi.org/10.36956/rwae.v6i3.1880
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការធ្វើឱ្យប្រសើរឡើងនូវភាពត្រឹមត្រូវក្នុងការព្យាករណ៍កសិកម្ម៖ ការវាយតម្លៃលើគំរូ SARIMA និងគំរូការព្យាករណ៍សម្រាប់តម្លៃផ្កាអាទីសូ (Artichoke)

ចំណងជើងដើម៖ Improving Accuracy in Agricultural Forecasts: Evaluation of SARIMA and Forecast Models for Artichoke Prices

អ្នកនិពន្ធ៖ Axel Zevallos-Aquije (Vice-Rectorate of Research, Cesar Vallejo University, Trujillo 13001, Peru), Anneliese Zevallos-Aquije (Faculty of Human Medicine, Ricardo Palma University, Lima 15039, Peru), Karen Palomino-Salcedo (Faculty of Business and Communication, Universidad Internacional de La Rioja (UNIR), Logroño 26006, Spain), Rosa Alejandra Salas-Bolaños (Vice-Rectorate of Research, Cesar Vallejo University, Trujillo 13001, Peru)

ឆ្នាំបោះពុម្ព៖ 2025 Research on World Agricultural Economy

វិស័យសិក្សា៖ Agricultural Economics

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការប្រែប្រួលតម្លៃកសិផលនៅក្នុងប្រទេសប៉េរូ បង្កបញ្ហាប្រឈមដល់សន្តិសុខស្បៀង និងស្ថិរភាពសេដ្ឋកិច្ច ជាពិសេសសម្រាប់ដំណាំសំខាន់ៗដូចជាផ្កាអាទីសូ (Artichoke)។ ការសិក្សានេះវាយតម្លៃភាពត្រឹមត្រូវនៃគំរូការព្យាករណ៍ដើម្បីប៉ាន់ស្មានតម្លៃប្រចាំខែឱ្យកាន់តែមានប្រសិទ្ធភាព។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានប្រើប្រាស់ទិន្នន័យប្រវត្តិសាស្រ្តពីខែមករា ឆ្នាំ២០២១ ដល់ខែធ្នូ ឆ្នាំ២០២៤ ដើម្បីប្រៀបធៀបគំរូការព្យាករណ៍ចំនួនប្រាំ ដោយប្រើប្រាស់ភាសា Python សម្រាប់ការវិភាគ និងការធ្វើឱ្យប្រសើរនូវប៉ារ៉ាម៉ែត្រ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
SARIMA (Seasonal ARIMA)
គំរូទស្សន៍ទាយ SARIMA (មានរួមបញ្ចូលកត្តារដូវកាល)
មានសមត្ថភាពខ្ពស់ក្នុងការចាប់យកលំនាំរដូវកាលដ៏ស្មុគស្មាញ និងដំណើរការបានល្អបំផុតសម្រាប់ការព្យាករណ៍រយៈពេលមធ្យម។ ទិន្នន័យសំណល់ (Residuals) មានលក្ខណៈជិតស្និទ្ធនឹង White Noise ដែលបញ្ជាក់ពីភាពរឹងមាំនៃគំរូ។ មានភាពរអាក់រអួលបន្តិចបន្តួចនៅពេលប្រឈមនឹងការប្រែប្រួលភ្លាមៗដែលមិនមែនជារដូវកាល (ឧទាហរណ៍៖ កំហុសខ្ពស់ក្នុងខែមករា)។ តម្រូវឱ្យមានការកំណត់ប៉ារ៉ាម៉ែត្រច្រើន។ ទទួលបានកំហុសមធ្យមទាបជាងគេបំផុតគឺ ១២,១៦% និងមានភាពត្រឹមត្រូវខ្ពស់ក្នុងខែកុម្ភៈ (កំហុសត្រឹម ៥,៦២%)។
ARIMA
គំរូទស្សន៍ទាយ ARIMA (មិនមានកត្តារដូវកាល)
មានដំណើរការល្អក្នុងការព្យាករណ៍និន្នាការទូទៅនៃស៊េរីពេលវេលា និងមានភាពរឹងមាំនៅពេលដែលទិន្នន័យមិនសូវមានលក្ខណៈរដូវកាលច្បាស់លាស់។ មិនអាចចាប់យកការប្រែប្រួលតម្លៃដែលបណ្តាលមកពីវដ្តរដូវកាលប្រចាំឆ្នាំបានល្អនោះទេ ដែលនាំឱ្យមានការកើនឡើងកំហុសក្នុងខែបន្ទាប់។ មានកំហុសមធ្យម ១៤,១៤% ដោយកំហុសក្នុងខែមករាមានត្រឹម ៣,៥០% ប៉ុន្តែកើនឡើងដល់ ២៤,៧៧% ក្នុងខែកុម្ភៈ។
Holt-Winters
គំរូ Holt-Winters (វិធីសាស្ត្រ Exponential Smoothing បូករដូវកាល)
ស័ក្តិសមសម្រាប់សំណុំទិន្នន័យដែលមាននិន្នាការ និងលំនាំរដូវកាលថេរច្បាស់លាស់ (Additive ឬ Multiplicative)។ ងាយរងគ្រោះ និងផ្តល់លទ្ធផលខុសឆ្ងាយពីការពិត នៅពេលទីផ្សារមានភាពប្រែប្រួលខ្លាំង ឬរដូវកាលមិនប្រក្រតី។ មានដំណើរការអន់ជាងគេ ដោយមានកំហុសមធ្យម ១៧,៤១% និងកំហុសខ្ពស់ដល់ទៅ ៣២,៩៩% ក្នុងខែកុម្ភៈ។
Naive Method
គំរូ Naive (យកតម្លៃចុងក្រោយជាការព្យាករណ៍)
ងាយស្រួលបំផុតក្នុងការប្រើប្រាស់ និងមានភាពត្រឹមត្រូវខ្ពស់ខ្លាំងសម្រាប់ការព្យាករណ៍រយៈពេលខ្លីបំផុត (១ខែខាងមុខ)។ មិនអាចសម្របខ្លួនទៅនឹងនិន្នាការ ឬរដូវកាលបានឡើយ ដែលធ្វើឱ្យវាមិនអាចប្រើប្រាស់បានសម្រាប់ការព្យាករណ៍រយៈពេលមធ្យម ឬវែង។ មានកំហុសទាបបំផុតក្នុងខែមករា (០,៥០%) ប៉ុន្តែបរាជ័យទាំងស្រុងក្នុងខែកុម្ភៈ (កំហុស ២៨,៩៤%)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះមិនតម្រូវឱ្យមានធនធានកុំព្យូទ័រ (Hardware) ធំដុំនោះទេ ប៉ុន្តែទាមទារចំណេះដឹងផ្នែកវិភាគស្ថិតិ និងសំណុំទិន្នន័យប្រវត្តិសាស្រ្តពេញលេញ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងដោយផ្អែកលើទិន្នន័យតម្លៃផ្កាអាទីសូ (Artichoke) នៅទីក្រុង Lima ប្រទេសប៉េរូ ដែលរងឥទ្ធិពលពីលក្ខខណ្ឌអាកាសធាតុ (ដូចជាគ្រោះរាំងស្ងួត) និងភស្តុភារនៅតំបន់អាមេរិកឡាទីន។ សម្រាប់ប្រទេសកម្ពុជា ទិន្នន័យកសិកម្មមានលក្ខណៈខុសប្លែកគ្នាដោយសារអាកាសធាតុត្រូពិច និងការពឹងផ្អែកលើដំណាំផ្សេងៗ ហេតុនេះការអនុវត្តគំរូទាំងនេះតម្រូវឱ្យប្រើប្រាស់សំណុំទិន្នន័យក្នុងស្រុក និងបញ្ចូលអថេរខាងក្រៅបន្ថែម។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្រ្តក្នុងឯកសារនេះគឺពិតជាមានអត្ថប្រយោជន៍ និងអាចយកមកអនុវត្តបានយ៉ាងមានប្រសិទ្ធភាពសម្រាប់ប្រព័ន្ធទស្សន៍ទាយតម្លៃកសិកម្មនៅកម្ពុជា។

ការបន្សាំគំរូនេះដោយរួមបញ្ចូលទាំងកត្តាអាកាសធាតុ (បរិមាណទឹកភ្លៀង) និងកត្តាភស្តុភារ នឹងជួយលើកកម្ពស់សន្តិសុខស្បៀង និងស្ថិរភាពប្រាក់ចំណូលរបស់កសិករនៅកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ប្រមូល និងរៀបចំទិន្នន័យកសិកម្មក្នុងស្រុក: ស្វែងរកទិន្នន័យប្រវត្តិសាស្រ្តនៃតម្លៃកសិផលប្រចាំខែ (ឧទាហរណ៍៖ ស្រូវ ឬដំឡូងមី) ពីក្រសួងកសិកម្ម។ បន្ទាប់មក រៀនប្រើប្រាស់បណ្ណាល័យ Pandas ក្នុង Python ដើម្បីសម្អាត និងរៀបចំទិន្នន័យទាំងនោះជាទម្រង់ Time Series។
  2. ធ្វើតេស្ត Stationarity នៃទិន្នន័យ: ប្រើប្រាស់មុខងារ Augmented Dickey-Fuller test តាមរយៈបណ្ណាល័យ Statsmodels ដើម្បីពិនិត្យមើលថាតើទិន្នន័យថេរឬទេ ហើយធ្វើ Differencing ប្រសិនបើចាំបាច់ (ស្វែងរកតម្លៃ d ឬ D សម្រាប់គំរូ)។
  3. ស្វែងរកប៉ារ៉ាម៉ែត្រល្អបំផុត (Model Optimization): សរសេរកូដដើម្បីដំណើរការ Grid Search ដោយធ្វើការសាកល្បងបន្សំប៉ារ៉ាម៉ែត្រ (p, d, q) និង (P, D, Q, S) សម្រាប់គំរូ SARIMA ដោយជ្រើសរើសយកគំរូណាដែលមានតម្លៃ AIC ទាបជាងគេបំផុត។
  4. វាយតម្លៃគំរូ និងវិភាគសំណល់ (Residual Diagnostics): ធ្វើការព្យាករណ៍លើទិន្នន័យសាកល្បង (Test Data) រួចគណនាកំហុស (Percentage Error)។ បន្ទាប់មក ប្រើប្រាស់ក្រាហ្វ ACF និង PACF ដើម្បីពិនិត្យមើលថាតើសំណល់នៃគំរូពិតជាគ្មានលំនាំដែលនៅសេសសល់ (White Noise) ឬទេ។
  5. ធ្វើឱ្យប្រសើរឡើងដោយបញ្ចូលអថេរខាងក្រៅ: នៅពេលដែលគំរូមូលដ្ឋានដំណើរការបានល្អ គួរងាកទៅសិក្សាពីគំរូ ARIMAX ឬបញ្ជូលបច្ចេកទេស Machine Learning ដោយបន្ថែមទិន្នន័យបរិមាណទឹកភ្លៀង (ពីក្រសួងធនធានទឹក) ដើម្បីបង្កើនភាពសុក្រឹតនៃការទស្សន៍ទាយនៅពេលមានបម្រែបម្រួលអាកាសធាតុ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
SARIMA (Seasonal ARIMA) ជាក្បួនគណិតវិទ្យាសម្រាប់វិភាគ និងទស្សន៍ទាយទិន្នន័យស៊េរីពេលវេលា ដោយគិតបញ្ចូលទាំងនិន្នាការទូទៅនៃការប្រែប្រួល និងវដ្តតាមរដូវកាលយ៉ាងជាក់លាក់ (ឧទាហរណ៍៖ តម្លៃកសិផលឡើងចុះតាមរដូវប្រមូលផលរៀងរាល់ឆ្នាំ)។ ដូចជាការទស្សន៍ទាយថានឹងមានភ្លៀងធ្លាក់នៅខែសីហាឆ្នាំក្រោយ ដោយផ្អែកលើកំណត់ត្រាថាខែសីហារាល់ឆ្នាំតែងតែមានភ្លៀងធ្លាក់ជានិច្ច។
Stationarity (ភាពថេរនៃទិន្នន័យ) ជាលក្ខណៈនៃទិន្នន័យស៊េរីពេលវេលាដែលមធ្យមភាគ (Mean) និងរង្វាស់នៃភាពប្រែប្រួល (Variance) របស់វាមិនផ្លាស់ប្តូរទៅតាមពេលវេលា ដែលជាលក្ខខណ្ឌចម្បងចាំបាច់ដើម្បីឱ្យគំរូដូចជា ARIMA អាចធ្វើការព្យាករណ៍បានត្រឹមត្រូវ។ ដូចជាការជិះកង់លើផ្លូវរាបស្មើ ដែលយើងងាយស្រួលក្នុងការប៉ាន់ស្មានល្បឿន និងគោលដៅ ជាជាងការជិះលើផ្លូវឡើងចុះចំណោតដែលល្បឿនចេះតែប្រែប្រួលមិនឈប់។
Akaike Information Criterion (លក្ខណៈវិនិច្ឆ័យព័ត៌មាន Akaike ឬ AIC) ជារង្វាស់មួយសម្រាប់វាយតម្លៃគុណភាពនៃគំរូស្ថិតិ។ តម្លៃ AIC កាន់តែទាប មានន័យថាគំរូនោះមានតុល្យភាពល្អប្រសើរបំផុតរវាងភាពសាមញ្ញ និងភាពត្រឹមត្រូវនៃការទស្សន៍ទាយ ដោយមិនមានភាពស្មុគស្មាញហួសហេតុពេក (Overfitting)។ ដូចជាការជ្រើសរើសទិញទូរស័ព្ទដៃ ដែលអ្នកចង់បានទូរស័ព្ទដែលដំណើរការល្អបំផុត ប៉ុន្តែមានតម្លៃធូរថ្លៃបំផុត (ចំណាយតិច ទទួលបានផលច្រើន)។
Residuals (ទិន្នន័យសំណល់) ជាភាពខុសគ្នារវាងតម្លៃពិតប្រាកដដែលបានកើតឡើង និងតម្លៃដែលគំរូបានទស្សន៍ទាយទុក។ ការវិភាគសំណល់នេះជួយឱ្យអ្នកស្រាវជ្រាវដឹងថា តើគំរូបានចាប់យកព័ត៌មាន និងលំនាំសំខាន់ៗពីទិន្នន័យអស់ហើយឬនៅ។ ដូចជាប្រាក់អាប់នៅពេលដែលយើងទិញអីវ៉ាន់។ ប្រសិនបើប្រាក់អាប់មានចំនួនខុសពីការរំពឹងទុកខ្លាំង មានន័យថាយើងប្រហែលជាគិតលុយខុសហើយ។
White noise (សំឡេងស ឬ ទិន្នន័យឥតលំនាំ) ក្នុងវិស័យស្ថិតិ វាសំដៅលើទិន្នន័យចៃដន្យដែលគ្មានលំនាំ គ្មាននិន្នាការ និងមិនអាចទស្សន៍ទាយបានទាល់តែសោះ។ គំរូព្យាករណ៍ដ៏ល្អមួយ ត្រូវតែបន្សល់ទុកតែទិន្នន័យសំណល់ (Residuals) ដែលមានលក្ខណៈជា White Noise ប៉ុណ្ណោះ។ ដូចជាសំឡេងតុកតាក់ៗនៅលើទូរទស្សន៍ដែលអត់មានប៉ុស្តិ៍ វាគ្រាន់តែជារលកសញ្ញាចៃដន្យដែលមិនមានអត្ថន័យអ្វីដែលអាចឱ្យយើងកត់សម្គាល់បានឡើយ។
Grid search (វិធីសាស្ត្រស្វែងរកប៉ារ៉ាម៉ែត្រដោយស្វ័យប្រវត្តិ) ជាដំណើរការសរសេរកូដដើម្បីសាកល្បងរាល់បន្សំប៉ារ៉ាម៉ែត្រទាំងអស់ដោយស្វ័យប្រវត្តិ ដើម្បីស្វែងរកការកំណត់មួយដែលធ្វើឱ្យគំរូទស្សន៍ទាយ (ដូចជា SARIMA) មានដំណើរការល្អបំផុត និងមានកំហុសតិចបំផុត។ ដូចជាការសាកល្បងចាក់សោលេខកូដវ៉ាលី ដោយបង្វិលសាកលេខម្ដងមួយៗ (០-៩) រហូតដល់រកឃើញលេខកូដត្រឹមត្រូវដែលអាចបើកវ៉ាលីបាន។
Exogenous variables (អថេរខាងក្រៅ) ជាកត្តាខាងក្រៅដែលអាចជះឥទ្ធិពលយ៉ាងខ្លាំងដល់លទ្ធផលនៃការព្យាករណ៍ ប៉ុន្តែមិនមែនជាផ្នែកនៃទិន្នន័យប្រវត្តិសាស្រ្តចម្បង ឧទាហរណ៍ដូចជា បរិមាណទឹកភ្លៀង គ្រោះរាំងស្ងួត ឬគោលនយោបាយរដ្ឋាភិបាលជាដើម។ បើយើងទស្សន៍ទាយពិន្ទុប្រឡងដោយផ្អែកលើម៉ោងរៀន នោះអាការៈឈឺក្បាលភ្លាមៗនៅថ្ងៃប្រឡង គឺជា "អថេរខាងក្រៅ" ដែលធ្វើឱ្យពិន្ទុធ្លាក់ចុះខុសពីការរំពឹងទុក។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖