Original Title: Empirical Comparison of Facebook Prophet and Traditional Models for Tomato Price Forecasting in Greece
Source: doi.org/10.36956/rwae.v5i4.1295
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការប្រៀបធៀបតាមបែបជាក់ស្តែងរវាងម៉ូដែល Facebook Prophet និងម៉ូដែលប្រពៃណីសម្រាប់ការព្យាករណ៍តម្លៃប៉េងប៉ោះនៅប្រទេសក្រិក

ចំណងជើងដើម៖ Empirical Comparison of Facebook Prophet and Traditional Models for Tomato Price Forecasting in Greece

អ្នកនិពន្ធ៖ Eirini Kostaridou (Democritus University of Thrace), Nikolaos Siatis (Independent Researcher), George Lampiris (Independent Researcher), Eleni Zafeiriou (Democritus University of Thrace)

ឆ្នាំបោះពុម្ព៖ 2024, Research on World Agricultural Economy

វិស័យសិក្សា៖ Agricultural Economics

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហាទាក់ទងនឹងភាពលំបាកក្នុងការវិភាគ និងការព្យាករណ៍តម្លៃកសិផល ជាពិសេសតម្លៃប៉េងប៉ោះនៅក្នុងប្រទេសក្រិក ដែលរងឥទ្ធិពលពីបម្រែបម្រួលរដូវកាល ការនាំចូល និងអថេរទីផ្សារផ្សេងៗ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់ទិន្នន័យស៊េរីពេលវេលាប្រចាំខែ (Monthly time-series data) ពីឆ្នាំ ២០១៣ ដល់ ២០២៣ ដើម្បីសាកល្បង និងប្រៀបធៀបប្រសិទ្ធភាពរវាងក្បួនដោះស្រាយទំនើបនិងម៉ូដែលស្ថិតិប្រពៃណី។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Facebook Prophet
ម៉ូដែលព្យាករណ៍ Facebook Prophet
មានសមត្ថភាពខ្ពស់ក្នុងការចាប់យកកត្តាប្រែប្រួលតាមរដូវកាល និន្នាការទីផ្សារលីនេអ៊ែរ និងមិនលីនេអ៊ែរ ព្រមទាំងងាយស្រួលប្រើប្រាស់។ ទាមទារទិន្នន័យប្រវត្តិសាស្ត្រច្រើនដើម្បីឱ្យការព្យាករណ៍កាន់តែច្បាស់ ហើយក្បួនដោះស្រាយមានលក្ខណៈស្មុគស្មាញ (Black box) ពិបាកបកស្រាយជាងម៉ូដែលស្ថិតិធម្មតា។ មានប្រសិទ្ធភាពខ្ពស់បំផុត ដោយទទួលបានកំហុស MAPE ត្រឹមតែ 12%, MAE 0.12 និង RMSE 0.13 ប៉ុណ្ណោះសម្រាប់ការព្យាករណ៍រយៈពេល៦ខែ។
SARIMA (Seasonal ARIMA)
ម៉ូដែលស្ថិតិ SARIMA
ជាវិធីសាស្ត្រដែលត្រូវបានទទួលស្គាល់យ៉ាងទូលំទូលាយ និងមានភាពរឹងមាំក្នុងការដោះស្រាយទិន្នន័យស៊េរីពេលវេលាដែលមានរដូវកាលច្បាស់លាស់។ ត្រូវការចំណេះដឹងស្ថិតិស៊ីជម្រៅដើម្បីកំណត់ប៉ារ៉ាម៉ែត្រ (p, d, q) និងមិនសូវបត់បែននៅពេលប្រឈមនឹងការផ្លាស់ប្តូរទីផ្សារភ្លាមៗ។ ទទួលបានលទ្ធផលកម្រិតមធ្យម ដែលមានកំហុស MAPE 17%, MAE 0.15 និង RMSE 0.17។
TRAMO/SEATS
ម៉ូដែល TRAMO/SEATS
មានសមត្ថភាពក្នុងការកែតម្រូវទិន្នន័យដែលបាត់បង់ដោយស្វ័យប្រវត្តិ និងមានភាពសុក្រឹតក្នុងការបំបែកទិន្នន័យ (Trend, Cycle, Seasonality)។ មានភាពស្មុគស្មាញក្នុងការអនុវត្ត ហើយទាមទារកម្មវិធីជាក់លាក់ក្នុងការដំណើរការបើធៀបនឹងម៉ូដែលសាមញ្ញ។ ផ្តល់លទ្ធផលប្រហាក់ប្រហែលនឹង SARIMA ដែលមានកំហុស MAPE 17%, MAE 0.15 និង RMSE 0.18។
Moving Average
វិធីសាស្ត្រមធ្យមភាគផ្លាស់ទី
សាមញ្ញបំផុតក្នុងការគណនា និងងាយស្រួលយល់សម្រាប់អ្នកដែលមិនមានជំនាញបច្ចេកទេស។ មិនអាចចាប់យកភាពប្រែប្រួលរដូវកាលដ៏ស្មុគស្មាញបានល្អនោះទេ ហើយការព្យាករណ៍អាចមានភាពយឺតយ៉ាវជាងនិន្នាការជាក់ស្តែង។ ដំណើរការបានល្អគួរសម ដោយមានកំហុស MAPE 15%, MAE 0.14 និង RMSE 0.17។
STL (Seasonal-Trend Decomposition using Loess)
ម៉ូដែលបំបែករដូវកាលនិងនិន្នាការដោយប្រើ STL
មានភាពបត់បែនខ្ពស់ក្នុងការស្រង់យកទិន្នន័យរដូវកាលចេញពីស៊េរីពេលវេលាដែលមិនប្រក្រតី។ ចាំបាច់ត្រូវប្រើរួមបញ្ចូលជាមួយវិធីសាស្ត្រផ្សេងទៀតសម្រាប់ធ្វើការព្យាករណ៍ ហើយការសិក្សានេះបង្ហាញថាវាមានកម្រិតកំហុសខ្ពស់ជាងគេ។ ដំណើរការខ្សោយជាងគេ ដោយមានកំហុសខ្ពស់បំផុត MAPE 22%, MAE 0.19 និង RMSE 0.24។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះប្រើប្រាស់កម្មវិធីកុំព្យូទ័រជាមូលដ្ឋាន និងកញ្ចប់ទិន្នន័យតម្លៃទីផ្សារជាប្រវត្តិសាស្រ្ត ដែលមិនទាមទារធនធានកុំព្យូទ័រធំដុំ (High-performance computing) នោះទេ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងនៅប្រទេសក្រិក ដោយប្រើប្រាស់ទិន្នន័យទីផ្សារកសិផលអឺរ៉ុប ដែលមានលក្ខខណ្ឌអាកាសធាតុអំណោយផល និងប្រព័ន្ធដាំដុះក្នុងផ្ទះកញ្ចក់ (Greenhouse) ទំនើបៗ។ ចំពោះប្រទេសកម្ពុជា បញ្ហានេះមានសារៈសំខាន់ណាស់ ព្រោះយើងមានអាកាសធាតុប្រាំងនិងវស្សាដាច់ដោយឡែក ហើយការកំណត់តម្លៃភាគច្រើនរងឥទ្ធិពលយ៉ាងខ្លាំងពីការនាំចូលកសិផលពីប្រទេសជិតខាង (វៀតណាម និងថៃ) ដូច្នេះម៉ូដែលនេះត្រូវតែបញ្ចូលកត្តាអាកាសធាតុ និងបរិមាណនាំចូលបន្ថែម។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រព្យាករណ៍នេះមានសក្តានុពលខ្ពស់ក្នុងការយកមកអនុវត្ត ដើម្បីគាំទ្រដល់វិស័យកសិកម្ម និងប្រព័ន្ធសេដ្ឋកិច្ចនៅក្នុងប្រទេសកម្ពុជា។

សរុបមក ការស្ថាបនាម៉ូដែលទំនើបដូចជា Facebook Prophet នឹងជួយបំលែងទិន្នន័យកសិកម្មកម្ពុជាឲ្យទៅជាព័ត៌មានដែលអាចធ្វើសកម្មភាពបាន (Actionable insights) ដែលនាំទៅរកស្ថិរភាពទីផ្សារ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ប្រមូល និងសម្អាតទិន្នន័យ (Data Collection & Preprocessing): ប្រមូលទិន្នន័យតម្លៃប្រចាំខែនៃកសិផល (ឧ. ស្រូវ ឬស្វាយកែវរមៀត) ពីក្រសួងពាណិជ្ជកម្ម ហើយធ្វើការសម្អាតទិន្នន័យដែលបាត់បង់ដោយប្រើប្រាស់បណ្ណាល័យ Pandas នៅក្នុងភាសា Python
  2. រៀនសរសេរកូដបង្កើតម៉ូដែលមូលដ្ឋាន (Develop Baseline Model): សាកល្បងសរសេរកូដដើម្បីកំណត់ និងបណ្តុះបណ្តាលម៉ូដែលដោយប្រើប្រាស់ prophet package នៅក្នុង Jupyter Notebook ដើម្បីស្វែងយល់ពីរបៀបដែលវាចាប់យកនិន្នាការ (Trend)។
  3. បញ្ចូលកត្តារដូវកាល និងពិធីបុណ្យជាតិ (Add Seasonality & Holidays): កែច្នៃកូដម៉ូដែលដោយបញ្ចូលកាលបរិច្ឆេទនៃពិធីបុណ្យជាតិសំខាន់ៗនៅកម្ពុជា (ដូចជា ចូលឆ្នាំខ្មែរ ភ្ជុំបិណ្ឌ) ដែលមានឥទ្ធិពលយ៉ាងខ្លាំងទៅលើតម្រូវការទីផ្សារនិងការប្រែប្រួលតម្លៃ។
  4. វាយតម្លៃ និងប្រៀបធៀបគំរូ (Evaluate & Tune Performance): ប្រើប្រាស់រង្វាស់បច្ចេកទេស MAE, RMSE និង MAPE ពី scikit-learn មកត្រួតពិនិត្យភាពត្រឹមត្រូវនៃការព្យាករណ៍របស់អ្នក រួចធ្វើការប្រៀបធៀបជាមួយវិធីសាស្ត្រ Moving Average ។
  5. បង្កើតផ្ទាំងបង្ហាញទិន្នន័យ (Deploy Dashboard): រៀបចំផ្ទាំង Interactive Dashboard ដោយប្រើ Streamlit ដើម្បើបង្ហាញលទ្ធផលព្យាករណ៍តម្លៃចេញពីម៉ូដែល ឱ្យកសិករឬអ្នកពាក់ព័ន្ធអាចចូលមើលបានងាយស្រួលតាមអ៊ីនធឺណិត។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Time Series (ស៊េរីពេលវេលា) ទិន្នន័យដែលត្រូវបានប្រមូលផ្តុំនិងកត់ត្រាជាបន្តបន្ទាប់តាមលំដាប់លំដោយនៃពេលវេលា (ដូចជាប្រចាំថ្ងៃ ប្រចាំខែ ឬប្រចាំឆ្នាំ) ដើម្បីសង្កេតមើលការប្រែប្រួល និន្នាការ និងលំនាំផ្សេងៗនាពេលអនាគត។ ដូចជាការកត់ត្រាកម្ពស់របស់អ្នកជារៀងរាល់ខែតាំងពីតូចដល់ធំ ដើម្បីមើលថាអ្នកលូតលាស់លឿនប៉ុនណាតាមពេលវេលា។
Facebook Prophet (ម៉ូដែល Facebook Prophet) ក្បួនដោះស្រាយសម្រាប់ធ្វើការព្យាករណ៍ទិន្នន័យស៊េរីពេលវេលា ដែលអភិវឌ្ឍដោយក្រុមហ៊ុន Meta (Facebook) ដោយវាមានសមត្ថភាពខ្ពស់ក្នុងការចាប់យករដូវកាល ថ្ងៃឈប់សម្រាក និងការប្រែប្រួលទីផ្សារដោយស្វ័យប្រវត្តិ។ ដូចជាអ្នកជំនាញម្នាក់ដែលដឹងច្បាស់ពីទម្លាប់របស់អ្នក (ឧ. តែងតែចំណាយច្រើននៅថ្ងៃបុណ្យទាន) ហើយអាចទាយដឹងថាខែក្រោយអ្នកនឹងចាយលុយអស់ប៉ុន្មានយ៉ាងងាយស្រួល។
SARIMA (Seasonal Autoregressive Integrated Moving Average) (ម៉ូដែល SARIMA) ម៉ូដែលស្ថិតិបុរាណមួយដែលប្រើសម្រាប់ការព្យាករណ៍អនាគត ដោយពឹងផ្អែកលើការវិភាគទំនាក់ទំនងនៃទិន្នន័យអតីតកាល និងកែតម្រូវកត្តារដូវកាល (Seasonality) ដែលកើតឡើងដដែលៗ។ ដូចជាការទស្សន៍ទាយអាកាសធាតុថ្ងៃស្អែក ដោយការរំលឹក និងប្រៀបធៀបទៅនឹងអាកាសធាតុថ្ងៃនេះ ម្សិលមិញ និងរដូវកាលដូចគ្នាកាលពីឆ្នាំមុន។
Seasonality (ភាពប្រែប្រួលតាមរដូវកាល) លំនាំនៃបំរែបំរួលទិន្នន័យដែលតែងតែកើតឡើងដដែលៗនិងអាចទស្សន៍ទាយបានក្នុងចន្លោះពេលជាក់លាក់ណាមួយ ដូចជាការឡើងថ្លៃទំនិញនៅរដូវបុណ្យទាន ឬតម្លៃស្រូវធ្លាក់ចុះនៅរដូវប្រមូលផល។ ដូចជាចរាចរណ៍ផ្លូវថ្នល់ដែលតែងតែស្ទះខ្លាំងនៅម៉ោង៥ល្ងាចជារៀងរាល់ថ្ងៃធ្វើការ។
Logistic Growth Model (ម៉ូដែលកំណើនភស្តុភារ) ទម្រង់គណិតវិទ្យាដែលពណ៌នាពីកំណើនមួយដែលកើនឡើងលឿននៅពេលដំបូង រួចក៏ថយល្បឿន និងរក្សាភាពថេរនៅពេលវាឈានដល់កម្រិតអតិបរមាណាមួយ (ហៅថា Carrying Capacity) ដើម្បីការពារកុំឱ្យការព្យាករណ៍ខុសពីការពិត។ ដូចជាការចាក់ទឹកចូលក្នុងកែវ ពេលកែវជិតពេញ អ្នកនឹងចាក់យឺតៗរហូតដល់ពេញល្មមដើម្បីកុំឱ្យវាហៀរចេញមកក្រៅ។
TRAMO/SEATS (ម៉ូដែល TRAMO/SEATS) វិធីសាស្ត្រស្ថិតិដែលត្រូវបានប្រើប្រាស់យ៉ាងទូលំទូលាយសម្រាប់បំបែកទិន្នន័យស៊េរីពេលវេលាទៅជាផ្នែកតូចៗ (និន្នាការ រដូវកាល វដ្ត) និងធ្វើការសម្អាតទិន្នន័យដែលខុសប្រក្រតី (Outliers) មុននឹងធ្វើការព្យាករណ៍។ ដូចជាការបំបែកសំឡេងចម្រៀងមួយបទ ដើម្បីទាញយកតែសំឡេងអ្នកច្រៀង សំឡេងហ្គីតា និងចម្រោះចោលនូវសំឡេងរំខានផ្សេងៗ។
Mean Absolute Percentage Error (MAPE) (កំហុសភាគរយដាច់ខាតជាមធ្យម) រូបមន្តសម្រាប់វាស់ស្ទង់ភាពត្រឹមត្រូវនៃម៉ូដែលព្យាករណ៍ ដែលប្រាប់ពីភាពលម្អៀងជាមធ្យមនៃលទ្ធផលព្យាករណ៍ធៀបនឹងតម្លៃជាក់ស្តែង ដោយគិតជាភាគរយ (វាកាន់តែតូច មានន័យថាម៉ូដែលកាន់តែត្រឹមត្រូវ)។ ដូចជាការបាញ់ស៊ីប ប្រសិនបើអ្នកបាញ់ខុសគោលដៅជាមធ្យម ១០% នោះមានន័យថាការបាញ់របស់អ្នកនៅមានកំហុស MAPE ១០%។
STL Decomposition (ការបំបែកទិន្នន័យតាមវិធីសាស្ត្រ STL) បច្ចេកទេសកុំព្យូទ័រក្នុងការបំបែកទិន្នន័យស៊េរីពេលវេលាទៅជាបីសមាសភាគធំៗគឺ៖ និន្នាការរលូន (Trend), ឥទ្ធិពលរដូវកាល (Seasonality) និងផ្នែកសំណល់ (Residuals) ដើម្បីផ្តល់ភាពងាយស្រួលក្នុងការវិភាគ។ ដូចជាការបំបែកមុខម្ហូបមួយចានធំទៅតាមប្រភេទនៃវត្ថុធាតុដើម ដើម្បីស្រាវជ្រាវថាតើរសជាតិណាដែលមានឥទ្ធិពលខ្លាំងជាងគេ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖