Original Title: Hybrid models of dynamical systems: neural differential equations, Shapley value analysis and illustrations in water systems
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

គំរូកូនកាត់នៃប្រព័ន្ធឌីណាមិក៖ សមីការឌីផេរ៉ង់ស្យែលសរសៃប្រសាទ ការវិភាគតម្លៃ Shapley និងការបង្ហាញនៅក្នុងប្រព័ន្ធទឹក

ចំណងជើងដើម៖ Hybrid models of dynamical systems: neural differential equations, Shapley value analysis and illustrations in water systems

អ្នកនិពន្ធ៖ Ward Quaghebeur (Ghent University)

ឆ្នាំបោះពុម្ព៖ 2022, Ghent University

វិស័យសិក្សា៖ Mathematical Modelling

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការធ្វើគំរូប្រព័ន្ធទឹកជាទូទៅជួបប្រទះនឹងដែនកំណត់ ដោយសារគំរូមេកានិក (Mechanistic models) មិនអាចចាប់យកសក្ដានុពលស្មុគស្មាញបានពេញលេញ ខណៈដែលគំរូផ្អែកលើទិន្នន័យ (Data-driven models) មិនអាចធ្វើការបកស្រាយបាន និងខ្សោយក្នុងការទស្សន៍ទាយស្ថានភាពថ្មីៗ។ ប្រព័ន្ធប្រព្រឹត្តិកម្មទឹកទាមទារនូវភាពសុក្រឹតខ្ពស់ដើម្បីបង្កើនប្រសិទ្ធភាពប្រតិបត្តិការ។

វិធីសាស្ត្រ (The Methodology)៖ និក្ខេបបទនេះស្នើឡើងនូវវិធីសាស្ត្រធ្វើគំរូកូនកាត់ (Hybrid modelling) ដែលរួមបញ្ចូលចំណេះដឹងផ្នែកមេកានិកទៅក្នុងបណ្តាញសរសៃប្រសាទ និងប្រើប្រាស់ទ្រឹស្តីហ្គេមសម្រាប់ការវិភាគលទ្ធផល។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Mechanistic Models
គំរូមេកានិកផ្អែកលើច្បាប់រូបវិទ្យា និងគីមី (Mechanistic Models)
មានភាពងាយស្រួលក្នុងការបកស្រាយ (Interpretable) ព្រោះវាផ្អែកលើច្បាប់ធម្មជាតិ និងមានសមត្ថភាពអាចទស្សន៍ទាយទិន្នន័យក្នុងស្ថានភាពដែលមិនធ្លាប់ជួបប្រទះ (Extrapolation)។ មិនអាចចាប់យកសក្ដានុពលស្មុគស្មាញ ឬបាតុភូតដែលមិនទាន់យល់ច្បាស់បានទេ ដែលធ្វើឱ្យការព្យាករណ៍មានកម្រិតខុសឆ្គងខ្ពស់ប្រសិនបើខ្វះព័ត៌មាន។ ទទួលបានលទ្ធផលមិនសូវល្អពេលជួបប្រទះស្ថានភាពភ្លៀងធ្លាក់ខ្លាំង (Rainy weather) នៅក្នុងប្រព័ន្ធ ASM ដោយមានកម្រិតលម្អៀង (RMSE) រហូតដល់ ៣.០៦។
Pure Data-Driven Models (e.g., LSTM)
គំរូផ្អែកលើទិន្នន័យសុទ្ធ (ឧទាហរណ៍ LSTM និង Neural Networks ធម្មតា)
មានភាពសុក្រឹតខ្ពស់ក្នុងការទស្សន៍ទាយលើទិន្នន័យដែលស្រដៀងនឹងទិន្នន័យបង្ហាត់ (Training data) ដោយមិនចាំបាច់មានការយល់ដឹងស៊ីជម្រៅពីប្រព័ន្ធរូបវិទ្យា។ គ្មានសមត្ថភាពទស្សន៍ទាយស្ថានភាពថ្មីៗ (Poor extrapolation) និងមិនអាចបកស្រាយប្រភពនៃការសម្រេចចិត្តបាន (Black-box) ព្រមទាំងអាចផ្តល់លទ្ធផលដែលផ្ទុយពីច្បាប់រូបវិទ្យា (ឧ. កំហាប់អវិជ្ជមាន)។ បរាជ័យទាំងស្រុងក្នុងការទស្សន៍ទាយសម្ពាធ Reverse Osmosis សម្រាប់រយៈពេលវែង (RMSE = ៥.២១) និងខុសឆ្គងខ្លាំងពេលមានភ្លៀងធ្លាក់ក្នុងប្រព័ន្ធ ASM (RMSE = ៥.៧៥)។
Hybrid Neural Differential Equations (NDEs)
គំរូកូនកាត់ផ្អែកលើសមីការឌីផេរ៉ង់ស្យែលសរសៃប្រសាទ (Hybrid NDEs)
រួមបញ្ចូលភាពខ្លាំងនៃចំណេះដឹងមេកានិក និងកម្លាំងទស្សន៍ទាយរបស់ AI ដែលជួយឱ្យវាចាប់យកសក្ដានុពលលាក់កំបាំងបានល្អ និងអាចទស្សន៍ទាយស្ថានភាពថ្មីៗដោយជោគជ័យ។ ទាមទារថាមពលកុំព្យូទ័រខ្ពស់ខ្លាំងមែនទែនសម្រាប់ការបង្ហាត់ (អាចចំណាយពេលរាប់ខែសម្រាប់គំរូស្មុគស្មាញ) និងត្រូវការអ្នកជំនាញផ្នែកទាំងពីរ។ ទទួលបានលទ្ធផលល្អបំផុតក្នុងការទស្សន៍ទាយកម្រិតយូរអង្វែងនៃប្រព័ន្ធ Reverse Osmosis (RMSE = ០.៩២) និងដំណើរការបានល្អបំផុតពេលមានភ្លៀង (RMSE = ០.៦៦)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអភិវឌ្ឍ និងបង្ហាត់គំរូកូនកាត់ប្រភេទនេះទាមទារនូវថាមពលកុំព្យូទ័រខ្លាំងសម្បើម និងពេលវេលាយូរ ជាពិសេសសម្រាប់ប្រព័ន្ធស្មុគស្មាញ (ដូចជាប្រព័ន្ធ RO ដែលទាមទារពេលបង្ហាត់ជាង ២ ខែ ទោះប្រើ GPU ក៏ដោយ)។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់ទិន្នន័យសិប្បនិម្មិតពីប្រព័ន្ធ BSM1 និងទិន្នន័យប្រតិបត្តិការជាក់ស្តែងពីរោងចក្រប្រព្រឹត្តិកម្មទឹកនៅប្រទេសប៊ែលហ្សិក។ ទិន្នន័យអឺរ៉ុបទាំងនេះឆ្លុះបញ្ចាំងពីការប្រែប្រួលសីតុណ្ហភាពតាមរដូវកាល (រដូវរងាធ្លាក់ទឹកកក និងរដូវក្តៅ) ខណៈដែលកម្ពុជាជាប្រទេសតំបន់ត្រូពិចដែលមានរដូវប្រាំង និងរដូវវស្សា ដែលធ្វើឱ្យលក្ខណៈនៃកំហាប់ទឹក សីតុណ្ហភាព និងមេរោគមានភាពខុសគ្នាស្រឡះ។ ហេតុនេះ ការយកមកអនុវត្តផ្ទាល់ត្រូវការទិន្នន័យក្នុងស្រុក។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាបរិបទអាកាសធាតុខុសគ្នាក៏ដោយ វិធីសាស្ត្រ Hybrid Modelling នេះមានសក្តានុពលដ៏ធំធេងក្នុងការធ្វើទំនើបកម្មហេដ្ឋារចនាសម្ព័ន្ធទឹកនៅកម្ពុជា។

សរុបមក ការអនុវត្តបច្ចេកវិទ្យានេះនឹងជួយបំប្លែងប្រតិបត្តិការទឹកនៅកម្ពុជាពីការធ្វើតាមទម្លាប់ ទៅជាការសម្រេចចិត្តផ្អែកលើទិន្នន័យនិងវិទ្យាសាស្ត្រច្បាស់លាស់ ដោយកាត់បន្ថយហានិភ័យនិងថ្លៃចំណាយថែទាំ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ជំហានទី១៖ សិក្សាមូលដ្ឋានគ្រឹះសមីការឌីផេរ៉ង់ស្យែល (ODEs): និស្សិតគួរចាប់ផ្តើមរៀនពីរបៀបសរសេរសមីការ Ordinary Differential Equations ដែលតំណាងឱ្យច្បាប់រូបវិទ្យា និងគីមី (ដូចជា Mass Balance) ដោយអនុវត្តកូដដោះស្រាយសមីការប្រើប្រាស់បណ្ណាល័យ SciPy (Python)MATLAB
  2. ជំហានទី២៖ ស្វែងយល់ពីបច្ចេកវិទ្យា Deep Learning ស៊ីជម្រៅ: ត្រូវរៀនពីការកសាងបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត ដូចជា Multilayer Perceptron (MLP) និង LSTM សម្រាប់ទិន្នន័យពេលវេលា (Time-series) ដោយសរសេរកូដតាមរយៈ PyTorch
  3. ជំហានទី៣៖ អនុវត្តការធ្វើគំរូកូនកាត់ (Neural ODEs): រៀនពីរបៀបបំពាក់ Neural Networks ទៅក្នុងសមីការរូបវិទ្យា ដោយប្រើប្រាស់កញ្ចប់កូដ TorchDiffEq។ ចាប់ផ្តើមធ្វើតេស្តលើប្រព័ន្ធសាមញ្ញៗដូចជា ប៉ោលយោល (Pendulum) មុននឹងឈានទៅធ្វើលើប្រព័ន្ធធំៗ។
  4. ជំហានទី៤៖ សិក្សាពីការបកស្រាយ AI (Model Interpretability): ប្រើប្រាស់កញ្ចប់កូដ SHAP ដើម្បីរៀនពីការវិភាគតម្លៃ Shapley ដែលអាចប្រាប់យើងពីមូលហេតុដែល AI សម្រេចចិត្តទស្សន៍ទាយលទ្ធផលណាមួយ ដើម្បីស្វែងរកទំនាក់ទំនងរូបវិទ្យាដែលលាក់កំបាំងពីទិន្នន័យ។
  5. ជំហានទី៥៖ គម្រោងស្រាវជ្រាវជាមួយទិន្នន័យក្នុងស្រុក: សហការជាមួយស្ថាប័នទឹកក្នុងស្រុក (ឧទាហរណ៍ PPWSA) ដើម្បីស្នើសុំទិន្នន័យប្រតិបត្តិការ (សីតុណ្ហភាព សម្ពាធទឹក កំហាប់) យកមកបង្ហាត់គំរូកូនកាត់នេះ ដើម្បីស្វែងរកដំណោះស្រាយពិតប្រាកដជូនជាតិ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Hybrid modelling ការធ្វើគំរូកូនកាត់ គឺជាការរួមបញ្ចូលគ្នារវាងគំរូមេកានិក (ផ្អែកលើច្បាប់រូបវិទ្យា/គីមី) និងគំរូផ្អែកលើទិន្នន័យ (បញ្ញាសិប្បនិម្មិត) ដើម្បីទាញយកចំណុចខ្លាំងនៃវិធីសាស្ត្រទាំងពីរ និងប៉ះប៉ូវចំណុចខ្វះខាតរៀងៗខ្លួនក្នុងការធ្វើការព្យាករណ៍ប្រព័ន្ធណាមួយឱ្យបានសុក្រឹតបំផុត។ ដូចជាការបើកបររថយន្តដោយប្រើផែនទីច្បាស់លាស់ (គំរូមេកានិក) រួមជាមួយការសង្កេតស្ថានភាពចរាចរណ៍ជាក់ស្តែងតាមរយៈកាមេរ៉ា (គំរូទិន្នន័យ) ដើម្បីទៅដល់គោលដៅប្រកបដោយសុវត្ថិភាព។
Neural differential equations សមីការឌីផេរ៉ង់ស្យែលសរសៃប្រសាទ គឺជាវិធីសាស្ត្រប្រើប្រាស់បណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (Neural Networks) ដើម្បីរៀន និងស្វែងរកទម្រង់នៃការប្រែប្រួលនៃប្រព័ន្ធមួយទៅតាមពេលវេលា ដោយវាអាចជួយបំពេញបន្ថែមសមីការគណិតវិទ្យា ឬច្បាប់ធម្មជាតិដែលយើងមិនទាន់យល់ច្បាស់ពីរូបរាងរបស់វា។ ដូចជាការផ្តល់ឱ្យ AI នូវវីដេអូដើមឈើលូតលាស់ ហើយឱ្យវារកសមីការគណិតវិទ្យាមកពន្យល់ពីល្បឿននៃការលូតលាស់នោះ ទោះបីជាវាមិនធ្លាប់ស្គាល់ទ្រឹស្តីជីវវិទ្យាក៏ដោយ។
Shapley value analysis ការវិភាគតម្លៃ Shapley គឺជាវិធីសាស្ត្រមួយផ្អែកលើទ្រឹស្តីហ្គេម (Game Theory) ដែលត្រូវបានប្រើដើម្បីគណនា និងបែងចែកចំណែកនៃការចូលរួម (កម្រិតឥទ្ធិពល) របស់អថេរនីមួយៗទៅលើលទ្ធផលចុងក្រោយ ដែលបានទស្សន៍ទាយដោយម៉ូដែល AI ដូូចជាដើម្បីចង់ដឹងថាមូលហេតុអ្វីទើប AI ទស្សន៍ទាយបែបនេះ។ ដូចជាការបែងចែកប្រាក់រង្វាន់ដល់កីឡាករម្នាក់ៗក្នុងក្រុមបាល់ទាត់ដោយយុត្តិធម៌បំផុត ដោយផ្អែកលើថាតើកីឡាករម្នាក់នោះបានជួយឱ្យក្រុមរកគ្រាប់បាល់បានច្រើនកម្រិតណា។
Mechanistic models គំរូមេកានិក គឺជាគំរូគណិតវិទ្យាដែលត្រូវបានបង្កើតឡើងដោយផ្អែកលើចំណេះដឹងទ្រឹស្តី ច្បាប់រូបវិទ្យា គីមីវិទ្យា ឬជីវវិទ្យា ដែលអាចពន្យល់ពីមូលហេតុ និងបច្ច័យនៃបាតុភូតអ្វីមួយយ៉ាងច្បាស់លាស់ពីខាងក្នុង។ ដូចជារូបមន្តធ្វើនំខេកដែលមានប្រាប់ច្បាស់ពីចំនួនម្សៅ ស្ករ និងសីតុណ្ហភាពដុត ដែលធ្វើឱ្យយើងដឹងច្បាស់ពីមូលហេតុដែលនំមានរសជាតិឆ្ងាញ់ឬមិនឆ្ងាញ់។
Activated Sludge Model គំរូកាកសំណល់សកម្ម គឺជាគំរូស្តង់ដារគណិតវិទ្យាដែលត្រូវបានប្រើប្រាស់ដើម្បីក្លែងធ្វើដំណើរការរោងចក្រប្រព្រឹត្តិកម្មទឹកកខ្វក់ ជាពិសេសផ្តោតលើសក្ដានុពលនៃការប្រើប្រាស់បាក់តេរីដើម្បីបំបែក ឬស៊ីកាកសំណល់សរីរាង្គនៅក្នុងទឹកប្រកបដោយប្រសិទ្ធភាព។ ដូចជាការចិញ្ចឹមត្រីក្នុងអាងដើម្បីឱ្យស៊ីស្លែ ដោយយើងត្រូវគណនាពីចំនួនត្រី ចំនួនអុកស៊ីសែន និងចំណីដែលវាត្រូវស៊ីដើម្បីឱ្យទឹកក្នុងអាងថ្លាល្អឡើងវិញ។
Reverse osmosis អូស្មូសបញ្ច្រាស (RO) គឺជាបច្ចេកវិទ្យាចម្រោះទឹកកម្រិតខ្ពស់ ដោយប្រើសម្ពាធខ្លាំងដើម្បីរុញទឹកឆ្លងកាត់ភ្នាសច្រោះដ៏តូចល្អិត (Membrane) ដើម្បីបំបែកយកមេរោគ សារធាតុគីមី និងអំបិលចេញពីទឹក ដើម្បីទទួលបានទឹកសុទ្ធបរិសុទ្ធ។ ដូចជាការប្រើកម្លាំងដៃច្របាច់តម្រងកាហ្វេដ៏ក្រាស់មួយ ដើម្បីយកតែទឹកកាហ្វេសុទ្ធ ដោយបង្ខំទុកកាកកាហ្វេនិងកម្ទេចតូចៗឱ្យនៅជាប់លើតម្រងនោះ។
Overfitting ការរៀនទន្ទេញចាំ ឬ Overfitting គឺជាបាតុភូតនៅក្នុង Machine Learning ដែលម៉ូដែលមួយរៀនចងចាំព័ត៌មាននិងភាពរំខាន (Noise) នៅក្នុងទិន្នន័យសម្រាប់បង្ហាត់បានល្អពេក ប៉ុន្តែវាបរាជ័យក្នុងការទស្សន៍ទាយឬធ្វើការលើទិន្នន័យថ្មីៗក្នុងស្ថានភាពជាក់ស្តែង។ ដូចសិស្សដែលទន្ទេញចាំមាត់នូវចម្លើយលំហាត់ក្នុងសៀវភៅបាន១០០% តែមិនចេះធ្វើលំហាត់ពេលប្រឡងប្រសិនបើគ្រូប្តូរលេខសូម្បីតែបន្តិច។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖