Original Title: Statistical Methods in Hydrology
Source: doi.org/10.3133/tm4a3
Document Type: Textbook / Educational Material
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original material for complete content.

វិធីសាស្ត្រស្ថិតិក្នុងវារីសាស្ត្រ

ចំណងជើងដើម៖ Statistical Methods in Hydrology

អ្នកនិពន្ធ៖ Prof. Belize Lane (Utah State University)

ឆ្នាំបោះពុម្ព៖ 2020 Utah State University

វិស័យសិក្សា៖ Hydrology

១. សេចក្តីសង្ខេប (Overview)

ប្រធានបទ (Topic)៖ ឯកសារនេះដោះស្រាយតម្រូវការក្នុងការប្រើប្រាស់ស្ថិតិដើម្បីសង្ខេបទិន្នន័យវារីសាស្ត្រដែលមានភាពស្មុគស្មាញ និងទស្សន៍ទាយពីឥរិយាបថនាពេលអនាគតនៃបាតុភូតទឹក ដូចជាទឹកជំនន់ និងលំហូរទឹកទន្លេ។

រចនាសម្ព័ន្ធ (Structure)៖ អត្ថបទនេះបង្ហាញពីគំរូប្រូបាប៊ីលីតេ និងបច្ចេកទេសវិភាគទិន្នន័យ ដែលត្រូវបានអនុវត្តជាពិសេសលើទិន្នន័យវារីសាស្ត្រ។

ចំណុចសំខាន់ៗ (Key Takeaways)៖

២. គោលបំណងសិក្សា (Learning Objectives)

បន្ទាប់ពីអានឯកសារនេះ អ្នកគួរអាច៖

  1. យល់ដឹងពីគោលបំណងនៃការប្រើប្រាស់វិធីសាស្ត្រស្ថិតិ (Statistical methods) ដើម្បីសង្ខេប និងទស្សន៍ទាយដំណើរការវារីសាស្ត្រដែលមានលក្ខណៈចៃដន្យ (Stochastic processes)។
  2. អាចវិភាគនិងសង្ខេបទិន្នន័យស៊េរីពេលវេលា (Time-series data) តាមរយៈការប្រើប្រាស់ក្រាហ្វ និងការបង្កើតខ្សែកោងថិរវេលាលំហូរ (Flow Duration Curves)។
  3. អនុវត្តការវិភាគប្រេកង់ (Frequency analysis) របាយប្រូបាប៊ីលីតេ (Probability distributions) និងការវាយតម្លៃភាពមិនប្រាកដប្រជា (Uncertainty quantification) សម្រាប់ព្រឹត្តិការណ៍ធ្ងន់ធ្ងរដូចជាទឹកជំនន់។

ឯកសារមេរៀននេះណែនាំអំពីមូលដ្ឋានគ្រឹះនៃស្ថិតិដែលត្រូវបានប្រើប្រាស់ក្នុងការវិភាគទិន្នន័យវារីសាស្ត្រ។ វាគ្របដណ្តប់លើការប្រើប្រាស់របាយប្រូបាប៊ីលីតេ ការគណនារយៈពេលត្រឡប់នៃទឹកជំនន់ និងវិធីសាស្ត្រវាយតម្លៃភាពមិនប្រាកដប្រជានៅក្នុងការប៉ាន់ស្មានធនធានទឹក និងបាតុភូតធម្មជាតិ។

៣. គោលគំនិតសំខាន់ៗ (Key Concepts)

គោលគំនិត (Concept) ការពន្យល់ (Explanation) ឧទាហរណ៍ (Example)
Flow Duration Curve (FDC)
ខ្សែកោងថិរវេលាលំហូរ
គឺជាក្រាហ្វដែលបង្ហាញពីភាគរយនៃពេលវេលាដែលលំហូរទឹកមានទំហំស្មើ ឬលើសពីតម្លៃជាក់លាក់ណាមួយ។ វាជួយឲ្យយើងយល់ពីទំនាក់ទំនងរវាងទំហំ និងប្រេកង់នៃអថេរវារីសាស្ត្រ។ ការគណនាភាគរយនៃថ្ងៃក្នុងមួយឆ្នាំដែលទន្លេឡូហ្កាន (Logan River) មានលំហូរទឹកលើសពី ១០០០ ម៉ែត្រគូបក្នុងមួយវិនាទី។
Frequency Analysis & Return Period
ការវិភាគប្រេកង់ និងរយៈពេលត្រឡប់
រយៈពេលត្រឡប់ (T=1/P) គឺជាពេលវេលាគិតជាមធ្យមរវាងការកើតឡើងនៃព្រឹត្តិការណ៍ធ្ងន់ធ្ងរ (ដូចជាទឹកជំនន់)។ ការវិភាគប្រេកង់ប្រើដើម្បីប៉ាន់ស្មានប្រូបាប៊ីលីតេនៃការកើតឡើងលើសកម្រិត (Exceedance probability) នៃព្រឹត្តិការណ៍ទាំងនោះ។ ការគណនាថា 'ទឹកជំនន់កម្រិត១០០ឆ្នាំ' មានប្រូបាប៊ីលីតេ ៦៣.៤% ក្នុងការកើតឡើងយ៉ាងហោចណាស់ម្តងក្នុងរយៈពេល១០០ឆ្នាំជាប់គ្នា។
Parametric vs Non-Parametric Statistics
ស្ថិតិប៉ារ៉ាម៉ែត្រ និងមិនមែនប៉ារ៉ាម៉ែត្រ
ស្ថិតិប៉ារ៉ាម៉ែត្រពឹងផ្អែកលើការសន្មត់អំពីរាងនៃរបាយទិន្នន័យ (ដូចជាមធ្យមភាគ) ខណៈស្ថិតិមិនមែនប៉ារ៉ាម៉ែត្រពឹងផ្អែកលើចំណាត់ថ្នាក់នៃទិន្នន័យ (ដូចជាមេដ្យាន) ដែលធ្វើឱ្យវារឹងមាំជាងមុននៅពេលមានទិន្នន័យខុសប្លែកខ្លាំង (Outliers)។ ការប្រើប្រាស់តម្លៃមេដ្យាន (Median) ជាជាងមធ្យមភាគ (Mean) ដើម្បីវាស់ស្ទង់កម្រិតទឹកភ្លៀងប្រចាំខែ ព្រោះទិន្នន័យទឹកភ្លៀងជារឿយៗមានលក្ខណៈវៀច (Skewed) និងមាន Outliers ។
Probability Distributions
របាយប្រូបាប៊ីលីតេ
ជាទម្រង់គណិតវិទ្យាដែលពិពណ៌នាពីឱកាសនៃការកើតឡើងនូវតម្លៃផ្សេងៗនៃអថេរចៃដន្យ (Random variables)។ ក្នុងវារីសាស្ត្រ គេច្រើនប្រើរបាយ Normal, Log-Normal, និង Gumbel។ ការបំពាក់របាយ Gumbel (Gumbel distribution) ទៅលើទិន្នន័យលំហូរទឹកអតិបរមាប្រចាំឆ្នាំ ដើម្បីទស្សន៍ទាយហានិភ័យទឹកជំនន់។
Quantifying Uncertainty
ការវាយតម្លៃភាពមិនប្រាកដប្រជា
គឺជាការប្រើប្រាស់វិធីសាស្ត្រស្ថិតិដូចជា Q-Q plots, ការធ្វើតេស្ត Kolmogorov-Smirnov និងចន្លោះទំនុកចិត្ត (Confidence intervals) ដើម្បីវាយតម្លៃថាតើទិន្នន័យជាក់ស្តែងស៊ីសង្វាក់គ្នាជាមួយគំរូប្រូបាប៊ីលីតេកម្រិតណា។ ការគណនាចន្លោះទំនុកចិត្ត ៩៥% (95% Confidence Interval) សម្រាប់មធ្យមភាគបរិមាណរំហួតទឹក (Evapotranspiration) ប្រចាំឆ្នាំនៅក្នុងអាងរងទឹកភ្លៀង។

៤. ភាពពាក់ព័ន្ធសម្រាប់កម្ពុជា (Cambodia Relevance)

ការអនុវត្តវិធីសាស្ត្រស្ថិតិក្នុងវារីសាស្ត្រគឺមានសារៈសំខាន់បំផុតសម្រាប់ប្រទេសកម្ពុជា ដែលជាប្រទេសងាយរងគ្រោះដោយសារបម្រែបម្រួលអាកាសធាតុ ទឹកជំនន់ លំហូរទន្លេមេគង្គ និងការពឹងផ្អែកលើធនធានទឹកសម្រាប់ការអភិវឌ្ឍសេដ្ឋកិច្ច។

ការអនុវត្ត (Applications)៖

ចំណេះដឹងពីវិធីសាស្ត្រស្ថិតិនេះ នឹងផ្តល់សមត្ថភាពដល់អ្នកស្រាវជ្រាវ វិស្វករ និងអ្នកធ្វើគោលនយោបាយកម្ពុជា ក្នុងការធ្វើសេចក្តីសម្រេចចិត្តដោយផ្អែកលើទិន្នន័យ (Data-driven decisions) ដើម្បីធានាចីរភាពធនធានទឹក។

៥. មគ្គុទ្ទេសក៍សិក្សា (Study Guide)

លំហាត់ និងសកម្មភាពសិក្សាដើម្បីពង្រឹងការយល់ដឹង៖

  1. ការបង្កើតខ្សែកោងថិរវេលាលំហូរ (Plotting a Flow Duration Curve): ទាញយកទិន្នន័យលំហូរទឹកប្រចាំថ្ងៃរបស់ទន្លេមេគង្គពីគេហទំព័ររបស់គណៈកម្មការទន្លេមេគង្គ (MRC) រួចប្រើប្រាស់កម្មវិធី MS Excel ឬ Python ដើម្បីតម្រៀបទិន្នន័យ (Rank) គណនាប្រូបាប៊ីលីតេនៃការកើតឡើងលើសកម្រិត និងគូសក្រាហ្វខ្សែកោងថិរវេលាលំហូរ (FDC)។
  2. ការគណនារយៈពេលត្រឡប់នៃទឹកជំនន់ (Calculating Flood Return Periods): ប្រមូលទិន្នន័យកម្ពស់ទឹកអតិបរមាប្រចាំឆ្នាំរយៈពេល ៥០ ឆ្នាំចុងក្រោយនៅស្ថានីយជលលិចណាមួយ។ អនុវត្តរូបមន្ត T = 1/p ដើម្បីគណនារកកម្រិតទឹកជំនន់ដែលមានរយៈពេលត្រឡប់ ២០ឆ្នាំ ៥០ឆ្នាំ និង ១០០ឆ្នាំ។
  3. ការប្រៀបធៀបស្ថិតិប៉ារ៉ាម៉ែត្រ និងមិនមែនប៉ារ៉ាម៉ែត្រ (Parametric vs Non-Parametric Comparison): ស្វែងរកទិន្នន័យរបាយទឹកភ្លៀងប្រចាំខែដែលមានភាពខុសប្លែកខ្លាំង (Outliers) ក្នុងរដូវវស្សា និងរដូវប្រាំង។ គណនាតម្លៃ Mean និង Median រួចពន្យល់ពីមូលហេតុដែលការប្រើប្រាស់ Median មានភាពត្រឹមត្រូវជាងសម្រាប់ទិន្នន័យវៀច (Skewed data)។
  4. ការធ្វើតេស្តភាពស័ក្តិសមនៃរបាយប្រូបាប៊ីលីតេ (Goodness-of-Fit Testing in Python): ប្រើប្រាស់ភាសា Python (library scipy.stats) ដើម្បីបំពាក់របាយ Gumbel និង Log-Normal ទៅលើទិន្នន័យលំហូរទឹក។ បន្ទាប់មក ប្រើប្រាស់ Q-Q plot ឬ Kolmogorov-Smirnov Test ដើម្បីវាយតម្លៃថាតើរបាយមួយណាដែលស័ក្តិសមបំផុតទៅនឹងទិន្នន័យជាក់ស្តែង។

៦. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស (English) ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Random variable ជាអថេរដែលតំណាងឱ្យតម្លៃនៃដំណើរការ ឬបាតុភូតធម្មជាតិដែលមិនអាចទាយទុកជាមុនបានច្បាស់លាស់ (មានភាពចៃដន្យ) ដូចជាបរិមាណទឹកភ្លៀង ឬលំហូរទឹកទន្លេ។ វារីសាស្ត្រប្រើប្រាស់របាយប្រូបាប៊ីលីតេដើម្បីពណ៌នាពីអថេរទាំងនេះ។ ដូចជាការបោះគ្រាប់ឡុកឡាក់ ដែលយើងដឹងថានឹងចេញលេខ១ដល់៦ ប៉ុន្តែយើងមិនដឹងច្បាស់ថានឹងចេញលេខមួយណានៅពេលបោះម្តងៗ។
Flow Duration Curve (FDC) ជាក្រាហ្វដែលបង្ហាញពីភាគរយនៃពេលវេលាដែលលំហូរទឹកនៅក្នុងទន្លេមានទំហំស្មើ ឬលើសពីកម្រិតជាក់លាក់ណាមួយ។ វាត្រូវបានប្រើដើម្បីយល់ពីទំនាក់ទំនងរវាងទំហំ និងប្រេកង់នៃបាតុភូតទឹកដោយផ្អែកលើទិន្នន័យប្រវត្តិសាស្ត្រ។ ដូចជាការកត់ត្រាពិន្ទុប្រឡងសិស្សក្នុងថ្នាក់សរុបប្រចាំឆ្នាំ ហើយគូសក្រាហ្វបង្ហាញថាមានប៉ុន្មានភាគរយនៃសិស្សដែលទទួលបានពិន្ទុលើសពី ៥០។
Return period ជារយៈពេលជាមធ្យមដែលព្រឹត្តិការណ៍ធម្មជាតិធ្ងន់ធ្ងរណាមួយ (ដូចជាទឹកជំនន់អតិបរមា) ត្រូវបានរំពឹងថានឹងកើតឡើងម្តង ដែលវាគណនាដោយយករូបមន្ត T = 1/P (P ជាប្រូបាប៊ីលីតេនៃការកើតឡើងលើសកម្រិត)។ ដូចជាការកត់សម្គាល់ថាតាមមធ្យម ព្យុះទីហ្វុងធំៗតែងតែបោកបក់មកលើតំបន់មួយក្នុងរៀងរាល់ ១០ ឆ្នាំម្តង។
Probability density function (PDF) ជាអនុគមន៍គណិតវិទ្យាដែលពិពណ៌នាអំពីឱកាស ឬប្រូបាប៊ីលីតេនៃការកើតឡើងនូវតម្លៃផ្សេងៗនៃអថេរចៃដន្យជាប់ (Continuous random variable) ណាមួយ។ តំបន់នៅក្រោមក្រាហ្វនេះតំណាងឱ្យប្រូបាប៊ីលីតេសរុបដែលស្មើនឹង ១។ ដូចជាការមើលគំនរខ្សាច់ដែលចាក់លើដី ដែលផ្នែកកណ្តាលខ្ពស់តំណាងឱ្យកន្លែងដែលគ្រាប់ខ្សាច់ធ្លាក់ប្រមូលផ្តុំច្រើនជាងគេ (ប្រូបាប៊ីលីតេខ្ពស់)។
Non-parametric statistics ជាវិធីសាស្ត្រស្ថិតិដែលពឹងផ្អែកលើចំណាត់ថ្នាក់ (Ranking) នៃទិន្នន័យ ជាជាងតម្លៃពិតប្រាកដរបស់ទិន្នន័យនោះ។ វិធីនេះមិនសូវរងឥទ្ធិពលពីតម្លៃខុសប្លែកខ្លាំង (Outliers) ទេ ដែលស័ក្តិសមខ្លាំងសម្រាប់ទិន្នន័យវារីសាស្ត្រ។ ដូចជាការរៀបសិស្សតាមលំដាប់កម្ពស់ពីទាបទៅខ្ពស់ដើម្បីរកអ្នកកណ្តាល (មេដ្យាន) ជាជាងការយកកម្ពស់អ្នកទាំងអស់បូកបញ្ចូលគ្នាដើម្បីរកមធ្យមភាគដែលរងឥទ្ធិពលពីអ្នកខ្ពស់ខុសគេម្នាក់។
Kolmogorov-Smirnov Test ជាការធ្វើតេស្តស្ថិតិដែលវាស់ស្ទង់គម្លាតអតិបរមា (Largest difference) រវាងរបាយប្រូបាប៊ីលីតេទិន្នន័យជាក់ស្តែង (Observed CDF) និងរបាយប្រូបាប៊ីលីតេទ្រឹស្តី (Target CDF) ដើម្បីវាយតម្លៃថាគំរូស័ក្តិសមនឹងទិន្នន័យកម្រិតណា។ ដូចជាការយកអាវដែលយើងកាត់ផ្ទាល់ដៃ ទៅត្រួតពីលើពុម្ពអាវស្តង់ដាររោងចក្រ ដើម្បីមើលថាតើវាមានទំហំខុសគ្នាត្រង់កន្លែងណាខ្លាំងជាងគេ។
Skewness ជាទំហំរង្វាស់ដែលបង្ហាញពីភាពមិនស៊ីមេទ្រី (Asymmetry) នៃរបាយទិន្នន័យជុំវិញតម្លៃមធ្យមរបស់វា។ ក្នុងវារីសាស្ត្រ ទិន្នន័យច្រើនមានរាងវៀចវិជ្ជមាន (Positive skewness) ដោយសារមានតម្លៃទាបបំផុតត្រឹមសូន្យ ប៉ុន្តែអាចមានតម្លៃខ្ពស់ខ្លាំង។ ដូចជាប្រាក់ចំណូលរបស់ប្រជាជនក្នុងភូមិមួយ ដែលភាគច្រើនមានចំណូលប្រហាក់ប្រហែលគ្នា ប៉ុន្តែមានសេដ្ឋីពីរឬបីនាក់ដែលមានចំណូលខ្ពស់កប់ពពក ធ្វើឱ្យក្រាហ្វទិន្នន័យមានកន្ទុយលយទៅខាងស្តាំយូរ។

៧. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖