Original Title: Performance Modelling and Network Monitoring for Internet of Things (IoT) Connectivity
Source: vbn.aau.dk
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការធ្វើគំរូនៃដំណើរការប្រតិបត្តិការ និងការត្រួតពិនិត្យបណ្តាញសម្រាប់ការតភ្ជាប់អ៊ីនធឺណិតនៃវត្ថុ (IoT)

ចំណងជើងដើម៖ Performance Modelling and Network Monitoring for Internet of Things (IoT) Connectivity

អ្នកនិពន្ធ៖ René Brandborg Sørensen (Aalborg University)

ឆ្នាំបោះពុម្ព៖ 2020 (Aalborg University Press)

វិស័យសិក្សា៖ Telecommunications

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ និក្ខេបបទនេះដោះស្រាយបញ្ហាប្រឈមក្នុងការធ្វើគំរូសមត្ថភាពធ្វើមាត្រដ្ឋាន (Scalability) និងដំណើរការប្រតិបត្តិការនៃបណ្តាញ LoRaWAN ព្រមទាំងអភិវឌ្ឍវិធីសាស្ត្រត្រួតពិនិត្យកំហុសបណ្តាញដោយអកម្មសម្រាប់ឧបករណ៍ IoT ចំនួនច្រើនសន្ធឹកសន្ធាប់។

វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះប្រើប្រាស់ការវិភាគតាមគំរូគណិតវិទ្យាសម្រាប់បណ្តាញ LoRaWAN និងអភិវឌ្ឍក្បួនដោះស្រាយតាមបែប Machine Learning ដើម្បីត្រួតពិនិត្យចរាចរណ៍ទិន្នន័យ។

គំរូទ្រឹស្តីជួរ (Queuing Theory Model) ដើម្បីវាយតម្លៃការពន្យារពេលបណ្តាលមកពីការកម្រិតរង្វិលជុំការងារ (Duty-cycle)។
គំរូលំហនិងពេលវេលា (Spatio-temporal Model) រួមបញ្ចូលគ្នាដែលគិតបញ្ចូលនូវបាតុភូតថតចាប់ (Capture Effect) និងផ្លូវបំប្លែងសញ្ញាច្រើន (Multiple Demodulating Paths)។
ការប្រើប្រាស់វិធីសាស្ត្របែងចែកជាក្រុម (Clustering Methods) តាមបែប Machine Learning ដូចជា NHM, SPC, និង GOC ដោយផ្អែកលើ Lomb-Scargle Periodogram ដើម្បីរកកំហុសបណ្តាញ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ច្រកចេញចូល (Gateway) ប្រភេទ SX1301 តែមួយអាចផ្តល់សេវាដល់ឧបករណ៍ Class A ចំនួន ១២០០ គ្រឿងលើ ៨ ប៉ុស្តិ៍ ក្នុងកម្រិតដាច់បណ្តាញ ៣០% សម្រាប់ការបញ្ជូនទិន្នន័យ ៥០ បៃ រៀងរាល់ ១០ នាទីម្តង។
សមត្ថភាពនៃផ្លូវ Demodulation របស់អ្នកទទួលមានឥទ្ធិពលយ៉ាងខ្លាំងទៅលើប្រូបាប៊ីលីតេនៃការទទួលទិន្នន័យជោគជ័យ (Frame Reception Probability) ដែលម៉ូដែលជំនាន់មុនៗមិនបានគិតដល់។
ក្បួនដោះស្រាយ GOC និង SPC អាចកំណត់អត្តសញ្ញាណឧបករណ៍ដែលដំណើរការខុសប្រក្រតី (Faulty Devices) ក្នុងបណ្តាញដោយស្វ័យប្រវត្តិ សូម្បីតែនៅពេលមានអត្រាដាច់បណ្តាញ (Outage) ខ្ពស់រហូតដល់ ៥០% ក៏ដោយ។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Naïve Monitoring Method វិធីសាស្ត្រត្រួតពិនិត្យបែបសាមញ្ញ	មានល្បឿនលឿនខ្លាំងក្នុងការគណនា និងដំណើរការបានល្អប្រសើរបំផុតនៅពេលបណ្តាញមិនមានការរអាក់រអួលឬដាច់ទាល់តែសោះ។	អត្រាកំហុសកើនឡើងយ៉ាងឆាប់រហ័សនៅពេលអត្រាដាច់បណ្តាញកើនឡើង និងមិនអាចដោះស្រាយទិន្នន័យដែលមានភាពមិនច្បាស់លាស់ខ្ពស់បានឡើយ។	មានកំហុសខ្ពស់ក្នុងការប៉ាន់ស្មានការដាច់បណ្តាញ នៅពេលដែលអត្រាដាច់ជាក់ស្តែងកើនលើសពី ២០%។
Normalised Harmonics Mean (NHM) វិធីសាស្ត្រមធ្យមអាម៉ូនិកធ្វើឱ្យមានលក្ខណៈធម្មតា	មានល្បឿនលឿនសម្រាប់ការវិភាគទិន្នន័យផ្ទាល់ (Online) ប្រើប្រាស់ថាមពលគណនាតិច និងមានកំហុសទាបទោះបីជាបណ្តាញមានការដាច់ញឹកញាប់ក៏ដោយ។	ទាមទារឱ្យទិន្នន័យមានភ្ជាប់ជាមួយស្លាកបញ្ជាក់ប្រភព (Labeled data) ជាមុនសិន។	កំហុសនៃការប៉ាន់ស្មានមានកម្រិតតិចជាង ៥% នៅពេលអត្រាដាច់បណ្តាញស្មើ ៣០% សម្រាប់គំរូទិន្នន័យចំនួន ៥០។
Greedy Online Clustering (GOC) វិធីសាស្ត្រចង្កោមទិន្នន័យតាមអ៊ីនធឺណិត Greedy	មិនត្រូវការទិន្នន័យដែលមានស្លាកពីមុនទេ ហើយអាចវាយតម្លៃឧបករណ៍ដែលដំណើរការកម្មវិធីច្រើនមុខព្រមគ្នា (Thick clients) បានយ៉ាងសុក្រឹតក្នុងពេលវេលាជាក់ស្តែង។	ទាមទារថាមពលគណនា (Computational cost) ខ្ពស់ជាងវិធីសាស្ត្រ NHM និងវិធីសាស្ត្រសាមញ្ញ។	អាចកំណត់អត្តសញ្ញាណឧបករណ៍ដែលដាច់ការតភ្ជាប់ (Offline) យ៉ាងច្បាស់ និងអាចទ្រទ្រង់ឧបករណ៍ចំនួនជាង ១២,២៤០ លើ CPU តែមួយ។
Successive Periodicity Clustering (SPC) វិធីសាស្ត្រចង្កោមទិន្នន័យតាមកាលកំណត់បន្តបន្ទាប់	ល្អបំផុតសម្រាប់ការវិភាគទិន្នន័យជាដុំ (Batch processing) និងមានប្រសិទ្ធភាពខ្ពស់ជាងវិធីសាមញ្ញនៅពេលបណ្តាញមានបញ្ហាដាច់ច្រើន។	ការដំណើរការទិន្នន័យជាដុំមានភាពយឺតយ៉ាវ និងអាចមានកំហុសតរហូត (Error propagation) ប្រសិនបើការដាក់ស្លាកដំបូងខុស។	មានភាពសុក្រឹតខ្ពស់ ប៉ុន្តែប្រសិទ្ធភាពអាចធ្លាក់ចុះបន្តិចបើប្រើទំហំគំរូច្រើនពេក (១០០) ដោយសារបាតុភូត Labeling drift។

ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះទាមទារធនធានកុំព្យូទ័រមធ្យមទៅខ្ពស់សម្រាប់ដំណើរការក្បួនដោះស្រាយ និងទាមទារសំណុំទិន្នន័យជាក់ស្តែងដ៏ធំពីបណ្តាញ IoT ដើម្បីផ្ទៀងផ្ទាត់ប្រសិទ្ធភាព។

Hardware: ត្រូវការយ៉ាងហោចណាស់ CPU 4.0GHz i7-6700 សម្រាប់ការធ្វើតេស្ត និងដំណើរការក្បួនដោះស្រាយ GOC លើឧបករណ៍រាប់ម៉ឺនគ្រឿងក្នុងពេលតែមួយ។
Software: ការធ្វើត្រាប់តាម (Simulation) និងការវិភាគទាមទារការប្រើប្រាស់កម្មវិធី MATLAB និងភាសា Python (ជាពិសេសកញ្ចប់បណ្ណាល័យ NumPy និង Astropy)។
Dataset: ទិន្នន័យជាក់ស្តែងនៃការបញ្ជូនជាង ១លានដង ពីឧបករណ៍ Smart Meter ចំនួន ៤,៥២២ គ្រឿង ដែលប្រមូលបានពីប្រតិបត្តិការប្រព័ន្ធ LoRaWAN ជាក់ស្តែង។
Expertise: ទាមទារចំណេះដឹងស៊ីជម្រៅលើផ្នែក ទ្រឹស្តីជួរ (Queuing Theory) ដំណើរការសញ្ញា (Signal Processing) និង ការរៀនដោយម៉ាស៊ីន (Machine Learning Clustering)។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះពឹងផ្អែកយ៉ាងខ្លាំងទៅលើបទប្បញ្ញត្តិរលកសញ្ញាអឺរ៉ុប (EU863-870 MHz ISM band) ជាពិសេសការកំណត់រង្វិលជុំការងារ (Duty-cycle) កម្រិត ១%។ ទិន្នន័យជាក់ស្តែងត្រូវបានប្រមូលពីតំបន់អឺរ៉ុបដែលមិនមានបញ្ជាក់ទីតាំងច្បាស់លាស់។ នេះជារឿងគួរពិចារណាសម្រាប់ប្រទេសកម្ពុជា ពីព្រោះកម្ពុជាប្រើប្រាស់ស្តង់ដាររលកសញ្ញាខុសគ្នា (ដូចជា AS923) ដែលមិនមានការរឹតបន្តឹង Duty-cycle ដូចគ្នា ដែលធ្វើឲ្យលទ្ធផលនៃការតម្រង់ជួរ (Queuing) និងការកកស្ទះទិន្នន័យមានភាពខុសប្លែកពីលទ្ធផលក្នុងឯកសារនេះ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាមានភាពខុសគ្នានៃបទប្បញ្ញត្តិក៏ដោយ វិធីសាស្ត្រត្រួតពិនិត្យបណ្តាញតាមបែប Machine Learning នេះមានប្រយោជន៍យ៉ាងខ្លាំងសម្រាប់ការរៀបចំបណ្តាញ IoT ទ្រង់ទ្រាយធំនៅក្នុងប្រទេសកម្ពុជា។

ការវាស់វែងស្មាតម៊ីទ័រទឹក និងអគ្គិសនី (Smart Water/Electricity Metering): អគ្គិសនីកម្ពុជា (EDC) និងរដ្ឋាករទឹកស្វយ័តក្រុងភ្នំពេញ (PPWSA) អាចប្រើប្រាស់ក្បួនដោះស្រាយ GOC ដើម្បីតាមដានស្មាតម៊ីទ័រ ដែលផ្តាច់ការតភ្ជាប់ឬខូចដោយស្វ័យប្រវត្តិ ដោយមិនចាំបាច់បញ្ជូនបុគ្គលិកចុះទៅពិនិត្យផ្ទាល់។
កសិកម្មឆ្លាតវៃនៅតំបន់បឹងទន្លេសាប និងខេត្តបាត់ដំបង: ការប្រើប្រាស់ឧបករណ៍វាស់កម្រិតទឹក និងសំណើមដីនៅទីតាំងដាច់ស្រយាលជារឿយៗជួបបញ្ហាដាច់សេវា (Outage)។ ក្បួនដោះស្រាយ NHM អាចជួយវិភាគដឹងថាឧបករណ៍ណាមួយខូចពិតប្រាកដ ឬគ្រាន់តែដាច់សេវាបណ្តោះអាសន្ន។
ការត្រួតពិនិត្យគុណភាពបរិស្ថានទីក្រុង (Environmental Sensors): គម្រោងទីក្រុងឆ្លាតវៃនៅរាជធានីភ្នំពេញ អាចតាមដានឧបករណ៍វាស់គុណភាពខ្យល់ (Air Quality Sensors) បានរាប់ពាន់គ្រឿងក្នុងពេលតែមួយ ដោយប្រើម៉ាស៊ីនមេ (Central Server) តែមួយតាមរយៈបច្ចេកទេសបែងចែកចង្កោម (Clustering) នេះ។

ជារួម ការអនុវត្តវិធីសាស្ត្រត្រួតពិនិត្យបណ្តាញអកម្ម (Passive Monitoring) នេះ នឹងជួយកាត់បន្ថយថ្លៃដើមប្រតិបត្តិការ និងការថែទាំយ៉ាងច្រើនសន្ធឹកសន្ធាប់សម្រាប់គម្រោង IoT នានានៅកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះនៃបណ្តាញ LoRaWAN និង IoT: ស្វែងយល់ពីស្ថាបត្យកម្មប្រព័ន្ធ LoRaWAN ស្រទាប់ PHY/MAC ដំណើរការនៃ Spreading Factor (SF) និងបាតុភូតថតចាប់ (Capture Effect) ដោយអានឯកសារ LoRaWAN Specification និងធនធានបច្ចេកទេសរបស់ស្ថាប័ន LoRa Alliance។
យល់ដឹងពីទ្រឹស្តីជួរ (Queuing Theory) សម្រាប់បណ្តាញ: សិក្សាអំពីទ្រឹស្តីជួរកម្រិតខ្ពស់ ដូចជាម៉ូដែល M/M/c និង M/D/c ដើម្បីយល់ពីផលប៉ះពាល់នៃការកំណត់ Duty Cycling ទៅលើការពន្យារពេល (Latency) ដោយប្រើប្រាស់កម្មវិធី MATLAB សម្រាប់ធ្វើតេស្តគំរូគណិតវិទ្យាទាំងនេះ។
អភិវឌ្ឍជំនាញ Machine Learning សម្រាប់ Time-Series: រៀនសរសេរកូដដោយប្រើ Python ជាពិសេសការប្រើប្រាស់បណ្ណាល័យ NumPy និង Astropy ដើម្បីអាចសរសេរក្បួនដោះស្រាយ Lomb-Scargle Periodogram សម្រាប់វិភាគទិន្នន័យពេលវេលាដែលមិនស្មើគ្នា (Unevenly sampled data)។
អនុវត្តផ្ទាល់លើទិន្នន័យសាកល្បង (Local Testbed): បង្កើតគម្រោងតូចមួយដោយដំឡើង Gateway LoRaWAN មួយនៅសាកលវិទ្យាល័យ និងឧបករណ៍សេនស័របន្តិចបន្តួច។ ប្រមូលទិន្នន័យចរាចរណ៍ (Traffic data) រួចសាកល្បងអនុវត្តក្បួនដោះស្រាយ Greedy Online Clustering (GOC) ដោយប្រើ Python ដើម្បីចាប់យកឧបករណ៍ដែលដំណើរការខុសប្រក្រតី។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Capture Effect	បាតុភូតនៅក្នុងបណ្តាញទូរគមនាគមន៍ឥតខ្សែ ដែលអង់តែនទទួល (Receiver) អាចចាប់យកនិងបកប្រែសញ្ញាដែលមានកម្លាំងខ្លាំងជាងគេបានដោយជោគជ័យ ទោះបីជាមានសញ្ញាផ្សេងទៀតកំពុងឆ្លងកាត់ ឬបុកគ្នាក្នុងពេលតែមួយក៏ដោយ។	ដូចជាពេលអ្នកអាចស្តាប់យល់ពីមិត្តភក្តិម្នាក់ដែលនិយាយខ្លាំងៗ ទោះបីជាមានមនុស្សច្រើនកំពុងនិយាយរអ៊ូៗជុំវិញអ្នកក្នុងបន្ទប់តែមួយក៏ដោយ។
Spreading Factor	រង្វាស់នៃការបញ្ជូនសញ្ញាក្នុងបច្ចេកវិទ្យា LoRa ដែលកំណត់អំពីល្បឿននៃការបញ្ជូនទិន្នន័យ និងចម្ងាយកាំសេវា។ SF កាន់តែធំ ធ្វើឲ្យការបញ្ជូនបានឆ្ងាយតែយឺត ហើយងាយរងការរំខាន ចំណែក SF តូចបញ្ជូនបានលឿនតែជិត។	ដូចជាការបើកបរឡានដោយប្រើលេខ (Gear)៖ លេខទាបទៅបានយឺតតែមានកម្លាំងរុញឡើងចំណោតបាន ចំណែកលេខខ្ពស់ទៅបានលឿនតែអត់សូវមានកម្លាំង។
Duty Cycling	ច្បាប់នៃការគ្រប់គ្រងបណ្តាញដែលកម្រិតពេលវេលាអនុញ្ញាតឲ្យឧបករណ៍មួយបញ្ជូនទិន្នន័យ (ឧទាហរណ៍៖ អនុញ្ញាតឲ្យបញ្ជូនតែ ១% នៃពេលវេលាសរុប ដើម្បីកុំឲ្យស្ទះសេវាឧបករណ៍ដទៃក្នុងរលកសញ្ញាតែមួយ)។	ដូចជាច្បាប់និយាយក្នុងអង្គប្រជុំ ដែលមនុស្សម្នាក់ៗត្រូវបានអនុញ្ញាតឲ្យនិយាយតែ ១ នាទី ហើយត្រូវរង់ចាំ ៩៩ នាទីទៀតទើបអាចនិយាយម្តងទៀតបាន។
Lomb-Scargle Periodogram	ក្បួនដោះស្រាយគណិតវិទ្យាដែលប្រើសម្រាប់ស្វែងរកវដ្តឬលំនាំពេលវេលាបញ្ជូនទិន្នន័យ (Frequencies) សូម្បីតែទិន្នន័យនោះត្រូវបានកត់ត្រាក្នុងចន្លោះពេលមិនស្មើគ្នាក៏ដោយ។ ក្នុងឯកសារនេះ វាត្រូវបានប្រើដើម្បីរាវរកឧបករណ៍ដែលខូច។	ដូចជាការព្យាយាមគណនាថាតើឡានក្រុងរត់រៀងរាល់ប៉ុន្មានម៉ោងម្តង ដោយគ្រាន់តែមានកំណត់ត្រាពេលខ្លះៗដែលឡានក្រុងមកដល់ចំណត (មិនមែនមានកំណត់ត្រាគ្រប់ពេលទាំងអស់នោះទេ)។
Queuing Theory	ទ្រឹស្តីគណិតវិទ្យាដែលសិក្សាអំពីការរង់ចាំក្នុងជួរ ដើម្បីប្រើប្រាស់វាយតម្លៃនិងព្យាករណ៍ពីការពន្យារពេល (Latency) និងការកកស្ទះនៅក្នុងប្រព័ន្ធបណ្តាញ ពេលដែលមានទិន្នន័យច្រើនសន្ធឹកសន្ធាប់មកដល់ព្រមៗគ្នា។	ដូចជាការគណនាជាមុនថាតើត្រូវបើកបញ្ជរបង់លុយនៅផ្សារទំនើបចំនួនប៉ុន្មាន ទើបអតិថិជនមិនចាំយូរ នៅពេលមានមនុស្សមកទិញទំនិញច្រើន។
Demodulation Path	សមត្ថភាពផ្នែករឹង (Hardware) របស់ម៉ាស៊ីនទទួល (Gateway Receiver) ក្នុងការចាប់យក និងបំប្លែងរលកសញ្ញាទៅជាទិន្នន័យកុំព្យូទ័រក្នុងពេលតែមួយ។ ប្រសិនបើច្រកនេះពេញ ទិន្នន័យថ្មីដែលមកដល់នឹងត្រូវបាត់បង់ (Dropped)។	ដូចជាចំនួនបុគ្គលិកបម្រើសេវានៅធនាគារ បើមានបុគ្គលិក ៨ នាក់ នោះគេអាចបម្រើអតិថិជនបានតែ ៨ នាក់ក្នុងពេលតែមួយ បើមានអ្នកទី ៩ មក គាត់នឹងត្រូវរង់ចាំ ឬត្រូវដើរចេញ។
Quasi-periodic Traffic	លំនាំទិន្នន័យដែលត្រូវបានបង្កើតឡើងដោយឧបករណ៍សេនស័រក្នុងចន្លោះពេលប្រហាក់ប្រហែលគ្នាជារឿយៗ ប៉ុន្តែមកដល់ម៉ាស៊ីនមេ (Server) មិនទៀងទាត់ពេលវេលា ១០០% នោះទេ ដោយសារការពន្យារពេល ឬការកកស្ទះតាមផ្លូវបណ្តាញទូរគមនាគមន៍។	ដូចជាការកំណត់ម៉ោងរោទ៍ទូរស័ព្ទឲ្យក្រោកពីគេងរៀងរាល់ម៉ោង ៦ ព្រឹកជារៀងរាល់ថ្ងៃ ប៉ុន្តែពេលខ្លះអ្នកអាចក្រោកនៅម៉ោង ៦:០៥ ឬ ៦:១០ នាទី ដោយសារភាពនឿយហត់ខុសៗគ្នា។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖