Original Title: Performance Modelling and Network Monitoring for Internet of Things (IoT) Connectivity
Source: vbn.aau.dk
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការធ្វើគំរូនៃដំណើរការប្រតិបត្តិការ និងការត្រួតពិនិត្យបណ្តាញសម្រាប់ការតភ្ជាប់អ៊ីនធឺណិតនៃវត្ថុ (IoT)

ចំណងជើងដើម៖ Performance Modelling and Network Monitoring for Internet of Things (IoT) Connectivity

អ្នកនិពន្ធ៖ René Brandborg Sørensen (Aalborg University)

ឆ្នាំបោះពុម្ព៖ 2020 (Aalborg University Press)

វិស័យសិក្សា៖ Telecommunications

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ និក្ខេបបទនេះដោះស្រាយបញ្ហាប្រឈមក្នុងការធ្វើគំរូសមត្ថភាពធ្វើមាត្រដ្ឋាន (Scalability) និងដំណើរការប្រតិបត្តិការនៃបណ្តាញ LoRaWAN ព្រមទាំងអភិវឌ្ឍវិធីសាស្ត្រត្រួតពិនិត្យកំហុសបណ្តាញដោយអកម្មសម្រាប់ឧបករណ៍ IoT ចំនួនច្រើនសន្ធឹកសន្ធាប់។

វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះប្រើប្រាស់ការវិភាគតាមគំរូគណិតវិទ្យាសម្រាប់បណ្តាញ LoRaWAN និងអភិវឌ្ឍក្បួនដោះស្រាយតាមបែប Machine Learning ដើម្បីត្រួតពិនិត្យចរាចរណ៍ទិន្នន័យ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Naïve Monitoring Method
វិធីសាស្ត្រត្រួតពិនិត្យបែបសាមញ្ញ
មានល្បឿនលឿនខ្លាំងក្នុងការគណនា និងដំណើរការបានល្អប្រសើរបំផុតនៅពេលបណ្តាញមិនមានការរអាក់រអួលឬដាច់ទាល់តែសោះ។ អត្រាកំហុសកើនឡើងយ៉ាងឆាប់រហ័សនៅពេលអត្រាដាច់បណ្តាញកើនឡើង និងមិនអាចដោះស្រាយទិន្នន័យដែលមានភាពមិនច្បាស់លាស់ខ្ពស់បានឡើយ។ មានកំហុសខ្ពស់ក្នុងការប៉ាន់ស្មានការដាច់បណ្តាញ នៅពេលដែលអត្រាដាច់ជាក់ស្តែងកើនលើសពី ២០%។
Normalised Harmonics Mean (NHM)
វិធីសាស្ត្រមធ្យមអាម៉ូនិកធ្វើឱ្យមានលក្ខណៈធម្មតា
មានល្បឿនលឿនសម្រាប់ការវិភាគទិន្នន័យផ្ទាល់ (Online) ប្រើប្រាស់ថាមពលគណនាតិច និងមានកំហុសទាបទោះបីជាបណ្តាញមានការដាច់ញឹកញាប់ក៏ដោយ។ ទាមទារឱ្យទិន្នន័យមានភ្ជាប់ជាមួយស្លាកបញ្ជាក់ប្រភព (Labeled data) ជាមុនសិន។ កំហុសនៃការប៉ាន់ស្មានមានកម្រិតតិចជាង ៥% នៅពេលអត្រាដាច់បណ្តាញស្មើ ៣០% សម្រាប់គំរូទិន្នន័យចំនួន ៥០។
Greedy Online Clustering (GOC)
វិធីសាស្ត្រចង្កោមទិន្នន័យតាមអ៊ីនធឺណិត Greedy
មិនត្រូវការទិន្នន័យដែលមានស្លាកពីមុនទេ ហើយអាចវាយតម្លៃឧបករណ៍ដែលដំណើរការកម្មវិធីច្រើនមុខព្រមគ្នា (Thick clients) បានយ៉ាងសុក្រឹតក្នុងពេលវេលាជាក់ស្តែង។ ទាមទារថាមពលគណនា (Computational cost) ខ្ពស់ជាងវិធីសាស្ត្រ NHM និងវិធីសាស្ត្រសាមញ្ញ។ អាចកំណត់អត្តសញ្ញាណឧបករណ៍ដែលដាច់ការតភ្ជាប់ (Offline) យ៉ាងច្បាស់ និងអាចទ្រទ្រង់ឧបករណ៍ចំនួនជាង ១២,២៤០ លើ CPU តែមួយ។
Successive Periodicity Clustering (SPC)
វិធីសាស្ត្រចង្កោមទិន្នន័យតាមកាលកំណត់បន្តបន្ទាប់
ល្អបំផុតសម្រាប់ការវិភាគទិន្នន័យជាដុំ (Batch processing) និងមានប្រសិទ្ធភាពខ្ពស់ជាងវិធីសាមញ្ញនៅពេលបណ្តាញមានបញ្ហាដាច់ច្រើន។ ការដំណើរការទិន្នន័យជាដុំមានភាពយឺតយ៉ាវ និងអាចមានកំហុសតរហូត (Error propagation) ប្រសិនបើការដាក់ស្លាកដំបូងខុស។ មានភាពសុក្រឹតខ្ពស់ ប៉ុន្តែប្រសិទ្ធភាពអាចធ្លាក់ចុះបន្តិចបើប្រើទំហំគំរូច្រើនពេក (១០០) ដោយសារបាតុភូត Labeling drift។

ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះទាមទារធនធានកុំព្យូទ័រមធ្យមទៅខ្ពស់សម្រាប់ដំណើរការក្បួនដោះស្រាយ និងទាមទារសំណុំទិន្នន័យជាក់ស្តែងដ៏ធំពីបណ្តាញ IoT ដើម្បីផ្ទៀងផ្ទាត់ប្រសិទ្ធភាព។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះពឹងផ្អែកយ៉ាងខ្លាំងទៅលើបទប្បញ្ញត្តិរលកសញ្ញាអឺរ៉ុប (EU863-870 MHz ISM band) ជាពិសេសការកំណត់រង្វិលជុំការងារ (Duty-cycle) កម្រិត ១%។ ទិន្នន័យជាក់ស្តែងត្រូវបានប្រមូលពីតំបន់អឺរ៉ុបដែលមិនមានបញ្ជាក់ទីតាំងច្បាស់លាស់។ នេះជារឿងគួរពិចារណាសម្រាប់ប្រទេសកម្ពុជា ពីព្រោះកម្ពុជាប្រើប្រាស់ស្តង់ដាររលកសញ្ញាខុសគ្នា (ដូចជា AS923) ដែលមិនមានការរឹតបន្តឹង Duty-cycle ដូចគ្នា ដែលធ្វើឲ្យលទ្ធផលនៃការតម្រង់ជួរ (Queuing) និងការកកស្ទះទិន្នន័យមានភាពខុសប្លែកពីលទ្ធផលក្នុងឯកសារនេះ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាមានភាពខុសគ្នានៃបទប្បញ្ញត្តិក៏ដោយ វិធីសាស្ត្រត្រួតពិនិត្យបណ្តាញតាមបែប Machine Learning នេះមានប្រយោជន៍យ៉ាងខ្លាំងសម្រាប់ការរៀបចំបណ្តាញ IoT ទ្រង់ទ្រាយធំនៅក្នុងប្រទេសកម្ពុជា។

ជារួម ការអនុវត្តវិធីសាស្ត្រត្រួតពិនិត្យបណ្តាញអកម្ម (Passive Monitoring) នេះ នឹងជួយកាត់បន្ថយថ្លៃដើមប្រតិបត្តិការ និងការថែទាំយ៉ាងច្រើនសន្ធឹកសន្ធាប់សម្រាប់គម្រោង IoT នានានៅកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃបណ្តាញ LoRaWAN និង IoT: ស្វែងយល់ពីស្ថាបត្យកម្មប្រព័ន្ធ LoRaWAN ស្រទាប់ PHY/MAC ដំណើរការនៃ Spreading Factor (SF) និងបាតុភូតថតចាប់ (Capture Effect) ដោយអានឯកសារ LoRaWAN Specification និងធនធានបច្ចេកទេសរបស់ស្ថាប័ន LoRa Alliance
  2. យល់ដឹងពីទ្រឹស្តីជួរ (Queuing Theory) សម្រាប់បណ្តាញ: សិក្សាអំពីទ្រឹស្តីជួរកម្រិតខ្ពស់ ដូចជាម៉ូដែល M/M/c និង M/D/c ដើម្បីយល់ពីផលប៉ះពាល់នៃការកំណត់ Duty Cycling ទៅលើការពន្យារពេល (Latency) ដោយប្រើប្រាស់កម្មវិធី MATLAB សម្រាប់ធ្វើតេស្តគំរូគណិតវិទ្យាទាំងនេះ។
  3. អភិវឌ្ឍជំនាញ Machine Learning សម្រាប់ Time-Series: រៀនសរសេរកូដដោយប្រើ Python ជាពិសេសការប្រើប្រាស់បណ្ណាល័យ NumPy និង Astropy ដើម្បីអាចសរសេរក្បួនដោះស្រាយ Lomb-Scargle Periodogram សម្រាប់វិភាគទិន្នន័យពេលវេលាដែលមិនស្មើគ្នា (Unevenly sampled data)។
  4. អនុវត្តផ្ទាល់លើទិន្នន័យសាកល្បង (Local Testbed): បង្កើតគម្រោងតូចមួយដោយដំឡើង Gateway LoRaWAN មួយនៅសាកលវិទ្យាល័យ និងឧបករណ៍សេនស័របន្តិចបន្តួច។ ប្រមូលទិន្នន័យចរាចរណ៍ (Traffic data) រួចសាកល្បងអនុវត្តក្បួនដោះស្រាយ Greedy Online Clustering (GOC) ដោយប្រើ Python ដើម្បីចាប់យកឧបករណ៍ដែលដំណើរការខុសប្រក្រតី។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Capture Effect បាតុភូតនៅក្នុងបណ្តាញទូរគមនាគមន៍ឥតខ្សែ ដែលអង់តែនទទួល (Receiver) អាចចាប់យកនិងបកប្រែសញ្ញាដែលមានកម្លាំងខ្លាំងជាងគេបានដោយជោគជ័យ ទោះបីជាមានសញ្ញាផ្សេងទៀតកំពុងឆ្លងកាត់ ឬបុកគ្នាក្នុងពេលតែមួយក៏ដោយ។ ដូចជាពេលអ្នកអាចស្តាប់យល់ពីមិត្តភក្តិម្នាក់ដែលនិយាយខ្លាំងៗ ទោះបីជាមានមនុស្សច្រើនកំពុងនិយាយរអ៊ូៗជុំវិញអ្នកក្នុងបន្ទប់តែមួយក៏ដោយ។
Spreading Factor រង្វាស់នៃការបញ្ជូនសញ្ញាក្នុងបច្ចេកវិទ្យា LoRa ដែលកំណត់អំពីល្បឿននៃការបញ្ជូនទិន្នន័យ និងចម្ងាយកាំសេវា។ SF កាន់តែធំ ធ្វើឲ្យការបញ្ជូនបានឆ្ងាយតែយឺត ហើយងាយរងការរំខាន ចំណែក SF តូចបញ្ជូនបានលឿនតែជិត។ ដូចជាការបើកបរឡានដោយប្រើលេខ (Gear)៖ លេខទាបទៅបានយឺតតែមានកម្លាំងរុញឡើងចំណោតបាន ចំណែកលេខខ្ពស់ទៅបានលឿនតែអត់សូវមានកម្លាំង។
Duty Cycling ច្បាប់នៃការគ្រប់គ្រងបណ្តាញដែលកម្រិតពេលវេលាអនុញ្ញាតឲ្យឧបករណ៍មួយបញ្ជូនទិន្នន័យ (ឧទាហរណ៍៖ អនុញ្ញាតឲ្យបញ្ជូនតែ ១% នៃពេលវេលាសរុប ដើម្បីកុំឲ្យស្ទះសេវាឧបករណ៍ដទៃក្នុងរលកសញ្ញាតែមួយ)។ ដូចជាច្បាប់និយាយក្នុងអង្គប្រជុំ ដែលមនុស្សម្នាក់ៗត្រូវបានអនុញ្ញាតឲ្យនិយាយតែ ១ នាទី ហើយត្រូវរង់ចាំ ៩៩ នាទីទៀតទើបអាចនិយាយម្តងទៀតបាន។
Lomb-Scargle Periodogram ក្បួនដោះស្រាយគណិតវិទ្យាដែលប្រើសម្រាប់ស្វែងរកវដ្តឬលំនាំពេលវេលាបញ្ជូនទិន្នន័យ (Frequencies) សូម្បីតែទិន្នន័យនោះត្រូវបានកត់ត្រាក្នុងចន្លោះពេលមិនស្មើគ្នាក៏ដោយ។ ក្នុងឯកសារនេះ វាត្រូវបានប្រើដើម្បីរាវរកឧបករណ៍ដែលខូច។ ដូចជាការព្យាយាមគណនាថាតើឡានក្រុងរត់រៀងរាល់ប៉ុន្មានម៉ោងម្តង ដោយគ្រាន់តែមានកំណត់ត្រាពេលខ្លះៗដែលឡានក្រុងមកដល់ចំណត (មិនមែនមានកំណត់ត្រាគ្រប់ពេលទាំងអស់នោះទេ)។
Queuing Theory ទ្រឹស្តីគណិតវិទ្យាដែលសិក្សាអំពីការរង់ចាំក្នុងជួរ ដើម្បីប្រើប្រាស់វាយតម្លៃនិងព្យាករណ៍ពីការពន្យារពេល (Latency) និងការកកស្ទះនៅក្នុងប្រព័ន្ធបណ្តាញ ពេលដែលមានទិន្នន័យច្រើនសន្ធឹកសន្ធាប់មកដល់ព្រមៗគ្នា។ ដូចជាការគណនាជាមុនថាតើត្រូវបើកបញ្ជរបង់លុយនៅផ្សារទំនើបចំនួនប៉ុន្មាន ទើបអតិថិជនមិនចាំយូរ នៅពេលមានមនុស្សមកទិញទំនិញច្រើន។
Demodulation Path សមត្ថភាពផ្នែករឹង (Hardware) របស់ម៉ាស៊ីនទទួល (Gateway Receiver) ក្នុងការចាប់យក និងបំប្លែងរលកសញ្ញាទៅជាទិន្នន័យកុំព្យូទ័រក្នុងពេលតែមួយ។ ប្រសិនបើច្រកនេះពេញ ទិន្នន័យថ្មីដែលមកដល់នឹងត្រូវបាត់បង់ (Dropped)។ ដូចជាចំនួនបុគ្គលិកបម្រើសេវានៅធនាគារ បើមានបុគ្គលិក ៨ នាក់ នោះគេអាចបម្រើអតិថិជនបានតែ ៨ នាក់ក្នុងពេលតែមួយ បើមានអ្នកទី ៩ មក គាត់នឹងត្រូវរង់ចាំ ឬត្រូវដើរចេញ។
Quasi-periodic Traffic លំនាំទិន្នន័យដែលត្រូវបានបង្កើតឡើងដោយឧបករណ៍សេនស័រក្នុងចន្លោះពេលប្រហាក់ប្រហែលគ្នាជារឿយៗ ប៉ុន្តែមកដល់ម៉ាស៊ីនមេ (Server) មិនទៀងទាត់ពេលវេលា ១០០% នោះទេ ដោយសារការពន្យារពេល ឬការកកស្ទះតាមផ្លូវបណ្តាញទូរគមនាគមន៍។ ដូចជាការកំណត់ម៉ោងរោទ៍ទូរស័ព្ទឲ្យក្រោកពីគេងរៀងរាល់ម៉ោង ៦ ព្រឹកជារៀងរាល់ថ្ងៃ ប៉ុន្តែពេលខ្លះអ្នកអាចក្រោកនៅម៉ោង ៦:០៥ ឬ ៦:១០ នាទី ដោយសារភាពនឿយហត់ខុសៗគ្នា។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖