Original Title: A Guide to Data Collection for Computation and Monitoring of Node Energy Consumption
Source: doi.org/10.3390/bdcc7030130
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

មគ្គុទ្ទេសក៍សម្រាប់ការប្រមូលទិន្នន័យសម្រាប់ការគណនា និងការត្រួតពិនិត្យការប្រើប្រាស់ថាមពលរបស់ថ្នាំងកុំព្យូទ័រ

ចំណងជើងដើម៖ A Guide to Data Collection for Computation and Monitoring of Node Energy Consumption

អ្នកនិពន្ធ៖ Alberto del Rio (Universidad Politécnica de Madrid), Giuseppe Conti (Universidad Politécnica de Madrid), Sandra Castano-Solis (Universidad Politécnica de Madrid), Javier Serrano (Universidad Politécnica de Madrid), David Jimenez (Universidad Politécnica de Madrid), Jesus Fraile-Ardanuy (Universidad Politécnica de Madrid)

ឆ្នាំបោះពុម្ព៖ 2023 (Big Data and Cognitive Computing)

វិស័យសិក្សា៖ Computer Science / Green Computing / Data Centers

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការស្រាវជ្រាវនេះដោះស្រាយបញ្ហាកង្វះខាតនៃសំណុំទិន្នន័យថាមពល (Energy Datasets) ដែលបើកចំហជាសាធារណៈសម្រាប់មជ្ឈមណ្ឌលទិន្នន័យ ដែលជាឧបសគ្គដល់ការអភិវឌ្ឍ AI ដើម្បីបង្កើនប្រសិទ្ធភាពថាមពល។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកនិពន្ធបានបង្កើតវិធីសាស្ត្រស្តង់ដារមួយសម្រាប់ការប្រមូលទិន្នន័យដោយប្រើប្រាស់ការធ្វើតេស្តសង្កត់ធ្ងន់ (Stress Tests) លើម៉ាស៊ីនមេ និងវាស់វែងការប្រើប្រាស់អគ្គិសនីជាក់ស្តែងតាមរយៈឧបករណ៍ IoT ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
No Charge Test (Idle State)
ការធ្វើតេស្តដោយគ្មានបន្ទុក (ស្ថានភាពមិនដំណើរការ)
ផ្តល់នូវទិន្នន័យមូលដ្ឋាន (Baseline) សម្រាប់ការប្រៀបធៀប និងបង្ហាញពីការប្រើប្រាស់ថាមពលអប្បបរមារបស់ប្រព័ន្ធ។ មិនផ្តល់ព័ត៌មានអំពីអាកប្បកិរិយារបស់ម៉ាស៊ីននៅពេលមានបន្ទុកការងារធ្ងន់។ ថាមពលសកម្មមធ្យមគឺ ២៧.៤ វ៉ាត់ (Watts)។
AsmFish Benchmark (High Intensity)
ការធ្វើតេស្ត AsmFish (កម្រិតខ្ពស់)
បង្កើតសម្ពាធអតិបរមាលើធនធាន CPU ដែលនាំឱ្យមានទំនាក់ទំនងខ្ពស់បំផុតរវាងការប្រើប្រាស់ធនធាន និងថាមពល។ អាចនឹងមិនឆ្លុះបញ្ចាំងពីការប្រើប្រាស់ជាក់ស្តែងដែលមានការប្រែប្រួលចុះឡើង។ ការប្រើប្រាស់ថាមពលកើនឡើង ៩៦.៥% ធៀបនឹងស្ថានភាពមិនដំណើរការ។
Hybrid Tests (Mixed Workloads)
ការធ្វើតេស្តចម្រុះ (Hybrid Tests)
ដោះស្រាយបញ្ហាភាពយឺតយ៉ាវនៃទិន្នន័យ (Measurement Lag) និងតំណាងឱ្យស្ថានភាពប្រើប្រាស់ជាក់ស្តែងជាងការធ្វើតេស្តតែមួយមុខ។ ទាមទារការរៀបចំស្គ្រីប (Scripts) ស្មុគស្មាញជាងមុន ដើម្បីដំណើរការកម្មវិធីច្រើនក្នុងពេលតែមួយ។ បង្កើតបាននូវការជាប់ទាក់ទងគ្នា (Correlation) ល្អប្រសើររវាងការវាស់វែង និងថាមពលសកម្ម ជាពិសេសនៅក្នុង Hybrid Test 2 ។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តវិធីសាស្ត្រនេះទាមទារធនធានផ្នែករឹងកម្រិតមធ្យម និងជំនាញផ្នែកទន់មួយចំនួនសម្រាប់ការប្រមូលទិន្នន័យ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងមន្ទីរពិសោធន៍សាកលវិទ្យាល័យនៅទីក្រុងម៉ាឌ្រីដ (Madrid) ដោយប្រើប្រាស់ម៉ាស៊ីនមេដែលមានស្ថាបត្យកម្មជាក់លាក់។ សម្រាប់កម្ពុជា ការយកចិត្តទុកដាក់គួរតែបន្ថែមលើកត្តាសីតុណ្ហភាពបរិស្ថាន (Temperature) ព្រោះអាកាសធាតុក្តៅនៅកម្ពុជាអាចតម្រូវឱ្យមានការប្រើប្រាស់ថាមពលសម្រាប់ប្រព័ន្ធត្រជាក់ (Cooling Systems) ច្រើនជាងនៅអឺរ៉ុប។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានប្រយោជន៍ខ្លាំងណាស់សម្រាប់កម្ពុជា ជាពិសេសសម្រាប់ការចាប់ផ្តើមស្រាវជ្រាវលើប្រសិទ្ធភាពថាមពល (Energy Efficiency) ដោយមិនចាំបាច់ចំណាយប្រាក់ច្រើន។

ការអនុវត្តគំរូនេះអាចជួយស្ថាប័ននៅកម្ពុជាបង្កើតយុទ្ធសាស្ត្រកាត់បន្ថយការបំភាយកាបូន និងសន្សំសំចៃថវិកាប្រតិបត្តិការ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ជំហានទី ១: ការរៀបចំផ្នែករឹង និងឧបករណ៍វាស់វែង: រៀបចំម៉ាស៊ីនមេ (Server) ឬកុំព្យូទ័រដែលដំណើរការដោយ Linux និងតម្លើងឧបករណ៍វាស់ថាមពល (Smart Plug ដែលមាន API ឬ IoT Sensor ដូចក្នុងឯកសារ) ដើម្បីត្រៀមប្រមូលទិន្នន័យ។
  2. ជំហានទី ២: ការតម្លើងកម្មវិធី និងការធ្វើតេស្ត: តម្លើង Phoronix Test Suite និងជ្រើសរើសការធ្វើតេស្តដូចជា AsmFish, Sysbench និង Radiance ។ សរសេរ Bash Script ដើម្បីដំណើរការការធ្វើតេស្តទាំងនេះដោយស្វ័យប្រវត្តិ។
  3. ជំហានទី ៣: ការប្រមូលទិន្នន័យធនធានប្រព័ន្ធ: ប្រើប្រាស់ពាក្យបញ្ជា htop និង cpustat នៅក្នុង Script ដើម្បីកត់ត្រាការប្រើប្រាស់ CPU និង Memory ជារៀងរាល់វិនាទី ស្របពេលដែលការធ្វើតេស្តកំពុងដំណើរការ។
  4. ជំហានទី ៤: ការវិភាគ និងការបង្កើតសំណុំទិន្នន័យ: បញ្ចូលទិន្នន័យពីឧបករណ៍វាស់ថាមពល និងទិន្នន័យពីប្រព័ន្ធ (System Logs) ចូលគ្នាដោយប្រើ Python (Pandas) ដើម្បីបង្កើតជា Dataset សម្រាប់វិភាគរកទំនាក់ទំនង (Correlation)។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Stress Tests ជាដំណើរការនៃការដាក់បន្ទុកការងារយ៉ាងធ្ងន់ធ្ងរទៅលើប្រព័ន្ធកុំព្យូទ័រ ឬម៉ាស៊ីនមេ (Server) ដើម្បីវាស់វែងពីស្ថេរភាព និងកម្រិតនៃការប្រើប្រាស់ថាមពលនៅពេលដែលវាដំណើរការដល់កម្រិតអតិបរមា។ ប្រៀបដូចជាការរត់ប្រណាំងក្នុងល្បឿនលឿនបំផុត ដើម្បីដឹងថារាងកាយយើងអាចទ្រាំទ្របានកម្រិតណា និងអស់កម្លាំងប៉ុន្មាន។
Benchmark គឺជាកម្មវិធីស្តង់ដារដែលត្រូវបានរចនាឡើងដើម្បីវាយតម្លៃ និងប្រៀបធៀបប្រសិទ្ធភាពនៃការដំណើរការរបស់ផ្នែករឹង (Hardware) ឬផ្នែកទន់ (Software) របស់កុំព្យូទ័រ ដោយផ្តល់ជាពិន្ទុ ឬលទ្ធផលជាក់លាក់។ ដូចជាការប្រឡងស្តង់ដារថ្នាក់ជាតិដែលសិស្សគ្រប់គ្នាត្រូវធ្វើដូចគ្នា ដើម្បីវាស់វែងសមត្ថភាពប្រៀបធៀបគ្នា។
Active Power សំដៅលើថាមពលអគ្គិសនីពិតប្រាកដ (គិតជាវ៉ាត់ - Watts) ដែលឧបករណ៍អគ្គិសនីប្រើប្រាស់ដើម្បីបំពេញការងារជាក់ស្តែង មិនរាប់បញ្ចូលថាមពលដែលបាត់បង់ ឬត្រឡប់ទៅវិញក្នុងប្រព័ន្ធឡើយ។ គឺជាកម្លាំងជាក់ស្តែងដែលត្រូវបានប្រើដើម្បីរុញឡាន មិនមែនគ្រាន់តែជាកម្លាំងដែលបញ្ចេញចោលនោះទេ។
Software-Defined Networking (SDN) ជាបច្ចេកវិទ្យាដែលអនុញ្ញាតឱ្យអ្នកគ្រប់គ្រងបណ្តាញ (Network Administrators) អាចគ្រប់គ្រងចរាចរណ៍ទិន្នន័យតាមរយៈកម្មវិធីកុំព្យូទ័រ ជាជាងការទៅកំណត់រចនាសម្ព័ន្ធនៅលើឧបករណ៍បណ្តាញ (Routers/Switches) នីមួយៗដោយផ្ទាល់។ ដូចជាការបញ្ជាភ្លើងចរាចរណ៍ទូទាំងទីក្រុងពីបន្ទប់បញ្ជាកណ្តាល ជាជាងឱ្យប៉ូលិសឈរនៅគ្រប់ស្តុបនីមួយៗ។
Virtualization បច្ចេកវិទ្យាដែលអនុញ្ញាតឱ្យបង្កើតម៉ាស៊ីននិម្មិត (Virtual Machines) ជាច្រើននៅលើម៉ាស៊ីនរូបវន្ត (Physical Machine) តែមួយ ដែលជួយឱ្យប្រើប្រាស់ធនធានកុំព្យូទ័របានពេញលេញ និងមានប្រសិទ្ធភាពជាងមុន។ ប្រៀបដូចជាការបែងចែកផ្ទះធំមួយឱ្យទៅជាបន្ទប់ជួលតូចៗជាច្រើន ដើម្បីឱ្យមនុស្សជាច្រើនអាចរស់នៅបានក្នុងពេលតែមួយ។
Autoencoder ជាប្រភេទនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (Neural Network) ដែលរៀនពីរបៀបបង្រួមទិន្នន័យទៅជាទម្រង់តូច និងព្យាយាមបង្កើតវាឡើងវិញ។ នៅក្នុងឯកសារនេះ វាត្រូវបានប្រើដើម្បីស្វែងរកភាពមិនប្រក្រតី ឬបំពេញទិន្នន័យដែលបាត់។ ដូចជាការសង្ខេបសៀវភៅមួយក្បាល ហើយបន្ទាប់មកព្យាយាមសរសេរសៀវភៅនោះឡើងវិញដោយផ្អែកលើការសង្ខេបនោះ ដើម្បីមើលថាតើមានអ្វីបាត់បង់ឬខុសប្រក្រតី។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖