Original Title: A Guide to Data Collection for Computation and Monitoring of Node Energy Consumption
Source: doi.org/10.3390/bdcc7030130
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

មគ្គុទ្ទេសក៍សម្រាប់ការប្រមូលទិន្នន័យសម្រាប់ការគណនា និងការត្រួតពិនិត្យការប្រើប្រាស់ថាមពលរបស់ថ្នាំងកុំព្យូទ័រ

ចំណងជើងដើម៖ A Guide to Data Collection for Computation and Monitoring of Node Energy Consumption

អ្នកនិពន្ធ៖ Alberto del Rio (Universidad Politécnica de Madrid), Giuseppe Conti (Universidad Politécnica de Madrid), Sandra Castano-Solis (Universidad Politécnica de Madrid), Javier Serrano (Universidad Politécnica de Madrid), David Jimenez (Universidad Politécnica de Madrid), Jesus Fraile-Ardanuy (Universidad Politécnica de Madrid)

ឆ្នាំបោះពុម្ព៖ 2023 (Big Data and Cognitive Computing)

វិស័យសិក្សា៖ Computer Science / Green Computing / Data Centers

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការស្រាវជ្រាវនេះដោះស្រាយបញ្ហាកង្វះខាតនៃសំណុំទិន្នន័យថាមពល (Energy Datasets) ដែលបើកចំហជាសាធារណៈសម្រាប់មជ្ឈមណ្ឌលទិន្នន័យ ដែលជាឧបសគ្គដល់ការអភិវឌ្ឍ AI ដើម្បីបង្កើនប្រសិទ្ធភាពថាមពល។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកនិពន្ធបានបង្កើតវិធីសាស្ត្រស្តង់ដារមួយសម្រាប់ការប្រមូលទិន្នន័យដោយប្រើប្រាស់ការធ្វើតេស្តសង្កត់ធ្ងន់ (Stress Tests) លើម៉ាស៊ីនមេ និងវាស់វែងការប្រើប្រាស់អគ្គិសនីជាក់ស្តែងតាមរយៈឧបករណ៍ IoT ។

ប្រព័ន្ធវាស់វែងថាមពលតាមរយៈ IoT (IoT Energy Measurement System) និងឧបករណ៍ចាប់សញ្ញាកម្មវិធី
ការធ្វើតេស្តសមត្ថភាព (Phoronix Test Suite) ដោយប្រើកម្មវិធីដូចជា AsmFish, Radiance និង Sysbench
ការប្រមូលទិន្នន័យធនធានប្រព័ន្ធ (System Resource Collection) ដោយប្រើ htop និង cpustat លើប្រព័ន្ធប្រតិបត្តិការ Linux

លទ្ធផលសំខាន់ៗ (The Verdict)៖

បានបង្កើតសំណុំទិន្នន័យដែលមាន ២៩ លក្ខណៈពិសេស (Features) និងទិន្នន័យជាង ២៩៤,៩១០ ជួរ ដែលអាចទាញយកបានជាសាធារណៈនៅលើ GitHub និង Kaggle ។
ការពិសោធន៍បង្ហាញថាការធ្វើតេស្ត AsmFish មានឥទ្ធិពលខ្លាំងបំផុតលើថាមពលសកម្ម (Active Power) ដោយកើនឡើងប្រហែល ៩៦.៥% ធៀបនឹងពេលម៉ាស៊ីនមិនដំណើរការ។
ការធ្វើតេស្តចម្រុះ (Hybrid Tests) ដែលរួមបញ្ចូលគ្នានូវបន្ទុកការងារផ្សេងៗគ្នា បានជួយដោះស្រាយបញ្ហាកង្វះភាពជាក់លាក់ក្នុងការប្រមូលទិន្នន័យ និងបង្ហាញពីទំនាក់ទំនងល្អរវាងការប្រើប្រាស់ CPU និងការប្រើប្រាស់ថាមពល។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
No Charge Test (Idle State) ការធ្វើតេស្តដោយគ្មានបន្ទុក (ស្ថានភាពមិនដំណើរការ)	ផ្តល់នូវទិន្នន័យមូលដ្ឋាន (Baseline) សម្រាប់ការប្រៀបធៀប និងបង្ហាញពីការប្រើប្រាស់ថាមពលអប្បបរមារបស់ប្រព័ន្ធ។	មិនផ្តល់ព័ត៌មានអំពីអាកប្បកិរិយារបស់ម៉ាស៊ីននៅពេលមានបន្ទុកការងារធ្ងន់។	ថាមពលសកម្មមធ្យមគឺ ២៧.៤ វ៉ាត់ (Watts)។
AsmFish Benchmark (High Intensity) ការធ្វើតេស្ត AsmFish (កម្រិតខ្ពស់)	បង្កើតសម្ពាធអតិបរមាលើធនធាន CPU ដែលនាំឱ្យមានទំនាក់ទំនងខ្ពស់បំផុតរវាងការប្រើប្រាស់ធនធាន និងថាមពល។	អាចនឹងមិនឆ្លុះបញ្ចាំងពីការប្រើប្រាស់ជាក់ស្តែងដែលមានការប្រែប្រួលចុះឡើង។	ការប្រើប្រាស់ថាមពលកើនឡើង ៩៦.៥% ធៀបនឹងស្ថានភាពមិនដំណើរការ។
Hybrid Tests (Mixed Workloads) ការធ្វើតេស្តចម្រុះ (Hybrid Tests)	ដោះស្រាយបញ្ហាភាពយឺតយ៉ាវនៃទិន្នន័យ (Measurement Lag) និងតំណាងឱ្យស្ថានភាពប្រើប្រាស់ជាក់ស្តែងជាងការធ្វើតេស្តតែមួយមុខ។	ទាមទារការរៀបចំស្គ្រីប (Scripts) ស្មុគស្មាញជាងមុន ដើម្បីដំណើរការកម្មវិធីច្រើនក្នុងពេលតែមួយ។	បង្កើតបាននូវការជាប់ទាក់ទងគ្នា (Correlation) ល្អប្រសើររវាងការវាស់វែង និងថាមពលសកម្ម ជាពិសេសនៅក្នុង Hybrid Test 2 ។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តវិធីសាស្ត្រនេះទាមទារធនធានផ្នែករឹងកម្រិតមធ្យម និងជំនាញផ្នែកទន់មួយចំនួនសម្រាប់ការប្រមូលទិន្នន័យ។

Hardware: ម៉ាស៊ីនមេ (Servers) និងប្រព័ន្ធវាស់វែងថាមពល IoT (ដូចជា Current Transformer sensors និង Microcontroller)។
Software: ប្រព័ន្ធប្រតិបត្តិការ Linux (Ubuntu/Debian), Phoronix Test Suite, និងឧបករណ៍តាមដានដូចជា htop និង cpustat ។
Expertise: ចំណេះដឹងអំពី Linux Command Line, Bash Scripting និងការវិភាគទិន្នន័យជាមូលដ្ឋាន។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងមន្ទីរពិសោធន៍សាកលវិទ្យាល័យនៅទីក្រុងម៉ាឌ្រីដ (Madrid) ដោយប្រើប្រាស់ម៉ាស៊ីនមេដែលមានស្ថាបត្យកម្មជាក់លាក់។ សម្រាប់កម្ពុជា ការយកចិត្តទុកដាក់គួរតែបន្ថែមលើកត្តាសីតុណ្ហភាពបរិស្ថាន (Temperature) ព្រោះអាកាសធាតុក្តៅនៅកម្ពុជាអាចតម្រូវឱ្យមានការប្រើប្រាស់ថាមពលសម្រាប់ប្រព័ន្ធត្រជាក់ (Cooling Systems) ច្រើនជាងនៅអឺរ៉ុប។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានប្រយោជន៍ខ្លាំងណាស់សម្រាប់កម្ពុជា ជាពិសេសសម្រាប់ការចាប់ផ្តើមស្រាវជ្រាវលើប្រសិទ្ធភាពថាមពល (Energy Efficiency) ដោយមិនចាំបាច់ចំណាយប្រាក់ច្រើន។

គ្រឹះស្ថានឧត្តមសិក្សា (ITC, RUPP): និស្សិតអាចប្រើប្រាស់វិធីសាស្ត្រនេះដើម្បីបង្កើតសំណុំទិន្នន័យផ្ទាល់ខ្លួនសម្រាប់គម្រោងបញ្ចប់ការសិក្សាផ្នែក AI ឬ IoT ដោយប្រើឧបករណ៍ដែលមានស្រាប់។
មជ្ឈមណ្ឌលទិន្នន័យខ្នាតតូច និងមធ្យម (SME Data Centers): ក្រុមហ៊ុនផ្តល់សេវាអ៊ីនធឺណិត (ISPs) ឬធនាគារក្នុងស្រុកអាចអនុវត្តការធ្វើតេស្តនេះដើម្បីវាស់វែង និងកាត់បន្ថយចំណាយលើអគ្គិសនី ដែលមានតម្លៃខ្ពស់នៅកម្ពុជា។

ការអនុវត្តគំរូនេះអាចជួយស្ថាប័ននៅកម្ពុជាបង្កើតយុទ្ធសាស្ត្រកាត់បន្ថយការបំភាយកាបូន និងសន្សំសំចៃថវិកាប្រតិបត្តិការ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

ជំហានទី ១: ការរៀបចំផ្នែករឹង និងឧបករណ៍វាស់វែង: រៀបចំម៉ាស៊ីនមេ (Server) ឬកុំព្យូទ័រដែលដំណើរការដោយ Linux និងតម្លើងឧបករណ៍វាស់ថាមពល (Smart Plug ដែលមាន API ឬ IoT Sensor ដូចក្នុងឯកសារ) ដើម្បីត្រៀមប្រមូលទិន្នន័យ។
ជំហានទី ២: ការតម្លើងកម្មវិធី និងការធ្វើតេស្ត: តម្លើង Phoronix Test Suite និងជ្រើសរើសការធ្វើតេស្តដូចជា AsmFish, Sysbench និង Radiance ។ សរសេរ Bash Script ដើម្បីដំណើរការការធ្វើតេស្តទាំងនេះដោយស្វ័យប្រវត្តិ។
ជំហានទី ៣: ការប្រមូលទិន្នន័យធនធានប្រព័ន្ធ: ប្រើប្រាស់ពាក្យបញ្ជា htop និង cpustat នៅក្នុង Script ដើម្បីកត់ត្រាការប្រើប្រាស់ CPU និង Memory ជារៀងរាល់វិនាទី ស្របពេលដែលការធ្វើតេស្តកំពុងដំណើរការ។
ជំហានទី ៤: ការវិភាគ និងការបង្កើតសំណុំទិន្នន័យ: បញ្ចូលទិន្នន័យពីឧបករណ៍វាស់ថាមពល និងទិន្នន័យពីប្រព័ន្ធ (System Logs) ចូលគ្នាដោយប្រើ Python (Pandas) ដើម្បីបង្កើតជា Dataset សម្រាប់វិភាគរកទំនាក់ទំនង (Correlation)។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Stress Tests	ជាដំណើរការនៃការដាក់បន្ទុកការងារយ៉ាងធ្ងន់ធ្ងរទៅលើប្រព័ន្ធកុំព្យូទ័រ ឬម៉ាស៊ីនមេ (Server) ដើម្បីវាស់វែងពីស្ថេរភាព និងកម្រិតនៃការប្រើប្រាស់ថាមពលនៅពេលដែលវាដំណើរការដល់កម្រិតអតិបរមា។	ប្រៀបដូចជាការរត់ប្រណាំងក្នុងល្បឿនលឿនបំផុត ដើម្បីដឹងថារាងកាយយើងអាចទ្រាំទ្របានកម្រិតណា និងអស់កម្លាំងប៉ុន្មាន។
Benchmark	គឺជាកម្មវិធីស្តង់ដារដែលត្រូវបានរចនាឡើងដើម្បីវាយតម្លៃ និងប្រៀបធៀបប្រសិទ្ធភាពនៃការដំណើរការរបស់ផ្នែករឹង (Hardware) ឬផ្នែកទន់ (Software) របស់កុំព្យូទ័រ ដោយផ្តល់ជាពិន្ទុ ឬលទ្ធផលជាក់លាក់។	ដូចជាការប្រឡងស្តង់ដារថ្នាក់ជាតិដែលសិស្សគ្រប់គ្នាត្រូវធ្វើដូចគ្នា ដើម្បីវាស់វែងសមត្ថភាពប្រៀបធៀបគ្នា។
Active Power	សំដៅលើថាមពលអគ្គិសនីពិតប្រាកដ (គិតជាវ៉ាត់ - Watts) ដែលឧបករណ៍អគ្គិសនីប្រើប្រាស់ដើម្បីបំពេញការងារជាក់ស្តែង មិនរាប់បញ្ចូលថាមពលដែលបាត់បង់ ឬត្រឡប់ទៅវិញក្នុងប្រព័ន្ធឡើយ។	គឺជាកម្លាំងជាក់ស្តែងដែលត្រូវបានប្រើដើម្បីរុញឡាន មិនមែនគ្រាន់តែជាកម្លាំងដែលបញ្ចេញចោលនោះទេ។
Software-Defined Networking (SDN)	ជាបច្ចេកវិទ្យាដែលអនុញ្ញាតឱ្យអ្នកគ្រប់គ្រងបណ្តាញ (Network Administrators) អាចគ្រប់គ្រងចរាចរណ៍ទិន្នន័យតាមរយៈកម្មវិធីកុំព្យូទ័រ ជាជាងការទៅកំណត់រចនាសម្ព័ន្ធនៅលើឧបករណ៍បណ្តាញ (Routers/Switches) នីមួយៗដោយផ្ទាល់។	ដូចជាការបញ្ជាភ្លើងចរាចរណ៍ទូទាំងទីក្រុងពីបន្ទប់បញ្ជាកណ្តាល ជាជាងឱ្យប៉ូលិសឈរនៅគ្រប់ស្តុបនីមួយៗ។
Virtualization	បច្ចេកវិទ្យាដែលអនុញ្ញាតឱ្យបង្កើតម៉ាស៊ីននិម្មិត (Virtual Machines) ជាច្រើននៅលើម៉ាស៊ីនរូបវន្ត (Physical Machine) តែមួយ ដែលជួយឱ្យប្រើប្រាស់ធនធានកុំព្យូទ័របានពេញលេញ និងមានប្រសិទ្ធភាពជាងមុន។	ប្រៀបដូចជាការបែងចែកផ្ទះធំមួយឱ្យទៅជាបន្ទប់ជួលតូចៗជាច្រើន ដើម្បីឱ្យមនុស្សជាច្រើនអាចរស់នៅបានក្នុងពេលតែមួយ។
Autoencoder	ជាប្រភេទនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (Neural Network) ដែលរៀនពីរបៀបបង្រួមទិន្នន័យទៅជាទម្រង់តូច និងព្យាយាមបង្កើតវាឡើងវិញ។ នៅក្នុងឯកសារនេះ វាត្រូវបានប្រើដើម្បីស្វែងរកភាពមិនប្រក្រតី ឬបំពេញទិន្នន័យដែលបាត់។	ដូចជាការសង្ខេបសៀវភៅមួយក្បាល ហើយបន្ទាប់មកព្យាយាមសរសេរសៀវភៅនោះឡើងវិញដោយផ្អែកលើការសង្ខេបនោះ ដើម្បីមើលថាតើមានអ្វីបាត់បង់ឬខុសប្រក្រតី។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖