Original Title: Energy-Efficient Management of Virtual Machines in Data Centers for Cloud Computing
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការគ្រប់គ្រងម៉ាស៊ីននិម្មិតប្រកបដោយប្រសិទ្ធភាពថាមពលនៅក្នុងមជ្ឈមណ្ឌលទិន្នន័យសម្រាប់សេវាកម្មកុំព្យូទ័រលើពពក (Cloud Computing)

ចំណងជើងដើម៖ Energy-Efficient Management of Virtual Machines in Data Centers for Cloud Computing

អ្នកនិពន្ធ៖ Anton Beloglazov (The University of Melbourne), Rajkumar Buyya (The University of Melbourne)

ឆ្នាំបោះពុម្ព៖ 2013

វិស័យសិក្សា៖ Computer Science / Cloud Computing

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការស្រាវជ្រាវនេះដោះស្រាយបញ្ហានៃការប្រើប្រាស់ថាមពលអគ្គិសនីដ៏ច្រើនសន្ធឹកសន្ធាប់នៅក្នុងមជ្ឈមណ្ឌលទិន្នន័យ (Data Centers) ដែលបណ្តាលមកពីការប្រើប្រាស់ធនធានកុំព្យូទ័រមិនអស់លទ្ធភាព (Low Utilization) និងការខ្ជះខ្ជាយថាមពលនៅក្នុងម៉ាស៊ីនមេដែលមិនដំណើរការ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះស្នើឡើងនូវវិធីសាស្ត្របង្រួមបញ្ចូលគ្នានៃម៉ាស៊ីននិម្មិត (Dynamic VM Consolidation) បែបចែកចាយ ដើម្បីកាត់បន្ថយចំនួនម៉ាស៊ីនមេដែលសកម្ម ដោយប្រើប្រាស់គំរូស្ថិតិ និងគណិតវិទ្យា។

Markov Chain Model (គំរូ Markov Chain) សម្រាប់រកមើលការផ្ទុកលើសកំណត់របស់ម៉ាស៊ីនមេ
Local Regression & Median Absolute Deviation (តម្រែតម្រង់ក្នុងតំបន់ និងគម្លាតដាច់ខាតមធ្យម) សម្រាប់ការវិភាគទិន្នន័យបន្ទុកការងារ
CloudSim Toolkit (ឧបករណ៍ CloudSim) សម្រាប់ការពិសោធន៍សាកល្បងជាមួយនឹងទិន្នន័យ PlanetLab
OpenStack Neat Framework (ក្របខ័ណ្ឌ OpenStack Neat) សម្រាប់ការអនុវត្ត និងការវាយតម្លៃជាក់ស្តែង

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ការបង្រួមបញ្ចូលគ្នានៃម៉ាស៊ីននិម្មិត (Dynamic VM Consolidation) អាចកាត់បន្ថយការប្រើប្រាស់ថាមពលបានរហូតដល់ ៣៣% ដោយមានផលប៉ះពាល់តិចតួចបំផុតលើដំណើរការកម្មវិធី។
ក្បួនដោះស្រាយ Markov Host Overload Detection (MHOD) អនុញ្ញាតឱ្យកំណត់គោលដៅគុណភាពសេវាកម្ម (QoS) បានច្បាស់លាស់ និងមានប្រសិទ្ធភាពប្រមាណ ៨៨% ធៀបនឹងក្បួនដោះស្រាយ offline ដ៏ល្អបំផុត។
ការរួមបញ្ចូលគ្នារវាងក្បួនដោះស្រាយ Local Regression និងគោលការណ៍ Minimum Migration Time (MMT) ផ្តល់នូវលទ្ធផលប្រសើរជាងគេក្នុងការកាត់បន្ថយការបំពាន SLA និងចំនួននៃការបន្លាស់ទីម៉ាស៊ីននិម្មិត។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Markov Host Overload Detection (MHOD) ការរកមើលការផ្ទុកលើសដោយប្រើគំរូ Markov (MHOD)	អនុញ្ញាតឱ្យកំណត់គោលដៅគុណភាពសេវាកម្ម (QoS) បានច្បាស់លាស់ និងមានលក្ខណៈអុបទិមសម្រាប់បន្ទុកការងារដែលមានស្ថេរភាព (Stationary Workload)។	ត្រូវការការគណនាស្មុគស្មាញជាងវិធីសាស្ត្រធម្មតា ហើយពឹងផ្អែកលើការប៉ាន់ប្រមាណបន្ទុកការងារ (Workload Estimation) សម្រាប់បន្ទុកដែលមិនមានស្ថេរភាព។	សម្រេចបានប្រសិទ្ធភាពប្រមាណ ៨៨% នៃក្បួនដោះស្រាយ Offline ល្អបំផុត និងមានការបំពាន SLA តិចជាង ០.៥%។
Local Regression (LR) / Robust Local Regression (LRR) វិធីសាស្ត្រតម្រែតម្រង់ក្នុងតំបន់ (Local Regression)	មានសមត្ថភាពខ្ពស់ក្នុងការគ្រប់គ្រងបន្ទុកការងារដែលមានការប្រែប្រួលខ្លាំង និងកាត់បន្ថយការបន្លាស់ទីដែលមិនចាំបាច់។	ការកំណត់ប៉ារ៉ាម៉ែត្រសុវត្ថិភាព (Safety Parameter) ដើម្បីថ្លឹងថ្លែងរវាងថាមពល និងគុណភាពសេវាកម្ម មានភាពលំបាកជាង MHOD។	កាត់បន្ថយការប្រើប្រាស់ថាមពលបានយ៉ាងល្អប្រសើរជាងវិធីសាស្ត្រកំណត់កម្រិតថេរ (Static Threshold)។
Static Threshold (THR) វិធីសាស្ត្រកំណត់កម្រិតនៃការប្រើប្រាស់ CPU ថេរ (Static Threshold)	ងាយស្រួលក្នុងការអនុវត្ត និងមិនត្រូវការការគណនាច្រើន។	មិនអាចបត់បែនតាមបម្រែបម្រួលនៃបន្ទុកការងារជាក់ស្តែង ដែលនាំឱ្យមានការខ្ជះខ្ជាយថាមពល ឬការបំពាន SLA ខ្ពស់។	មានប្រសិទ្ធភាពទាបជាងវិធីសាស្ត្រ Dynamic (ដូចជា MHOD ឬ LRR) ក្នុងការរក្សាតុល្យភាពរវាងថាមពល និងគុណភាព។
Non-Power Aware (NPA) / DVFS Only វិធីសាស្ត្រមិនគិតពីការសន្សំសំចៃថាមពល (ឬប្រើតែ DVFS)	ផ្តល់នូវដំណើរការម៉ាស៊ីនខ្ពស់បំផុតដោយគ្មានការរំខានពីការបន្លាស់ទី VM។	ខ្ជះខ្ជាយថាមពលខ្លាំងបំផុត ដោយសារម៉ាស៊ីនមេដែលមិនសូវមានដំណើរការនៅតែបើកចោល។	ប្រើប្រាស់ជាស្តង់ដារគោល (Baseline) ដើម្បីបង្ហាញពីការសន្សំសំចៃថាមពលរបស់វិធីសាស្ត្រដែលបានស្នើឡើង។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តវិធីសាស្ត្រនេះទាមទារនូវបរិស្ថានក្លែងធ្វើ ឬប្រព័ន្ធ Cloud ខ្នាតតូចដែលមានការគាំទ្រ Live Migration ប៉ុន្តែមិនត្រូវការឧបករណ៍ជំនាញថ្លៃៗនោះទេ។

Software: ត្រូវការចេះប្រើប្រាស់ OpenStack (សម្រាប់ OpenStack Neat Framework) និងភាសា Python ព្រមទាំងឧបករណ៍ក្លែងធ្វើ CloudSim (Java)។
Hardware: ម៉ាស៊ីនមេ (Servers) ដែលគាំទ្រ Virtualization (ដូចជា Intel VT-x) និងមានបណ្តាញភ្ជាប់ល្បឿនលឿនសម្រាប់ Live Migration។
Dataset: ទិន្នន័យបន្ទុកការងារជាក់ស្តែង ដូចជា PlanetLab workload traces ដែលផ្តល់ដោយគម្រោង CoMon។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់ទិន្នន័យពី PlanetLab ដែលជាបណ្តាញស្រាវជ្រាវសកល។ បន្ទុកការងារ (Workload) អាចមានលក្ខណៈខុសប្លែកពីកម្មវិធីពាណិជ្ជកម្ម (Commercial Applications) នៅក្នុងវិស័យធនាគារ ឬសហគ្រាសនៅកម្ពុជា ដែលទាមទារឱ្យមានការធ្វើតេស្តបន្ថែមលើទិន្នន័យក្នុងស្រុក។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានប្រយោជន៍យ៉ាងខ្លាំងសម្រាប់កម្ពុជា ដោយសារតម្លៃអគ្គិសនីខ្ពស់ ដែលជាកត្តាជំរុញឱ្យមជ្ឈមណ្ឌលទិន្នន័យស្វែងរកដំណោះស្រាយសន្សំសំចៃថាមពល។

មជ្ឈមណ្ឌលទិន្នន័យនៅរាជធានីភ្នំពេញ (Phnom Penh Data Centers): អាចជួយកាត់បន្ថយថ្លៃចំណាយប្រតិបត្តិការ (OPEX) សម្រាប់ក្រុមហ៊ុនផ្គត់ផ្គង់សេវាអ៊ីនធឺណិត (ISPs) និងក្រុមហ៊ុន hosting ក្នុងស្រុក។
គ្រឹះស្ថានឧត្តមសិក្សា (Higher Education Institutions): សាកលវិទ្យាល័យដូចជា RUPP ឬ ITC អាចប្រើប្រាស់ក្របខ័ណ្ឌ OpenStack Neat ដើម្បីបង្កើត Private Cloud ដែលមានប្រសិទ្ធភាពថាមពលសម្រាប់ការស្រាវជ្រាវ។
វិស័យធនាគារ និងមីក្រូហិរញ្ញវត្ថុ: ការប្រើប្រាស់ MHOD អាចជួយធានាគុណភាពសេវាកម្ម (SLA) សម្រាប់ប្រព័ន្ធ Core Banking ខណៈពេលកាត់បន្ថយការប្រើប្រាស់ធនធាន។

ក្របខ័ណ្ឌ OpenStack Neat គឺជាឧបករណ៍ដ៏មានសក្តានុពលសម្រាប់អ្នកអភិវឌ្ឍន៍ Cloud នៅកម្ពុជា ប៉ុន្តែការអនុវត្តជាក់ស្តែងទាមទារឱ្យមានការកែតម្រូវប៉ារ៉ាម៉ែត្រឱ្យសមស្របនឹងប្រភេទកម្មវិធីក្នុងស្រុក។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះនៃ Virtualization និង Cloud: ស្វែងយល់អំពីគោលការណ៍នៃ Virtual Machines (VMs), Hypervisors (ដូចជា KVM/Xen), និងបច្ចេកវិទ្យា Live Migration។
ការពិសោធន៍ជាមួយ CloudSim: ដំឡើងនិងប្រើប្រាស់ CloudSim Toolkit ដើម្បីធ្វើការពិសោធន៍លើក្បួនដោះស្រាយ VM Allocation ផ្សេងៗ ដោយប្រើទិន្នន័យ PlanetLab ជាគំរូ។
ការសិក្សាកូដ OpenStack Neat: វិភាគលើកូដប្រភព (Source Code) របស់ OpenStack Neat (សរសេរជាភាសា Python) ដើម្បីយល់ពីរបៀបដែលវាធ្វើអន្តរកម្មជាមួយ OpenStack Nova API។
ការអនុវត្តលើប្រព័ន្ធជាក់ស្តែង: ដំឡើង OpenStack (DevStack) នៅលើម៉ាស៊ីនមេ ឬក្នុង Lab សាលា ហើយសាកល្បងបញ្ចូល OpenStack Neat ដើម្បីវាស់វែងការសន្សំសំចៃថាមពលជាក់ស្តែង។
ការស្រាវជ្រាវបន្តលើម៉ូដែលកូនកាត់ (Hybrid Models): សាកល្បងកែប្រែ Algorithm ដោយបញ្ចូលបច្ចេកទេស Machine Learning ទំនើបៗជំនួសឱ្យ Local Regression ដើម្បីបង្កើនភាពត្រឹមត្រូវនៃការទស្សន៍ទាយបន្ទុកការងារ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Dynamic VM Consolidation	ដំណើរការនៃការប្រមូលផ្តុំម៉ាស៊ីននិម្មិត (Virtual Machines) ឱ្យទៅស្ថិតនៅលើម៉ាស៊ីនមេ (Physical Servers) ចំនួនតិចបំផុតតាមដែលអាចធ្វើទៅបាន ដើម្បីអនុញ្ញាតឱ្យបិទម៉ាស៊ីនមេដែលនៅសល់ដើម្បីសន្សំសំចៃថាមពលអគ្គិសនី ដោយមិនប៉ះពាល់ដល់ដំណើរការកម្មវិធី។	ដូចជាការរៀបចំឱ្យអ្នកដំណើរជិះក្នុងឡានក្រុងឱ្យពេញៗ ដើម្បីកាត់បន្ថយចំនួនឡានក្រុងដែលត្រូវរត់ និងសន្សំសាំង។
Live Migration	បច្ចេកវិទ្យាដែលអនុញ្ញាតឱ្យផ្លាស់ទីម៉ាស៊ីននិម្មិត (VM) ពីម៉ាស៊ីនមេមួយទៅម៉ាស៊ីនមេមួយទៀត ខណៈពេលដែលវាកំពុងដំណើរការ ដោយមិនធ្វើឱ្យគាំង ឬរំខានដល់អ្នកប្រើប្រាស់ឡើយ។	ប្រៀបបាននឹងការលើកត្រីចេញពីកែវមួយទៅកែវមួយទៀត ដោយមិនឱ្យត្រីនោះដឹងខ្លួន ឬដាច់ដង្ហើម។
Service Level Agreement (SLA)	កិច្ចព្រមព្រៀងរវាងអ្នកផ្តល់សេវា (Cloud Provider) និងអតិថិជន ដែលកំណត់អំពីកម្រិតគុណភាពសេវាកម្ម (ដូចជាល្បឿន និងស្ថេរភាព)។ នៅក្នុងបរិបទនេះ វាសំដៅលើការធានាថាម៉ាស៊ីននិម្មិតនឹងទទួលបានធនធាន CPU គ្រប់គ្រាន់។	ដូចជាការធានារបស់អ្នកដឹកជញ្ជូនភីហ្សាថា «បើដឹកយឺតជាង ៣០នាទី នឹងមិនគិតលុយ»។
Markov Chain	គំរូគណិតវិទ្យាដែលប្រើសម្រាប់ទស្សន៍ទាយស្ថានភាពនាពេលអនាគត ដោយផ្អែកលើស្ថានភាពបច្ចុប្បន្នសុទ្ធសាធ (មិនខ្វល់ពីអតីតកាល)។ នៅក្នុងការសិក្សានេះ វាត្រូវបានប្រើដើម្បីសម្រេចចិត្តថាពេលណាគួរបន្លាស់ទី VM ចេញនៅពេលម៉ាស៊ីនមេធ្វើការធ្ងន់ពេក។	ដូចជាការលេងហ្គេមបutes ដែលជំហានបន្ទាប់របស់អ្នកអាស្រ័យតែលើកន្លែងដែលអ្នកកំពុងឈរ មិនមែនកន្លែងដែលអ្នកបានដើរកាត់ពីមុននោះទេ។
Local Regression	វិធីសាស្ត្រស្ថិតិដែលប្រើប្រាស់ទិន្នន័យថ្មីៗចុងក្រោយ ដើម្បីគូសខ្សែក្រាហ្វព្យាករណ៍អំពីទិសដៅនៃការប្រើប្រាស់ធនធាន (CPU Usage) នាពេលអនាគតក្នុងរយៈពេលខ្លី។	ដូចជាការប៉ាន់ស្មានថាតើភ្លៀងនឹងធ្លាក់ឬអត់ក្នុងរយៈពេល ១០នាទីទៀត ដោយមើលតែលើពពកខ្មៅដែលកំពុងរសាត់មកជិត។
Infrastructure as a Service (IaaS)	សេវាកម្មកុំព្យូទ័រលើពពកដែលផ្តល់នូវហេដ្ឋារចនាសម្ព័ន្ធមូលដ្ឋាន (ដូចជា ម៉ាស៊ីនមេ កន្លែងផ្ទុកទិន្នន័យ និងបណ្តាញ) ដល់អ្នកប្រើប្រាស់ ដើម្បីឱ្យពួកគេអាចដំឡើងកម្មវិធី និងប្រព័ន្ធប្រតិបត្តិការដោយខ្លួនឯងបាន។	ដូចជាការជួលដីទទេដើម្បីសង់ផ្ទះដោយខ្លួនឯង ជាជាងការជួលបន្ទប់សណ្ឋាគារដែលគេរៀបចំឱ្យស្រាប់។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖