Original Title: Energy-Efficient Management of Virtual Machines in Data Centers for Cloud Computing
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការគ្រប់គ្រងម៉ាស៊ីននិម្មិតប្រកបដោយប្រសិទ្ធភាពថាមពលនៅក្នុងមជ្ឈមណ្ឌលទិន្នន័យសម្រាប់សេវាកម្មកុំព្យូទ័រលើពពក (Cloud Computing)

ចំណងជើងដើម៖ Energy-Efficient Management of Virtual Machines in Data Centers for Cloud Computing

អ្នកនិពន្ធ៖ Anton Beloglazov (The University of Melbourne), Rajkumar Buyya (The University of Melbourne)

ឆ្នាំបោះពុម្ព៖ 2013

វិស័យសិក្សា៖ Computer Science / Cloud Computing

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការស្រាវជ្រាវនេះដោះស្រាយបញ្ហានៃការប្រើប្រាស់ថាមពលអគ្គិសនីដ៏ច្រើនសន្ធឹកសន្ធាប់នៅក្នុងមជ្ឈមណ្ឌលទិន្នន័យ (Data Centers) ដែលបណ្តាលមកពីការប្រើប្រាស់ធនធានកុំព្យូទ័រមិនអស់លទ្ធភាព (Low Utilization) និងការខ្ជះខ្ជាយថាមពលនៅក្នុងម៉ាស៊ីនមេដែលមិនដំណើរការ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះស្នើឡើងនូវវិធីសាស្ត្របង្រួមបញ្ចូលគ្នានៃម៉ាស៊ីននិម្មិត (Dynamic VM Consolidation) បែបចែកចាយ ដើម្បីកាត់បន្ថយចំនួនម៉ាស៊ីនមេដែលសកម្ម ដោយប្រើប្រាស់គំរូស្ថិតិ និងគណិតវិទ្យា។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Markov Host Overload Detection (MHOD)
ការរកមើលការផ្ទុកលើសដោយប្រើគំរូ Markov (MHOD)
អនុញ្ញាតឱ្យកំណត់គោលដៅគុណភាពសេវាកម្ម (QoS) បានច្បាស់លាស់ និងមានលក្ខណៈអុបទិមសម្រាប់បន្ទុកការងារដែលមានស្ថេរភាព (Stationary Workload)។ ត្រូវការការគណនាស្មុគស្មាញជាងវិធីសាស្ត្រធម្មតា ហើយពឹងផ្អែកលើការប៉ាន់ប្រមាណបន្ទុកការងារ (Workload Estimation) សម្រាប់បន្ទុកដែលមិនមានស្ថេរភាព។ សម្រេចបានប្រសិទ្ធភាពប្រមាណ ៨៨% នៃក្បួនដោះស្រាយ Offline ល្អបំផុត និងមានការបំពាន SLA តិចជាង ០.៥%។
Local Regression (LR) / Robust Local Regression (LRR)
វិធីសាស្ត្រតម្រែតម្រង់ក្នុងតំបន់ (Local Regression)
មានសមត្ថភាពខ្ពស់ក្នុងការគ្រប់គ្រងបន្ទុកការងារដែលមានការប្រែប្រួលខ្លាំង និងកាត់បន្ថយការបន្លាស់ទីដែលមិនចាំបាច់។ ការកំណត់ប៉ារ៉ាម៉ែត្រសុវត្ថិភាព (Safety Parameter) ដើម្បីថ្លឹងថ្លែងរវាងថាមពល និងគុណភាពសេវាកម្ម មានភាពលំបាកជាង MHOD។ កាត់បន្ថយការប្រើប្រាស់ថាមពលបានយ៉ាងល្អប្រសើរជាងវិធីសាស្ត្រកំណត់កម្រិតថេរ (Static Threshold)។
Static Threshold (THR)
វិធីសាស្ត្រកំណត់កម្រិតនៃការប្រើប្រាស់ CPU ថេរ (Static Threshold)
ងាយស្រួលក្នុងការអនុវត្ត និងមិនត្រូវការការគណនាច្រើន។ មិនអាចបត់បែនតាមបម្រែបម្រួលនៃបន្ទុកការងារជាក់ស្តែង ដែលនាំឱ្យមានការខ្ជះខ្ជាយថាមពល ឬការបំពាន SLA ខ្ពស់។ មានប្រសិទ្ធភាពទាបជាងវិធីសាស្ត្រ Dynamic (ដូចជា MHOD ឬ LRR) ក្នុងការរក្សាតុល្យភាពរវាងថាមពល និងគុណភាព។
Non-Power Aware (NPA) / DVFS Only
វិធីសាស្ត្រមិនគិតពីការសន្សំសំចៃថាមពល (ឬប្រើតែ DVFS)
ផ្តល់នូវដំណើរការម៉ាស៊ីនខ្ពស់បំផុតដោយគ្មានការរំខានពីការបន្លាស់ទី VM។ ខ្ជះខ្ជាយថាមពលខ្លាំងបំផុត ដោយសារម៉ាស៊ីនមេដែលមិនសូវមានដំណើរការនៅតែបើកចោល។ ប្រើប្រាស់ជាស្តង់ដារគោល (Baseline) ដើម្បីបង្ហាញពីការសន្សំសំចៃថាមពលរបស់វិធីសាស្ត្រដែលបានស្នើឡើង។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តវិធីសាស្ត្រនេះទាមទារនូវបរិស្ថានក្លែងធ្វើ ឬប្រព័ន្ធ Cloud ខ្នាតតូចដែលមានការគាំទ្រ Live Migration ប៉ុន្តែមិនត្រូវការឧបករណ៍ជំនាញថ្លៃៗនោះទេ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់ទិន្នន័យពី PlanetLab ដែលជាបណ្តាញស្រាវជ្រាវសកល។ បន្ទុកការងារ (Workload) អាចមានលក្ខណៈខុសប្លែកពីកម្មវិធីពាណិជ្ជកម្ម (Commercial Applications) នៅក្នុងវិស័យធនាគារ ឬសហគ្រាសនៅកម្ពុជា ដែលទាមទារឱ្យមានការធ្វើតេស្តបន្ថែមលើទិន្នន័យក្នុងស្រុក។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានប្រយោជន៍យ៉ាងខ្លាំងសម្រាប់កម្ពុជា ដោយសារតម្លៃអគ្គិសនីខ្ពស់ ដែលជាកត្តាជំរុញឱ្យមជ្ឈមណ្ឌលទិន្នន័យស្វែងរកដំណោះស្រាយសន្សំសំចៃថាមពល។

ក្របខ័ណ្ឌ OpenStack Neat គឺជាឧបករណ៍ដ៏មានសក្តានុពលសម្រាប់អ្នកអភិវឌ្ឍន៍ Cloud នៅកម្ពុជា ប៉ុន្តែការអនុវត្តជាក់ស្តែងទាមទារឱ្យមានការកែតម្រូវប៉ារ៉ាម៉ែត្រឱ្យសមស្របនឹងប្រភេទកម្មវិធីក្នុងស្រុក។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃ Virtualization និង Cloud: ស្វែងយល់អំពីគោលការណ៍នៃ Virtual Machines (VMs), Hypervisors (ដូចជា KVM/Xen), និងបច្ចេកវិទ្យា Live Migration។
  2. ការពិសោធន៍ជាមួយ CloudSim: ដំឡើងនិងប្រើប្រាស់ CloudSim Toolkit ដើម្បីធ្វើការពិសោធន៍លើក្បួនដោះស្រាយ VM Allocation ផ្សេងៗ ដោយប្រើទិន្នន័យ PlanetLab ជាគំរូ។
  3. ការសិក្សាកូដ OpenStack Neat: វិភាគលើកូដប្រភព (Source Code) របស់ OpenStack Neat (សរសេរជាភាសា Python) ដើម្បីយល់ពីរបៀបដែលវាធ្វើអន្តរកម្មជាមួយ OpenStack Nova API។
  4. ការអនុវត្តលើប្រព័ន្ធជាក់ស្តែង: ដំឡើង OpenStack (DevStack) នៅលើម៉ាស៊ីនមេ ឬក្នុង Lab សាលា ហើយសាកល្បងបញ្ចូល OpenStack Neat ដើម្បីវាស់វែងការសន្សំសំចៃថាមពលជាក់ស្តែង។
  5. ការស្រាវជ្រាវបន្តលើម៉ូដែលកូនកាត់ (Hybrid Models): សាកល្បងកែប្រែ Algorithm ដោយបញ្ចូលបច្ចេកទេស Machine Learning ទំនើបៗជំនួសឱ្យ Local Regression ដើម្បីបង្កើនភាពត្រឹមត្រូវនៃការទស្សន៍ទាយបន្ទុកការងារ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Dynamic VM Consolidation ដំណើរការនៃការប្រមូលផ្តុំម៉ាស៊ីននិម្មិត (Virtual Machines) ឱ្យទៅស្ថិតនៅលើម៉ាស៊ីនមេ (Physical Servers) ចំនួនតិចបំផុតតាមដែលអាចធ្វើទៅបាន ដើម្បីអនុញ្ញាតឱ្យបិទម៉ាស៊ីនមេដែលនៅសល់ដើម្បីសន្សំសំចៃថាមពលអគ្គិសនី ដោយមិនប៉ះពាល់ដល់ដំណើរការកម្មវិធី។ ដូចជាការរៀបចំឱ្យអ្នកដំណើរជិះក្នុងឡានក្រុងឱ្យពេញៗ ដើម្បីកាត់បន្ថយចំនួនឡានក្រុងដែលត្រូវរត់ និងសន្សំសាំង។
Live Migration បច្ចេកវិទ្យាដែលអនុញ្ញាតឱ្យផ្លាស់ទីម៉ាស៊ីននិម្មិត (VM) ពីម៉ាស៊ីនមេមួយទៅម៉ាស៊ីនមេមួយទៀត ខណៈពេលដែលវាកំពុងដំណើរការ ដោយមិនធ្វើឱ្យគាំង ឬរំខានដល់អ្នកប្រើប្រាស់ឡើយ។ ប្រៀបបាននឹងការលើកត្រីចេញពីកែវមួយទៅកែវមួយទៀត ដោយមិនឱ្យត្រីនោះដឹងខ្លួន ឬដាច់ដង្ហើម។
Service Level Agreement (SLA) កិច្ចព្រមព្រៀងរវាងអ្នកផ្តល់សេវា (Cloud Provider) និងអតិថិជន ដែលកំណត់អំពីកម្រិតគុណភាពសេវាកម្ម (ដូចជាល្បឿន និងស្ថេរភាព)។ នៅក្នុងបរិបទនេះ វាសំដៅលើការធានាថាម៉ាស៊ីននិម្មិតនឹងទទួលបានធនធាន CPU គ្រប់គ្រាន់។ ដូចជាការធានារបស់អ្នកដឹកជញ្ជូនភីហ្សាថា «បើដឹកយឺតជាង ៣០នាទី នឹងមិនគិតលុយ»។
Markov Chain គំរូគណិតវិទ្យាដែលប្រើសម្រាប់ទស្សន៍ទាយស្ថានភាពនាពេលអនាគត ដោយផ្អែកលើស្ថានភាពបច្ចុប្បន្នសុទ្ធសាធ (មិនខ្វល់ពីអតីតកាល)។ នៅក្នុងការសិក្សានេះ វាត្រូវបានប្រើដើម្បីសម្រេចចិត្តថាពេលណាគួរបន្លាស់ទី VM ចេញនៅពេលម៉ាស៊ីនមេធ្វើការធ្ងន់ពេក។ ដូចជាការលេងហ្គេមបutes ដែលជំហានបន្ទាប់របស់អ្នកអាស្រ័យតែលើកន្លែងដែលអ្នកកំពុងឈរ មិនមែនកន្លែងដែលអ្នកបានដើរកាត់ពីមុននោះទេ។
Local Regression វិធីសាស្ត្រស្ថិតិដែលប្រើប្រាស់ទិន្នន័យថ្មីៗចុងក្រោយ ដើម្បីគូសខ្សែក្រាហ្វព្យាករណ៍អំពីទិសដៅនៃការប្រើប្រាស់ធនធាន (CPU Usage) នាពេលអនាគតក្នុងរយៈពេលខ្លី។ ដូចជាការប៉ាន់ស្មានថាតើភ្លៀងនឹងធ្លាក់ឬអត់ក្នុងរយៈពេល ១០នាទីទៀត ដោយមើលតែលើពពកខ្មៅដែលកំពុងរសាត់មកជិត។
Infrastructure as a Service (IaaS) សេវាកម្មកុំព្យូទ័រលើពពកដែលផ្តល់នូវហេដ្ឋារចនាសម្ព័ន្ធមូលដ្ឋាន (ដូចជា ម៉ាស៊ីនមេ កន្លែងផ្ទុកទិន្នន័យ និងបណ្តាញ) ដល់អ្នកប្រើប្រាស់ ដើម្បីឱ្យពួកគេអាចដំឡើងកម្មវិធី និងប្រព័ន្ធប្រតិបត្តិការដោយខ្លួនឯងបាន។ ដូចជាការជួលដីទទេដើម្បីសង់ផ្ទះដោយខ្លួនឯង ជាជាងការជួលបន្ទប់សណ្ឋាគារដែលគេរៀបចំឱ្យស្រាប់។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖