បញ្ហា (The Problem)៖ និក្ខេបបទនេះដោះស្រាយបញ្ហានៃការបែងចែក និងរក្សាទុកទិន្នន័យប្រកបដោយប្រសិទ្ធភាព សមធម៌ និងធន់នឹងកំហុស (fault-tolerant) នៅក្នុងបណ្តាញផ្ទុកទិន្នន័យចម្រុះ (heterogeneous storage networks) ដែលតែងតែមានការប្រែប្រួល។
វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះប្រើប្រាស់វិធីសាស្រ្តនៃក្បួនដោះស្រាយដោយចៃដន្យ (randomized algorithms) និងទ្រឹស្តីកូដដើម្បីបង្កើតយុទ្ធសាស្រ្តបែងចែកទិន្នន័យថ្មីៗ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| SPREAD Strategy យុទ្ធសាស្រ្តបែងចែកទិន្នន័យបែបចៃដន្យបន្ស៊ាំសម្រាប់ប្រព័ន្ធចម្រុះ (Adaptive Randomized Allocation) |
អាចសម្របខ្លួនទៅនឹងការផ្លាស់ប្តូរនៃបណ្តាញផ្ទុកទិន្នន័យ (បន្ថែម/ដកថាស) ដោយមិនចាំបាច់រៀបចំទិន្នន័យឡើងវិញច្រើន។ ធានាបាននូវសមធម៌ និងមានភាពធន់នឹងកំហុសខ្ពស់។ | មានភាពស្មុគស្មាញក្នុងការអនុវត្តជាងប្រព័ន្ធ Hashing ធម្មតា ដោយសារត្រូវគ្រប់គ្រងរចនាសម្ព័ន្ធតារាងបែងចែក (Allocation tables) យ៉ាងលម្អិត។ | សម្រេចបាននូវភាពបន្ស៊ាំកម្រិត 8(1+γ)-adaptive សម្រាប់ការផ្លាស់ប្តូរសមត្ថភាពផ្ទុក ដោយរក្សាបានល្បឿនស្វែងរក O(1)។ |
| COMB Strategy យុទ្ធសាស្រ្តបែងចែកទិន្នន័យសម្រាប់ប្រព័ន្ធថេរ (Static Randomized Allocation) |
ងាយស្រួលក្នុងការគណនា និងផ្តល់នូវការបែងចែកទិន្នន័យប្រកបដោយសមធម៌និងធន់នឹងកំហុសសម្រាប់ថាសដែលមានចំណុះខុសៗគ្នា។ | មិនមានភាពបន្ស៊ាំ (Not adaptive) មានន័យថាប្រសិនបើមានថាសថ្មីបន្ថែមចូល ប្រព័ន្ធតម្រូវឱ្យមានការរៀបចំទិន្នន័យទាំងអស់ឡើងវិញ។ | គម្លាតផ្ទុកអតិបរមាពីតម្លៃរំពឹងទុកគឺស្ថិតក្នុងកម្រិត O(√(c_i·k·r·log n)) សម្រាប់ថាសនីមួយៗ។ |
| Read-Write Codes (RWC) កូដអាន-សរសេរសម្រាប់កាត់បន្ថយការពិន័យពេលសរសេរពង្រីក (Erasure Codes) |
កាត់បន្ថយការពិន័យលើការសរសេរ (write-penalty) បានយ៉ាងល្អ ដោយអនុញ្ញាតឱ្យធ្វើបច្ចុប្បន្នភាពទិន្នន័យថ្មីដោយប្រើប្រាស់និមិត្តសញ្ញាកូដតិចតួចប៉ុណ្ណោះ។ | ទាមទារទំហំអក្ខរក្រមនិមិត្តសញ្ញា (Symbol alphabets) ធំជាងកូដលុបស្តង់ដារបន្តិចសម្រាប់កូដល្អឥតខ្ចោះ និងត្រូវការការគណនាគណិតវិទ្យាលើ Finite Fields។ | អាចឌិកូដព័ត៌មានពីការអាននិមិត្តសញ្ញាចំនួន r ណាមួយ និងសរសេរទិន្នន័យថ្មីដោយកែប្រែត្រឹមតែនិមិត្តសញ្ញាចំនួន w ណាមួយ (ដែល w < n)។ |
| Standard Erasure Codes (RAID / Reed-Solomon) កូដលុបស្តង់ដារ និងប្រព័ន្ធ RAID |
មានប្រសិទ្ធភាពផ្ទុកខ្ពស់បំផុត និងមានប្រជាប្រិយភាពខ្លាំងក្នុងការប្រើប្រាស់ជាក់ស្តែងដោយសារការគណនា XOR ងាយស្រួល (សម្រាប់ RAID)។ | រងផលប៉ះពាល់យ៉ាងខ្លាំងពីការពិន័យការសរសេរ (write-penalty) ព្រោះរាល់ការកែប្រែទិន្នន័យតូចមួយតម្រូវឱ្យមានការធ្វើបច្ចុប្បន្នភាពកូដអម (parity) ទាំងអស់។ | ប្រើប្រាស់ទំហំផ្ទុកបន្ថែមតិចតួច (Ratio k/n) តែការធ្វើបច្ចុប្បន្នភាពតម្រូវឱ្យកែប្រែនិមិត្តសញ្ញាទាំង n។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តយុទ្ធសាស្រ្តទាំងនេះទាមទារសមត្ថភាពគណនា និងរចនាសម្ព័ន្ធគ្រប់គ្រងអង្គចងចាំជាក់លាក់នៅក្នុងប្រព័ន្ធផ្ទុកទិន្នន័យកម្រិតខ្ពស់។
ការសិក្សានេះផ្អែកលើការវិភាគទ្រឹស្តីគណិតវិទ្យាសុទ្ធសាធ (Theoretical Computer Science) ដោយមិនប្រើប្រាស់ទិន្នន័យប្រជាសាស្ត្រ ឬភូមិសាស្ត្រជាក់លាក់ណាមួយឡើយ។ សម្រាប់ប្រទេសកម្ពុជា ទ្រឹស្តីនៃក្បួនដោះស្រាយនេះអាចអនុវត្តបានដោយផ្ទាល់ដោយមិនរងឥទ្ធិពលពីភាពលំអៀងឡើយ ដែលវាស័ក្តិសមឥតខ្ចោះសម្រាប់រចនាសម្ព័ន្ធមជ្ឈមណ្ឌលទិន្នន័យទូទៅ។
វិធីសាស្រ្តកម្រិតខ្ពស់នៅក្នុងឯកសារនេះមានអត្ថប្រយោជន៍យ៉ាងធំធេងសម្រាប់ការអភិវឌ្ឍហេដ្ឋារចនាសម្ព័ន្ធទិន្នន័យខ្នាតធំនៅក្នុងប្រទេសកម្ពុជា។
ការរួមបញ្ចូលនូវយុទ្ធសាស្រ្តទាំងនេះនឹងជួយឱ្យស្ថាប័នកម្ពុជាសន្សំសំចៃការចំណាយមូលធន (TCO) ដោយអាចប្រើប្រាស់ថាសទិន្នន័យគ្រប់ទំហំបញ្ចូលគ្នា និងបង្កើនស្ថិរភាពប្រព័ន្ធ។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Storage Area Network (SAN) | បណ្តាញកុំព្យូទ័រល្បឿនលឿនដែលតភ្ជាប់ម៉ាស៊ីនមេ (Servers) ជាច្រើនទៅកាន់ឧបករណ៍ផ្ទុកទិន្នន័យ (Storage Devices) ដាច់ដោយឡែក ធ្វើឱ្យកុំព្យូទ័រទាំងអស់អាចប្រើប្រាស់ឧបករណ៍ផ្ទុកទាំងនោះរួមគ្នាបានយ៉ាងមានប្រសិទ្ធភាព។ | ប្រៀបដូចជាប្រព័ន្ធផ្លូវល្បឿនលឿនមួយដែលភ្ជាប់រោងចក្រជាច្រើនទៅកាន់ឃ្លាំងស្តុកទំនិញរួមមួយ ដើម្បីងាយស្រួលនិងពន្លឿនការដឹកជញ្ជូន។ |
| Erasure Codes | វិធីសាស្រ្តការពារការបាត់បង់ទិន្នន័យដោយបំបែកទិន្នន័យជាចំណែកតូចៗ រួចបញ្ចូលគណិតវិទ្យាដើម្បីបង្កើតចំណែកទិន្នន័យបន្ថែម (Parity/Redundancy) និងរក្សាទុកវានៅលើថាសផ្សេងៗគ្នា។ ទោះបីជាថាសខ្លះខូច ក៏ទិន្នន័យដើមនៅតែអាចចងក្រងមកវិញបាន។ | ដូចជាការសរសេរសំបុត្រមួយហើយកាត់ជាបំណែកៗ រួចថតចម្លងបំណែកខ្លះទុក បើទោះជាបាត់បំណែកមួយចំនួនក៏នៅតែអាចយកបំណែកដែលសល់មកផ្គុំអានបានន័យពេញលេញដដែល។ |
| Balls-into-Bins Model | គំរូគណិតវិទ្យានៃទ្រឹស្តីប្រូបាប៊ីលីតេដែលប្រើសម្រាប់ការបែងចែកកិច្ចការឬទិន្នន័យ (បាល់) ទៅក្នុងកន្លែងទទួលឬថាសផ្ទុក (ធុង) ដោយចៃដន្យ ដើម្បីសិក្សាពីរបៀបបែងចែកឲ្យមានតុល្យភាពនិងការពារកុំឲ្យមានការផ្ទុកលើសទម្ងន់។ | ប្រៀបដូចជាការបិទភ្នែកហើយបោះគ្រាប់ឃ្លីចូលទៅក្នុងកែវជាច្រើន ដើម្បីមើលថាតើកែវណាមួយនឹងផ្ទុកគ្រាប់ឃ្លីច្រើនជាងគេ។ |
| Consistent Hashing | បច្ចេកទេសបែងចែកទិន្នន័យនៅក្នុងប្រព័ន្ធកុំព្យូទ័រចែកចាយ ដែលជួយកាត់បន្ថយការរៀបចំទិន្នន័យឡើងវិញយ៉ាងច្រើនសន្ធឹកសន្ធាប់ នៅពេលដែលយើងបន្ថែមម៉ាស៊ីនថ្មី ឬដកម៉ាស៊ីនចាស់ចេញពីប្រព័ន្ធ។ | ដូចជាការបែងចែកកន្លែងអង្គុយដល់សិស្សក្នុងថ្នាក់ បើមានសិស្សថ្មីចូលមក យើងគ្រាន់តែប្តូរកន្លែងអង្គុយសិស្សតិចតួចបំផុត ជាជាងការរៀបចំកន្លែងអង្គុយរបស់សិស្សគ្រប់គ្នាឡើងវិញទាំងអស់។ |
| Read-Write Codes (RWC) | ប្រព័ន្ធកូដប្រភេទថ្មីដែលបង្កើតឡើងដើម្បីដោះស្រាយបញ្ហាយឺតយ៉ាវពេលសរសេរទិន្នន័យ (Write-Penalty) ដោយអនុញ្ញាតឱ្យប្រព័ន្ធធ្វើបច្ចុប្បន្នភាពទិន្នន័យថ្មី តាមរយៈការកែប្រែនិមិត្តសញ្ញាកូដតែមួយចំនួនតូចប៉ុណ្ណោះ។ | ដូចជាការកែតម្រូវអក្ខរាវិរុទ្ធលើសៀវភៅមួយទំព័រ ដោយគ្រាន់តែលុបនិងសរសេរពាក្យខុសនោះឡើងវិញ ជាជាងការលុបសរសេរទំព័រនោះទាំងមូលឡើងវិញ។ |
| Write-Penalty | បន្ទុកការងារ ឬពេលវេលាបន្ថែមដែលប្រព័ន្ធត្រូវចំណាយនៅពេលសរសេរកែប្រែទិន្នន័យថ្មីម្តងៗ ព្រោះវាត្រូវទាញយកទិន្នន័យចាស់មកគណនា រួចទៅធ្វើបច្ចុប្បន្នភាពទិន្នន័យសុវត្ថិភាព (Parity) នៅលើថាសផ្សេងៗទៀតឲ្យស៊ីចង្វាក់គ្នា។ | ប្រៀបដូចជាអ្នកចង់ប្តូរលេខទូរស័ព្ទថ្មី អ្នកមិនត្រឹមតែត្រូវប្តូរស៊ីមកាតខ្លួនឯងទេ តែត្រូវដើរប្រាប់មិត្តភក្តិទាំងអស់ឱ្យលុបលេខចាស់របស់អ្នក ហើយកត់លេខថ្មីទុកដូចគ្នា។ |
| Load Balancing | ការបែងចែកទំហំទិន្នន័យ និងចំនួនប្រតិបត្តិការ (I/O requests) ឲ្យស្មើៗគ្នាទៅគ្រប់ម៉ាស៊ីនមេ ឬថាសផ្ទុកទិន្នន័យទាំងអស់ ដើម្បីបង្កើនល្បឿនប្រព័ន្ធ និងការពារកុំឲ្យឧបករណ៍ណាមួយធ្វើការធ្ងន់ជ្រុល។ | ប្រៀបដូចជាការចាត់ចែងភ្ញៀវដែលចូលមកភោជនីយដ្ឋានឲ្យអង្គុយតាមតុផ្សេងៗគ្នាស្មើៗគ្នា ដើម្បីឲ្យអ្នកបម្រើគ្រប់តុអាចបម្រើភ្ញៀវបានលឿន។ |
| Competitive Analysis | វិធីសាស្ត្រគណិតវិទ្យាសម្រាប់វាយតម្លៃប្រសិទ្ធភាពនៃក្បួនដោះស្រាយ (Algorithm) ដែលធ្វើការសម្រេចចិត្តភ្លាមៗ (Online) ដោយប្រៀបធៀបលទ្ធផលរបស់វាទៅនឹងក្បួនដោះស្រាយដ៏ល្អឥតខ្ចោះដែលដឹងពីទិន្នន័យទាំងអស់ជាមុន (Offline)។ | ដូចជាការប្រៀបធៀបការសម្រេចចិត្តរបស់អ្នកដែលត្រូវប្រឈមមុខដោះស្រាយបញ្ហាភ្លាមៗ ទៅនឹងអ្នកដែលបានដឹងមុនពីអ្វីដែលនឹងកើតឡើងនាពេលអនាគត។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖