Original Title: Brief Introduction to Modern Processing Devices
Source: doi.org/10.17605/OSF.IO/A4FPN
Document Type: Textbook / Educational Material
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original material for complete content.

សេចក្តីណែនាំសង្ខេបអំពីឧបករណ៍ដំណើរការទិន្នន័យទំនើប

ចំណងជើងដើម៖ Brief Introduction to Modern Processing Devices

អ្នកនិពន្ធ៖ Manuel José Fernández Iglesias (atlanTTic - Universidade de Vigo)

ឆ្នាំបោះពុម្ព៖ 2025

វិស័យសិក្សា៖ Computer Architecture

១. សេចក្តីសង្ខេប (Overview)

ប្រធានបទ (Topic)៖ ឯកសារនេះមានគោលបំណងពន្យល់ពីភាពចម្រុះនៃឧបករណ៍ដំណើរការទិន្នន័យក្នុងប្រព័ន្ធកុំព្យូទ័រទំនើប ដែលបច្ចុប្បន្នទាមទារឱ្យមានការប្រើប្រាស់ឧបករណ៍ឯកទេសចម្រុះ (Heterogeneous computing) សម្រាប់ដោះស្រាយកិច្ចការស្មុគស្មាញផ្សេងៗគ្នា។

រចនាសម្ព័ន្ធ (Structure)៖ ឯកសារនេះប្រើប្រាស់វិធីសាស្ត្រពិពណ៌នាបែបប្រៀបធៀប (Comparative descriptive approach) ដើម្បីពន្យល់ពីស្ថាបត្យកម្ម មុខងារ និងការប្រើប្រាស់នៃឧបករណ៍ដំណើរការនីមួយៗ ដោយភ្ជាប់ជាមួយឧទាហរណ៍ជាក់ស្តែង។

ចំណុចសំខាន់ៗ (Key Takeaways)៖

២. គោលបំណងសិក្សា (Learning Objectives)

បន្ទាប់ពីអានឯកសារនេះ អ្នកគួរអាច៖

  1. យល់ដឹងពីស្ថាបត្យកម្មនិងមុខងាររបស់ឧបករណ៍ដំណើរការទិន្នន័យទូទៅដូចជា CPU និងឧបករណ៍ឯកទេសរួមមាន GPU, TPU, និង FPGA (Understand architectures of general and specialized processors)។
  2. វិភាគពីតុល្យភាពរវាងដំណើរការការងារ (Performance) ប្រសិទ្ធភាពថាមពល (Power efficiency) និងភាពងាយស្រួលក្នុងការសរសេរកម្មវិធី (Programmability) របស់ឧបករណ៍នីមួយៗ។
  3. មានសមត្ថភាពក្នុងការជ្រើសរើសប្រភេទឧបករណ៍ដំណើរការដែលស័ក្តិសមបំផុតសម្រាប់ដោះស្រាយបញ្ហាជាក់លាក់ណាមួយ (ឧទាហរណ៍៖ AI, IoT, ការបំប្លែងសញ្ញាទូរគមនាគមន៍)។

ជំពូកនេះផ្តល់នូវការណែនាំជាមូលដ្ឋានអំពីប្រភេទផ្សេងៗនៃឧបករណ៍ដំណើរការទិន្នន័យ (Processing Devices) ដែលត្រូវបានប្រើប្រាស់យ៉ាងទូលំទូលាយក្នុងប្រព័ន្ធកុំព្យូទ័រទំនើប។ វារៀបរាប់ពីមុខងារ ស្ថាបត្យកម្ម និងការអនុវត្តជាក់ស្តែងនៃឧបករណ៍នីមួយៗ ចាប់ពី CPU ស្តង់ដារ រហូតដល់ឧបករណ៍ពន្លឿនឯកទេស (Specialized Accelerators) ដើម្បីជួយនិស្សិតយល់ពីទស្សនាទាននៃការគណនាចម្រុះ (Heterogeneous computing)។

៣. គោលគំនិតសំខាន់ៗ (Key Concepts)

គោលគំនិត (Concept) ការពន្យល់ (Explanation) ឧទាហរណ៍ (Example)
Central Processing Unit (CPU) & Instruction Set Architecture (ISA)
អង្គដំណើរការកណ្តាល (CPU) និងស្ថាបត្យកម្មសំណុំបញ្ជា (ISA)
CPU គឺជាខួរក្បាលស្នូលទូទៅរបស់កុំព្យូទ័រដែលដំណើរការប្រព័ន្ធប្រតិបត្តិការ និងកិច្ចការតាមលំដាប់លំដោយយ៉ាងស្មុគស្មាញ។ ISA កំណត់នូវសំណុំបញ្ជាដែលអ្នកសរសេរកម្មវិធីអាចប្រើដើម្បីបញ្ជា CPU ឱ្យធ្វើការគណនា ផ្លាស់ទីទិន្នន័យ និងគ្រប់គ្រងលំហូរនៃកម្មវិធី។ ការប្រើប្រាស់ CPU (ដូចជា Intel Core ឬ ARM) ដើម្បីដំណើរការប្រព័ន្ធប្រតិបត្តិការ Windows ព្រមទាំងកម្មវិធីទូទៅជាច្រើននៅលើកុំព្យូទ័រយួរដៃរបស់អ្នក។
Graphics Processing Unit (GPU) & Parallel Computing
អង្គគណនាក្រាហ្វិក (GPU) និងការគណនាស្របគ្នា
GPU ត្រូវបានរចនាឡើងជាមួយនឹងអង្គគណនាតូចៗរាប់ពាន់ដែលធ្វើការស្របគ្នា ដើម្បីដោះស្រាយកិច្ចការដែលមានទិន្នន័យច្រើនសន្ធឹកសន្ធាប់ក្នុងពេលតែមួយ។ វាមានប្រសិទ្ធភាពខ្ពស់សម្រាប់ការគូររូបភាព និងការគណនាបែបវិទ្យាសាស្ត្រធំៗ។ ការប្រើប្រាស់បច្ចេកវិទ្យា CUDA លើ NVIDIA GPU ដើម្បីពន្លឿនការហ្វឹកហាត់ម៉ូដែល Machine Learning ឬការលេងហ្គេមដែលមានក្រាហ្វិកកម្រិតខ្ពស់។
System on Chip (SoC) & Microcontroller Unit (MCU)
ប្រព័ន្ធនៅលើបន្ទះឈីប (SoC) និងអង្គបញ្ជាខ្នាតតូច (MCU)
SoC រួមបញ្ចូលសមាសភាគជាច្រើន (CPU, GPU, Memory) ទៅក្នុងបន្ទះឈីបតែមួយដើម្បីសន្សំសំចៃថាមពលនិងទំហំ ចំណែកឯ MCU គឺជាកុំព្យូទ័រខ្នាតតូចដែលប្រើប្រាស់ថាមពលទាបបំផុតសម្រាប់គ្រប់គ្រងឧបករណ៍អេឡិចត្រូនិចជាក់លាក់។ ការប្រើប្រាស់បន្ទះឈីប Snapdragon (SoC) ក្នុងទូរស័ព្ទដៃស្មាតហ្វូនដើម្បីបំពេញការងារចម្រុះ និងការប្រើប្រាស់ ESP32 (MCU) ក្នុងប្រព័ន្ធស្រោចស្រពដំណាំស្វ័យប្រវត្តិ។
AI Accelerators (TPU, NPU, IPU)
ឧបករណ៍ពន្លឿនបញ្ញាសិប្បនិម្មិត (TPU, NPU, IPU)
ឧបករណ៍ទាំងនេះត្រូវបានបង្កើតឡើងយ៉ាងពិសេសដើម្បីដោះស្រាយការគណនាគណិតវិទ្យាស្មុគស្មាញ (ដូចជា Matrix/Tensor) សម្រាប់ដំណើរការបញ្ញាសិប្បនិម្មិត (AI) និង Deep Learning ប្រកបដោយប្រសិទ្ធភាពខ្ពស់ និងស៊ីថាមពលតិចជាងការប្រើ CPU ឬ GPU ។ ការប្រើប្រាស់ NPU (Neural Processing Unit) នៅក្នុងទូរស័ព្ទដៃទំនើប ដើម្បីចាប់សញ្ញាផ្ទៃមុខអ្នកប្រើប្រាស់ (Face Recognition) បានលឿននិងមិនសូវស៊ីថ្ម។
Custom-designed Processors (FPGA & ASIC)
ឧបករណ៍ដំណើរការរចនាតាមតម្រូវការ (FPGA និង ASIC)
FPGA អនុញ្ញាតឱ្យវិស្វករផ្លាស់ប្តូរការកំណត់រចនាសម្ព័ន្ធ Hardware បន្ទាប់ពីផលិតរួច ចំណែកឯ ASIC ត្រូវបានរចនាឡើងយ៉ាងជាក់លាក់សម្រាប់តែកិច្ចការតែមួយប៉ុណ្ណោះ ដែលផ្តល់នូវល្បឿនលឿនបំផុតនិងស៊ីថាមពលតិចបំផុត ប៉ុន្តែមិនអាចកែប្រែបានទេ។ ការប្រើប្រាស់ ASIC សម្រាប់បង្កើតម៉ាស៊ីនជីកយករូបិយប័ណ្ណឌីជីថល (Bitcoin Mining) ឬការប្រើប្រាស់ FPGA សម្រាប់ប្រព័ន្ធទូរគមនាគមន៍ដែលត្រូវការផ្លាស់ប្តូរស្តង់ដារញឹកញាប់។

៤. ភាពពាក់ព័ន្ធសម្រាប់កម្ពុជា (Cambodia Relevance)

ការយល់ដឹងអំពីឧបករណ៍ដំណើរការទិន្នន័យទំនើបមានសារៈសំខាន់ណាស់សម្រាប់ប្រទេសកម្ពុជា ស្របពេលដែលប្រទេសកំពុងជំរុញការអភិវឌ្ឍសេដ្ឋកិច្ចឌីជីថល និងបច្ចេកវិទ្យាឧស្សាហកម្មជំនាន់ទី៤ (Industry 4.0)។

ការអនុវត្ត (Applications)៖

ចំណេះដឹងផ្នែក Hardware នេះនឹងជួយឱ្យនិស្សិតវិស្វកម្មកម្ពុជាមានសមត្ថភាពក្នុងការជ្រើសរើស និងរចនាប្រព័ន្ធដែលមានប្រសិទ្ធភាពខ្ពស់ ឆ្លើយតបយ៉ាងត្រឹមត្រូវទៅនឹងតម្រូវការទីផ្សារការងារក្នុងស្រុកនិងអន្តរជាតិ។

៥. មគ្គុទ្ទេសក៍សិក្សា (Study Guide)

លំហាត់ និងសកម្មភាពសិក្សាដើម្បីពង្រឹងការយល់ដឹង៖

  1. ការវិភាគលើការបកប្រែភាសាកូដទៅជាសេចក្តីបង្គាប់ (Assembly Code Analysis): សរសេរកូដភាសា C សាមញ្ញមួយ រួចប្រើប្រាស់កម្មវិធី gcc និង objdump ក្នុង Terminal ដើម្បីពិនិត្យមើលកូដ Assembly ដែលត្រូវបានបង្កើត។ សកម្មភាពនេះជួយឱ្យអ្នកយល់ពីវដ្តនៃការទាញយក-បកប្រែ-ប្រតិបត្តិ (fetch-decode-execute cycle) របស់ CPU។
  2. ការសរសេរកម្មវិធីគណនាស្របគ្នាដោយប្រើ GPU (GPU Parallel Programming): សរសេរកូដសាមញ្ញមួយ (ឧទាហរណ៍៖ ការបូកវ៉ិចទ័រ ឬគុណម៉ាទ្រីស) ដោយប្រើប្រាស់បណ្ណាល័យ CUDA របស់ NVIDIA ឬ OpenCL។ ធ្វើការប្រៀបធៀបល្បឿននៃដំណើរការកូដនេះនៅលើ GPU ធៀបនឹងការដំណើរការនៅលើ CPU ធម្មតា។
  3. ការធ្វើតេស្តបញ្ញាសិប្បនិម្មិតលើ NPU (AI Inference on NPU): ប្រើប្រាស់ Android Neural Networks API (NNAPI) ដើម្បីដំណើរការម៉ូដែល AI ស្គាល់រូបភាពសាមញ្ញមួយនៅលើទូរស័ព្ទដៃស្មាតហ្វូនរបស់អ្នក។ វាស់ស្ទង់រយៈពេលដែលវាដំណើរការ (Inference latency) និងប្រៀបធៀបវាជាមួយការប្រើប្រាស់ត្រឹមតែ CPU សុទ្ធ។
  4. ការសាកល្បងដំណើរការ DSP (DSP Signal Processing): អនុវត្តការសរសេរកូដសម្រាប់តម្រងសញ្ញា (FIR filter) តាមរយៈការប្រើប្រាស់កម្មវិធី GNU Radio ដើម្បីមើលរលកសញ្ញាចូល និងចេញ (Input/Output Waveforms) ដែលជួយឱ្យយល់ពីគោលការណ៍កាត់បន្ថយភាពយឺតយ៉ាវនៃទិន្នន័យ (Low-latency) នៅក្នុង DSP។
  5. ការប្រើប្រាស់កម្មវិធីក្លែងធ្វើ (CPU Simulators): ចូលទៅកាន់គេហទំព័រ CPUlator (cpulator.01xz.net) ដើម្បីសរសេរ និងសាកល្បងកូដ Assembly ខ្លីៗដោយផ្ទាល់នៅលើ Browser ដោយសង្កេតមើលការផ្លាស់ប្តូរទិន្នន័យនៅក្នុង Registers និង Memory របស់ CPU ក្នុងពេលជាក់ស្តែង។

៦. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស (English) ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Instruction-Set Architecture (ISA) ជាកិច្ចសន្យារវាង Hardware និង Software ដែលកំណត់នូវទម្រង់បញ្ជា ប្រភេទការគណនា និងរបៀបដែលខួរក្បាលកុំព្យូទ័រ (CPU) ត្រូវធ្វើការ។ វាអនុញ្ញាតឱ្យអ្នកសរសេរកម្មវិធីដឹងពីរបៀបបញ្ជា CPU ឱ្យបានត្រឹមត្រូវដោយមិនចាំបាច់ដឹងពីការរចនាស៊ីជម្រៅរបស់សៀគ្វីអគ្គិសនី។ ដូចជាសៀវភៅបញ្ជីមុខម្ហូបនៅក្នុងភោជនីយដ្ឋានអញ្ចឹង — វាប្រាប់អ្នក (Software) ថាតើចុងភៅ (Hardware) អាចធ្វើម្ហូបអ្វីបានខ្លះ និងត្រូវកុម្ម៉ង់ដោយរបៀបណា។
System on Chip (SoC) ជាបច្ចេកវិទ្យាដែលរួមបញ្ចូលសមាសភាគសំខាន់ៗទាំងអស់របស់កុំព្យូទ័រ ដូចជា CPU, GPU, អង្គចងចាំ និងឧបករណ៍ភ្ជាប់ផ្សេងៗ ទៅលើបន្ទះឈីបតែមួយ។ ការធ្វើបែបនេះជួយសន្សំសំចៃទំហំ បង្កើនល្បឿនបញ្ជូនទិន្នន័យ និងកាត់បន្ថយការប្រើប្រាស់ថាមពល ដែលពេញនិយមខ្លាំងក្នុងទូរស័ព្ទដៃស្មាតហ្វូន។ ដូចជាប្រអប់បាយសិស្សសាលា (Bento box) ដែលមានបាយ ម្ហូប បន្លែ និងបង្អែមរៀបចំរួចជាស្រេចក្នុងប្រអប់តែមួយ ដែលងាយស្រួលយួរតាមខ្លួន។
Graphics Processing Unit (GPU) ជាអង្គដំណើរការដែលមានស្នូលតូចៗរាប់ពាន់ សម្រាប់ធ្វើការងារស្របគ្នាក្នុងពេលតែមួយ (Parallel computing) លើទិន្នន័យច្រើនសន្ធឹកសន្ធាប់។ ទោះបីបង្កើតដំបូងសម្រាប់គូររូបភាពក្រាហ្វិក តែកច្ចុប្បន្នវាជាកម្លាំងស្នូលក្នុងការហ្វឹកហាត់ម៉ូដែលបញ្ញាសិប្បនិម្មិត (AI)។ ដូចជាកម្មកររោងចក្រកាត់ដេររាប់ពាន់នាក់ដែលដេរអាវម៉ូតតែមួយក្នុងពេលព្រមគ្នា (GPU) ប្រៀបធៀបនឹងជាងកាត់ដេរចំណានម្នាក់ដែលកាត់ខោអាវគ្រប់ម៉ូតតែធ្វើម្នាក់ឯង (CPU)។
Microcontroller Unit (MCU) ជាប្រព័ន្ធកុំព្យូទ័រខ្នាតតូចបំផុត និងស៊ីភ្លើងតិចបំផុតដែលដាក់លើបន្ទះឈីបមួយ សម្រាប់ប្រើប្រាស់ក្នុងឧបករណ៍អេឡិចត្រូនិកដើម្បីគ្រប់គ្រងកិច្ចការងាររចនាម៉ូដជាក់លាក់ និងពេលវេលាពិត (Real-time control) ដូចជាប្រព័ន្ធបញ្ជាក្នុងម៉ាស៊ីនបោកគក់ ឬឧបករណ៍ IoT។ ដូចជាខួរក្បាលតូចមួយដែលគេបង្កប់ក្នុងម៉ាស៊ីនត្រជាក់ ដើម្បីចាំតែបញ្ជាបិទនិងបើកតាមសីតុណ្ហភាព ដោយមិនខ្វល់ពីការងារស្មុគស្មាញផ្សេងទៀតទេ។
Field-Programmable Gate Array (FPGA) ជាបន្ទះសៀគ្វី Hardware ដែលវិស្វករអាចសរសេរកម្មវិធីដើម្បីផ្លាស់ប្តូររចនាសម្ព័ន្ធខាងក្នុងរបស់វាសាជាថ្មី បន្ទាប់ពីវាត្រូវបានផលិតចេញពីរោងចក្ររួច។ វាផ្តល់ភាពបត់បែនខ្ពស់សម្រាប់ការសាកល្បងបច្ចេកវិទ្យាថ្មីៗ មុននឹងសម្រេចចិត្តផលិតជា ASIC។ ដូចជាដុំឡេហ្គោ (Lego) ដែលអ្នកអាចដោះចេញ និងតម្លើងជារូបរាងថ្មីៗ (ឡាន យន្តហោះ ផ្ទះ) បានគ្រប់ពេលតាមតម្រូវការរបស់អ្នក។
Application-Specific Integrated Circuit (ASIC) ជាបន្ទះឈីបដែលត្រូវបានរចនាឡើងយ៉ាងជាក់លាក់បំផុតដើម្បីធ្វើការងារតែមួយមុខគត់ មិនអាចកែប្រែកម្មវិធីវាបានទេបន្ទាប់ពីផលិតរួច។ តែវាមានល្បឿនលឿនបំផុត និងមានប្រសិទ្ធភាពខ្ពស់ក្នុងការសន្សំសំចៃថាមពលជាងគេ (ឧទាហរណ៍៖ ឈីបសម្រាប់ជីក Bitcoin)។ ដូចជាពុម្ពចាក់នំអាកោ — វាអាចធ្វើបានតែនំអាកោប៉ុណ្ណោះ (មិនអាចប្តូរទៅធ្វើនំផ្សេងបានទេ) ប៉ុន្តែវាអាចធ្វើនំនេះបានលឿន និងល្អឥតខ្ចោះ។
Tensor Processing Unit (TPU) ជាឧបករណ៍ពន្លឿនឯកទេស (Accelerator) ដែលត្រូវបានរចនាឡើងជាពិសេសសម្រាប់ការគណនាគណិតវិទ្យាប្រភេទម៉ាទ្រីស (Matrix) ធំៗ ដើម្បីជួយឱ្យការរៀនស៊ីជម្រៅ (Deep Learning) របស់បញ្ញាសិប្បនិម្មិតដំណើរការបានលឿននិងមានប្រសិទ្ធភាពខ្ពស់។ ដូចជាម៉ាស៊ីនគិតលេខពិសេសមួយដែលបង្កើតឡើងសម្រាប់តែគណនារូបមន្តបញ្ញាសិប្បនិម្មិតដ៏ស្មុគស្មាញដោយមិនចាំបាច់គិតពីការងារទូទៅផ្សេង។
Single-Instruction Multiple-Thread (SIMT) ជាទម្រង់នៃការគណនារបស់ GPU ដែលក្នុងនោះ ការណែនាំ (Instruction) តែមួយត្រូវបានបញ្ជូនទៅកាន់ខ្សែដំណើរការ (Threads) ជាច្រើនដើម្បីអនុវត្តលើទិន្នន័យផ្សេងៗគ្នាក្នុងពេលតែមួយ ដែលជួយសន្សំសំចៃពេលវេលាយ៉ាងច្រើន។ ដូចជាគ្រូបង្រៀនម្នាក់ស្រែកប្រាប់សិស្ស៣០នាក់ឱ្យ "បើកសៀវភៅទំព័រទី១០" ហើយសិស្សទាំងអស់ធ្វើសកម្មភាពនោះព្រមគ្នាក្នុងពេលតែមួយ។

៧. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖