Original Title: Intelligent Control of Building Vibrations: A Transformer-Based Deep Reinforcement Learning Framework
Source: doi.org/10.18280/jesa.570213
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការគ្រប់គ្រងប្រកបដោយភាពឆ្លាតវៃលើរំញ័រអគារ៖ ក្របខ័ណ្ឌការរៀនស៊ីជម្រៅផ្អែកលើរង្វាន់ដោយប្រើម៉ូដែល Transformer

ចំណងជើងដើម៖ Intelligent Control of Building Vibrations: A Transformer-Based Deep Reinforcement Learning Framework

អ្នកនិពន្ធ៖ Imad Z. Gheni (Mechanical Engineering Department, University of Technology-Iraq), Hussein M.H. Al-Khafaji, Hassan M. Alwan

ឆ្នាំបោះពុម្ព៖ 2024, Journal Européen des Systèmes Automatisés

វិស័យសិក្សា៖ Structural Engineering and Machine Learning

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហាប្រឈមក្នុងការកាត់បន្ថយរំញ័ររបស់អគារដែលបណ្តាលមកពីកត្តាខាងក្រៅ (ដូចជាខ្យល់ ឬរញ្ជួយដី) ព្រមទាំងស្វែងរកដំណោះស្រាយដើម្បីកាត់បន្ថយពេលវេលា និងទំហំនៃការគណនាខ្ពស់ (Computational Cost) របស់វិធីសាស្ត្រ Deep Reinforcement Learning (DRL)។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានស្នើឡើងនូវវិធីសាស្ត្រថ្មីមួយដោយរួមបញ្ចូលគ្នារវាងក្បួនដោះស្រាយ Deep Reinforcement Learning (DRL) និងម៉ូដែល Transformer ដើម្បីបង្កើនប្រសិទ្ធភាពប្រព័ន្ធគ្រប់គ្រងរំញ័រអគារដោយមិនចាំបាច់មានអន្តរកម្មផ្ទាល់ទិន្នន័យ។

ការប្រើប្រាស់ក្បួនដោះស្រាយ Proximal Policy Optimization (PPO) នៅក្នុងប្រព័ន្ធ DRL ដើម្បីរៀន និងបង្កើតសញ្ញាគ្រប់គ្រង (Control Signals)។
ការប្រើប្រាស់ម៉ូដែល Transformer ជាកម្មវិធីក្លែងធ្វើ (Emulator) សម្រាប់ព្យាករណ៍ពីការផ្លាស់ទីរបស់ជាន់អគារ (Floor displacement) ដោយផ្អែកលើទិន្នន័យជាស៊េរីពេល (Sequential Data)។
ការរួមបញ្ចូលម៉ូដែលនេះជាមួយនឹងប្រព័ន្ធបញ្ជាបែបបុរាណ Linear-Quadratic Regulator (LQR) ដើម្បីកែតម្រូវសញ្ញាបញ្ជាក្នុងពេលជាក់ស្តែង (Real-time)។
ការធ្វើតេស្តសាកល្បងជាក់ស្តែងលើគំរូអគារកម្ពស់ ៣ ជាន់ (3-story building model) ដោយប្រើប្រាស់តុតេស្តរំញ័រ (Shaking table) និង Active Mass Damper (AMD) ភ្ជាប់ជាមួយសេនស័រវាស់ល្បឿន និងគម្លាត។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ការរួមបញ្ចូលគ្នារវាងម៉ូដែល DRL និង Transformer បានជួយលុបបំបាត់តម្រូវការអន្តរកម្មផ្ទាល់ពេលកំពុងបណ្តុះបណ្តាល (Online interaction) ដែលជួយកាត់បន្ថយពេលវេលា និងទំហំនៃការគណនាយ៉ាងច្រើនសន្ធឹកសន្ធាប់។
ប្រព័ន្ធគ្រប់គ្រងថ្មីនេះអាចកាត់បន្ថយការរសាត់ និងការបង្កើនល្បឿនរំញ័រនៅតាមជាន់នីមួយៗបានយ៉ាងប្រសើរចន្លោះពី 50% ទៅ 70% បើធៀបទៅនឹងករណីដែលគ្មានការគ្រប់គ្រង (No-control case)។
លទ្ធផលជាក់ស្តែងបង្ហាញថា ក្របខ័ណ្ឌ Transformer-based DRL ដំណើរការបានល្អជាងប្រព័ន្ធគ្រប់គ្រង LQR បុរាណ ព្រមទាំងងាយស្រួលក្នុងការធ្វើសមាហរណកម្មជាមួយប្រព័ន្ធគ្រប់គ្រងអគារដែលមានស្រាប់។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Without Control (Baseline) អគារដែលគ្មានប្រព័ន្ធគ្រប់គ្រងរំញ័រ (Without Control)	មិនត្រូវការចំណាយលើការដំឡើងឧបករណ៍ផ្នែករឹង (Hardware) ឬប្រព័ន្ធបញ្ជាស្មុគស្មាញឡើយ។	រងផលប៉ះពាល់យ៉ាងខ្លាំងពីរំញ័រខាងក្រៅ ដែលអាចធ្វើឱ្យប៉ះពាល់ដល់រចនាសម្ព័ន្ធ និងសុវត្ថិភាពអគារ។	មានតម្លៃនៃការបង្កើនល្បឿន (RMS acceleration) និងការរសាត់ទី (RMS displacement) ខ្ពស់បំផុត។
Classical Linear-Quadratic Regulator (LQR) និយតករលីនេអ៊ែរ-កាដ្រាទិចបែបបុរាណ (Classical LQR)	ផ្តល់នូវគោលការណ៍គ្រប់គ្រងប្រកបដោយស្ថិរភាព និងជាវិធីសាស្ត្រមូលដ្ឋានដែលត្រូវបានទទួលស្គាល់យ៉ាងទូលំទូលាយ។	មានដែនកំណត់ក្នុងការបន្សាំខ្លួនទៅនឹងការផ្លាស់ប្តូរ និងរំញ័រដែលស្មុគស្មាញ (Non-linear disturbances)។	អាចកាត់បន្ថយរំញ័របានមួយកម្រិត ប៉ុន្តែប្រសិទ្ធភាពនៅទាបជាងវិធីសាស្ត្រ DRL ។
Transformer-Based DRL-LQR ការរួមបញ្ចូល DRL និង Transformer ជាមួយ LQR	លុបបំបាត់តម្រូវការអន្តរកម្មផ្ទាល់ជាមួយបរិស្ថាន (Online interaction) កាត់បន្ថយពេលវេលាបណ្តុះបណ្តាលយ៉ាងច្រើន និងអាចបន្សាំទៅនឹងរំញ័របានលឿនក្នុងពេលជាក់ស្តែង។	ទាមទារចំណេះដឹងខ្ពស់ក្នុងការរៀបចំក្របខ័ណ្ឌ Deep Learning និងទាមទារការធ្វើតេស្តបណ្តុះបណ្តាលក្រៅបណ្តាញ (Offline training) ជាមុន។	កាត់បន្ថយការបង្កើនល្បឿន (RMS acceleration) និងការរសាត់ជាន់ (Floor displacement) បានពី 50% ទៅ 70% ធៀបនឹងការមិនប្រើប្រព័ន្ធបញ្ជា។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តប្រព័ន្ធគ្រប់គ្រងរំញ័រឆ្លាតវៃនេះ ទាមទារការវិនិយោគទាំងលើផ្នែករឹង (Hardware) សម្រាប់ដំឡើងឧបករណ៍ និងផ្នែកទន់ (Software) សម្រាប់ដំណើរការក្បួនដោះស្រាយ និងក្លែងធ្វើ។

Hardware (Microcontroller & Actuators): ប្រើប្រាស់ Arduino Mega 2560 ដើម្បីបញ្ជាឧបករណ៍, ម៉ូទ័រ NEMA17 Stepper Motor, Driver TB6600, និង Active Mass Damper (AMD)។
Hardware (Sensors): ត្រូវការសេនស័រវាស់ល្បឿន (ADXL335 Accelerometers) ចំនួន៤ និងសេនស័រវាស់ចម្ងាយ (VL53L0X)។
Software (Simulation & Control): ប្រើប្រាស់ MATLAB/Simulink និង Simulink Real-Time សម្រាប់បញ្ជា LQR និងបណ្ណាល័យ tensorforce សម្រាប់ដំណើរការម៉ូដែល DRL ។
Dataset: ប្រើប្រាស់ទិន្នន័យត្រាប់តាមរញ្ជួយដី (EL Centro earthquake time history) សម្រាប់ធ្វើតេស្តលើ Shaking table ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងនៅក្នុងមន្ទីរពិសោធន៍នៃសាកលវិទ្យាល័យបច្ចេកវិទ្យា-អ៊ីរ៉ាក់ (University of Technology-Iraq) ដោយប្រើប្រាស់គំរូអគារតូចត្រឹមតែ ៣ ជាន់ និងទិន្នន័យរញ្ជួយដីក្លែងធ្វើ។ សម្រាប់ប្រទេសកម្ពុជា ទោះបីជាយើងមិនសូវរងគ្រោះពីរញ្ជួយដីធ្ងន់ធ្ងរ ប៉ុន្តែសំណង់អគារខ្ពស់ៗពិតប្រាកដ (Full-scale high-rise buildings) ទាមទារការសាកល្បងបន្ថែមទៅលើកម្លាំងខ្យល់បក់ខ្លាំង (Wind loads) ឬកម្លាំងរំញ័រពីសកម្មភាពសាងសង់ជុំវិញ ដើម្បីបញ្ជាក់ពីប្រសិទ្ធភាពពេញលេញ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់ក្នុងការយកមកអនុវត្តនៅក្នុងវិស័យសំណង់ និងអភិវឌ្ឍន៍អចលនទ្រព្យនៅកម្ពុជា ជាពិសេសសម្រាប់ការគ្រប់គ្រងសុវត្ថិភាពអគារខ្ពស់ៗ។

អគារខ្ពស់ៗនៅរាជធានីភ្នំពេញ (Phnom Penh High-rises): អាចប្រើប្រាស់ប្រព័ន្ធ Active Mass Damper (AMD) ជាមួយបច្ចេកវិទ្យា DRL ដើម្បីទប់ទល់នឹងរំញ័រដែលបណ្តាលមកពីខ្យល់បក់ខ្លាំងនារដូវវស្សា ជួយរក្សាស្ថិរភាពអគារកប់ពពក និងផាសុកភាពរបស់អ្នករស់នៅ។
វិស័យសំណង់នៅក្រុងព្រះសីហនុ (Sihanoukville Construction): សមស្របសម្រាប់អគារពាណិជ្ជកម្ម និងសណ្ឋាគារខ្ពស់ៗនៅក្បែរមាត់សមុទ្រ ដែលតែងតែរងឥទ្ធិពលពីខ្យល់ព្យុះសមុទ្រ ដោយប្រព័ន្ធនេះអាចជួយកាត់បន្ថយភាពរង្គោះរង្គើ និងពន្យារអាយុកាលសំណង់។
ការត្រួតពិនិត្យសុខភាពរចនាសម្ព័ន្ធ (Structural Health Monitoring): និស្សិតផ្នែកវិស្វកម្មសំណង់ស៊ីវិលនៅកម្ពុជាអាចយកគំនិតនៃការប្រើប្រាស់ម៉ូដែល Transformer និងសេនស័រ (IoT) ដើម្បីតាមដានសុខភាពស្ពាន ឬហេដ្ឋារចនាសម្ព័ន្ធសំខាន់ៗក្នុងប្រទេស។

សរុបមក ការចាប់យកបច្ចេកវិទ្យាបញ្ជារំញ័រឆ្លាតវៃ (Intelligent Vibration Control) នេះ នឹងជួយលើកកម្ពស់សុវត្ថិភាពស្តង់ដារសំណង់អគារខ្ពស់ៗនៅកម្ពុជាឱ្យកាន់តែមានភាពរឹងមាំ និងទំនើបកម្ម។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

ជំហានទី១៖ សិក្សាមូលដ្ឋានគ្រឹះនៃរចនាសម្ព័ន្ធ និងប្រព័ន្ធ LQR: និស្សិតត្រូវស្វែងយល់ពីទ្រឹស្តីរំញ័រ (Structural Dynamics) និងរបៀបរៀបចំប្រព័ន្ធបញ្ជា Linear-Quadratic Regulator (LQR) ដោយអនុវត្តការសរសេរកូដក្លែងធ្វើនៅក្នុង MATLAB និង Simulink។
ជំហានទី២៖ អនុវត្តក្បួនដោះស្រាយ Deep Reinforcement Learning: សិក្សាពីក្បួនដោះស្រាយ Proximal Policy Optimization (PPO) ព្រមទាំងការប្រើប្រាស់ម៉ូដែល Transformer សម្រាប់ការទស្សន៍ទាយទិន្នន័យជាស៊េរី (Time-series) ដោយប្រើប្រាស់ភាសា Python គួបផ្សំជាមួយបណ្ណាល័យ tensorforce ឬ PyTorch។
ជំហានទី៣៖ ធ្វើសមាហរណកម្ម DRL ជាមួយ LQR (Simulation Setup): បង្កើតបរិស្ថានក្លែងធ្វើដោយភ្ជាប់កូដ Python ជាមួយនឹងគំរូរចនាសម្ព័ន្ធនៅក្នុង MATLAB ដើម្បីឱ្យ Agent (DRL) អាចរៀនកែតម្រូវសញ្ញាបញ្ជារបស់ LQR តាមរយៈរង្វាន់ (Reward function) ដែលបានកំណត់។
ជំហានទី៤៖ រៀបចំឧបករណ៍ផ្នែករឹងកម្រិតតូច (Hardware Prototyping): សាងសង់គំរូអគារខ្នាតតូចក្នុងមន្ទីរពិសោធន៍ ដោយប្រើប្រាស់ Arduino Mega 2560 ភ្ជាប់ជាមួយ ADXL335 (សេនស័រវាស់ល្បឿន) និង NEMA17 Stepper Motor ដើរតួជា Active Mass Damper។
ជំហានទី៥៖ ធ្វើតេស្ត ទាញយកទិន្នន័យ និងវាយតម្លៃប្រសិទ្ធភាព: ដំណើរការ Simulink Real-Time ដើម្បីបញ្ជាម៉ូទ័រទប់រំញ័រក្នុងពេលជាក់ស្តែង ពេលដែលមានរំញ័រ (ប្រើ Shaking table) រួចប្រៀបធៀបតម្លៃកាត់បន្ថយការបង្កើនល្បឿន (RMS Acceleration) រវាងការប្រើ LQR ធម្មតា និងប្រព័ន្ធបញ្ជាថ្មី។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Deep Reinforcement Learning (DRL)	ជាទម្រង់នៃការរៀនរបស់ម៉ាស៊ីន (Machine Learning) ដែលភ្នាក់ងារបញ្ញាសិប្បនិម្មិត (AI Agent) រៀនធ្វើការសម្រេចចិត្តតាមរយៈការសាកល្បងខុស និងត្រូវនៅក្នុងបរិស្ថានណាមួយ ដោយទទួលបានរង្វាន់ (Reward) ពេលធ្វើត្រូវ និងការពិន័យ ពេលធ្វើខុស ដើម្បីស្វែងរកយុទ្ធសាស្ត្រគ្រប់គ្រងកម្លាំងរំញ័រដ៏ល្អបំផុតដោយស្វ័យប្រវត្តិ។	ដូចជាការបង្ហាត់សត្វឆ្កែឱ្យចេះចាប់បាល់ ដោយយើងផ្តល់ចំណីឱ្យវាពេលវាចាប់បាន និងមិនឱ្យចំណីពេលវាចាប់ខុស រហូតដល់វាដឹងពីរបៀបចាប់បាល់ឱ្យបានល្អបំផុត។
Transformer Model	ជាប្រភេទបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត (Neural Network) ដែលមានសមត្ថភាពខ្ពស់ក្នុងការវិភាគទិន្នន័យជាស៊េរី (Sequential data) ដោយប្រើប្រព័ន្ធចំណាប់អារម្មណ៍ (Self-attention) ដើម្បីចាប់យកទំនាក់ទំនងនៃទិន្នន័យដែលនៅឆ្ងាយពីគ្នាដោយមិនចាំបាច់រង់ចាំអានតាមលំដាប់លំដោយ ទីនេះគេប្រើវាដើម្បីទស្សន៍ទាយចលនារបស់អគារនាពេលអនាគត។	ដូចជាមនុស្សអានសៀវភៅមួយទំព័រ ដែលភ្នែករបស់យើងអាចសម្លឹងមើលពាក្យសំខាន់ៗនៅកន្លែងផ្សេងៗគ្នាក្នុងពេលតែមួយ ដើម្បីយល់ន័យជារួម ដោយមិនចាំបាច់អានមួយពាក្យម្តងៗពីដើមដល់ចប់។
Linear-Quadratic Regulator (LQR)	ជាប្រព័ន្ធគ្រប់គ្រងបែបគណិតវិទ្យាបុរាណ ដែលគណនារកកម្លាំង ឬសញ្ញាបញ្ជាដ៏ល្អបំផុត ដើម្បីរក្សាស្ថិរភាពនៃប្រព័ន្ធមេកានិច (ដូចជាអគារ) ឱ្យត្រឡប់មកសភាពស្ងៀមវិញ ក្នុងកម្រិតថាមពលទាបបំផុត។	ដូចជាអ្នកជិះកង់លើខ្សែពួរ ដែលត្រូវថ្លឹងទម្ងន់ខ្លួនឯងដោយស្វ័យប្រវត្តិដើម្បីកុំឱ្យធ្លាក់ ដោយប្រើប្រាស់កម្លាំង និងចលនាតិចតួចបំផុតតាមដែលអាចធ្វើទៅបាន។
Active Mass Damper (AMD)	ជាឧបករណ៍ទប់រំញ័រអគារដែលបំពាក់នូវដុំទម្ងន់ (Mass) និងម៉ូទ័រ (Actuator) ដោយវាអាចបញ្ចេញកម្លាំង ឬធ្វើចលនាឆ្លើយតបទៅនឹងទិសដៅនៃរំញ័ររញ្ជួយដី ឬខ្យល់បក់ ដើម្បីទាញអគារឱ្យមានលំនឹងឡើងវិញ។	ដូចជាអ្នកកាន់ថាសទឹកមួយពេញ ពេលមានអ្នករុញអ្នកទៅមុខ អ្នកត្រូវទាញថាសនោះមកក្រោយវិញភ្លាមៗ ដើម្បីទប់លំនឹងកុំឱ្យទឹកកំពប់ចេញ។
Proximal Policy Optimization (PPO)	ជាក្បួនដោះស្រាយ (Algorithm) មួយប្រភេទនៅក្នុង DRL ដែលជួយឱ្យម៉ាស៊ីនរៀនពីបទពិសោធន៍របស់វាដោយការកែតម្រូវយុទ្ធសាស្ត្របន្តិចម្តងៗ ដើម្បីចៀសវាងការផ្លាស់ប្តូរខ្លាំងពេកដែលអាចធ្វើឱ្យបាត់បង់ស្ថិរភាពម៉ូដែលពេលកំពុងបណ្តុះបណ្តាល។	ដូចជាអ្នករៀនជិះកង់ ដែលអ្នកកែតម្រូវចង្កូតបន្តិចម្តងៗពេលជិតដួល ជាជាងទាញចង្កូតខ្លាំងៗភ្លាមៗដែលអាចធ្វើឱ្យអ្នកដួលកាន់តែលឿន។
Markov Decision Process	ជាក្របខ័ណ្ឌគណិតវិទ្យាដែលពិពណ៌នាអំពីវដ្តនៃអន្តរកម្មរវាង AI Agent និងបរិស្ថានរបស់វា រួមមាន៖ ស្ថានភាពបច្ចុប្បន្ន សកម្មភាព រង្វាន់ និងស្ថានភាពបន្ទាប់ ដោយសន្មតថាការសម្រេចចិត្តបន្ទាប់អាស្រ័យតែលើស្ថានភាពបច្ចុប្បន្នប៉ុណ្ណោះ។	ដូចជាការលេងអុក ដែលការដើរកូនអុកនៅជំហានបន្ទាប់ គឺពឹងផ្អែកទៅលើទីតាំងកូនអុកនៅលើក្តារនាពេលបច្ចុប្បន្នទាំងស្រុង ដោយមិនខ្វល់ពីរបៀបដែលអ្នកដើរកាលពី១០ជំហានមុនឡើយ។
Shaking table	ជាតុមេកានិចនៅក្នុងមន្ទីរពិសោធន៍ដែលគេប្រើម៉ូទ័រដើម្បីបង្កើតរំញ័រត្រាប់តាមកម្លាំងរញ្ជួយដីពិតប្រាកដ សម្រាប់យកមកសាកល្បងភាពធន់ ការរង្គើ និងប្រតិកម្មរបស់គំរូអគារតូចៗ។	ដូចជាការដាក់ប្រអប់ក្រដាសនៅលើម៉ាស៊ីនបោកខោអាវដែលកំពុងញ័រខ្លាំង ដើម្បីមើលថាតើប្រអប់នោះមានរាងទ្រុឌទ្រោម ឬធ្លាក់ចុះមកដែរឬទេ។
Root Mean Square (RMS)	ជារង្វាស់ស្ថិតិដែលគេប្រើសម្រាប់វាស់ទំហំមធ្យមនៃអថេរដែលមានការប្រែប្រួលជានិច្ច (ដូចជាការរសាត់ ឬល្បឿនរំញ័រ) ក្នុងអំឡុងពេលណាមួយ ដើម្បីវាយតម្លៃថាតើប្រព័ន្ធបញ្ជាអាចកាត់បន្ថយរំញ័រសរុបបានកម្រិតណា។	ដូចជាការគណនាប្រាក់ចំណូលជាមធ្យមរបស់អ្នកលក់ដូរដែលរកបានប្រាក់ចំណូលឡើងចុះមិនទៀងទាត់រៀងរាល់ថ្ងៃ ដើម្បីដឹងពីកម្រិតលទ្ធភាពសេដ្ឋកិច្ចជាក់ស្តែងរបស់គាត់ជារួម។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖