Original Title: NGHIÊN CỨU SỬ DỤNG MÔ HÌNH HỌC MẠNG THẦN KINH NHÂN TẠO DỰ BÁO VÀ NGHIÊN CỨU CƯỜNG ĐỘ CHỊU NÉN CỦA ĐẤT GIA CỐ XI MĂNG
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការស្រាវជ្រាវលើការប្រើប្រាស់ម៉ូដែលបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (ANN) ដើម្បីព្យាករណ៍ និងសិក្សាពីកម្លាំងសង្កត់នៃដីលាយស៊ីម៉ងត៍

ចំណងជើងដើម៖ NGHIÊN CỨU SỬ DỤNG MÔ HÌNH HỌC MẠNG THẦN KINH NHÂN TẠO DỰ BÁO VÀ NGHIÊN CỨU CƯỜNG ĐỘ CHỊU NÉN CỦA ĐẤT GIA CỐ XI MĂNG

អ្នកនិពន្ធ៖ Nguyễn Hữu Năm (Viện Thuỷ điện và Năng lượng tái tạo), Nguyễn Quang Phú (Trường Đại học Thủy lợi), Nguyễn Tiếp Tân (Viện Khoa học Thủy lợi Việt Nam)

ឆ្នាំបោះពុម្ព៖ 2024, Tạp chí Khoa học và Công nghệ Thủy lợi

វិស័យសិក្សា៖ Geotechnical Engineering

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការកំណត់កម្លាំងសង្កត់ (Unconfined Compressive Strength - UCS) នៃដីលាយស៊ីម៉ងត៍តាមវិធីសាស្ត្រពិសោធន៍បែបប្រពៃណីទាមទារពេលវេលា និងចំណាយច្រើន។ ដូច្នេះ ការសិក្សានេះមានគោលបំណងប្រើប្រាស់វិធីសាស្ត្ររៀនដោយម៉ាស៊ីន (Machine Learning) ដើម្បីដោះស្រាយបញ្ហានេះប្រកបដោយប្រសិទ្ធភាពខ្ពស់។

វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះបានអភិវឌ្ឍម៉ូដែលបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (ANN) ដោយប្រើប្រាស់សំណុំទិន្នន័យចំនួន ៥០ គំរូ ជាមួយនឹងអថេរធាតុចូលចំនួន ៩ ទាក់ទងនឹងសមាសភាពដី និងបរិមាណស៊ីម៉ងត៍។

ការប្រមូល និងបែងចែកទិន្នន័យ (Data Collection and Splitting): បែងចែកទិន្នន័យ ៧០% សម្រាប់ការបណ្តុះបណ្តាលម៉ូដែល និង ៣០% សម្រាប់ការធ្វើតេស្តផ្ទៀងផ្ទាត់។
ការបង្កើតម៉ូដែលបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (Artificial Neural Network Modeling): បង្កើតស្ថាបត្យកម្ម ANN ដ៏ប្រសើរបំផុតដែលមានស្រទាប់លាក់ចំនួន ២ (មាន ៤ និង ៣ ណឺរ៉ូនរៀងគ្នា)។
ការវិភាគឥទ្ធិពលដោយប្រើប្រាស់ SHAP (SHAP Analysis): ប្រើប្រាស់វិធីសាស្ត្រ SHAP ដើម្បីកំណត់ពីកម្រិតនៃឥទ្ធិពលរបស់អថេរនីមួយៗទៅលើការព្យាករណ៍កម្លាំងសង្កត់ (UCS)។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ម៉ូដែល ANN អាចព្យាករណ៍កម្លាំងសង្កត់បានយ៉ាងត្រឹមត្រូវ ដោយទទួលបានមេគុណ R² ស្មើនឹង ០.៩៥៤៥ សម្រាប់ទិន្នន័យបណ្តុះបណ្តាល និង ០.៩២១២ សម្រាប់ទិន្នន័យផ្ទៀងផ្ទាត់។
ការវិភាគ SHAP បង្ហាញថា បរិមាណស៊ីម៉ងត៍ (Cement Content), ដែនកំណត់រាវ (Liquid Limit), និងសន្ទស្សន៍ភាពប្លាស្ទិក (Plasticity Index) គឺជាកត្តាដែលជះឥទ្ធិពលខ្លាំងជាងគេទៅលើកម្លាំងសង្កត់។
ការប្រើប្រាស់ម៉ូដែល ANN ផ្តល់នូវវិធីសាស្ត្រដ៏មានប្រសិទ្ធភាព និងសន្សំសំចៃខ្ពស់ក្នុងការប៉ាន់ស្មានកម្លាំងសង្កត់ (UCS) ដែលជាឧបករណ៍ដ៏មានតម្លៃសម្រាប់គម្រោងហេដ្ឋារចនាសម្ព័ន្ធពាក់ព័ន្ធនឹងការពង្រឹងគុណភាពដីខ្សោយ។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Traditional Experimental Methods វិធីសាស្ត្រពិសោធន៍តាមមន្ទីរពិសោធន៍បែបប្រពៃណី	ផ្តល់លទ្ធផលជាក់ស្តែង និងអាចទុកចិត្តបានខ្ពស់តាមរយៈការធ្វើតេស្តផ្ទាល់លើគំរូដីពិតៗ។	ចំណាយពេលវេលាយូរ និងទាមទារថវិកាច្រើនក្នុងការរៀបចំគំរូ និងដំណើរការម៉ាស៊ីនតេស្តកម្លាំងសង្កត់។	ផ្តល់ទិន្នន័យមូលដ្ឋាន (UCS) សម្រាប់ប្រើប្រាស់ក្នុងការផ្ទៀងផ្ទាត់ និងបណ្តុះបណ្តាលម៉ូដែលកុំព្យូទ័រ។
Artificial Neural Network (ANN) - 2 Hidden Layers ម៉ូដែលបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (ANN) ដែលមាន ២ ស្រទាប់លាក់ (៤ និង ៣ ណឺរ៉ូន)	អាចទស្សន៍ទាយកម្លាំងសង្កត់បានយ៉ាងរហ័ស មានភាពត្រឹមត្រូវខ្ពស់ និងអាចវិភាគទំនាក់ទំនងដ៏ស្មុគស្មាញ (Non-linear) រវាងលក្ខណៈដីនិងកម្លាំងបានយ៉ាងល្អ។	ទាមទារសំណុំទិន្នន័យ (Dataset) ច្រើននិងច្បាស់លាស់ដើម្បីបណ្តុះបណ្តាល ហើយពិបាកពន្យល់ពីដំណើរការគណនាខាងក្នុង (Black-box nature)។	ទទួលបានមេគុណ R² ស្មើនឹង ០.៩៥៤៥ (សម្រាប់ការបណ្តុះបណ្តាល) និង ០.៩២១២ (សម្រាប់ការធ្វើតេស្តផ្ទៀងផ្ទាត់) ជាមួយកំហុស RMSE ទាបត្រឹម ០.៤៧៧៧ MPa។

ការចំណាយលើធនធាន (Resource Cost)៖ ឯកសារនេះមិនបានបញ្ជាក់លម្អិតអំពីតម្លៃធនធាននោះទេ ប៉ុន្តែការប្រើប្រាស់ម៉ូដែលរៀនដោយម៉ាស៊ីន (Machine Learning) ជារួមតម្រូវឱ្យមានឧបករណ៍កុំព្យូទ័រ និងទិន្នន័យជាក់លាក់។

Software & Libraries: ត្រូវការភាសា Python និងបណ្ណាល័យសម្រាប់ Machine Learning ដូចជា scikit-learn សម្រាប់ការសាងសង់ម៉ូដែល និង SHAP សម្រាប់ការវិភាគឥទ្ធិពលអថេរ។
Hardware: ដោយសារសំណុំទិន្នន័យមានទំហំតូច (ត្រឹមតែ ៥០ គំរូ) កុំព្យូទ័រយួរដៃដែលមានសមត្ថភាពមធ្យម (Standard CPU) គឺគ្រប់គ្រាន់សម្រាប់ការដំណើរការ ដោយមិនតម្រូវឱ្យមាន GPU ថ្លៃៗនោះទេ។
Dataset Requirement: តម្រូវឱ្យមានទិន្នន័យដែលប្រមូលបានពីការពិសោធន៍ជាក់ស្តែង (ទិន្នន័យអថេរចូលចំនួន ៩ ដូចជា កម្រិតសំណើម កម្រិតគ្រាប់ខ្សាច់/ដីឥដ្ឋ និងបរិមាណស៊ីម៉ងត៍)។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យតូចត្រឹមតែ ៥០ គំរូ ដែលដកស្រង់ចេញពីការស្រាវជ្រាវមុន (Gajurel et al.) ដែលអាចនឹងមានភាពលម្អៀងទៅលើលក្ខខណ្ឌដីនៅតំបន់ភូមិសាស្ត្រជាក់លាក់ណាមួយ (មិនមែននៅវៀតណាម ឬកម្ពុជា)។ សម្រាប់ប្រទេសកម្ពុជា ការយកម៉ូដែលនេះមកប្រើប្រាស់ដោយផ្ទាល់អាចនឹងមិនសុក្រឹតនោះទេ លុះត្រាតែមានការប្រមូលទិន្នន័យដីក្នុងស្រុក (Local soil data) បន្ថែមដើម្បីបណ្តុះបណ្តាលម៉ូដែលឡើងវិញ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាទិន្នន័យអាចមានភាពខុសគ្នា ប៉ុន្តែវិធីសាស្ត្រនិងការរៀបចំបណ្តាញសរសៃប្រសាទនេះ មានសក្តានុពលខ្ពស់មែនទែនក្នុងការយកមកអនុវត្តនៅក្នុងវិស័យសំណង់ និងហេដ្ឋារចនាសម្ព័ន្ធនៅក្នុងប្រទេសកម្ពុជា។

គម្រោងសាងសង់ផ្លូវនៅតំបន់វាលទំនាប (កណ្តាល បាត់ដំបង និងជុំវិញបឹងទន្លេសាប): តំបន់ទាំងនេះសំបូរទៅដោយដីទន់ខ្សោយ និងដីឥដ្ឋដែលត្រូវការការពង្រឹងដោយការលាយស៊ីម៉ងត៍។ ការប្រើប្រាស់ម៉ូដែល ANN អាចជួយវិស្វករគណនាបរិមាណស៊ីម៉ងត៍ដែលត្រូវលាយបានយ៉ាងឆាប់រហ័ស និងជួយសន្សំសំចៃថវិកាគម្រោង។
ការអភិវឌ្ឍហេដ្ឋារចនាសម្ព័ន្ធតំបន់ឆ្នេរ (ខេត្តព្រះសីហនុ និងកោះកុង): គម្រោងចាក់ដីលុបសមុទ្រ ឬសាងសង់លើទីតាំងដីល្បាប់ តម្រូវឱ្យមានការត្រួតពិនិត្យកម្លាំងសង្កត់ដីជាប្រចាំ។ ម៉ូដែលនេះអាចដើរតួជាឧបករណ៍ជំនួយក្នុងការប៉ាន់ស្មានលទ្ធផលបណ្តោះអាសន្ន ខណៈពេលរង់ចាំលទ្ធផលផ្លូវការពីមន្ទីរពិសោធន៍។
ការសិក្សាស្រាវជ្រាវនៅតាមគ្រឹះស្ថានឧត្តមសិក្សា (ITC, RUFA): និស្សិតផ្នែកវិស្វកម្មសំណង់ស៊ីវិល អាចយកវិធីសាស្ត្រនេះមកសិក្សាបន្ត និងកសាងជាមូលដ្ឋានទិន្នន័យអំពីលក្ខណៈដី (Soil Properties Database) ប្រចាំតំបន់នីមួយៗក្នុងប្រទេសកម្ពុជា។

សរុបមក ការធ្វើសមាហរណកម្មរវាងចំណេះដឹងផ្នែកវិស្វកម្មភូមិសាស្ត្រ (Geotechnical Engineering) និងវិទ្យាសាស្ត្រទិន្នន័យ (Data Science) នឹងក្លាយជាកាតាលីករដ៏សំខាន់ក្នុងការជំរុញប្រសិទ្ធភាព និងគុណភាពនៃការសាងសង់នៅកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

ជំហានទី១៖ សិក្សាមូលដ្ឋានគ្រឹះនៃ Geotech និង Python: និស្សិតគួរយល់ដឹងពីទ្រឹស្តីកម្លាំងសង្កត់មិនកំណត់ (UCS) និងអថេររបស់ដីជាមុនសិន។ បន្ទាប់មក ចាប់ផ្តើមរៀនសរសេរកូដ Python ដោយផ្តោតលើការគ្រប់គ្រងទិន្នន័យតាមរយៈបណ្ណាល័យ Pandas និង NumPy។
ជំហានទី២៖ ការប្រមូលទិន្នន័យក្នុងស្រុក (Data Collection): សហការជាមួយមន្ទីរពិសោធន៍សំណង់ (ឧទាហរណ៍មន្ទីរពិសោធន៍របស់ក្រសួង ឬសាកលវិទ្យាល័យ) ដើម្បីប្រមូលទិន្នន័យតេស្តដីលាយស៊ីម៉ងត៍ពិតប្រាកដនៅកម្ពុជា។ រៀបចំសំណុំទិន្នន័យ (Dataset) ដោយត្រូវមានអថេរដូចជា ភាគរយដីឥដ្ឋ ខ្សាច់ សំណើម និងលទ្ធផល UCS ប្រហែល ៥០ ទៅ ១០០ គំរូ។
ជំហានទី៣៖ កសាងម៉ូដែលកុំព្យូទ័រ (Model Building): ប្រើប្រាស់បណ្ណាល័យ Scikit-learn នៅក្នុង Python ដើម្បីបង្កើតម៉ូដែល ANN (MLPRegressor)។ សាកល្បងកំណត់រចនាសម្ព័ន្ធដូចការសិក្សានេះ ដោយប្រើប្រាស់ស្រទាប់លាក់ចំនួន ២ (មាន ៤ ណឺរ៉ូន និង ៣ ណឺរ៉ូន) និងប្រើមុខងារ Activation ហៅថា 'relu'។
ជំហានទី៤៖ ការវាយតម្លៃ និងការបកស្រាយលទ្ធផលម៉ូដែល: ប្រើប្រាស់រង្វាស់ R² និង RMSE ដើម្បីពិនិត្យមើលភាពត្រឹមត្រូវនៃការព្យាករណ៍របស់ម៉ូដែល។ អ្វីដែលសំខាន់បំផុត គឺត្រូវប្រើប្រាស់បណ្ណាល័យ SHAP ដើម្បីបង្កើតក្រាហ្វិកពន្យល់ពីឥទ្ធិពលនៃអថេរនីមួយៗ (ឧទាហរណ៍ តើបរិមាណស៊ីម៉ងត៍ប៉ុន្មានភាគរយ ទើបធ្វើឱ្យដីមានកម្លាំងសង្កត់ខ្លាំងបំផុត)។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Artificial Neural Networks (ANN)	ជាប្រព័ន្ធកុំព្យូទ័រដែលត្រូវបានបង្កើតឡើងដោយត្រាប់តាមរបៀបធ្វើការនៃខួរក្បាលមនុស្ស ដោយប្រើប្រាស់បណ្តាញនៃ 'ណឺរ៉ូនសិប្បនិម្មិត' (Artificial Neurons) ដើម្បីរៀនពីទិន្នន័យចាស់ៗ ស្វែងរកទំនាក់ទំនងស្មុគស្មាញ និងធ្វើការព្យាករណ៍លទ្ធផលថ្មីៗ។	ដូចជាកូនក្មេងដែលរៀនស្គាល់សត្វឆ្កែនិងឆ្មា ដោយការមើលរូបភាពច្រើនៗដដែលៗ រហូតដល់វាអាចចំណាំបានដោយខ្លួនឯង។
Unconfined Compressive Strength (UCS)	ជារង្វាស់ទំហំនៃកម្លាំងសង្កត់អតិបរមាដែលគំរូដីមួយ (ជាទូទៅជារាងស៊ីឡាំង) អាចទ្រាំទ្របានមុនពេលវាប្រេះ ឬបែកបាក់ ដោយមិនមានកម្លាំងទប់ពីផ្នែកខាងចំហៀងឡើយ។ វាត្រូវបានប្រើដើម្បីវាយតម្លៃភាពរឹងមាំរបស់ដីក្រោយពេលលាយស៊ីម៉ងត៍រួច។	ដូចជាការយកដុំឥដ្ឋមួយដុំមកដាក់ផ្ទុកទម្ងន់ពីលើរហូតដល់វាបែក ដើម្បីចង់ដឹងថាវាអាចទ្រទម្ងន់បានប៉ុន្មានគីឡូក្រាម។
SHAP (SHapley Additive exPlanations)	ជាវិធីសាស្ត្រគណិតវិទ្យាក្នុងការវិភាគម៉ូដែល Machine Learning ដើម្បីបកស្រាយ និងបង្ហាញច្បាស់ថាតើអថេរធាតុចូលនីមួយៗ (ឧទាហរណ៍ បរិមាណស៊ីម៉ងត៍ ឬកម្រិតសំណើម) បានចូលរួមចំណែកឥទ្ធិពលប៉ុន្មានភាគរយក្នុងការសម្រេចចិត្តទស្សន៍ទាយលទ្ធផលចុងក្រោយ។	ដូចជាការបែងចែកប្រាក់រង្វាន់ដល់កីឡាករម្នាក់ៗក្នុងក្រុមបាល់ទាត់ ដោយផ្អែកលើទំហំនៃការខិតខំប្រឹងប្រែង និងការស៊ុតបញ្ចូលទីរបស់ពួកគេរៀងៗខ្លួន។
Root Mean Square Error (RMSE)	ជារង្វាស់ស្តង់ដារមួយដែលប្រើដើម្បីវាស់ពីកម្រិតនៃភាពខុសគ្នា (កំហុស) រវាងតម្លៃដែលម៉ូដែលកុំព្យូទ័របានទស្សន៍ទាយ និងតម្លៃពិតប្រាកដដែលបានពីការវាស់វែងជាក់ស្តែង។ តម្លៃ RMSE កាន់តែតូច បញ្ជាក់ថាម៉ូដែរកាន់តែសុក្រឹត។	ដូចជាការបាញ់ព្រួញទៅកាន់ផ្ទាំងស៊ីប រួចវាស់ចម្ងាយសរុបនៃគ្រាប់ព្រួញទាំងអស់ដែលឃ្លាតពីចំណុចកណ្តាល ដើម្បីដឹងថាអ្នកបាញ់មានភាពច្បាស់លាស់កម្រិតណា។
Liquid Limit	គឺជាកម្រិតសំណើមអតិបរមារបស់ដីនៅពេលដែលដីនោះប្រែប្រួលស្ថានភាពពីភាពស្អិត (Plastic state) ទៅជាទម្រង់រាវ (Liquid state) ដែលអាចហូរបាន។ វាជាសូចនាករមួយនៃសមត្ថភាពស្រូបទឹករបស់ដីក្នុងវិស្វកម្មភូមិសាស្ត្រ។	ដូចជាការលាយម្សៅធ្វើនំ ប្រសិនបើចាក់ទឹកច្រើនពេកដល់កម្រិតមួយ ម្សៅនោះនឹងលែងស្អិតរមួត ហើយក្លាយជាទឹកខាប់ៗដែលអាចហូរបាន។
Plasticity Index	ជាទំហំនៃគម្លាតរវាងដែនកំណត់រាវ (Liquid Limit) និងដែនកំណត់ប្លាស្ទិក (Plastic Limit) របស់ដី។ វាបញ្ជាក់ពីបរិមាណទឹកដែលដីអាចទាញយកបានដោយរក្សាបាននូវភាពស្អិតរមួត (មិនរាវពេក ឬមិនរឹងពេក)។	ដូចជាដីឥដ្ឋសម្រាប់សូនរូប ប្រសិនបើវាមានសន្ទស្សន៍នេះខ្ពស់ មានន័យថាអ្នកអាចចាក់ទឹកលាយវា និងសូនជារូបរាងផ្សេងៗបានយ៉ាងងាយស្រួលដោយមិនងាយប្រេះ។
Hyperparameter tuning	ដំណើរការនៃការផ្លាស់ប្តូរការកំណត់ (Settings) ផ្សេងៗរបស់ម៉ូដែល Machine Learning (ឧទាហរណ៍ ចំនួនស្រទាប់លាក់ ឬចំនួនណឺរ៉ូន) មុនពេលចាប់ផ្តើមបណ្តុះបណ្តាល ដើម្បីស្វែងរកបន្សំនៃការកំណត់ណាដែលផ្តល់លទ្ធផលព្យាករណ៍ល្អបំផុត។	ដូចជាការបង្វិលប៊ូតុងសារ៉េប៉ុស្តិ៍វិទ្យុ ដើម្បីរកមើលប្រេកង់ណាដែលស្តាប់បានសំឡេងច្បាស់បំផុតដោយគ្មានសំឡេងរំខាន។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖