បញ្ហា (The Problem)៖ ការវាយតម្លៃលក្ខណៈសម្បត្តិមេកានិចនៃសរសៃអំបោះ Flax (ដូចជាកម្លាំងដាច់ និងការយឺត) តាមវិធីសាស្រ្តពិសោធន៍ដោយផ្ទាល់ មានតម្លៃថ្លៃ ចំណាយពេលច្រើន និងត្រូវការកម្លាំងពលកម្មខ្ពស់។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានប្រើប្រាស់ទិន្នន័យពីការពិសោធន៍ជាក់ស្តែង ដើម្បីបង្វឹកម៉ាស៊ីនរៀន (Machine Learning) និងបង្កើតជាកម្មវិធីកុំព្យូទ័រ (GUI) ដើម្បីព្យាករណ៍គុណភាពសរសៃអំបោះបានយ៉ាងងាយស្រួល។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Random Forest Regressor (Proposed Best Model) ម៉ូដែលតម្រែតម្រង់ព្រៃចៃដន្យ (Random Forest) |
មានសមត្ថភាពចាប់យកទំនាក់ទំនងមិនលីនេអ៊ែរបានល្អ និងមិនងាយមានបញ្ហា Overfitting ដូចម៉ូដែលផ្សេងទៀត។ | ត្រូវការធនធានគណនារបស់កុំព្យូទ័រច្រើនជាងម៉ូដែលលីនេអ៊ែរបន្តិច ប៉ុន្តែនៅតែអាចដំណើរការលើកុំព្យូទ័រទូទៅបាន។ | ផ្តល់លទ្ធផលល្អបំផុតដោយមានតម្លៃ R² ខ្ពស់ដល់ ០.៩៩ និងកំហុសទាបបំផុត (Low MSE/MAE) ក្នុងការទស្សន៍ទាយកម្លាំងដាច់នៃសរសៃ។ |
| Support Vector Regressor (SVR) ម៉ូដែលតម្រែតម្រង់ Support Vector |
មានប្រសិទ្ធភាពសម្រាប់ទិន្នន័យដែលមានចំនួនតិច និងមានភាពរឹងមាំចំពោះទិន្នន័យដែលមានតម្លៃខុសប្រក្រតី (Outliers)។ | ផ្តល់លទ្ធផលទាបជាងគេក្នុងការសិក្សានេះ ដោយមានតម្លៃ R² ទាប និងកំហុសខ្ពស់ ហើយពិបាកក្នុងការកំណត់ប៉ារ៉ាម៉ែត្រ (Hyperparameters)។ | ទទួលបានតម្លៃ R² ចន្លោះពី ០.៨៤ ដល់ ០.៨៩ ដែលទាបជាងម៉ូដែលផ្សេងទៀតយ៉ាងខ្លាំង។ |
| XGBoost Regressor ម៉ូដែលតម្រែតម្រង់ XGBoost |
ជាក្បួនដោះស្រាយដែលមានល្បឿនលឿន និងមានសមត្ថភាពខ្ពស់ក្នុងការដោះស្រាយទិន្នន័យដែលបាត់ (Missing values)។ | បង្ហាញសញ្ញានៃការ Overfitting (លទ្ធផលល្អពេកពេលបង្វឹក ប៉ុន្តែធ្លាក់ចុះពេលតេស្ត) ទោះបីជាមានការកែសម្រួលក៏ដោយ។ | ទទួលបានតម្លៃ R² ប្រហែល ០.៩០ ទៅ ០.៩១ ក្នុងការតេស្ត ដែលល្អបង្គួរដែរប៉ុន្តែនៅតែទាបជាង Random Forest។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះប្រើប្រាស់ធនធានកុំព្យូទ័រក្នុងកម្រិតមធ្យម ដែលអាចអនុវត្តបានយ៉ាងងាយស្រួលនៅក្នុងមន្ទីរពិសោធន៍សាកលវិទ្យាល័យនៅកម្ពុជា។
ការសិក្សានេះធ្វើឡើងនៅប្រទេសឥណ្ឌា ដោយប្រើប្រាស់ពូជ Flax (JRF-2) និងលក្ខខណ្ឌដាំដុះក្នុងតំបន់នោះ។ នេះជាចំណុចសំខាន់សម្រាប់កម្ពុជា ព្រោះលក្ខណៈសម្បត្តិនៃសរសៃអំបោះអាចប្រែប្រួលទៅតាមពូជរុក្ខជាតិ និងអាកាសធាតុ ដូច្នេះយើងមិនអាចយកគំរូនេះមកប្រើផ្ទាល់ទេ តែត្រូវប្រមូលទិន្នន័យសរសៃក្នុងស្រុកដើម្បីបង្វឹកម៉ូដែលឡើងវិញ។
វិធីសាស្រ្តនេះមានសារៈប្រយោជន៍ខ្ពស់សម្រាប់កម្ពុជា ក្នុងការធ្វើទំនើបកម្មវិស័យកសិកម្ម និងវាយនភណ្ឌតាមរយៈបច្ចេកវិទ្យាឌីជីថល។
ការបង្កើត GUI ភ្ជាប់ជាមួយ ML ជួយឱ្យអ្នកបច្ចេកទេស ឬកសិករអាចប៉ាន់ប្រមាណគុណភាពសរសៃបានយ៉ាងរហ័សដោយមិនចាំបាច់ចេះសរសេរកូដ ដែលជួយបង្កើនប្រសិទ្ធភាពផលិតកម្ម។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Random Forest Regressor | ជាក្បួនដោះស្រាយម៉ាស៊ីនរៀន (Machine Learning) ដែលបង្កើត 'ដើមឈើសម្រេចចិត្ត' (Decision Trees) ជាច្រើន ហើយយកលទ្ធផលមធ្យមរបស់ពួកវាដើម្បីទទួលបានការទស្សន៍ទាយដែលមានភាពជាក់លាក់ខ្ពស់ជាងការប្រើដើមឈើតែមួយ។ វាជួយកាត់បន្ថយបញ្ហាទស្សន៍ទាយលំអៀង។ | ដូចជាការសួរយោបល់ពីអ្នកជំនាញ ១០០នាក់ រួចយកចម្លើយដែលមនុស្សភាគច្រើនយល់ស្រប ជាជាងជឿលើមនុស្សតែម្នាក់។ |
| SHapley Additive exPlanations (SHAP) | ជាវិធីសាស្រ្តសម្រាប់បកស្រាយលទ្ធផលរបស់ AI ដោយបង្ហាញយ៉ាងច្បាស់ថា តើកត្តានីមួយៗ (ដូចជា សំណើម ឬទម្ងន់) មានឥទ្ធិពលវិជ្ជមាន ឬអវិជ្ជមានប៉ុណ្ណាទៅលើលទ្ធផលចុងក្រោយនៃការទស្សន៍ទាយ។ | ដូចជាការបែងចែកប្រាក់រង្វាន់ឱ្យសមាជិកក្រុមបាល់ទាត់ម្នាក់ៗ ទៅតាមទំហំការងារជាក់ស្តែងដែលពួកគេបានចូលរួមលេងក្នុងការប្រកួត។ |
| Graphical User Interface (GUI) | ជាចំណុចប្រទាក់ដែលអនុញ្ញាតឱ្យអ្នកប្រើប្រាស់អាចបញ្ជា ឬបញ្ចូលទិន្នន័យទៅក្នុងកុំព្យូទ័រតាមរយៈរូបភាព ប៊ូតុង និងប្រអប់អក្សរ ដោយមិនចាំបាច់ចេះសរសេរកូដបញ្ជាដ៏ស្មុគស្មាញ។ | ដូចជាការបើកបររថយន្តដោយប្រើចង្កូតនិងហ្គែរ ជាជាងការទៅតខ្សែភ្លើងនៅក្នុងម៉ាស៊ីនដោយផ្ទាល់ដើម្បីឱ្យឡានដើរ។ |
| Gauge Length | គឺជាប្រវែងនៃផ្នែកសរសៃអំបោះដែលស្ថិតនៅចន្លោះគំនៀបទាំងពីរនៃម៉ាស៊ីនតេស្ត។ ក្នុងការសិក្សានេះ វាជាកត្តាសំខាន់បំផុតមួយដែលកំណត់ថា តើសរសៃនោះនឹងដាច់នៅកម្លាំងប៉ុន្មាន។ | ដូចជាចន្លោះប្រវែងរវាងដៃឆ្វេងនិងដៃស្តាំរបស់អ្នក នៅពេលអ្នកកាន់កៅស៊ូកងដើម្បីទាញវាឱ្យដាច់ (កាន់កាន់តែខ្លី កាន់តែពិបាកទាញ)។ |
| Coefficient of Determination (R2) | ជាមេគុណស្ថិតិដែលវាស់វែងថាតើម៉ូដែលរបស់យើងអាចទស្សន៍ទាយបានត្រឹមត្រូវកម្រិតណា។ តម្លៃកាន់តែកៀកនឹងលេខ ១ មានន័យថាម៉ូដែលនោះទស្សន៍ទាយបានល្អឥតខ្ចោះ។ | ដូចជាពិន្ទុប្រឡង បើបាន ១.០០ គឺបានពិន្ទពេញ ១០០% មានន័យថាចម្លើយត្រូវទាំងអស់។ |
| Constant Rate of Loading (CRL) | ជាវិធីសាស្រ្តតេស្តមេកានិច ដោយម៉ាស៊ីនបង្កើនកម្លាំងទាញ ឬសង្កត់ទៅលើសរសៃអំបោះក្នុងល្បឿនថេរមួយដែលបានកំណត់ទុក រហូតទាល់តែសរសៃនោះដាច់។ | ដូចជាការចាក់ទឹកចូលក្នុងធុងយឺតៗក្នុងល្បឿនស្មើគ្នា រហូតទាល់តែដៃយួរធុងនោះដាច់។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖