Original Title: PHẦN THỨ HAI: NGHIÊN CỨU, ỨNG DỤNG
Source: khcn.hcmunre.edu.vn
Document Type: Textbook / Educational Material
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original material for complete content.

ផ្នែកទី២៖ ការស្រាវជ្រាវ និងការអនុវត្ត

ចំណងជើងដើម៖ PHẦN THỨ HAI: NGHIÊN CỨU, ỨNG DỤNG

អ្នកនិពន្ធ៖ N/A

ឆ្នាំបោះពុម្ព៖ N/A

វិស័យសិក្សា៖ Applied Sciences

១. សេចក្តីសង្ខេប (Overview)

ប្រធានបទ (Topic)៖ ឯកសារនេះពិភាក្សាអំពីបញ្ហាប្រឈម និងយុទ្ធសាស្ត្រក្នុងការបំប្លែងទ្រឹស្តីវិទ្យាសាស្ត្រទៅជាការអនុវត្តជាក់ស្តែង ដើម្បីដោះស្រាយបញ្ហាក្នុងវិស័យឧស្សាហកម្ម។

រចនាសម្ព័ន្ធ (Structure)៖ វិធីសាស្ត្រនេះផ្តោតលើការវាយតម្លៃគំរូស្រាវជ្រាវ និងការធ្វើសមាហរណកម្មបច្ចេកវិទ្យាថ្មីៗទៅក្នុងការអនុវត្តជាក់ស្តែង។

ចំណុចសំខាន់ៗ (Key Takeaways)៖

២. គោលបំណងសិក្សា (Learning Objectives)

បន្ទាប់ពីអានឯកសារនេះ អ្នកគួរអាច៖

  1. យល់ដឹងពីរបៀបប្រើប្រាស់ប្រព័ន្ធ Google Earth Engine (GEE) និងរូបភាពរណប Sentinel-2 សម្រាប់ការតាមដានបរិស្ថាន (Environmental Monitoring)។","អនុវត្តក្បួនដោះស្រាយម៉ាស៊ីនរៀនសូត្រ (Machine Learning) ជាពិសេស Random Forest សម្រាប់ការធ្វើចំណាត់ថ្នាក់គម្របដី (Land Cover Classification)។","វិភាគ និងវាយតម្លៃការផ្លាស់ប្តូរទំហំលំហបៃតងនៅក្នុងទីក្រុងតាមពេលវេលាជាក់លាក់ (Change Detection) ព្រមទាំងគណនាកម្រិតភាពត្រឹមត្រូវ។

ឯកសារនេះបង្ហាញពីការអនុវត្តបច្ចេកវិទ្យាវិទ្យាសាស្ត្រពីចម្ងាយ (Remote Sensing) ផ្អែកលើប្រព័ន្ធក្លោដ (Cloud-based) និងម៉ាស៊ីនរៀនសូត្រ ដើម្បីតាមដានលំហបៃតងទីក្រុង។ វាគ្របដណ្តប់លើជំហានអនុវត្តជាក់ស្តែងចាប់ពីការប្រមូលទិន្នន័យ ការរៀបចំទិន្នន័យ ការធ្វើចំណាត់ថ្នាក់ដោយប្រើ Random Forest និងការវិភាគរកការផ្លាស់ប្តូរពីមួយឆ្នាំទៅមួយឆ្នាំ។

៣. គោលគំនិតសំខាន់ៗ (Key Concepts)

គោលគំនិត (Concept) ការពន្យល់ (Explanation) ឧទាហរណ៍ (Example)
Google Earth Engine (GEE)
ប្រព័ន្ធកុំព្យូទ័រលើបណ្តាញ GEE
ជាប្រព័ន្ធកុំព្យូទ័រលើបណ្តាញ (Cloud computing platform) ដែលអាចដំណើរការ និងវិភាគទិន្នន័យរូបភាពរណបខ្នាតធំបានយ៉ាងលឿនដោយមិនទាមទារកុំព្យូទ័រដែលមានកម្លាំងខ្លាំង។ វារួមបញ្ចូលនូវទិន្នន័យភូមិសាស្ត្រ និងឧបករណ៍សរសេរកូដសម្រាប់វិភាគ។ ការប្រើប្រាស់ប្រព័ន្ធនេះដើម្បីទាញយក និងដំណើរការរូបភាព Sentinel-2 សម្រាប់ទីក្រុងទាំងមូលដោយស្វ័យប្រវត្តិជំនួសឱ្យការទាញយកទិន្នន័យរាប់ហ្គីកាបៃមកម៉ាស៊ីនកុំព្យូទ័រផ្ទាល់ខ្លួន។
Random Forest Algorithm
ក្បួនដោះស្រាយ Random Forest
ជាវិធីសាស្ត្រម៉ាស៊ីនរៀនសូត្រ (Machine Learning) មួយដែលប្រើដើមឈើសម្រេចចិត្ត (Decision Trees) ជាច្រើនដើម្បីធ្វើចំណាត់ថ្នាក់ទិន្នន័យ។ វាមានភាពជាក់លាក់ខ្ពស់ និងជួយកាត់បន្ថយកំហុសប្រភេទ Overfitting ក្នុងការធ្វើចំណាត់ថ្នាក់។ ការប្រើម៉ូដែលនេះដើម្បីបំបែកផ្ទៃដីជា "លំហបៃតង" (Green Space) និង "មិនមែនលំហបៃតង" ដោយពឹងផ្អែកលើសំណាកទិន្នន័យបង្វឹក (Training Data)។
Change Detection
ការរកឃើញការផ្លាស់ប្តូរ
ជាបច្ចេកទេសកំណត់អត្តសញ្ញាណភាពខុសគ្នានៃស្ថានភាពវត្ថុ ឬតំបន់ណាមួយដោយសង្កេតមើលវានៅពេលវេលាខុសគ្នា។ បច្ចេកទេសនេះប្រើប្រាស់ម៉ាទ្រីសដើម្បីប្រៀបធៀបចំណាត់ថ្នាក់ពីពីរឆ្នាំផ្សេងគ្នា។ ការប្រៀបធៀបផែនទីលំហបៃតងឆ្នាំ ២០១៩ និង ២០២៤ ដើម្បីរកមើលតំបន់ណាដែលត្រូវបានកាត់បន្ថយ ឬបំប្លែងទៅជាតំបន់សំណង់ទីក្រុង។
Confusion Matrix & Kappa Coefficient
ម៉ាទ្រីសកំហុស និងមេគុណ Kappa
ជាវិធីសាស្ត្រវាយតម្លៃភាពត្រឹមត្រូវនៃម៉ូដែលចំណាត់ថ្នាក់ ដោយប្រៀបធៀបលទ្ធផលដែលម៉ូដែលទស្សន៍ទាយជាមួយទិន្នន័យជាក់ស្តែងនៅលើដី (Ground Truth)។ ការទទួលបានភាពត្រឹមត្រូវសរុប (Overall Accuracy) លើសពី ៩៦% និងមេគុណ Kappa លើសពី ០.៩៣ ដែលបញ្ជាក់ថាម៉ូដែលនេះមានភាពជឿជាក់ខ្ពស់ក្នុងការប្រើប្រាស់ជាក់ស្តែង។

៤. ភាពពាក់ព័ន្ធសម្រាប់កម្ពុជា (Cambodia Relevance)

ប្រធានបទនេះមានសារៈសំខាន់ខ្លាំងណាស់សម្រាប់ប្រទេសកម្ពុជា ស្របពេលដែលនគរូបនីយកម្មយ៉ាងឆាប់រហ័សនៅក្នុងទីក្រុងនានា ទាមទារឱ្យមានការតាមដានលំហបៃតង និងបម្រែបម្រួលបរិស្ថានប្រកបដោយប្រសិទ្ធភាព។

ការអនុវត្ត (Applications)៖

ការបំពាក់បំប៉ននិស្សិតកម្ពុជានូវជំនាញប្រើប្រាស់ GEE និង Machine Learning នឹងផ្តល់អំណាចឱ្យពួកគេក្នុងការតាមដាន និងគ្រប់គ្រងធនធានធម្មជាតិ ដែលជាផ្នែកមួយគាំទ្រដល់ការអភិវឌ្ឍប្រកបដោយចីរភាពនៅកម្ពុជា។

៥. មគ្គុទ្ទេសក៍សិក្សា (Study Guide)

លំហាត់ និងសកម្មភាពសិក្សាដើម្បីពង្រឹងការយល់ដឹង៖

  1. ការចុះឈ្មោះ និងទាញយកទិន្នន័យ (GEE Setup & Data Loading): បង្កើតគណនី Google Earth Engine និងសរសេរកូដ JavaScript ជាមូលដ្ឋានដើម្បីទាញយករូបភាពរណប Sentinel-2 Level-2A សម្រាប់រាជធានីភ្នំពេញ ដោយកំណត់កម្រិតពពក (Cloud cover) តិចជាង ១០%។
  2. ការប្រមូលសំណាកទិន្នន័យ (Training Data Collection): ប្រើប្រាស់ Google Earth Pro ឬឧបករណ៍គូសវាសក្នុង GEE ដើម្បីកត់ត្រាចំណុចនិយាមកា (Polygons) យ៉ាងហោចណាស់ ១០០ ចំណុច តំណាងឱ្យ 'តំបន់បៃតង' និង ១០០ ចំណុចទៀតសម្រាប់ 'តំបន់សំណង់/ទឹក'។
  3. ការធ្វើចំណាត់ថ្នាក់រូបភាព (Image Classification with Random Forest): សរសេរកូដអនុវត្តក្បួនដោះស្រាយ Random Forest នៅក្នុង GEE ដោយប្រើសំណាកទិន្នន័យដែលបានប្រមូល ដើម្បីបង្កើតផែនទីចំណាត់ថ្នាក់គម្របដី (Land Cover Map) សម្រាប់ឆ្នាំបច្ចុប្បន្ន។
  4. ការវិភាគការផ្លាស់ប្តូរ (Change Detection Analysis): ធ្វើការចំណាត់ថ្នាក់ដដែលសម្រាប់រូបភាពរណបកាលពី ៥ ឆ្នាំមុន បន្ទាប់មកប្រើអនុគមន៍គណនាក្នុង GEE ដើម្បីបង្កើតផែនទីបង្ហាញពីតំបន់ដែលបាត់បង់លំហបៃតង (Green Space Loss) និងគណនាទំហំផ្ទៃដីសរុបដែលបានបាត់បង់ជាហិកតា។

៦. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស (English) ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Google Earth Engine (GEE) ជាប្រព័ន្ធកុំព្យូទ័រលើបណ្តាញ (Cloud Platform) របស់ក្រុមហ៊ុន Google ដែលអនុញ្ញាតឱ្យអ្នកប្រើប្រាស់វិភាគ និងដំណើរការទិន្នន័យភូមិសាស្ត្រ និងរូបភាពរណបខ្នាតធំបានយ៉ាងរហ័ស ដោយមិនចាំបាច់ប្រើកុំព្យូទ័រផ្ទាល់ខ្លួនដែលមានកម្លាំងខ្លាំងនោះទេ។ នៅក្នុងអត្ថបទនេះ វាត្រូវបានប្រើសម្រាប់ទាញយក និងវិភាគរូបភាពរណប Sentinel-2។ ដូចជាការជួលរោងចក្រដ៏ធំមួយដែលមានម៉ាស៊ីនស្រាប់នៅលើអ៊ីនធឺណិត ដើម្បីកែច្នៃទិន្នន័យផែនទីរាប់ពាន់សន្លឹកក្នុងពេលតែមួយ ដោយមិនបាច់ទិញម៉ាស៊ីនថ្លៃៗមកទុកនៅផ្ទះ។
Random Forest (RF) ជាក្បួនដោះស្រាយម៉ាស៊ីនរៀនសូត្រ (Machine Learning algorithm) ដែលបង្កើតឡើងដោយការប្រមូលផ្តុំ "ដើមឈើសម្រេចចិត្ត" (Decision Trees) ជាច្រើន។ នៅក្នុងការសិក្សានេះ វាត្រូវបានប្រើដើម្បីធ្វើចំណាត់ថ្នាក់ប្រភេទផ្ទៃដី (ដូចជាតំបន់លំហបៃតង និងមិនមែនបៃតង) ពីទិន្នន័យរូបភាពរណបប្រកបដោយភាពត្រឹមត្រូវខ្ពស់។ ដូចជាការសួរមតិពីមនុស្ស១០០នាក់ (ដើមឈើ) ថាតើវត្ថុមួយជារូបអ្វី រួចយកចម្លើយដែលមានអ្នកឆ្លើយស្របគ្នាភាគច្រើនជាការសម្រេចចិត្តចុងក្រោយ ដើម្បីចៀសវាងការឆ្លើយខុសដោយការវិនិច្ឆ័យរបស់បុគ្គលម្នាក់។
Sentinel-2 ជាបេសកកម្មផ្កាយរណបសង្កេតផែនដីរបស់ទីភ្នាក់ងារអវកាសអឺរ៉ុប (ESA) ដែលផ្តល់រូបភាពអុបទិកពហុស្រទាប់ពន្លឺ មានកម្រិតភាពច្បាស់ខ្ពស់ (១០ ម៉ែត្រ) សម្រាប់បម្រើដល់ការតាមដានការប្រែប្រួលផ្ទៃដី រុក្ខជាតិ និងបរិស្ថាន។ ដូចជាកាមេរ៉ាឌីជីថលដ៏ធំមួយដែលហោះជុំវិញផែនដី ហើយថតរូបភាពយ៉ាងច្បាស់ពីផ្ទៃដីរៀងរាល់ប៉ុន្មានថ្ងៃម្តង ដើម្បីឲ្យយើងមើលឃើញការប្រែប្រួលរុក្ខជាតិនៅលើផែនដី។
Change Detection ជាដំណើរការនៃការកំណត់អត្តសញ្ញាណភាពខុសគ្នា ឬការប្រែប្រួលនៃស្ថានភាពវត្ថុ ឬតំបន់ណាមួយ ដោយសង្កេតមើលរូបភាពរណបនៅពេលវេលាខុសគ្នា (ឧទាហរណ៍ ឆ្នាំ ២០១៩ ប្រៀបធៀបនឹង ២០២៤ ក្នុងការសិក្សានេះ)។ ដូចជាការយកកូនរូបថត២សន្លឹកដែលថតនៅទីតាំងតែមួយ តែនៅឆ្នាំខុសគ្នា មកដាក់ទន្ទឹមគ្នាដើម្បីរកមើលថាតើមានដើមឈើណាខ្លះត្រូវបានកាប់ ឬមានផ្ទះថ្មីណាខ្លះត្រូវបានសាងសង់។
Confusion Matrix ជាតារាងម៉ាទ្រីសដែលប្រើសម្រាប់វាយតម្លៃកម្រិតភាពត្រឹមត្រូវនៃម៉ូដែលចំណាត់ថ្នាក់ (Classification Model) ដោយប្រៀបធៀបលទ្ធផលដែលម៉ូដែលបានទាយ ជាមួយនឹងទិន្នន័យពិតប្រាកដដែលបានកត់ត្រានៅលើទីតាំងផ្ទាល់ (Ground truth)។ ដូចជាតារាងកត់ត្រាពិន្ទុសិស្សប្រឡង ដោយផ្ទៀងផ្ទាត់ចម្លើយដែលសិស្សបានធ្វើ (លទ្ធផលម៉ូដែល) ជាមួយនឹងកូនសោរចម្លើយត្រឹមត្រូវ (ទិន្នន័យពិត) ដើម្បីដឹងថាសិស្សធ្វើត្រូវប៉ុន្មាននិងខុសប៉ុន្មាន។
Kappa Coefficient ជាសូចនាករស្ថិតិមួយប្រើសម្រាប់វាស់ស្ទង់កម្រិតភាពស៊ីចង្វាក់គ្នា (Agreement) រវាងការទស្សន៍ទាយរបស់ម៉ូដែល និងទិន្នន័យជាក់ស្តែង ដោយមានការកែតម្រូវកត្តាដែលម៉ូដែលទាយត្រូវដោយចៃដន្យ។ តម្លៃខិតជិត ១ បញ្ជាក់ពីភាពត្រឹមត្រូវកាន់តែខ្ពស់។ ដូចជារង្វាស់ដែលបញ្ជាក់ថាសិស្សប្រឡងជាប់ដោយសារតែគេចេះមេរៀនពិតប្រាកដ មិនមែនដោយសារតែការគូសចម្លើយត្រូវដោយចៃដន្យ (ទាយប្រថុយ) នោះទេ។
Machine Learning (ML) ជាផ្នែកមួយនៃបញ្ញាសិប្បនិម្មិត (AI) ដែលផ្តោតលើការបង្កើតម៉ូដែលគណិតវិទ្យា អនុញ្ញាតឱ្យកុំព្យូទ័ររៀនសូត្រពីទិន្នន័យ រកមើលលំនាំទិន្នន័យ និងធ្វើការសម្រេចចិត្ត ឬទស្សន៍ទាយដោយស្វ័យប្រវត្តិដោយមិនចាំបាច់សរសេរកូដប្រាប់គ្រប់ជំហានឡើយ។ ដូចជាការបង្រៀនកូនក្មេងឱ្យស្គាល់សត្វឆ្កែ ដោយបង្ហាញរូបភាពសត្វឆ្កែជាច្រើនសន្លឹកឱ្យគេមើល រហូតដល់គេអាចចំណាំ និងប្រាប់បានថាសត្វមួយណាជាសត្វឆ្កែដោយខ្លួនឯងនៅពេលក្រោយ។

៧. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖