Original Title: Mapping Buildings from Semi-Informal Settlements Using Non-Parametric Classifiers: A Case of Old Naledi
Source: doi.org/10.54203/jceu.2024.14
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការគូសផែនទីអគារពីលំនៅឋានក្រៅផ្លូវការពាក់កណ្តាលដោយប្រើប្រាស់ឧបករណ៍ចំណាត់ថ្នាក់មិនមែនប៉ារ៉ាម៉ែត្រ៖ ករណីសិក្សានៅ Old Naledi

ចំណងជើងដើម៖ Mapping Buildings from Semi-Informal Settlements Using Non-Parametric Classifiers: A Case of Old Naledi

អ្នកនិពន្ធ៖ Wame Mpoeleng (University of Botswana), Mooketsi Segobye (University of Botswana), Yashon Ouma (University of Botswana), Kealeboga Moreri (University of Botswana), Bagadzi M. Manisa (University of Botswana), Boipuso Nkwae (University of Botswana), Lopang Maphale (University of Botswana), Nyaladzani Nkhwanana (University of Botswana)

ឆ្នាំបោះពុម្ព៖ 2024, Journal of Civil Engineering and Urbanism

វិស័យសិក្សា៖ Remote Sensing and Urban Planning

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការគូសផែនទីប្លង់អគារនៅក្នុងតំបន់លំនៅឋានក្រៅផ្លូវការពាក់កណ្តាលមានការលំបាកយ៉ាងខ្លាំងដោយសារភាពខុសគ្នានៃលំហរៀបចំ ដែលធ្វើឱ្យប៉ះពាល់ដល់ការរៀបចំផែនការហេដ្ឋារចនាសម្ព័ន្ធ និងការផ្តល់សេវាសាធារណៈមូលដ្ឋាន។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានវាយតម្លៃក្បួនដោះស្រាយម៉ាស៊ីនរៀន (Machine Learning) ចំនួនបីប្រភេទ ដោយប្រើប្រាស់រូបភាពផ្កាយរណបកម្រិតច្បាស់ខ្ពស់រួមបញ្ចូលជាមួយទិន្នន័យវាយនភាព ដើម្បីទាញយកទិន្នន័យអគារ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Gaussian Mixture Model (GMM)
ម៉ូដែល Gaussian Mixture (GMM)
មានប្រសិទ្ធភាពខ្ពស់បំផុតក្នុងការទាញយកប្លង់អគារ និងគែមអគារបានច្បាស់លាស់ ដោយមិនចាំបាច់ប្រើទិន្នន័យវាយនភាព (GLCM textures)។ សមត្ថភាពថយចុះនៅពេលប្រើរួមបញ្ចូលជាមួយទិន្នន័យវាយនភាព ដែលអាចបណ្តាលឱ្យម៉ូដែលដំណើរការលើសកម្រិត (Overfit) ឬខ្វះកម្រិត (Underfit)។ ទទួលបានភាពត្រឹមត្រូវមធ្យម ៩២,៣៨% សម្រាប់ការរកឃើញអគារ ដែលជាលទ្ធផលខ្ពស់ជាងគេបំផុត។
Random Forest (RF)
ម៉ូដែល Random Forest (RF)
មានស្ថិរភាពល្អក្នុងការចាត់ថ្នាក់វត្ថុផ្សេងៗគ្នាទូទៅនៅលើរូបភាព និងទទួលបានអត្ថប្រយោជន៍ខ្ពស់នៅពេលប្រើជាមួយទិន្នន័យវាយនភាព។ មិនសូវមានប្រសិទ្ធភាពក្នុងការកំណត់ព្រំប្រទល់ ឬគែមរបស់អគារនីមួយៗនោះទេ ជាពិសេសនៅតំបន់ដែលមានអគារកកកុញ។ មានភាពត្រឹមត្រូវរួម (Overall Accuracy) ខ្ពស់ដល់ ៩៩,៩០% តែភាពត្រឹមត្រូវសម្រាប់ការទាញយកប្លង់អគារមានត្រឹមតែ ៧០,៥៣% ប៉ុណ្ណោះ។
Support Vector Machine (SVM)
ម៉ូដែល Support Vector Machine (SVM)
ស័ក្តិសមសម្រាប់សំណុំទិន្នន័យស្មុគស្មាញ និងមានប្រសិទ្ធភាពក្នុងការកំណត់គែមអគារបានល្អប្រសើរនៅពេលប្រើជាមួយទិន្នន័យវាយនភាព GLCM។ មានភាពត្រឹមត្រូវទាបជាងម៉ូដែល GMM ក្នុងការទាញយកអគារ ហើយចាំបាច់ត្រូវទាមទារការប្រើប្រាស់សន្ទស្សន៍វាយនភាពដើម្បីទទួលបានលទ្ធផលល្អ។ ទទួលបានភាពត្រឹមត្រូវមធ្យម ៧៩,២៦% សម្រាប់ការរកឃើញប្លង់អគារ។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះពឹងផ្អែកជាចម្បងលើទិន្នន័យរូបភាពផ្កាយរណបកម្រិតច្បាស់ខ្ពស់ដែលមានតម្លៃថ្លៃ និងទាមទារសមត្ថភាពកុំព្យូទ័រមធ្យមក្នុងការដំណើរការម៉ូដែល Machine Learning។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានអនុវត្តនៅក្នុងតំបន់ Old Naledi រដ្ឋធានី Gaborone ប្រទេស Botswana ដែលជាលំនៅឋានក្រៅផ្លូវការពាក់កណ្តាលមានផ្ទះតូចៗកកកុញ និងគ្មានសណ្តាប់ធ្នាប់រៀបរយ។ លក្ខណៈភូមិសាស្ត្រ និងសណ្ឋានអគារទាំងនេះមានភាពប្រហាក់ប្រហែលគ្នានឹងសហគមន៍ក្រីក្រ ឬការតាំងទីលំនៅក្រៅផ្លូវការមួយចំនួននៅក្នុងប្រទេសកម្ពុជា ដែលសបញ្ជាក់ថាម៉ូដែល GMM ពិតជាមានសក្តានុពលក្នុងការយកមកអនុវត្តក្នុងបរិបទប្រទេសយើង។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនៃការប្រើប្រាស់រូបភាពផ្កាយរណប និង Machine Learning នេះ មានសារៈសំខាន់ និងអាចយកមកអនុវត្តបានយ៉ាងល្អសម្រាប់ប្រទេសកម្ពុជា ក្នុងការអភិវឌ្ឍន៍ទីក្រុង និងការគ្រប់គ្រងហេដ្ឋារចនាសម្ព័ន្ធ។

ជារួម ការប្រើប្រាស់រូបភាពផ្កាយរណបកម្រិតច្បាស់ខ្ពស់រួមជាមួយក្បួនដោះស្រាយ GMM គឺជាដំណោះស្រាយទំនើបដែលចំណាយពេលវេលា និងថវិកាតិចជាងការចុះវាស់វែងផ្ទាល់ សម្រាប់ការធ្វើបច្ចុប្បន្នភាពទិន្នន័យនគរូបនីយកម្មនៅកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ស្វែងយល់ពីប្រភពទិន្នន័យរូបភាពផ្កាយរណប: និស្សិតគួរចាប់ផ្តើមរៀនទាញយករូបភាពផ្កាយរណបដោយប្រើប្រាស់ Google Earth Engine (GEE) ឬស្វែងរកទិន្នន័យឥតគិតថ្លៃកម្រិតច្បាស់មធ្យមពី Sentinel-2 និងការស្នើសុំទិន្នន័យសិក្សាពី PlanetScope ជាជាងការទិញទិន្នន័យថ្លៃៗភ្លាមៗ។
  2. សិក្សាអំពីការរៀបចំទិន្នន័យរូបភាពជាមុន (Pre-processing): អនុវត្តការបូកបញ្ចូលរូបភាពឱ្យច្បាស់ (Pan-sharpening) និងការគណនាសន្ទស្សន៍វាយនភាព GLCM ដោយប្រើប្រាស់កម្មវិធី QGISArcGIS Pro ដើម្បីត្រៀមទិន្នន័យសម្រាប់ម៉ូដែល។
  3. ការសរសេរកូដសម្រាប់ម៉ូដែល Machine Learning: ប្រើប្រាស់ភាសា Python ជាមួយបណ្ណាល័យ (Libraries) ស្តង់ដារដូចជា Scikit-learn និង Rasterio សម្រាប់សរសេរកូដបង្កើតម៉ូដែល GMM, Random Forest, និង SVM ដើម្បីធ្វើចំណាត់ថ្នាក់រូបភាពដោយស្វ័យប្រវត្តិ។
  4. ការអនុវត្តផ្ទាល់ និងការវាយតម្លៃលទ្ធផល: ជ្រើសរើសតំបន់លំនៅឋានណាមួយនៅជាយរាជធានីភ្នំពេញ (ឧទាហរណ៍៖ តំបន់ស្ទឹងមានជ័យ) សាកល្បងដំណើរការម៉ូដែលទាំងនេះ រួចធ្វើការវាយតម្លៃភាពត្រឹមត្រូវ (Accuracy Assessment) ដោយប្រើប្រាស់ Confusion Matrix ធៀបនឹងរូបភាពពី Google Earth។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Gaussian Mixture Model (GMM) ជាក្បួនដោះស្រាយម៉ាស៊ីនរៀនដោយគ្មានការត្រួតពិនិត្យ (Unsupervised Machine Learning) ដែលធ្វើការបែងចែកទិន្នន័យជាក្រុមៗ (Clusters) ដោយស្វ័យប្រវត្តិ ដោយផ្អែកលើការចែកចាយស្ថិតិបែប Gaussian នៃកម្រិតពណ៌ឬវាយនភាពក្នុងរូបភាព។ ដូចជាការបែងចែកសិស្សក្នុងថ្នាក់ជាក្រុមៗដោយស្វ័យប្រវត្តិ ដោយផ្អែកលើកម្ពស់ និងទម្ងន់របស់ពួកគេ ដោយមិនចាំបាច់មានគ្រូប្រាប់មុនថានរណានៅក្រុមណានោះទេ។
Gray-Level Co-Occurrence Matrix (GLCM) ជាវិធីសាស្ត្រគណិតវិទ្យាសម្រាប់វិភាគ "វាយនភាព" (Texture) នៃរូបភាពផ្កាយរណប ដោយវាស់ស្ទង់ថាតើភីកសែល (Pixels) ដែលមានកម្រិតពណ៌ប្រផេះដូចគ្នាច្រើនតែកើតមាននៅក្បែរគ្នាក្នុងទម្រង់បែបណា ដើម្បីសម្គាល់វត្ថុផ្សេងៗគ្នា។ ដូចជាការស្ទាបក្រណាត់ពីរប្រភេទដោយបិទភ្នែក ដើម្បីដឹងថាវារលោង ឬគ្រើម ដោយមិនបាច់ពឹងផ្អែកលើការមើលពណ៌របស់វានោះទេ។
Pan-sharpening ជាបច្ចេកទេសបូកបញ្ចូលគ្នារវាងរូបភាពសខ្មៅដែលមានកម្រិតច្បាស់ខ្ពស់ (Panchromatic) និងរូបភាពពណ៌ដែលមានកម្រិតច្បាស់ទាប (Multispectral) ដើម្បីបង្កើតជារូបភាពពណ៌ថ្មីមួយដែលមានភាពច្បាស់លាស់ខ្លាំងក្នុងការទាញយកប្លង់អគារ។ ដូចជាការយកគំនូរព្រាងខ្មៅដៃដែលគូសបានលម្អិតច្បាស់ មកផាត់ពណ៌ពីលើរូបភាពដែលព្រិលៗ ដើម្បីទទួលបានគំនូរពណ៌ថ្មីមួយដែលច្បាស់និងលម្អិត។
Random Forest (RF) ជាក្បួនដោះស្រាយម៉ាស៊ីនរៀនដែលបង្កើត "ដើមឈើសម្រេចចិត្ត" (Decision Trees) តូចៗជាច្រើន ហើយយកលទ្ធផលទស្សន៍ទាយពីដើមឈើទាំងអស់នោះមកបោះឆ្នោតជ្រើសរើសចម្លើយរួមមួយដែលត្រឹមត្រូវបំផុត ដើម្បីចាត់ថ្នាក់វត្ថុក្នុងរូបភាព។ ដូចជាការសួរមតិពីអ្នកជំនាញចំនួន ១០០ នាក់ អំពីបញ្ហាមួយ រួចយកចម្លើយដែលអ្នកជំនាញភាគច្រើនយល់ស្របគ្នាធ្វើជាសេចក្តីសន្និដ្ឋានចុងក្រោយ។
Support Vector Machine (SVM) ជាម៉ូដែលម៉ាស៊ីនរៀនដែលព្យាយាមស្វែងរកបន្ទាត់ ឬប្លង់ (Hyperplane) ដ៏ល្អបំផុតមួយ ដើម្បីខណ្ឌចែកចំណាត់ថ្នាក់ទិន្នន័យ (ឧទាហរណ៍៖ អគារ និង មិនមែនអគារ) ជាពីរក្រុមដាច់ពីគ្នាបានច្បាស់លាស់បំផុត។ ដូចជាការគូសបន្ទាត់មួយនៅលើតុដើម្បីបំបែកក្រុមផ្លែប៉ោម និងក្រុមផ្លែក្រូច ឱ្យនៅឆ្ងាយពីគ្នាឲ្យបានច្រើនបំផុតតាមដែលអាចធ្វើទៅបាន ដើម្បីកុំឱ្យច្រឡំគ្នា។
Multispectral Image (MSI) ជារូបភាពផ្កាយរណបដែលថតយកទិន្នន័យចំណាំងផ្លាតពន្លឺតាមប្រេកង់រលកផ្សេងៗគ្នា (ដូចជាពណ៌ក្រហម បៃតង ខៀវ និងពន្លឺអ៊ីនហ្វ្រារ៉េដ) ដែលជួយឲ្យម៉ាស៊ីនកុំព្យូទ័រអាចបែងចែកប្រភេទវត្ថុនៅលើដីបានកាន់តែច្បាស់។ ដូចជាការប្រើវ៉ែនតាវេទមន្តដែលអាចឲ្យយើងមើលឃើញរលកកម្ដៅ ឬប្រភេទរុក្ខជាតិ ដែលភ្នែកធម្មតាមនុស្សយើងមិនអាចមើលឃើញ។
Semi-Informal Settlements ជាតំបន់លំនៅឋានដែលសាងសង់ដោយមិនមានការរៀបចំផែនការទីក្រុងត្រឹមត្រូវ សំណង់កកកុញ និងខ្វះខាតហេដ្ឋារចនាសម្ព័ន្ធសាធារណៈមូលដ្ឋាន ប៉ុន្តែមិនមែនជាការតាំងទីលំនៅអនាធិបតេយ្យទាំងស្រុងនោះទេ។ ដូចជាភូមិ ឬសហគមន៍ដែលប្រជាជនសង់ផ្ទះតាមចិត្តដោយគ្មានប្លង់និងផ្លូវខ្វាត់ខ្វែង ប៉ុន្តែពួកគេរស់នៅទីនោះយូរមកហើយនិងមានផ្ទះសំបែងរឹងមាំគួរសម។
WorldView-2 (WV2) ជាផ្កាយរណបពាណិជ្ជកម្មសម្រាប់សង្កេតមើលផែនដីដែលផ្តល់រូបភាពក្នុងកម្រិតច្បាស់ខ្ពស់បំផុត (Resolution 0.46m សម្រាប់រូបភាពសខ្មៅ) ដែលអាចឱ្យគេកំណត់ទីតាំង និងគែមអគារតូចៗបានយ៉ាងច្បាស់។ ដូចជាកែវយឺតដ៏មានអានុភាពខ្លាំងបំពាក់លើលំហអាកាស ដែលអាចចាប់យករូបភាពដំបូលផ្ទះរបស់អ្នកពីលើមេឃបានយ៉ាងច្បាស់កម្រិត HD។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖