Original Title: Disease diagnosis in banana leaves: a review on AI powered techniques
Source: doi.org/10.7717/peerj-cs.3310
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការធ្វើរោគវិនិច្ឆ័យជំងឺលើស្លឹកចេក៖ ការពិនិត្យឡើងវិញលើបច្ចេកទេសដែលប្រើប្រាស់បញ្ញាសិប្បនិម្មិត (AI)

ចំណងជើងដើម៖ Disease diagnosis in banana leaves: a review on AI powered techniques

អ្នកនិពន្ធ៖ Priyadarshini R. (School of Computer Science and Engineering, Vellore Institute of Technology, Chennai, Tamilnadu, India), Vinothini A. (School of Computer Science and Engineering, Vellore Institute of Technology, Chennai, Tamilnadu, India)

ឆ្នាំបោះពុម្ព៖ 2025 PeerJ Computer Science

វិស័យសិក្សា៖ Computer Science, Artificial Intelligence in Agriculture

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ជំងឺស្លឹកចេកបង្កការគំរាមកំហែងយ៉ាងធ្ងន់ធ្ងរដល់ផលិតភាពកសិកម្ម និងសន្តិសុខស្បៀង ខណៈការតាមដានរកមើលជំងឺដោយផ្ទាល់ដៃលើចម្ការធំៗចំណាយពេលយូរ និងគ្មានប្រសិទ្ធភាពខ្ពស់។ ឯកសារនេះដោះស្រាយតម្រូវការក្នុងការប្រើប្រាស់ដំណោះស្រាយដោយបញ្ញាសិប្បនិម្មិត (AI) ដើម្បីរកមើល និងចាត់ថ្នាក់ជំងឺទាំងនេះដោយស្វ័យប្រវត្តិ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះអនុវត្តការពិនិត្យឡើងវិញជាប្រព័ន្ធទៅលើឯកសារស្រាវជ្រាវ (Systematic Literature Review) ដោយផ្អែកលើគោលការណ៍ PRISMA ដើម្បីជ្រើសរើស និងវិភាគអត្ថបទចំនួន ១៣៤ ពីមូលដ្ឋានទិន្នន័យ (Databases) ដូចជា Scopus និង IEEE ចន្លោះឆ្នាំ ២០១៩ ដល់ ២០២៥។

ការកែច្នៃរូបភាព (Image Processing) សម្រាប់ការកែលម្អគុណភាពរូបភាព ទាញយកលក្ខណៈពិសេស និងកាត់បំបែកផ្នែកជំងឺ (Segmentation)
វិធីសាស្ត្ររៀនដោយម៉ាស៊ីន (Machine Learning) ដូចជា SVM, KNN និង Random Forest សម្រាប់ការចាត់ថ្នាក់ជំងឺ
វិធីសាស្ត្ររៀនស៊ីជម្រៅ (Deep Learning) និងបណ្ដាញប្រសៃប្រសាទ (CNNs) ដូចជា ResNet, VGG, MobileNet សម្រាប់ការវិភាគស្មុគស្មាញ
ការផ្ទេរចំណេះដឹង (Transfer Learning) សម្រាប់បង្កើនភាពត្រឹមត្រូវនៃម៉ូដែលនៅពេលទិន្នន័យហ្វឹកហាត់មានកំណត់
ការប្រមូលទិន្នន័យដោយប្រើប្រាស់ឧបករណ៍ផ្សេងៗ (Data Acquisition Devices) រួមមាន កាមេរ៉ាស្មាតហ្វូន ដ្រូន (UAVs) និងកាមេរ៉ាពហុស្រទាប់ (Multispectral Cameras)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ម៉ូដែលការរៀនស៊ីជម្រៅ (Deep Learning) ជាពិសេសបណ្ដាញ CNNs មានប្រសិទ្ធភាពខ្ពស់ជាងវិធីសាស្ត្រប្រពៃណី ដោយជារឿយៗសម្រេចបានភាពត្រឹមត្រូវ (Accuracy) ច្រើនជាង ៩០% ទោះក្នុងស្ថានភាពរូបភាពស្មុគស្មាញក៏ដោយ។
ការប្រើប្រាស់ម៉ូដែលធុនស្រាល (Lightweight Models) លើឧបករណ៍ចល័តដូចជាស្មាតហ្វូន បង្ហាញពីសក្ដានុពលខ្ពស់សម្រាប់ការធ្វើរោគវិនិច្ឆ័យទាន់ពេលវេលា (Real-time Diagnosis) នៅក្នុងកសិដ្ឋានដោយផ្ទាល់។
បញ្ហាប្រឈមធំៗសម្រាប់អនុវត្តជាក់ស្តែងនៅតែមាន ដូចជាកង្វះកម្រងទិន្នន័យ (Datasets) ដែលមានជំងឺចម្រុះលើស្លឹកតែមួយ ការប្រើប្រាស់ AI ដែលអាចបកស្រាយបាន (Explainable AI) នៅមានកម្រិត និងបញ្ហាការធ្លាក់ចុះភាពត្រឹមត្រូវនៅពេលយកទៅប្រើប្រាស់ក្នុងបរិស្ថានកសិដ្ឋានពិតប្រាកដ។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Image Processing (IP) ការកែច្នៃរូបភាព (Image Processing)	ងាយស្រួលអនុវត្ត និងមិនទាមទារថាមពលកុំព្យូទ័រខ្ពស់។ ល្អសម្រាប់ការកែលម្អរូបភាពបឋម (Preprocessing) និងកាត់បំបែកផ្ទៃដែលមានជំងឺ (Segmentation)។	ពឹងផ្អែកខ្លាំងលើការទាញយកលក្ខណៈពិសេសដោយផ្ទាល់ដៃ (Manual feature extraction) និងធ្លាក់ចុះភាពត្រឹមត្រូវនៅពេលរូបភាពមានផ្ទៃខាងក្រោយស្មុគស្មាញ ឬពន្លឺមិនល្អ។	អាចសម្រេចបានភាពត្រឹមត្រូវចន្លោះពី ៨០% ទៅ ៩៧% ប៉ុន្តែភាគច្រើនស្ថិតក្នុងបរិស្ថានដែលត្រូវបានគ្រប់គ្រងពន្លឺ និងផ្ទៃខាងក្រោយបានល្អប៉ុណ្ណោះ។
Traditional Machine Learning (SVM, KNN, RF) ការរៀនដោយម៉ាស៊ីនប្រពៃណី (SVM, KNN, Random Forest)	មានប្រសិទ្ធភាពខ្ពស់សម្រាប់ទិន្នន័យដែលមានទំហំតូចទៅមធ្យម និងប្រើប្រាស់ពេលវេលាហ្វឹកហាត់ (Training time) តិចជាងម៉ូដែល Deep Learning។	ត្រូវការសក្ដានុពលក្នុងការរៀបចំទិន្នន័យខ្ពស់ ហើយភាពត្រឹមត្រូវធ្លាក់ចុះនៅពេលទិន្នន័យមានទំហំធំ និងមានភាពស្មុគស្មាញខ្លាំងនៅលើរូបភាពពិត។	ម៉ូដែល SVM និង KNN ជាទូទៅផ្តល់នូវភាពត្រឹមត្រូវចន្លោះពី ៧៦% ទៅ ៩៦% ដោយផ្អែកលើគុណភាពនៃការទាញយកលក្ខណៈពិសេស (Feature extraction)។
Deep Learning (CNNs, ResNet, MobileNet) ការរៀនស៊ីជម្រៅ (Deep Learning - បណ្ដាញ CNNs)	អាចរៀនពីលក្ខណៈពិសេសនៃរូបភាពដោយស្វ័យប្រវត្តិ (Automatic feature extraction) និងមានភាពធន់ខ្ពស់ទៅនឹងការប្រែប្រួលនៃពន្លឺ ឬទម្រង់ស្លឹកសក្ដានុពល។ ម៉ូដែលធុនស្រាល (Lightweight) អាចដើរលើទូរស័ព្ទដៃបាន។	ទាមទារទិន្នន័យរូបភាពចំនួនច្រើនសន្ធឹកសន្ធាប់ និងថាមពលកុំព្យូទ័រខ្លាំង (GPUs) សម្រាប់ហ្វឹកហាត់។ វាមានលក្ខណៈជា "ប្រអប់ខ្មៅ" (Black box) ដែលពិបាកបកស្រាយមូលហេតុនៃការសម្រេចចិត្ត។	ជាវិធីសាស្ត្រដែលជោគជ័យបំផុត ដោយជារឿយៗផ្តល់ភាពត្រឹមត្រូវលើសពី ៩៥% រហូតដល់ ៩៩% ក្នុងការចាត់ថ្នាក់ជំងឺផ្សេងៗ។

ការចំណាយលើធនធាន (Resource Cost)៖ ទោះបីជាឯកសារមិនបានបញ្ជាក់លម្អិតពីតម្លៃជាទឹកប្រាក់ក៏ដោយ ការអនុវត្តប្រព័ន្ធទាំងនេះទាមទារការវិនិយោគលើឧបករណ៍ប្រមូលទិន្នន័យ និងកម្លាំងម៉ាស៊ីនសម្រាប់ហ្វឹកហាត់ម៉ូដែល AI។

Hardware (Data Collection): ស្មាតហ្វូនធម្មតា (ឧ. Samsung SMA715F) និងកាមេរ៉ាឌីជីថល (Canon EOS) សម្រាប់ការថតរូបពីចម្ការផ្ទាល់។ សម្រាប់ចម្ការធំៗ ត្រូវការដ្រូន (UAVs ដូចជា DJI Phantom 4) និងកាមេរ៉ាពហុស្រទាប់ (Multispectral Cameras ដូចជា MicaSense RedEdge)។
Hardware (Computing): ម៉ាស៊ីនកុំព្យូទ័រដែលមានអង្គគណនាវីដេអូកម្រិតខ្ពស់ (GPUs) គឺចាំបាច់សម្រាប់ការហ្វឹកហាត់ម៉ូដែល Deep Learning ស្មុគស្មាញ (ResNet, VGG)។ ចំពោះការប្រើប្រាស់ជាក់ស្តែង (Inference) ទូរស័ព្ទ Android ធម្មតាគឺគ្រប់គ្រាន់សម្រាប់ Lightweight Models។
Software & Frameworks: ការប្រើប្រាស់ភាសាសរសេរកូដ និងបណ្ណាល័យកូដដូចជា Python, MATLAB, OpenCV សម្រាប់ Image Processing ព្រមទាំងប្រព័ន្ធ DL frameworks (ដូចជា PyTorch ឬ TensorFlow)។
Datasets: ទាមទារសំណុំទិន្នន័យរូបភាពដែលមានការបិទស្លាកច្បាស់លាស់ (Annotated Images) ចាប់ពីខ្ទង់រយរហូតដល់រាប់ម៉ឺនសន្លឹក (ឧ. Kaggle, PlantVillage) ដើម្បីឱ្យម៉ូដែលរៀនបានត្រឹមត្រូវ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សាភាគច្រើនត្រូវបានធ្វើឡើងដោយប្រើប្រាស់ទិន្នន័យមកពីប្រទេសឥណ្ឌា ចិន បង់ក្លាដែស និងបណ្តាប្រទេសនៅអាហ្វ្រិក (ឧ. តង់ហ្សានី) ដោយខ្វះខាតទិន្នន័យចម្រុះពីតំបន់អាស៊ីអាគ្នេយ៍ផ្សេងទៀត។ ចំណុចនេះមានសារៈសំខាន់សម្រាប់ប្រទេសកម្ពុជា ព្រោះពូជចេកក្នុងស្រុក (ឧ. ចេកណាំវ៉ា ចេកអំបូង) និងលក្ខខណ្ឌអាកាសធាតុអាចធ្វើឱ្យរោគសញ្ញាជំងឺមានភាពខុសប្លែកគ្នា ដែលអាចបណ្តាលឱ្យម៉ូដែលបរទេសទាំងនេះធ្លាក់ចុះភាពត្រឹមត្រូវនៅពេលយកមកអនុវត្តផ្ទាល់នៅកម្ពុជា។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកទេស AI ដែលបានលើកឡើងនៅក្នុងឯកសារនេះ មានសក្តានុពលខ្ពស់ណាស់ក្នុងការជួយលើកស្ទួយវិស័យកសិកម្មនៅកម្ពុជា ជាពិសេសក្នុងការដោះស្រាយបញ្ហាជំងឺរុក្ខជាតិទាន់ពេលវេលា។

Smallholder Farmers in Rural Provinces (កសិករខ្នាតតូចនៅតាមបណ្តាខេត្ត): ការអភិវឌ្ឍកម្មវិធីទូរស័ព្ទឆ្លាតវៃដំណើរការដោយ Offline (ប្រើ Lightweight CNNs ដូចជា MobileNet) អាចអនុញ្ញាតឱ្យកសិករនៅខេត្តកំពង់ចាម ឬបាត់ដំបង ថតរូបស្លឹកចេក និងដឹងពីរោគវិនិច្ឆ័យជំងឺ (ឧ. ជំងឺ Sigatoka) ភ្លាមៗដោយមិនចាំបាច់មានសេវាអ៊ីនធឺណិត។
Commercial Banana Plantations (ចម្ការចេកឧស្សាហកម្មខ្នាតធំ): ក្រុមហ៊ុនកសិកម្មធំៗនៅកម្ពុជា អាចប្រើប្រាស់ដ្រូន (UAVs) បំពាក់កាមេរ៉ា Multispectral ហោះស្កេនពីលើចម្ការរាប់រយហិកតា ដើម្បីរកមើលតំបន់ឆ្លងជំងឺដំបូង (Early detection of Fusarium wilt) ជួយសន្សំសំចៃការប្រើប្រាស់ថ្នាំសម្លាប់សត្វល្អិត និងកាត់បន្ថយការខាតបង់។
Agricultural Research Institutions (ស្ថាប័នស្រាវជ្រាវកសិកម្ម): សាកលវិទ្យាល័យភូមិន្ទកសិកម្ម (RUA) ឬវិទ្យាស្ថានស្រាវជ្រាវនានា អាចចាប់ផ្តើមប្រមូលចងក្រងសំណុំទិន្នន័យ (Dataset) រូបភាពជំងឺស្លឹកចេកពិតប្រាកដរបស់កម្ពុជា ដើម្បីធ្វើការហ្វឹកហាត់ម៉ូដែល AI ដែលមានភាពជាក់លាក់ខ្ពស់សម្រាប់បរិបទក្នុងស្រុក។

ការរួមបញ្ចូលគ្នារវាងម៉ូដែល AI ធុនស្រាលលើទូរស័ព្ទដៃ និងការប្រើប្រាស់ដ្រូនតាមចម្ការខ្នាតធំ នឹងក្លាយជាដំណោះស្រាយដ៏មុតស្រួចមួយដើម្បីធានាសន្តិសុខស្បៀង និងប្រាក់ចំណូលជូនកសិករកម្ពុជាពីការគំរាមកំហែងនៃជំងឺរុក្ខជាតិ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះនៃ Computer Vision និងឧបករណ៍ AI: ចាប់ផ្តើមដោយការរៀនភាសា Python និងបណ្ណាល័យសំខាន់ៗដូចជា OpenCV សម្រាប់ការកែច្នៃរូបភាព (Image Processing) ព្រមទាំងស្វែងយល់ពីមូលដ្ឋាននៃការបង្កើតម៉ូដែល AI តាមរយៈ TensorFlow ឬ PyTorch។
អនុវត្តលើសំណុំទិន្នន័យបើកទូលាយ (Public Datasets): ទាញយកទិន្នន័យរូបភាពស្លឹកចេកដែលមានស្រាប់ពីប្រភពដូចជា Kaggle ឬ PlantVillage dataset យកមកធ្វើការសាកល្បងហ្វឹកហាត់។ សាកល្បងប្រើវិធីសាស្ត្រ Transfer Learning ជាមួយម៉ូដែលដូចជា ResNet50 ឬ MobileNetV2 ដើម្បីយល់ពីដំណើរការនៃការស្គាល់ជំងឺ (Classification)។
ប្រមូល និងរៀបចំទិន្នន័យសម្រាប់បរិបទកម្ពុជា (Local Data Collection): ចុះទៅចម្ការចេកផ្ទាល់ដើម្បីថតរូបជំងឺស្លឹកចេកក្នុងស្រុកដោយប្រើប្រាស់កាមេរ៉ាស្មាតហ្វូនក្នុងលក្ខខណ្ឌពន្លឺផ្សេងៗគ្នា។ បន្ទាប់មក ប្រើប្រាស់ឧបករណ៍ដូចជា LabelImg ឬ Roboflow ដើម្បីបិទស្លាក (Annotate) រូបភាពទាំងនោះដោយបែងចែកប្រភេទជំងឺឱ្យបានច្បាស់លាស់។
ហ្វឹកហាត់ម៉ូដែលធុនស្រាល (Train Lightweight Models): ដោយសារកសិករភាគច្រើនប្រើប្រាស់ទូរស័ព្ទកម្រិតមធ្យម គប្បីហ្វឹកហាត់ម៉ូដែលដែលស៊ីទំហំតូច និងដើរលឿនដូចជា YOLOv8 (សម្រាប់ Object Detection) ឬ MobileNet/SqueezeNet ដោយរួមបញ្ចូលទិន្នន័យក្នុងស្រុកដែលទើបប្រមូលបានដើម្បីបង្កើនភាពត្រឹមត្រូវ។
អភិវឌ្ឍន៍កម្មវិធីទូរស័ព្ទសម្រាប់ប្រើប្រាស់ផ្ទាល់ (Mobile App Deployment): បំប្លែងម៉ូដែល AI ទៅជាទម្រង់ TFLite (TensorFlow Lite) រួចប្រើប្រាស់កម្មវិធី Android Studio ដើម្បីសរសេរបង្កើតកម្មវិធីទូរស័ព្ទដៃដែលអនុញ្ញាតឱ្យកសិករអាចថតរូបស្លឹកចេក និងទទួលបានលទ្ធផលរោគវិនិច្ឆ័យដោយមិនបាច់ប្រើអ៊ីនធឺណិត (Offline Inference)។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Convolutional Neural Network (CNN)	វាជាបណ្ដាញប្រសៃប្រសាទសិប្បនិម្មិតមួយប្រភេទដែលត្រូវបានរចនាឡើងជាពិសេសសម្រាប់វិភាគទិន្នន័យជារូបភាព។ វាយកផ្ទាំងរូបភាពមកច្រោះកាត់ស្រទាប់តម្រងជាច្រើន ដើម្បីរៀនចំណាំទម្រង់ ពណ៌ និងស្នាមអុចៗនៃជំងឺនៅលើស្លឹកចេកដោយស្វ័យប្រវត្តិ។	វាប្រៀបដូចជាកែវយឹតពង្រីកដែលសម្លឹងមើលពីរូបភាពធំ រួចពង្រីកមើលចំណុចតូចៗម្តងមួយៗ ដើម្បីរកមើលសញ្ញាសម្គាល់ជាក់លាក់ណាមួយដោយមិនរំលង។
Transfer Learning	វាជាបច្ចេកទេសដែលយកម៉ូដែល AI មួយដែលធ្លាប់បានហ្វឹកហាត់លើរូបភាពទូទៅរាប់លានសន្លឹករួចហើយ (មានចំណេះដឹងស្រាប់) យកមកបង្វឹកបន្តបន្តិចបន្តួចបន្ថែមទៀតលើរូបភាពជំងឺស្លឹកចេក ដើម្បីចំណេញពេល និងដំណើរការបានល្អទោះមានទិន្នន័យតិចក៏ដោយ។	វាដូចជាការយកចុងភៅដែលចេះធ្វើម្ហូបអឺរ៉ុបរួចហើយ មកបង្រៀនបន្ថែមពីរបៀបស្លម្ជូរគ្រឿងខ្មែរ ដែលវាលឿនជាងការបង្រៀនអ្នកដែលមិនចេះកាន់កាំបិតសោះ។
Image segmentation	គឺជាដំណើរការនៃការកាត់បំបែក ឬញែករូបភាពមួយទៅជាផ្នែកតូចៗជាច្រើន ដើម្បីទាញយកតែផ្នែកដែលសំខាន់។ ក្នុងកសិកម្ម វាជួយញែកផ្ទៃស្លឹកចេកដែលមានរោគសញ្ញាជំងឺ ចេញពីផ្ទៃស្លឹកដែលល្អ និងផ្ទៃខាងក្រោយ។	វាប្រៀបដូចជាការប្រើកន្ត្រៃកាត់យកតែរូបភាពមនុស្សចេញពីទស្សនាវដ្តី ដោយបោះចោលផ្ទៃទេសភាពខាងក្រោយចោល។
Explainable AI (XAI)	ជាបច្ចេកទេសដែលជួយបកស្រាយពីមូលហេតុ ឬរបៀបដែលម៉ូដែល AI មួយឈានដល់ការសម្រេចចិត្តរបស់វា។ ឧទាហរណ៍ វាបង្កើតជាផែនទីកម្តៅ (Heatmap) ដើម្បីបង្ហាញថា AI កំពុងសម្លឹងមើលចំណុចណាខ្លះលើស្លឹកចេក ទើបវាទាយថាជាជំងឺ Sigatoka។	វាដូចជាគ្រូបង្រៀនគណិតវិទ្យាដែលតម្រូវឱ្យសិស្សសរសេរលម្អិតពីរបៀបដោះស្រាយលំហាត់ មិនមែនគ្រាន់តែទារចម្លើយចុងក្រោយនោះទេ។
Data augmentation	ជាវិធីសាស្ត្រក្នុងការបង្កើតទិន្នន័យថ្មីៗបន្ថែមពីទិន្នន័យចាស់ដែលមានស្រាប់ តាមរយៈការកែច្នៃរូបភាពចាស់ៗដូចជា បង្វិល ត្រឡប់ បង្រួម ពង្រីក ឬកែពន្លឺ ដើម្បីធ្វើឱ្យម៉ូដែល AI រៀនបានកាន់តែឆ្លាត និងមិនងាយភាន់ច្រឡំ។	វាដូចជាការឱ្យសិស្សមើលវត្ថុមួយពីមុំ និងពន្លឺខុសៗគ្នា ដើម្បីឱ្យសិស្សនោះនៅតែអាចចំណាំវត្ថុនោះបាន ទោះជាស្ថិតក្នុងស្ថានភាពបែបណាក៏ដោយ។
Hyperspectral imaging	ជាបច្ចេកវិទ្យាថតរូបដែលអាចចាប់យកព័ត៌មានពន្លឺបានរាប់រយស្រទាប់ពណ៌ ដែលភ្នែកមនុស្សមិនអាចមើលឃើញ។ វាត្រូវបានប្រើដើម្បីតាមដានការផ្លាស់ប្តូរជីវគីមីនៅក្នុងស្លឹកចេក ដែលអនុញ្ញាតឱ្យយើងដឹងថាវាមានជំងឺមុនពេលមានរោគសញ្ញាលេចចេញមកក្រៅ។	វាដូចជាការពាក់វ៉ែនតាវេទមន្តដែលអាចមើលធ្លុះដល់ស្បែក ដើម្បីឃើញពីចរន្តឈាមខាងក្នុង មុនពេលដែលស្បែកនោះឡើងជាំក្រហម។
Federated Learning	វាជាប្រព័ន្ធហ្វឹកហាត់ AI ដែលអនុញ្ញាតឱ្យឧបករណ៍ ឬកុំព្យូទ័រនៅតាមតំបន់ផ្សេងៗគ្នារៀនពីទិន្នន័យរបស់ពួកគេរៀងៗខ្លួន រួចបញ្ជូនតែ 'ចំណេះដឹង' ទៅកាន់កុំព្យូទ័រកណ្តាល ដោយមិនចាំបាច់បញ្ជូនទិន្នន័យរូបភាពឯកជននោះទេ។	វាដូចជាសិស្សនៅតាមសាលាផ្សេងៗគ្នារៀនពីសៀវភៅរៀងៗខ្លួន រួចផ្ញើតែសេចក្តីសង្ខេបមេរៀនទៅឱ្យប្រធានថ្នាក់ ជំនួសឱ្យការយកសៀវភៅទាំងអស់ទៅគរទុកនៅកន្លែងតែមួយ។
Feature extraction	គឺជាដំណើរការនៃការទាញយកព័ត៌មានដែលសំខាន់ៗ និងមានលក្ខណៈពិសេសពីរូបភាពដើម (ដូចជា ពណ៌ វាយនភាព ឬទម្រង់គែម) ដើម្បីបំប្លែងទៅជាទិន្នន័យលេខ ដែលម៉ាស៊ីនងាយស្រួលនឹងយល់ និងធ្វើការចាត់ថ្នាក់បាន។	វាប្រៀបដូចជាការពណ៌នាភិនភាគរបស់ចោរប្រាប់ប៉ូលិស ដោយប្រាប់តែចំណុចសំខាន់ៗដូចជា កម្ពស់ខ្ពស់ សក់រួញ និងមានប្រជ្រុយ ជាជាងរៀបរាប់គ្រប់ចំណុចទាំងអស់នៅលើខ្លួន។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖