Original Title: Leveraging Zero-Shot Learning for Real-Time Decision Making in IoT Applications
Source: www.researchgate.net
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការប្រើប្រាស់ការរៀនដោយគ្មានគំរូ (Zero-Shot Learning) សម្រាប់ការសម្រេចចិត្តក្នុងពេលវេលាជាក់ស្តែងនៅក្នុងកម្មវិធី IoT

ចំណងជើងដើម៖ Leveraging Zero-Shot Learning for Real-Time Decision Making in IoT Applications

អ្នកនិពន្ធ៖ Mia Cate

ឆ្នាំបោះពុម្ព៖ March, 2023

វិស័យសិក្សា៖ Machine Learning

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហាប្រឈមនៃម៉ូដែល Machine Learning ប្រពៃណីនៅក្នុងប្រព័ន្ធអ៊ីនធឺណិតនៃវត្ថុ (IoT) ដែលទាមទារទិន្នន័យមានស្លាក (Labeled Data) ច្រើន និងការបណ្តុះបណ្តាលឡើងវិញញឹកញាប់សម្រាប់ការសម្រេចចិត្តក្នុងពេលវេលាជាក់ស្តែង។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះរៀបរាប់ពីការប្រើប្រាស់វិធីសាស្ត្ររៀនដោយគ្មានគំរូ (Zero-Shot Learning) ដើម្បីជម្នះដែនកំណត់របស់ AI ប្រពៃណីនៅក្នុងបរិស្ថាន IoT ។

ការបង្កប់អត្ថន័យន័យវិទ្យា (Semantic Embeddings)
ការរៀនផ្អែកលើគុណលក្ខណៈ (Attribute-Based Learning)
ការផ្ទេរចំណេះដឹង (Knowledge Transfer)
ការទទួលស្គាល់ក្នុងពិភពបើកចំហ (Open-World Recognition)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ZSL កាត់បន្ថយការពឹងផ្អែកយ៉ាងខ្លាំងលើទិន្នន័យដែលបានដាក់ស្លាក (Labeled Data) និងពន្លឿនការសម្រេចចិត្តក្នុងពេលវេលាជាក់ស្តែងនៅក្នុងបរិស្ថាន IoT ដែលផ្លាស់ប្តូរលឿន។
ការអនុវត្ត ZSL នៅក្នុងទីក្រុងឆ្លាតវៃ (Smart Cities) អាចជួយឧបករណ៍ IoT ព្យាករណ៍ការកកស្ទះចរាចរណ៍ និងបង្កើនប្រសិទ្ធភាពថាមពលដោយមិនចាំបាច់បណ្តុះបណ្តាលម៉ូដែលជាមុនលើទិន្នន័យថ្មី។
នៅក្នុងស្វ័យប្រវត្តិកម្មឧស្សាហកម្ម ZSL អនុញ្ញាតឱ្យមានការរកឃើញភាពមិនប្រក្រតីនិងធ្វើការថែទាំទុកជាមុន (Predictive Maintenance) ទោះបីជាប្រព័ន្ធមិនធ្លាប់ជួបប្រទះការខូចខាតឧបករណ៍ជាក់លាក់នោះពីមុនមកក៏ដោយ។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Supervised Learning ការរៀនដោយមានការត្រួតពិនិត្យ	មានភាពត្រឹមត្រូវខ្ពស់នៅពេលទិន្នន័យសាកល្បងស្ថិតក្នុងចំណាត់ថ្នាក់ដែលបានបណ្តុះបណ្តាលរួច។	ទាមទារទិន្នន័យដែលមានស្លាក (Labeled data) យ៉ាងច្រើន និងតម្រូវឱ្យមានការបណ្តុះបណ្តាលឡើងវិញរាល់ពេលមានប្រភេទកំណត់ត្រាថ្មី ដែលធ្វើឱ្យមានភាពយឺតយ៉ាវ។	ចំណាត់ថ្នាក់រូបភាព (ឧទាហរណ៍៖ ការបែងចែករវាងឆ្មា និង ឆ្កែ) ប៉ុន្តែមានកម្រិតត្រឹមតែថ្នាក់ដែលបានបណ្តុះបណ្តាល។
Unsupervised Learning ការរៀនដោយគ្មានការត្រួតពិនិត្យ	អាចប្រើប្រាស់ទិន្នន័យដែលគ្មានស្លាក (Unlabeled data) ដើម្បីស្វែងរកលំនាំ និងធ្វើចំណាត់កម្រិតទិន្នន័យទៅជាក្រុម (Clusters)។	មិនមានសមត្ថភាពក្នុងការធ្វើចំណាត់ថ្នាក់ទិន្នន័យដោយផ្ទាល់ និងច្បាស់លាស់សម្រាប់ប្រភេទថ្មីៗឡើយ។	ការបែងចែកអតិថិជនក្នុងផ្នែកទីផ្សារ (Customer segmentation) ដោយមិនត្រូវការទិន្នន័យមានស្លាក។
Zero-Shot Learning (ZSL) ការរៀនដោយគ្មានគំរូ	មិនត្រូវការទិន្នន័យមានស្លាកសម្រាប់ការបណ្តុះបណ្តាលប្រភេទថ្មីឡើយ ហើយអាចសម្របខ្លួនបានលឿនក្នុងបរិស្ថានដែលផ្លាស់ប្តូរជាប្រចាំ (Dynamic environments)។	នៅមានភាពលំបាកក្នុងការគ្រប់គ្រងទិន្នន័យរំខាន (Noisy data) នៅក្នុងបរិស្ថាន IoT និងទាមទារឱ្យមានការរចនា Semantic Embeddings ដ៏ល្អ។	ការទទួលស្គាល់វត្ថុថ្មីៗក្នុងកាមេរ៉ា IoT និងការសម្រេចចិត្តក្នុងពេលវេលាជាក់ស្តែងដោយមិនចាំបាច់មានទិន្នន័យហ្វឹកហាត់ពីមុន។

ការចំណាយលើធនធាន (Resource Cost)៖ ឯកសារនេះមិនបានបញ្ជាក់ពីតួលេខនៃការចំណាយធនធានជាក់លាក់នោះទេ ប៉ុន្តែវាបានលើកឡើងយ៉ាងច្បាស់ពីតម្រូវការផ្នែករឹង និងបច្ចេកទេសដើម្បីដំណើរការ ZSL ក្នុងប្រព័ន្ធ IoT ។

Hardware: ឧបករណ៍ IoT (សេនស័រ កាមេរ៉ា) ដែលមានថាមពលគណនា និងអង្គចងចាំមានកម្រិត ហើយតម្រូវឱ្យមាន Edge Computing ដើម្បីជួយកាត់បន្ថយការពន្យារពេល (Latency)។
Software & Algorithms: បណ្ណាល័យ ឬម៉ូដែលសម្រាប់បង្កើត Semantic Embeddings ដូចជា Word2Vec និង GloVe ព្រមទាំងប្រព័ន្ធ Federated Learning សម្រាប់ការរៀនសូត្ររួមគ្នា។
Dataset: ទិន្នន័យចំណេះដឹងជាមុន (Prior Knowledge) វចនានុក្រមទិន្នន័យ ឬសំណុំទិន្នន័យដែលមានគុណលក្ខណៈ (Attributes) ដើម្បីឱ្យម៉ូដែល ZSL អាចទាញយកទំនាក់ទំនងន័យវិទ្យាបាន។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ឯកសារនេះជាប្រភេទអត្ថបទស្រាវជ្រាវត្រួសត្រាយ (Review Paper) ដែលមិនបានប្រើប្រាស់សំណុំទិន្នន័យប្រជាសាស្ត្រ ឬទិន្នន័យភូមិសាស្ត្រជាក់លាក់ណាមួយឡើយ ផ្ទុយទៅវិញវាផ្តោតលើទ្រឹស្តី និងករណីសិក្សារបស់ IoT ទូទៅ។ សម្រាប់ប្រទេសកម្ពុជា ការខ្វះខាតទិន្នន័យទាក់ទងនឹងបរិបទក្នុងស្រុកដែលមានស្លាកត្រឹមត្រូវ (Labeled Data) គឺជាឧបសគ្គដ៏ធំ ដូច្នេះការប្រើប្រាស់វិធីសាស្ត្រដែលអាចរៀនដោយមិនបាច់មានគំរូ (ZSL) នេះគឺពិតជាមានអត្ថប្រយោជន៍ខ្លាំងក្នុងការជម្នះភាពលម្អៀងនិងកង្វះខាតទិន្នន័យទាំងនោះ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រ Zero-Shot Learning (ZSL) នេះមានសក្តានុពល និងភាពជាក់ស្តែងខ្ពស់សម្រាប់ការអភិវឌ្ឍន៍ប្រព័ន្ធបច្ចេកវិទ្យានៅប្រទេសកម្ពុជា ជាពិសេសក្នុងបរិបទដែលយើងកំពុងជំរុញការប្រើប្រាស់ IoT តែខ្វះខាតទិន្នន័យធំៗសម្រាប់ការបណ្តុះបណ្តាល AI ។

ទីក្រុងឆ្លាតវៃនៅភ្នំពេញ និងព្រះសីហនុ (Smart Cities in Phnom Penh & Sihanoukville): អាចប្រើប្រាស់ ZSL សម្រាប់ប្រព័ន្ធគ្រប់គ្រងចរាចរណ៍ឆ្លាតវៃ (Traffic Management) ដែលអាចកែសម្រួលភ្លើងស្តុបដោយស្វ័យប្រវត្តិដោយផ្អែកលើលំហូរចរាចរណ៍ ឬឧបទ្ទវហេតុថ្មីៗ ដោយមិនចាំបាច់មានទិន្នន័យហ្វឹកហាត់ពីមុន។
តំបន់សេដ្ឋកិច្ចពិសេស និងរោងចក្រកាត់ដេរ (SEZs & Garment Factories): ការប្រើប្រាស់ ZSL សម្រាប់ការថែទាំឧបករណ៍ទុកជាមុន (Predictive Maintenance) ដើម្បីពិនិត្យមើលសញ្ញាណខូចខាតម៉ាស៊ីនចម្លែកៗ ដោយជួយកាត់បន្ថយពេលវេលាផ្អាកដំណើរការរោងចក្រ។
វិស័យសុខាភិបាលនៅតាមបណ្តាខេត្ត (Healthcare in Rural Areas): ការបំពាក់ឧបករណ៍ IoT សម្រាប់តាមដានអ្នកជំងឺពីចម្ងាយ (Remote Patient Monitoring) ដែលអាចចាប់យកភាពមិនប្រក្រតីនៃសុខភាពថ្មីៗបានលឿន ទោះបីជាប្រព័ន្ធមិនធ្លាប់ស្គាល់ទម្រង់នៃជំងឺនោះពីមុនមកក៏ដោយ។

ជារួម ការអនុវត្តបច្ចេកវិទ្យា ZSL អាចជួយឱ្យកម្ពុជាពន្លឿនការវិវឌ្ឍទៅរកបដិវត្តន៍ឧស្សាហកម្មទី៤ និងស្វ័យប្រវត្តិកម្មដោយសន្សំសំចៃពេលវេលានិងថវិកាក្នុងការប្រមូលទិន្នន័យ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

ជំហានទី១៖ សិក្សាមូលដ្ឋានគ្រឹះនៃ Machine Learning និង IoT: និស្សិតគួរចាប់ផ្តើមស្វែងយល់ពីរបៀបដំណើរការរបស់សេនស័រ IoT និងការសរសេរកូដ Python ជាមូលដ្ឋាន ដោយប្រើប្រាស់បណ្ណាល័យដូចជា Scikit-Learn និង TensorFlow ដើម្បីយល់ពីភាពខុសគ្នារវាង Supervised និង Unsupervised Learning។
ជំហានទី២៖ ស្វែងយល់ស៊ីជម្រៅពី Semantic Embeddings: អនុវត្តការសរសេរកូដដោយប្រើប្រាស់ Word2Vec ឬ GloVe ដើម្បីយល់ពីរបៀបដែលប្រព័ន្ធ AI អាចតភ្ជាប់ទំនាក់ទំនងន័យវិទ្យារវាងពាក្យ និងគុណលក្ខណៈផ្សេងៗ ដែលជាបេះដូងដ៏សំខាន់របស់ Zero-Shot Learning។
ជំហានទី៣៖ អនុវត្តគម្រោងខ្នាតតូចជាមួយ Zero-Shot Learning: សាកល្បងសាងសង់ប្រព័ន្ធចំណាត់ថ្នាក់រូបភាពងាយៗ (Image Classification) ដោយប្រើប្រាស់ម៉ូដែលដែលត្រៀមរួចជាស្រេច (Pre-trained models) ដូចជាម៉ូដែល CLIP របស់ក្រុមហ៊ុន OpenAI ទៅលើទិន្នន័យរូបភាពពីកាមេរ៉ាសុវត្ថិភាព។
ជំហានទី៤៖ រួមបញ្ចូល ZSL ជាមួយឧបករណ៍ Edge Computing: សាកល្បងដំណើរការម៉ូដែល ZSL របស់អ្នកនៅលើឧបករណ៍ IoT ខ្នាតតូចដូចជា Raspberry Pi ឬ Arduino ដើម្បីសិក្សាពីរបៀបកាត់បន្ថយការពន្យារពេល (Latency) សម្រាប់ការសម្រេចចិត្តក្នុងពេលវេលាជាក់ស្តែង (Real-Time Decision Making)។
ជំហានទី៥៖ ដោះស្រាយបញ្ហាប្រឈមក្នុងពិភពពិតសម្រាប់គម្រោងបញ្ចប់ការសិក្សា: បង្កើតគម្រោង IoT ជាក់ស្តែងមួយសម្រាប់ប្រទេសកម្ពុជា (ឧទាហរណ៍៖ ប្រព័ន្ធតាមដានកម្រិតទឹកជំនន់ ឬប្រព័ន្ធចរាចរណ៍ឆ្លាតវៃ) ដោយផ្តោតលើការកែច្នៃទិន្នន័យរំខាន (Noisy IoT data) និងការប្រើបច្ចេកទេស Hybrid ដែលផ្សំ ZSL ជាមួយ Few-Shot Learning។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Zero-Shot Learning (ZSL)	បច្ចេកទេសបញ្ញាសិប្បនិម្មិត (AI) ដែលអនុញ្ញាតឱ្យកុំព្យូទ័រអាចសម្គាល់និងធ្វើចំណាត់ថ្នាក់វត្ថុ ឬទិន្នន័យថ្មីៗដែលវាមិនធ្លាប់បានហ្វឹកហាត់ ឬមិនធ្លាប់ឃើញពីមុនមកទាល់តែសោះ ដោយប្រើប្រាស់ចំណេះដឹងពីទំនាក់ទំនងន័យវិទ្យាដែលមានស្រាប់។	ដូចជាមនុស្សម្នាក់ដែលមិនធ្លាប់ឃើញសត្វសេះបង្កង់ពីមុនមក ប៉ុន្តែអាចស្គាល់វាបានដោយសារគេធ្លាប់ប្រាប់ថាវាជា "សេះដែលមានឆ្នូតសខ្មៅ"។
Semantic Embeddings	ការបំប្លែងពាក្យ ឬទិន្នន័យទៅជាទម្រង់វ៉ិចទ័រលេខនៅក្នុងលំហរគណិតវិទ្យា ដើម្បីឱ្យកុំព្យូទ័រអាចយល់ពីអត្ថន័យ និងទំនាក់ទំនងរវាងពាក្យ ឬវត្ថុផ្សេងៗគ្នាបាន (ឧទាហរណ៍៖ កុំព្យូទ័រដឹងថាវ៉ិចទ័រពាក្យ "ឆ្កែ" និង "ឆ្មា" នៅជិតគ្នាជាងពាក្យ "ឆ្កែ" និង "ឡាន")។	ដូចជាការគូសផែនទីនៃពាក្យ ដោយដាក់ពាក្យដែលមានអត្ថន័យស្រដៀងគ្នាឱ្យនៅជិតៗគ្នា ដើម្បីឱ្យម៉ាស៊ីនងាយស្រួលរកទំនាក់ទំនង។
Attribute-Based Learning	ការបង្រៀនប្រព័ន្ធកុំព្យូទ័រឱ្យស្គាល់វត្ថុ ឬព្រឹត្តិការណ៍ថ្មីៗដោយផ្អែកលើការពិពណ៌នាពីលក្ខណៈសម្បត្តិ ឬគុណលក្ខណៈរបស់វា (ដូចជា ពណ៌ ទំហំ រូបរាង) ជាជាងការផ្តល់ទិន្នន័យរូបភាពរាប់ពាន់សន្លឹកឱ្យវាទន្ទេញចាំ។	ដូចជាប៉ូលីសស្វែងរកជនសង្ស័យដោយផ្អែកលើការភិនភាគ (មានកម្ពស់ខ្ពស់ ពាក់អាវក្រហម) ជាជាងការស្វែងរកដោយមានរូបថតផ្ទាល់។
Knowledge Transfer	ដំណើរការនៃការយកចំណេះដឹងដែលម៉ូដែល AI ទទួលបានពីការរៀនសូត្រលើកិច្ចការមួយ ទៅអនុវត្តលើកិច្ចការថ្មីមួយទៀតដែលមិនធ្លាប់ជួប ប៉ុន្តែមានលក្ខណៈស្រដៀងគ្នា ដើម្បីសន្សំពេលវេលាបណ្តុះបណ្តាល និងបង្កើនភាពត្រឹមត្រូវ។	ដូចជាអ្នកចេះជិះកង់រួចហើយ យកជំនាញរក្សាលំនឹងនោះទៅប្រើប្រាស់ដើម្បីរៀនជិះម៉ូតូឱ្យឆាប់ចេះលឿនជាងមុន។
Edge computing	ការដំណើរការទិន្នន័យនៅក្បែរប្រភពដែលបង្កើតទិន្នន័យនោះផ្ទាល់ (ដូចជានៅលើកាមេរ៉ាសុវត្ថិភាព ឬសេនស័រ IoT) ជាជាងការបញ្ជូនទិន្នន័យទាំងអស់ទៅកាន់ Cloud ឆ្ងាយៗ ដើម្បីកាត់បន្ថយការពន្យារពេល (Latency) ក្នុងការសម្រេចចិត្ត។	ដូចជាការដោះស្រាយបញ្ហាបន្ទាន់ភ្លាមៗនៅកន្លែងកើតហេតុដោយខ្លួនឯង ដោយមិនបាច់រង់ចាំខលទៅសុំការសម្រេចចិត្តពីថ្នាក់លើដែលនៅឆ្ងាយ។
Open-World Recognition	សមត្ថភាពរបស់ប្រព័ន្ធ AI ក្នុងការដំណើរការក្នុងបរិស្ថានជាក់ស្តែងដែលផ្លាស់ប្តូរជានិច្ច ដែលវាអាចដឹងថាវត្ថុណាមួយជារបស់ថ្មីមិនធ្លាប់ស្គាល់ (Novel entities) ហើយព្យាយាមយល់ពីវា ដោយមិនមានការរឹតត្បិតត្រឹមបញ្ជីទិន្នន័យចាស់ៗដែលវាធ្លាប់រៀន។	ដូចជាការដើរចូលព្រៃជ្រៅ ហើយអាចដឹងថារុក្ខជាតិមួយនេះជារុក្ខជាតិប្រភេទថ្មី ដែលមិនធ្លាប់មាននរណាកត់ត្រាក្នុងសៀវភៅជីវវិទ្យាពីមុនមក។
Federated learning	វិធីសាស្ត្របណ្តុះបណ្តាលម៉ូដែល AI ដែលអនុញ្ញាតឱ្យឧបករណ៍ IoT ច្រើនរៀនសូត្ររួមគ្នាដោយមិនចាំបាច់បញ្ជូនទិន្នន័យឯកជន (Raw data) របស់ពួកវាទៅកាន់ម៉ាស៊ីនមេ (Central Server) ឡើយ គឺបញ្ជូនតែលទ្ធផលនៃការរៀនសូត្រប៉ុណ្ណោះ។	ដូចជាសិស្សរៀនធ្វើលំហាត់នៅផ្ទះរៀងៗខ្លួន រួចយកតែចម្លើយនិងគន្លឹះដែលរកឃើញមកប្រាប់គ្រូ ដោយមិនបាច់យកសៀវភៅព្រាងដែលរញ៉េរញ៉ៃមកបង្ហាញឡើយ។
Neuro-symbolic AI	ការរួមបញ្ចូលគ្នានៃបច្ចេកវិទ្យា AI ពីរប្រភេទ គឺ Neural Networks (ពូកែខាងរៀនពីទិន្នន័យ និងសម្គាល់លំនាំ) និង Symbolic AI (ពូកែខាងវែកញែករកហេតុផលតាមបែបតក្កវិទ្យាច្បាស់លាស់) ដើម្បីឱ្យប្រព័ន្ធ AI កាន់តែឆ្លាតវៃក្នុងការសម្រេចចិត្ត។	ដូចជាការរួមបញ្ចូលគ្នានូវវិចិត្រករដែលពូកែមើលរូបភាពទូទៅ និងអ្នកគណិតវិទ្យាដែលពូកែគិតរកហេតុផលនិងរូបមន្ត ទៅក្នុងខួរក្បាលតែមួយ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖