Original Title: Objectification of Subjective Content towards Uncertainty Processing: A Survey (综述:从"主观客观化" 到不确定性处理)
Source: doi.org/10.13140/RG.2.2.27125.45280
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការប្រែក្លាយមាតិកាអត្តនោម័តទៅជាសត្យានុម័តសម្រាប់ដំណើរការនៃភាពមិនប្រាកដប្រជា៖ ឯកសារទិដ្ឋភាពទូទៅ

ចំណងជើងដើម៖ Objectification of Subjective Content towards Uncertainty Processing: A Survey (综述:从"主观客观化" 到不确定性处理)

អ្នកនិពន្ធ៖ Yucong Duan (DIKW research group, Hainan University)

ឆ្នាំបោះពុម្ព៖ 2022

វិស័យសិក្សា៖ Artificial Intelligence and Information Science

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហានៃភាពមិនប្រាកដប្រជា (Uncertainty) នៅក្នុងប្រព័ន្ធបញ្ញាសិប្បនិម្មិត (AI) និងសេវាកម្មទិន្នន័យ ដោយផ្តោតលើការប្រែក្លាយអត្ថន័យអត្តនោម័ត (Subjective semantics) ទៅជាសត្យានុម័ត (Objective) តាមរយៈស្ថាបត្យកម្ម DIKW (ទិន្នន័យ ព័ត៌មាន ចំណេះដឹង និងប្រាជ្ញា)។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានធ្វើការត្រួតពិនិត្យ និងវិភាគយ៉ាងទូលំទូលាយលើទ្រឹស្តី បច្ចេកវិទ្យា និងគំរូពាក់ព័ន្ធនឹងដំណើរការអត្ថន័យ និងការបំប្លែង DIKW សម្រាប់ការចែករំលែកធនធានសេវាកម្ម។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Data-Driven Machine Learning / Deep Learning
ការរៀនម៉ាស៊ីនផ្អែកលើទិន្នន័យ និង Deep Learning
មានប្រសិទ្ធភាពខ្ពស់ក្នុងការវិភាគទិន្នន័យដែលមានលក្ខណៈសត្យានុម័ត (Objective) ច្បាស់លាស់ និងអាចធ្វើចំណាត់ថ្នាក់បានដោយស្វ័យប្រវត្តិ។ ខ្វះសមត្ថភាពក្នុងការយល់ដឹងពីអត្ថន័យស៊ីជម្រៅ ជាពិសេសអត្ថន័យអត្តនោម័ត (Subjective) ដូចជាមនោសញ្ចេតនា និងប្រាជ្ញា ដែលនាំឱ្យមានភាពមិនច្បាស់លាស់នៅពេលទិន្នន័យមិនពេញលេញ។ បណ្តាលឱ្យមានបញ្ហាផ្ទុកព័ត៌មានលើសចំណុះ (Cognitive Overload) និងកាត់បន្ថយទំនុកចិត្តលើការសម្រេចចិត្តរបស់ប្រព័ន្ធ AI នៅក្នុងបរិបទជាក់ស្តែង។
DIKW Architecture & Subjective Objectification
ស្ថាបត្យកម្ម DIKW និងការប្រែក្លាយភាពអត្តនោម័តទៅជាសត្យានុម័ត
ជួយកាត់បន្ថយភាពមិនប្រាកដប្រជាតាមរយៈការបំប្លែងទិន្នន័យ ព័ត៌មាន ចំណេះដឹង និងប្រាជ្ញាខ្នាតតូច ឱ្យទៅជាប្រព័ន្ធសេវាកម្មដែលអាចពន្យល់បាន និងអាចជឿទុកចិត្តបាន។ នៅតែស្ថិតក្នុងដំណាក់កាលអភិវឌ្ឍន៍នៅឡើយ ដែលទាមទារការស្រាវជ្រាវបន្ថែមលើការបង្កើតគំរូ (Modeling) និងការគណនាអត្ថន័យចម្រុះឆ្លងវិស័យ។ បង្កើតបាននូវទិន្នន័យធំ DIKW ដែលមានភាពត្រឹមត្រូវ កាត់បន្ថយហានិភ័យ និងជំរុញសហគ្រាសធុនតូចនិងមធ្យម (SMEs) ឱ្យអាចប្រកួតប្រជែងជាមួយក្រុមហ៊ុនធំៗបាន។

ការចំណាយលើធនធាន (Resource Cost)៖ ទោះបីជាឯកសារមិនបានបញ្ជាក់អំពីតម្លៃធនធានហិរញ្ញវត្ថុជាក់លាក់ក្តី ប៉ុន្តែការអនុវត្តវិធីសាស្ត្រនេះទាមទារឱ្យមានការរៀបចំហេដ្ឋារចនាសម្ព័ន្ធទិន្នន័យកម្រិតខ្ពស់ និងចំណេះដឹងពហុវិស័យ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះផ្តោតសំខាន់លើបរិបទនៃតំបន់ពាណិជ្ជកម្មសេរីហៃណាន (Hainan Free Trade Port) ប្រទេសចិន ដែលមានវិស័យទេសចរណ៍ កសិកម្ម និងសហគ្រាសធុនតូចនិងមធ្យម (SMEs) ជាស្នូល។ នេះជាចំណុចសំខាន់សម្រាប់ប្រទេសកម្ពុជា ព្រោះកម្ពុជាក៏ពឹងផ្អែកខ្លាំងលើវិស័យស្រដៀងគ្នានេះ ហើយ SMEs កម្ពុជាតែងតែជួបប្រទះបញ្ហាកង្វះទិន្នន័យធំ (Big Data) ក្នុងការប្រកួតប្រជែងជាមួយក្រុមហ៊ុនបច្ចេកវិទ្យាបរទេស។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រចែករំលែក និងកែច្នៃធនធាន DIKW នេះ គឺមានសារៈសំខាន់ និងអាចអនុវត្តបានយ៉ាងល្អសម្រាប់ជំរុញសេដ្ឋកិច្ចឌីជីថលនៅកម្ពុជា។

ការអនុវត្តស្ថាបត្យកម្ម DIKW នឹងជួយពង្រឹងភាពជាម្ចាស់ទិន្នន័យ និងលើកកម្ពស់សមត្ថភាពប្រកួតប្រជែងរបស់សហគ្រាសខ្នាតតូចកម្ពុជានៅក្នុងខ្សែសង្វាក់តម្លៃសកល។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃស្ថាបត្យកម្ម DIKW: និស្សិតគួរសិក្សាពីរបៀបបែងចែករវាង ទិន្នន័យ ព័ត៌មាន ចំណេះដឹង និងប្រាជ្ញា ព្រមទាំងការកសាងក្រាហ្វចំណេះដឹង (Knowledge Graph) ដោយសាកល្បងប្រើប្រាស់កម្មវិធី Neo4j ឬ Protégé សម្រាប់ការរៀបចំរចនាសម្ព័ន្ធទិន្នន័យ។
  2. ស្វែងយល់ពីបញ្ហានៃអត្ថន័យអត្តនោម័ត (Subjective Semantics): ស្រាវជ្រាវពីដែនកំណត់របស់ AI បច្ចុប្បន្នក្នុងការយល់ដឹងពីអត្ថន័យ (Natural Language Processing) ដោយផ្តោតលើការប្រើប្រាស់ Hugging Face transformers ដើម្បីវិភាគពីគម្លាតរវាងទិន្នន័យពិត និងអត្ថន័យបង្កប់។
  3. វិភាគប្រព័ន្ធសេវាកម្មរបស់ SMEs នៅកម្ពុជា: ធ្វើការចុះសិក្សា (Case Study) លើអាជីវកម្មខ្នាតតូចក្នុងស្រុក ដើម្បីប្រមូល Small Data ស្វែងយល់ពីកង្វះខាតប្រព័ន្ធសេវាកម្មរបស់ពួកគេ និងសិក្សាពីលទ្ធភាពប្រើប្រាស់គំរូ Software as a Service (SaaS) ដើម្បីដោះស្រាយ។
  4. បង្កើតគំរូសេវាកម្មចែករំលែក (Service Broker Prototype): ប្រើប្រាស់វេទិកា Cloud ដូចជា AWS ឬ Google Cloud Platform ត្រង់សេវាកម្ម API Gateway ដើម្បីបង្កើតជាប្រព័ន្ធសាកល្បងមួយ ដែលអនុញ្ញាតឱ្យក្រុមហ៊ុនពីរ ឬបីអាចចែករំលែកទិន្នន័យ DIKW ជាមួយគ្នាបានដោយសុវត្ថិភាព។
  5. រៀបចំយន្តការវាយតម្លៃ និងទំនុកចិត្ត (Trust & Evaluation Mechanism): អនុវត្តការប្រើប្រាស់ Smart Contracts (តាមរយៈ Ethereum ឬ Hyperledger) ឬប្រព័ន្ធក្បួនដោះស្រាយតម្លៃសេវាកម្ម (Value modeling) ដើម្បីធានាថាការចែកចាយផលប្រយោជន៍រវាងអ្នកផ្តល់ និងអ្នកទទួលសេវាមានតម្លាភាព។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
DIKW (Data, Information, Knowledge and Wisdom) ជាស្ថាបត្យកម្មប្រព័ន្ធចំណាត់ថ្នាក់ដែលបំប្លែងទិន្នន័យឆៅ (Data) ទៅជាព័ត៌មានដែលមានន័យ (Information) បន្ទាប់មកចម្រាញ់ជាចំណេះដឹង (Knowledge) និងចុងក្រោយអភិវឌ្ឍទៅជាប្រាជ្ញា (Wisdom) ដើម្បីជួយដល់ការធ្វើសេចក្តីសម្រេចចិត្តដោយស្វ័យប្រវត្តិនៅក្នុងប្រព័ន្ធកុំព្យូទ័រ។ ដូចជាការយកគ្រាប់ស្រូវ (ទិន្នន័យ) ទៅកិនជាអង្ករ (ព័ត៌មាន) ដាំជាបាយ (ចំណេះដឹង) និងដឹងពីរបៀបហូបឱ្យមានជីវជាតិល្អដល់រាងកាយ (ប្រាជ្ញា)។
Subjective Objectification គឺជាដំណើរការកែច្នៃនិងប្រែក្លាយអ្វីដែលជាអារម្មណ៍ ការយល់ឃើញ ឬមតិផ្ទាល់ខ្លួន (អត្តនោម័ត) ឱ្យទៅជាទម្រង់ទិន្នន័យស្តង់ដារដែលអាចវាស់វែង និងវាយតម្លៃបានតាមបែបវិទ្យាសាស្ត្រ (សត្យានុម័ត) ដើម្បីឱ្យប្រព័ន្ធបញ្ញាសិប្បនិម្មិត (AI) អាចដំណើរការនិងទាញយកទៅប្រើប្រាស់បានត្រឹមត្រូវ។ ដូចជាការបំប្លែងអារម្មណ៍មនុស្សដែលរអ៊ូថា "ខ្ញុំក្តៅណាស់" ទៅជាតួលេខច្បាស់លាស់ "សីតុណ្ហភាព ៣៨ អង្សាសេ" ដើម្បីឱ្យម៉ាស៊ីនត្រជាក់អាចយល់និងបញ្ចុះកម្តៅដោយស្វ័យប្រវត្តិ។
Semantic Space ជាលំហគណិតវិទ្យាឬទម្រង់តំណាងទិន្នន័យនៅក្នុងប្រព័ន្ធ AI ដែលផ្ទុកអត្ថន័យនៃពាក្យ ឬគំនិតផ្សេងៗ ដើម្បីឱ្យកុំព្យូទ័រអាចគណនា និងយល់ដឹងពីទំនាក់ទំនងព្រមទាំងបរិបទរវាងពាក្យទាំងនោះ។ ដូចជាវចនានុក្រមនៅក្នុងខួរក្បាលកុំព្យូទ័រ ដែលជួយវាឱ្យដឹងថាពាក្យ "ឆ្កែ" និង "ឆ្មា" មិនត្រឹមតែជាអក្សរប៉ុណ្ណោះទេ តែវាមានអត្ថន័យជិតស្និទ្ធគ្នាក្នុងនាមជាសត្វចិញ្ចឹម។
Uncertainty Processing ជាបច្ចេកទេសនៅក្នុងប្រព័ន្ធកុំព្យូទ័រសម្រាប់ដោះស្រាយនិងកែច្នៃទិន្នន័យដែលមិនពេញលេញ មិនច្បាស់លាស់ ឬផ្ទុយគ្នា ដោយព្យាយាមកាត់បន្ថយភាពលម្អៀង និងទាញយកសេចក្តីសន្និដ្ឋានមួយដែលគួរឱ្យទុកចិត្តបំផុត។ ដូចជាការព្យាយាមផ្គុំរូបភាព Jigsaw Puzzle មួយដែលបាត់បំណែកខ្លះ ប៉ុន្តែយើងនៅតែអាចប្រើគំនិតដើម្បីទាយដឹងថារូបភាពនោះជារូបអ្វីឱ្យប្រាកដ។
Knowledge Graph ជារចនាសម្ព័ន្ធបណ្តាញទិន្នន័យដែលកុំព្យូទ័រប្រើដើម្បីតភ្ជាប់ព័ត៌មានផ្សេងៗចូលគ្នាជាទម្រង់ថ្នាំង (ចំណុច) និងខ្សែភ្ជាប់ (ទំនាក់ទំនង) ដែលអនុញ្ញាតឱ្យប្រព័ន្ធ AI អាចធ្វើការវែកញែករកហេតុផល និងស្វែងរកចម្លើយដ៏ស្មុគស្មាញបាន។ ដូចជាផ្ទាំងក្តារខៀនរបស់ប៉ូលីសស៊ើបអង្កេត ដែលមានចងខ្សែភ្ជាប់ពីភស្តុតាងមួយទៅជនសង្ស័យមួយទៀត ដើម្បីងាយស្រួលរកមុខអ្នកប្រព្រឹត្តបទល្មើស។
XaaS មកពីពាក្យពេញ Everything as a Service ដែលជាគំរូអាជីវកម្មបច្ចេកវិទ្យាក្នុងការផ្តល់នូវសេវាកម្មគ្រប់យ៉ាង (កម្មវិធី កុំព្យូទ័រ ហេដ្ឋារចនាសម្ព័ន្ធ) តាមរយៈប្រព័ន្ធអ៊ីនធឺណិត (Cloud computing) ជំនួសឱ្យការទិញឧបករណ៍ Hardware មកដំឡើងដោយផ្ទាល់នៅក្នុងក្រុមហ៊ុន។ ដូចជាការជួលរថយន្តជិះតាមតម្រូវការជាក់ស្តែង និងបង់លុយតាមរយៈកម្មវិធីទូរស័ព្ទ ជាជាងការត្រូវចំណាយលុយរាប់ម៉ឺនដុល្លារដើម្បីទិញរថយន្តមួយគ្រឿងទុកចោល។
Service Brokerage ជាកម្មវិធីឬភ្នាក់ងារកណ្តាលនៅក្នុងប្រព័ន្ធកុំព្យូទ័រ ដែលមានតួនាទីជួយស្វែងរក ជ្រើសរើស សម្របសម្រួល និងភ្ជាប់អ្នកប្រើប្រាស់ទៅនឹងធនធានសេវាកម្មឌីជីថល ដែលស័ក្តិសមបំផុតទៅនឹងតម្រូវការនិងថវិការបស់ពួកគេ។ ដូចជាភ្នាក់ងារអចលនទ្រព្យដែលជួយស្វែងរកផ្ទះដែលត្រូវនឹងតម្រូវការរបស់អ្នកទិញ ដោយអ្នកទិញគ្រាន់តែប្រាប់លក្ខខណ្ឌហើយមិនបាច់ចំណាយពេលដើររកដោយខ្លួនឯង។
Concept Space ជាបណ្តុំនៃគំនិត ទ្រឹស្តី ឬនិមិត្តសញ្ញាដែលមនុស្សប្រើប្រាស់សម្រាប់ការគិតនិងទំនាក់ទំនង ដែលត្រូវយកមកផ្គូផ្គងជាមួយ Semantic Space ដើម្បីដោះស្រាយភាពខុសគ្នានៃការយល់ដឹងរវាងភាសាមនុស្សនិងភាសាម៉ាស៊ីន។ ដូចជាទូដាក់ឯកសារនៅក្នុងខួរក្បាលមនុស្ស ដែលរៀបចំចំណេះដឹងនិងគំនិតផ្សេងៗជាថតៗ ដើម្បីងាយស្រួលទាញយកមកនិយាយនិងពន្យល់ប្រាប់អ្នកដទៃ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖