Original Title: SIEL: Aspect Based Sentiment Analysis in Reviews
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

SIEL: ការវិភាគមនោសញ្ចេតនាផ្អែកលើទិដ្ឋភាពនៅក្នុងការវាយតម្លៃ

ចំណងជើងដើម៖ SIEL: Aspect Based Sentiment Analysis in Reviews

អ្នកនិពន្ធ៖ Satarupa Guha, International Institute of Information Technology, Hyderabad, Aditya Joshi, International Institute of Information Technology, Hyderabad, Vasudeva Varma, International Institute of Information Technology, Hyderabad

ឆ្នាំបោះពុម្ព៖ 2015 SemEval

វិស័យសិក្សា៖ Natural Language Processing

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហានៃការវិភាគមនោសញ្ចេតនាផ្អែកលើទិដ្ឋភាព (Aspect-based Sentiment Analysis) ដើម្បីកំណត់ប្រភេទនៃទិដ្ឋភាព និងកម្រិតមនោសញ្ចេតនាដែលបានបញ្ចេញនៅក្នុងអត្ថបទវាយតម្លៃរបស់អតិថិជនលើភោជនីយដ្ឋាន។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានប្រើប្រាស់វិធីសាស្ត្ររៀនដោយម៉ាស៊ីន (Machine Learning) ផ្សេងៗគ្នាសម្រាប់កិច្ចការរងទាំងបីនៃកម្មវិធី SemEval-2015 រួមមាន ការចាត់ថ្នាក់ឯករាជ្យ ការកំណត់ស្លាកតាមលំដាប់ និងការរៀនតាមបែបបណ្តុំ។

ចំណាត់ថ្នាក់ព្រៃចៃដន្យ (Random Forest Classifiers) សម្រាប់ការរកឃើញប្រភេទនៃទិដ្ឋភាព (Aspect Category Detection)
វាលចៃដន្យតាមលក្ខខណ្ឌ (Conditional Random Fields - CRFs) សម្រាប់ការកំណត់កន្សោមគោលដៅមតិ (Opinion Target Expression)
ការរៀនតាមបែបបណ្តុំដោយប្រើម៉ាស៊ីនវ៉ិចទ័រគាំទ្របន្ទាត់ត្រង់ (Stacking Classifiers with Linear SVM) សម្រាប់ការចាត់ថ្នាក់ប៉ូលមនោសញ្ចេតនា (Sentiment Polarity)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ប្រព័ន្ធនេះទទួលបានចំណាត់ថ្នាក់ទី៤ ក្នុងការរកឃើញប្រភេទនៃទិដ្ឋភាព (Aspect Category) ជាមួយនឹងពិន្ទុ F1 ស្មើនឹង ០,៥៧។
សម្រាប់កិច្ចការរងកំណត់កន្សោមគោលដៅមតិ (Opinion Target Expression) ប្រព័ន្ធទទួលបានចំណាត់ថ្នាក់ទី៧ ជាមួយនឹងពិន្ទុ F1 ស្មើនឹង ០,៥៣។
ប្រព័ន្ធរៀនតាមបែបបណ្តុំ (Ensemble system) ទទួលបានចំណាត់ថ្នាក់ទី៨ សម្រាប់ការចាត់ថ្នាក់មនោសញ្ចេតនា (Sentiment Polarity) ដោយទទួលបានពិន្ទុ F1 ០,៧១។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Random Forest Classifiers (One-vs-all with Unigrams) ចំណាត់ថ្នាក់ព្រៃចៃដន្យ (ប្រើ Unigrams សម្រាប់កិច្ចការទី១)	មានភាពសាមញ្ញ លឿន និងមានប្រសិទ្ធភាពខ្ពស់ក្នុងការចាត់ថ្នាក់ទិន្នន័យអត្ថបទដែលមានទំហំតូច ដោយប្រើត្រឹមកញ្ចប់ពាក្យ (Bag of Words)។	មិនអាចចាប់យកអត្ថន័យស៊ីជម្រៅនៃពាក្យ ឬបរិបទបានល្អដូចវិធីសាស្ត្រវ៉ិចទ័រពាក្យ (Word2Vec) នោះទេ។	ទទួលបានពិន្ទុ F1 ០,៥៧ សម្រាប់កិច្ចការរកឃើញប្រភេទនៃទិដ្ឋភាព (ចំណាត់ថ្នាក់ទី៤)។
Conditional Random Fields (CRF) using Mallet វាលចៃដន្យតាមលក្ខខណ្ឌ (CRF) សម្រាប់កិច្ចការទី២	ស័ក្តិសមបំផុតសម្រាប់ការចាត់ថ្នាក់តាមលំដាប់ (Sequence Labelling) និងការទាញយកកន្សោមពាក្យគោលដៅមតិ។	ទាមទារការកំណត់លក្ខណៈពិសេសដោយដៃច្រើន (Hand-crafted features) ដូចជា POS, Dependency និងការបង្កើតបញ្ជីពាក្យ Seed lists។	ទទួលបានពិន្ទុ F1 ០,៥៣ សម្រាប់កិច្ចការរកឃើញកន្សោមគោលដៅមតិ (ចំណាត់ថ្នាក់ទី៧)។
Stacking Classifiers (Ensemble Learning) ការរៀនតាមបែបបណ្តុំចាត់ថ្នាក់ (Stacking សម្រាប់កិច្ចការទី៣)	បង្កើនភាពត្រឹមត្រូវដោយរួមបញ្ចូលលទ្ធផលពីម៉ូដែលជាច្រើនបញ្ជូលគ្នា (SVM, SGD, AdaBoost) រួមជាមួយនឹងលក្ខណៈ Lexicon។	ចំណាយពេលយូរជាងមុនក្នុងការបង្ហាត់ម៉ូដែល និងមានភាពស្មុគស្មាញក្នុងការរៀបចំលំហូរបណ្តុះបណ្តាលទិន្នន័យ។	ទទួលបានពិន្ទុ F1 ០,៧១ សម្រាប់កិច្ចការចាត់ថ្នាក់មនោសញ្ចេតនា (ចំណាត់ថ្នាក់ទី៨)។
Linear SVM with only lexicon features (Baseline) ម៉ាស៊ីនវ៉ិចទ័រគាំទ្របន្ទាត់ត្រង់ (ម៉ូដែលគោល/Baseline)	លឿនជាង និងងាយស្រួលក្នុងការអនុវត្តដោយប្រើតែលក្ខណៈពិសេសពីវចនានុក្រម (Lexicon features) ប៉ុណ្ណោះ។	ផ្តល់លទ្ធផលទាបជាងម៉ូដែលបែបបណ្តុំ (Ensemble) ដោយសារខ្វះការរៀនពីម៉ូដែលចាត់ថ្នាក់ផ្សេងៗទៀត។	ទទួលបានពិន្ទុ Accuracy ត្រឹមតែ ០,៦៨ ដែលទាបជាងម៉ូដែល Stacking ចំនួន ០,០៣។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តប្រព័ន្ធនេះទាមទារធនធានកុំព្យូទ័រមធ្យម និងពេលវេលាច្រើនក្នុងការរៀបចំលក្ខណៈពិសេសនៃភាសា (Feature Engineering) និងបញ្ជីវចនានុក្រម។

Software Frameworks: ត្រូវការបណ្ណាល័យ Python ដូចជា Scikit-Learn សម្រាប់ Machine Learning, NLTK សម្រាប់ដំណើរការភាសា និង Mallet Toolkit សម្រាប់ CRF។
Datasets: ប្រើប្រាស់ទិន្នន័យវាយតម្លៃភោជនីយដ្ឋានពី SemEval 2014 & 2015 ព្រមទាំងទិន្នន័យបន្ថែមពី Yelp Reviews សម្រាប់បង្ហាត់ Word2Vec និង Brown Clustering។
External Lexicons: ទាមទារវចនានុក្រមមនោសញ្ចេតនា (Sentiment Lexicons) ចំនួនច្រើនដូចជា SentiWordNet, Bing Liu, MPQA, Sentiment140 និង WordNet សម្រាប់ទាញយកលក្ខណៈពាក្យ។
Hardware: អាចដំណើរការបានយ៉ាងរលូនលើកុំព្យូទ័រធម្មតា (CPU) ដោយសារវាមិនប្រើប្រាស់ម៉ូដែល Deep Learning ខ្នាតធំ ប៉ុន្តែទាមទារ RAM គ្រប់គ្រាន់សម្រាប់ Ensemble Learning។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះផ្អែកទាំងស្រុងលើទិន្នន័យវាយតម្លៃភោជនីយដ្ឋានជាភាសាអង់គ្លេសពីកម្មវិធី SemEval (ភាគច្រើនជាទិន្នន័យបស្ចិមប្រទេស)។ វាមានសារៈសំខាន់សម្រាប់ប្រទេសកម្ពុជា ដោយសារភាសាខ្មែរមានទម្រង់វេយ្យាករណ៍ និងការបញ្ចេញមតិខុសគ្នា ដែលតម្រូវឱ្យមានការបង្កើតវចនានុក្រមមនោសញ្ចេតនា (Lexicons) និងទិន្នន័យស្រាវជ្រាវជាភាសាខ្មែរផ្ទាល់ ទើបអាចអនុវត្តបានប្រកបដោយប្រសិទ្ធភាព។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាប្រព័ន្ធនេះត្រូវបានបង្កើតឡើងសម្រាប់ភាសាអង់គ្លេសក៏ដោយ វិធីសាស្ត្រ Aspect-Based Sentiment Analysis មានអត្ថប្រយោជន៍យ៉ាងខ្លាំងក្នុងការយកមកកែច្នៃប្រើប្រាស់សម្រាប់វិស័យពាណិជ្ជកម្ម និងសេវាកម្មនៅកម្ពុជា។

Tourism and Hospitality (ទេសចរណ៍ និងបដិសណ្ឋារកិច្ច): អាចអនុវត្តដើម្បីវិភាគការវាយតម្លៃរបស់ភ្ញៀវទេសចរលើភោជនីយដ្ឋាន និងសណ្ឋាគារនៅខេត្តសៀមរាប និងភ្នំពេញ ដើម្បីដឹងឱ្យច្បាស់ថាភ្ញៀវចូលចិត្ត ឬមិនពេញចិត្តលើទិដ្ឋភាពណាខ្លះ (ឧ. រសជាតិម្ហូប ឬសេវាកម្មបម្រើ)។
E-commerce & Delivery Platforms (Nham24, Foodpanda): ជួយដល់កម្មវិធីដឹកជញ្ជូនអាហារក្នុងការស្វែងយល់ពីមតិរបស់អតិថិជនលើទិដ្ឋភាពជាក់លាក់ ជំនួសឱ្យការមើលត្រឹមតែពិន្ទុផ្កាយរួម ដែលជួយម្ចាស់ហាងឱ្យកែលម្អគុណភាពបានចំគោលដៅ។
Banking and Telecom (ធនាគារ និងទូរគមនាគមន៍): ប្រើប្រាស់ដើម្បីត្រួតពិនិត្យមតិយោបល់របស់អតិថិជននៅលើបណ្តាញសង្គម ទាក់ទងនឹងសេវាកម្មអ៊ីនធឺណិត សេវាកម្មអតិថិជន ឬកម្មវិធីទូរស័ព្ទ (Mobile App) របស់ធនាគារនានានៅកម្ពុជា។

ជារួម ការអនុវត្តម៉ូដែលនេះនឹងជួយឱ្យអាជីវកម្មនៅកម្ពុជាអាចយល់ច្បាស់ពីចំណុចខ្លាំងនិងចំណុចខ្សោយរបស់ខ្លួន តាមរយៈការវិភាគមតិអតិថិជនយ៉ាងលម្អិតតាមផ្នែកនីមួយៗ (Aspect-level) ជាជាងការវាយតម្លៃជារួម។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

ជំហានទី១៖ ប្រមូល និងរៀបចំទិន្នន័យភាសាខ្មែរ: ប្រមូលទិន្នន័យវាយតម្លៃជាភាសាខ្មែរពីបណ្តាញសង្គម ឬកម្មវិធីដូចជា Nham24 និង TripAdvisor រួចធ្វើចំណារ (Annotation) កំណត់ប្រភេទពាក្យ និងមនោសញ្ចេតនាតាមបរិបទនីមួយៗ។
ជំហានទី២៖ កសាងវចនានុក្រមមនោសញ្ចេតនា: បង្កើតបញ្ជីវចនានុក្រមមនោសញ្ចេតនា (Sentiment Lexicon) សម្រាប់ភាសាខ្មែរ ដោយបកប្រែ ឬផ្អែកតាមគំរូនៃ SentiWordNet និង Bing Liu Lexicon ដើម្បីកំណត់ពាក្យវិជ្ជមាន និងអវិជ្ជមាន។
ជំហានទី៣៖ អនុវត្តម៉ូដែលចំណាត់ថ្នាក់មូលដ្ឋាន: ប្រើប្រាស់បណ្ណាល័យ Scikit-Learn ជាមួយក្បួនដោះស្រាយ Random Forest និង Linear SVM ដើម្បីសាកល្បងចាត់ថ្នាក់ប្រភេទអត្ថបទ ដោយទាញយកលក្ខណៈសម្បត្តិ Bag of Words (BoW) និង TF-IDF។
ជំហានទី៤៖ ទាញយកគោលដៅមតិដោយប្រើលំដាប់ពាក្យ: សិក្សាពីការប្រើប្រាស់បណ្ណាល័យ CRFsuite ឬ Mallet Toolkit ដើម្បីទាញយកពាក្យគោលដៅមតិ (Opinion Target Expressions) ពីប្រយោគ ដោយផ្អែកលើ POS tags របស់ភាសាខ្មែរ។
ជំហានទី៥៖ បង្កើនប្រសិទ្ធភាពតាមរយៈការរៀនបែបបណ្តុំ: អភិវឌ្ឍម៉ូដែលកម្រិតខ្ពស់ដោយរួមបញ្ចូលលទ្ធផលពីម៉ូដែលច្រើនបញ្ជូលគ្នា (Stacking Classifiers) ដើម្បីទទួលបានការទស្សន៍ទាយមនោសញ្ចេតនាកាន់តែមានភាពជាក់លាក់ និងត្រឹមត្រូវខ្ពស់។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Aspect Based Sentiment Analysis	ការវិភាគមនោសញ្ចេតនាដោយបំបែកតាមផ្នែក ឬលក្ខណៈពិសេសរបស់ផលិតផល/សេវាកម្ម ជាជាងការវាយតម្លៃជារួម ដើម្បីដឹងថាអតិថិជនពេញចិត្ត ឬមិនពេញចិត្តលើចំណុចណាខ្លះដោយឡែកពីគ្នា។	ដូចជាការផ្តល់ពិន្ទុដាច់ដោយឡែកសម្រាប់ "រសជាតិម្ហូប" និង "សេវាកម្ម" នៅក្នុងភោជនីយដ្ឋានតែមួយ។
Opinion Target Expression	កន្សោមពាក្យ ឬគោលដៅជាក់លាក់នៅក្នុងប្រយោគដែលអ្នកសរសេរចង់បញ្ចេញមតិយោបល់ទៅលើ (ឧទាហរណ៍ ពាក្យថា "fajitas" ក្នុងប្រយោគ "I loved the fajitas")។	ជាពាក្យឬឈ្មោះវត្ថុដែលគេកំពុងនិយាយដើម ឬសរសើរ នៅក្នុងប្រយោគមួយ។
Conditional Random Fields	ម៉ូដែលស្ថិតិនិងរៀនដោយម៉ាស៊ីន (Machine Learning) ដែលប្រើសម្រាប់ទស្សន៍ទាយ និងចាត់ថ្នាក់ទិន្នន័យដែលមានលំដាប់លំដោយ ដូចជាការស្វែងរកពាក្យគោលដៅមតិនៅក្នុងលំដាប់នៃប្រយោគអត្ថបទដោយផ្អែកលើបរិបទជុំវិញ។	ដូចជាអ្នកស៊ើបអង្កេតដែលទស្សន៍ទាយសកម្មភាពបន្ទាប់របស់ជនសង្ស័យ ដោយផ្អែកលើលំដាប់នៃសកម្មភាពមុនៗរបស់គេ។
Stacking Classifiers	បច្ចេកទេសរៀនបែបបណ្តុំ (Ensemble Learning) ដែលប្រមូលផ្តុំលទ្ធផលទស្សន៍ទាយពីម៉ូដែលរៀនម៉ាស៊ីនជាច្រើន (Base models) រួចប្រើម៉ូដែលមួយទៀត (Meta-model) មកបូកសរុបដើម្បីសម្រេចចិត្តចុងក្រោយក្នុងការទស្សន៍ទាយ ដើម្បីបង្កើនភាពត្រឹមត្រូវ។	ដូចជាការសួរយោបល់ពីគ្រូពេទ្យឯកទេស៣នាក់ រួចយកចម្លើយទាំង៣នោះទៅឱ្យប្រធានមន្ទីរពេទ្យសម្រេចចិត្តធ្វើរោគវិនិច្ឆ័យចុងក្រោយ។
Word2Vec	ក្បួនដោះស្រាយបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត ដែលបំប្លែងពាក្យទៅជាវ៉ិចទ័រលេខ ដើម្បីឱ្យកុំព្យូទ័រអាចយល់ពីអត្ថន័យ និងទំនាក់ទំនងរវាងពាក្យ ធ្វើឱ្យពាក្យដែលមានន័យស្រដៀងគ្នានឹងមានតម្លៃវ៉ិចទ័រក្បែរគ្នាក្នុងលំហទិន្នន័យ។	ដូចជាការដាក់ទីតាំងនៅលើផែនទី ដែលទីតាំងឬពាក្យដែលមានលក្ខណៈស្រដៀងគ្នានឹងត្រូវដាក់នៅជិតគ្នា។
TF-IDF	រូបមន្តគណនាទម្ងន់ ឬសារៈសំខាន់នៃពាក្យមួយនៅក្នុងឯកសារ ដោយវាផ្តល់ពិន្ទុខ្ពស់ដល់ពាក្យដែលលេចឡើងញឹកញាប់ក្នុងឯកសារនោះ ប៉ុន្តែកម្រមានក្នុងឯកសារផ្សេងទៀត ដើម្បីជួយញែកប្រធានបទ។	ដូចជាការពាក់អាវពណ៌ក្រហមក្នុងចំណោមមនុស្សពាក់អាវសរាប់ពាន់នាក់ ធ្វើឱ្យអ្នកលេចធ្លោ និងងាយចំណាំជាងគេ។
Random Forest Classifiers	ក្បួនដោះស្រាយនៃការរៀនម៉ាស៊ីន ដែលបង្កើត "ដើមឈើការសម្រេចចិត្ត" (Decision Trees) ជាច្រើន ហើយរួមបញ្ចូលលទ្ធផលរបស់វាចូលគ្នា ដើម្បីធ្វើការទស្សន៍ទាយប្រកបដោយភាពត្រឹមត្រូវ និងកាត់បន្ថយការទន្ទេញទិន្នន័យចាំ (Overfitting)។	ដូចជាការបោះឆ្នោតជ្រើសរើសចម្លើយពីគណៈកម្មការរាប់សិបនាក់ ដើម្បីទទួលបានលទ្ធផលរួមដែលត្រឹមត្រូវបំផុត ជំនួសឱ្យការជឿលើមនុស្សតែម្នាក់។
Support Vector Machines	ម៉ូដែលរៀនម៉ាស៊ីន ដែលព្យាយាមគូសបន្ទាត់ ឬព្រំដែន (Hyperplane) ដ៏ល្អបំផុត ដើម្បីបំបែកក្រុមទិន្នន័យ (ឧទាហរណ៍ បំបែកប្រយោគវិជ្ជមាន និងអវិជ្ជមាន) ឱ្យនៅដាច់ពីគ្នាបានច្បាស់លាស់បំផុត។	ដូចជាការគូសបន្ទាត់ព្រំដែននៅលើវាលស្មៅ ដើម្បីបំបែកហ្វូងចៀម និងហ្វូងពពែឱ្យនៅឆ្ងាយពីគ្នាតាមដែលអាចធ្វើទៅបាន។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖