Original Title: Dual-view preference learning for adaptive recommendation
Source: doi.org/10.1109/TKDE.2023.3236370
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការរៀនចំណូលចិត្តតាមទស្សនៈពីរសម្រាប់ការផ្តល់អនុសាសន៍តាមបែបសម្របខ្លួន

ចំណងជើងដើម៖ Dual-view preference learning for adaptive recommendation

អ្នកនិពន្ធ៖ Zhongzhou Liu (Singapore Management University), Yuan Fang (Singapore Management University), Min Wu (Institute for Infocomm Research, A*STAR)

ឆ្នាំបោះពុម្ព៖ 2023 (IEEE Transactions on Knowledge and Data Engineering)

វិស័យសិក្សា៖ Computer Science

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ប្រព័ន្ធផ្តល់អនុសាសន៍បច្ចុប្បន្នភាគច្រើនចាប់យកតែចំណូលចិត្តទូទៅរបស់អ្នកប្រើប្រាស់ (Macro-view) ប៉ុន្តែខកខានក្នុងការស្វែងយល់ពីចំណូលចិត្តលម្អិតនៅក្នុងប្រភេទនៃទំនិញនីមួយៗ (Micro-view) ឬត្រូវពឹងផ្អែកលើទិន្នន័យការវាយតម្លៃដែលមានភាពរំខាន។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះស្នើឡើងនូវម៉ូដែលឈ្មោះ DVAR ដែលប្រើប្រាស់បណ្តាញព័ត៌មានមិនដូចគ្នា (HIN) ដើម្បីធ្វើសមាហរណកម្មចំណូលចិត្តទាំងពីរទស្សនៈ និងប្រើប្រាស់បច្ចេកទេសសម្របខ្លួនដើម្បីបង្កើតប៉ារ៉ាម៉ែត្រព្យាករណ៍។

ការបង្កើតបណ្តាញព័ត៌មានមិនដូចគ្នា (Heterogeneous Information Network Construction) នៃអ្នកប្រើប្រាស់ ទំនិញ និងប្រភេទ
ការប្រើប្រាស់ផ្លូវមេតា (Meta-paths) និងបច្ចេកទេស mp2vec ដើម្បីបង្កើតទិន្នន័យតំណាង
ម៉ូឌុលសម្របខ្លួនតាមទស្សនៈពីរ (Dual-View Adaptive Module) ដោយប្រើ Hypernetworks និង FiLM

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ម៉ូដែល DVAR ទទួលបានលទ្ធផលល្អប្រសើរជាងវិធីសាស្ត្រទំនើបៗផ្សេងទៀតនៅលើសំណុំទិន្នន័យចំនួន ៤ (MovieLens, Last.fm, Serendipity, និង Alibaba) ដោយមានការកើនឡើងប្រសិទ្ធភាពគួរឱ្យកត់សម្គាល់។
ការធ្វើតេស្តបង្ហាញថា ការរួមបញ្ចូលគ្នានៃទស្សនៈម៉ាក្រូ និងមីក្រូ តាមរបៀបសម្របខ្លួន (Adaptive way) ជួយឱ្យប្រព័ន្ធយល់ច្បាស់ពីចំណូលចិត្តលម្អិតរបស់អ្នកប្រើប្រាស់ដោយមិនចាំបាច់ពឹងផ្អែកលើទិន្នន័យអត្ថបទ (Text reviews)។
ម៉ូដែលនេះមានសមត្ថភាពសម្របខ្លួនដោយស្វ័យប្រវត្តិទៅនឹងអ្នកប្រើប្រាស់ និងប្រភេទធាតុផ្សេងៗគ្នា ដែលបង្កើនភាពជាក់លាក់នៃការផ្តល់អនុសាសន៍។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
DVAR (Proposed Method) ការរៀនចំណូលចិត្តពីរទស្សនៈតាមបែបសម្របខ្លួន (Dual-View Adaptive Recommendation)	មានសមត្ថភាពចាប់យកចំណូលចិត្តលម្អិតរបស់អ្នកប្រើប្រាស់ទៅលើប្រភេទធាតុផ្សេងៗគ្នា (Micro-view) និងអាចសម្របប៉ារ៉ាម៉ែត្រព្យាករណ៍ទៅតាមស្ថានការណ៍ជាក់ស្តែង។	ត្រូវការធនធានកុំព្យូទ័រខ្លាំងជាងម៉ូដែលសាមញ្ញ និងទាមទារឱ្យមានទិន្នន័យប្រភេទ (Category info) ច្បាស់លាស់។	ទទួលបានពិន្ទុខ្ពស់បំផុតលើរង្វាស់រង្វាយ Precision, Recall និង NDCG លើសំណុំទិន្នន័យទាំង ៤ បើធៀបនឹងវិធីសាស្ត្រដទៃ។
NeuCF (Neural Collaborative Filtering) ការច្រោះសហការដោយប្រើបណ្តាញសរសៃប្រសាទ	ដំណើរការលឿន និងជាស្តង់ដារដែលត្រូវបានប្រើប្រាស់យ៉ាងទូលំទូលាយ។	ចាប់យកបានតែចំណូលចិត្តទូទៅ (Macro-view) និងមិនអាចវិភាគទំនាក់ទំនងស្មុគស្មាញក្នុងបណ្តាញ HIN បានល្អ។	មានប្រសិទ្ធភាពទាបជាង DVAR ជាពិសេសលើទិន្នន័យដែលមានភាពរាយប៉ាយ (Sparse data) ដូចជា Alibaba dataset។
HERec / MTRec ប្រព័ន្ធផ្តល់អនុសាសន៍ផ្អែកលើបណ្តាញ HIN	អាចប្រើប្រាស់ព័ត៌មានអត្ថន័យពីបណ្តាញ HIN តាមរយៈ Meta-paths ដើម្បីបង្កើនប្រសិទ្ធភាព។	ម៉ូដែលត្រូវបានបង្វឹកហើយមិនអាចកែប្រែប៉ារ៉ាម៉ែត្រដោយស្វ័យប្រវត្តិសម្រាប់អ្នកប្រើប្រាស់ម្នាក់ៗដូច DVAR ទេ។	ផ្តល់លទ្ធផលល្អប្រសើរជាងវិធីសាស្ត្របុរាណ ប៉ុន្តែនៅតែទាបជាង DVAR ដែលមានសមត្ថភាពសម្របខ្លួន។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារធនធានកុំព្យូទ័រដែលមានសមត្ថភាពខ្ពស់សម្រាប់ការបង្វឹកម៉ូដែល ជាពិសេសគឺការប្រើប្រាស់ GPU ដើម្បីគណនាបណ្តាញសរសៃប្រសាទនិងដំណើរការលើទិន្នន័យធំ។

Hardware: ម៉ូដែលនេះត្រូវបានពិសោធន៍លើ Workstation ដែលមាន CPU 6-core 3.6 GHz, RAM 128 GB និង GPU RTX 2080 Ti ចំនួន ២ គ្រាប់។
Software: ត្រូវបានអនុវត្តដោយប្រើ Python 3.6 និងបណ្ណាល័យ TensorFlow 2.2។
Data Processing: ត្រូវការការបង្កើតបណ្តាញ HIN និងការគណនា Meta-paths ដែលទាមទារការរៀបចំទិន្នន័យ (Preprocessing) យ៉ាងល្អិតល្អន់។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យពីបរទេសដូចជា MovieLens (អាមេរិក), Last.fm (តន្ត្រីសកល), និង Alibaba (ចិន)។ សម្រាប់បរិបទកម្ពុជា ទិន្នន័យពាណិជ្ជកម្មអេឡិចត្រូនិកអាចមានភាពខុសប្លែកគ្នានៃឥរិយាបថអ្នកប្រើប្រាស់ និងកង្វះខាតរចនាសម្ព័ន្ធទិន្នន័យប្រភេទ (Item Categories) ដែលច្បាស់លាស់។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់សម្រាប់កម្ពុជា ដោយសារវិស័យឌីជីថលកំពុងរីកចម្រើន ប៉ុន្តែប្រឈមនឹងបញ្ហាទិន្នន័យរាយប៉ាយ (Data Sparsity) ដែល DVAR អាចជួយដោះស្រាយបាន។

ពាណិជ្ជកម្មអេឡិចត្រូនិក (E-commerce): អាចអនុវត្តលើវេទិកាដូចជា Khmer24 ឬ AEON Online ដើម្បីផ្តល់អនុសាសន៍ទំនិញដែលតម្រូវតាមចំណូលចិត្តជាក់លាក់របស់អ្នកប្រើប្រាស់ក្នុងប្រភេទផលិតផលនីមួយៗ។
សេវាកម្មដឹកជញ្ជូនអាហារ (Food Delivery): សម្រាប់កម្មវិធីដូចជា Nham24 ឬ GrabFood ក្នុងការណែនាំអាហារ ដោយបែងចែកចំណូលចិត្តរវាងប្រភេទអាហារផ្សេងៗគ្នា (ឧ. ចូលចិត្តហាងថ្លៃសម្រាប់អាហារថ្ងៃត្រង់ ប៉ុន្តែចូលចិត្តអាហាររហ័សសម្រាប់ពេលល្ងាច)។

ការប្រើប្រាស់បច្ចេកទេសសម្របខ្លួន (Adaptive Learning) នឹងជួយបង្កើនបទពិសោធន៍អ្នកប្រើប្រាស់ក្នុងស្រុក និងបង្កើនអត្រានៃការលក់សម្រាប់អាជីវកម្មឌីជីថលនៅកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

ការពង្រឹងមូលដ្ឋានគ្រឹះបច្ចេកទេស: និស្សិតគួរចាប់ផ្តើមសិក្សាអំពី Python និងបណ្ណាល័យ Deep Learning ដូចជា TensorFlow ឬ PyTorch ព្រមទាំងស្វែងយល់ពីគោលគំនិតនៃ Heterogeneous Information Networks (HIN)។
ការរៀបចំទិន្នន័យក្នុងស្រុក: ប្រមូលទិន្នន័យពីប្រភពបើកចំហរ ឬបង្កើតសំណុំទិន្នន័យសាកល្បងពីវេទិកាក្នុងស្រុក ដោយផ្តោតលើការកត់ត្រាទំនាក់ទំនងរវាង អ្នកប្រើប្រាស់-ទំនិញ-ប្រភេទ (User-Item-Category)។
ការអនុវត្តម៉ូដែល mp2vec: អនុវត្តកូដ mp2vec (metapath2vec) ដើម្បីបង្កើតទិន្នន័យតំណាង (Embeddings) សម្រាប់ថ្នាំងនីមួយៗក្នុងបណ្តាញ HIN ដែលជាធាតុចូលសំខាន់សម្រាប់ DVAR។
ការអភិវឌ្ឍ និងតេស្តម៉ូដែល DVAR: សរសេរកូដម៉ូដែល DVAR ដោយយោងតាមឯកសារភ្ជាប់ (Github repository របស់អ្នកនិពន្ធ) ហើយធ្វើការពិសោធន៍ប្រៀបធៀបជាមួយម៉ូដែលសាមញ្ញដូចជា NeuCF ដើម្បីមើលប្រសិទ្ធភាព។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Macro-view and Micro-view	គំនិតដែលបែងចែកចំណូលចិត្តអ្នកប្រើប្រាស់ជាពីរកម្រិត៖ ទស្សនៈម៉ាក្រូ (Macro) គឺជាចំណាប់អារម្មណ៍ទូទៅលើគ្រប់ប្រភេទធាតុ រីឯទស្សនៈមីក្រូ (Micro) គឺជាចំណូលចិត្តលម្អិតដែលប្រែប្រួលទៅតាមប្រភេទជាក់លាក់នីមួយៗនៃធាតុ។	ដូចជាមនុស្សម្នាក់ចូលចិត្តមើល "ភាពយន្ត" ទូទៅ (ម៉ាក្រូ) ប៉ុន្តែសម្រាប់រឿង "កំប្លែង" គាត់ចូលចិត្តតួអង្គ A រីឯរឿង "វាយប្រហារ" គាត់ចូលចិត្តតួអង្គ B (មីក្រូ)។
Heterogeneous Information Network (HIN)	ជាប្រភេទនៃក្រាហ្វទិន្នន័យដែលមានផ្ទុកនូវប្រភេទថ្នាំង (Nodes) និងការតភ្ជាប់ (Edges) ច្រើនប្រភេទផ្សេងៗគ្នា (ដូចជា អ្នកប្រើប្រាស់, ទំនិញ, ប្រភេទ) ដើម្បីតំណាងឱ្យទំនាក់ទំនងដ៏ស្មុគស្មាញនៅក្នុងប្រព័ន្ធ។	ប្រៀបដូចជាផែនទីមួយដែលមិនត្រឹមតែបង្ហាញផ្លូវថ្នល់ប៉ុណ្ណោះទេ តែថែមទាំងបង្ហាញទីតាំងហាង សាលារៀន និងទំនាក់ទំនងរវាងមនុស្សនៅក្នុងតំបន់នោះផងដែរ។
Meta-paths	ជាលំដាប់នៃទំនាក់ទំនងដែលភ្ជាប់ថ្នាំងពីរនៅក្នុងបណ្តាញ HIN ដើម្បីកំណត់ពីអត្ថន័យនៃទំនាក់ទំនងរវាងពួកវា (ឧទាហរណ៍៖ អ្នកប្រើប្រាស់ -> ទំនិញ -> ប្រភេទ -> ទំនិញ)។	ដូចជាការរកឃើញទំនាក់ទំនងរវាងមនុស្សពីរនាក់ដោយនិយាយថា "យើងទាំងពីរធ្លាប់ទិញទំនិញប្រភេទដូចគ្នា" ដែលជាផ្លូវភ្ជាប់ទំនាក់ទំនងតាមរយៈការទិញ។
Hypernetworks	ជាបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (Neural Network) មួយដែលរៀនបង្កើតប៉ារ៉ាម៉ែត្រ (Weights) សម្រាប់បណ្តាញមួយផ្សេងទៀត ដើម្បីឱ្យបណ្តាញនោះអាចសម្របខ្លួនទៅនឹងទិន្នន័យបញ្ចូលថ្មីៗដោយស្វ័យប្រវត្តិ។	ប្រៀបបានទៅនឹងមេជាងម្នាក់ដែលប្រាប់កូនជាងឱ្យផ្លាស់ប្តូររបៀបធ្វើការភ្លាមៗទៅតាមប្រភេទការងារដែលចូលមកដល់ ដើម្បីឱ្យការងារនោះមានប្រសិទ្ធភាពបំផុត។
Feature-wise Linear Modulation (FiLM)	ជាបច្ចេកទេសគណិតវិទ្យាមួយដែលអនុញ្ញាតឱ្យម៉ូដែលកែប្រែលក្ខណៈសម្បត្តិនៃទិន្នន័យដោយការគុណ (Scaling) និងបូក (Shifting) ដើម្បីសម្របទៅនឹងលក្ខខណ្ឌណាមួយ (ដូចជាប្រភេទនៃទំនិញ)។	ដូចជាការកែសម្រួលសំឡេង (Volume) និង បាស (Bass) នៃវិទ្យុដោយស្វ័យប្រវត្តិទៅតាមប្រភេទបទចម្រៀងដែលកំពុងចាក់ ដើម្បីឱ្យស្តាប់ទៅពិរោះបំផុត។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖