បញ្ហា (The Problem)៖ ប្រព័ន្ធផ្តល់អនុសាសន៍បច្ចុប្បន្នភាគច្រើនចាប់យកតែចំណូលចិត្តទូទៅរបស់អ្នកប្រើប្រាស់ (Macro-view) ប៉ុន្តែខកខានក្នុងការស្វែងយល់ពីចំណូលចិត្តលម្អិតនៅក្នុងប្រភេទនៃទំនិញនីមួយៗ (Micro-view) ឬត្រូវពឹងផ្អែកលើទិន្នន័យការវាយតម្លៃដែលមានភាពរំខាន។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះស្នើឡើងនូវម៉ូដែលឈ្មោះ DVAR ដែលប្រើប្រាស់បណ្តាញព័ត៌មានមិនដូចគ្នា (HIN) ដើម្បីធ្វើសមាហរណកម្មចំណូលចិត្តទាំងពីរទស្សនៈ និងប្រើប្រាស់បច្ចេកទេសសម្របខ្លួនដើម្បីបង្កើតប៉ារ៉ាម៉ែត្រព្យាករណ៍។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| DVAR (Proposed Method) ការរៀនចំណូលចិត្តពីរទស្សនៈតាមបែបសម្របខ្លួន (Dual-View Adaptive Recommendation) |
មានសមត្ថភាពចាប់យកចំណូលចិត្តលម្អិតរបស់អ្នកប្រើប្រាស់ទៅលើប្រភេទធាតុផ្សេងៗគ្នា (Micro-view) និងអាចសម្របប៉ារ៉ាម៉ែត្រព្យាករណ៍ទៅតាមស្ថានការណ៍ជាក់ស្តែង។ | ត្រូវការធនធានកុំព្យូទ័រខ្លាំងជាងម៉ូដែលសាមញ្ញ និងទាមទារឱ្យមានទិន្នន័យប្រភេទ (Category info) ច្បាស់លាស់។ | ទទួលបានពិន្ទុខ្ពស់បំផុតលើរង្វាស់រង្វាយ Precision, Recall និង NDCG លើសំណុំទិន្នន័យទាំង ៤ បើធៀបនឹងវិធីសាស្ត្រដទៃ។ |
| NeuCF (Neural Collaborative Filtering) ការច្រោះសហការដោយប្រើបណ្តាញសរសៃប្រសាទ |
ដំណើរការលឿន និងជាស្តង់ដារដែលត្រូវបានប្រើប្រាស់យ៉ាងទូលំទូលាយ។ | ចាប់យកបានតែចំណូលចិត្តទូទៅ (Macro-view) និងមិនអាចវិភាគទំនាក់ទំនងស្មុគស្មាញក្នុងបណ្តាញ HIN បានល្អ។ | មានប្រសិទ្ធភាពទាបជាង DVAR ជាពិសេសលើទិន្នន័យដែលមានភាពរាយប៉ាយ (Sparse data) ដូចជា Alibaba dataset។ |
| HERec / MTRec ប្រព័ន្ធផ្តល់អនុសាសន៍ផ្អែកលើបណ្តាញ HIN |
អាចប្រើប្រាស់ព័ត៌មានអត្ថន័យពីបណ្តាញ HIN តាមរយៈ Meta-paths ដើម្បីបង្កើនប្រសិទ្ធភាព។ | ម៉ូដែលត្រូវបានបង្វឹកហើយមិនអាចកែប្រែប៉ារ៉ាម៉ែត្រដោយស្វ័យប្រវត្តិសម្រាប់អ្នកប្រើប្រាស់ម្នាក់ៗដូច DVAR ទេ។ | ផ្តល់លទ្ធផលល្អប្រសើរជាងវិធីសាស្ត្របុរាណ ប៉ុន្តែនៅតែទាបជាង DVAR ដែលមានសមត្ថភាពសម្របខ្លួន។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារធនធានកុំព្យូទ័រដែលមានសមត្ថភាពខ្ពស់សម្រាប់ការបង្វឹកម៉ូដែល ជាពិសេសគឺការប្រើប្រាស់ GPU ដើម្បីគណនាបណ្តាញសរសៃប្រសាទនិងដំណើរការលើទិន្នន័យធំ។
ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យពីបរទេសដូចជា MovieLens (អាមេរិក), Last.fm (តន្ត្រីសកល), និង Alibaba (ចិន)។ សម្រាប់បរិបទកម្ពុជា ទិន្នន័យពាណិជ្ជកម្មអេឡិចត្រូនិកអាចមានភាពខុសប្លែកគ្នានៃឥរិយាបថអ្នកប្រើប្រាស់ និងកង្វះខាតរចនាសម្ព័ន្ធទិន្នន័យប្រភេទ (Item Categories) ដែលច្បាស់លាស់។
វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់សម្រាប់កម្ពុជា ដោយសារវិស័យឌីជីថលកំពុងរីកចម្រើន ប៉ុន្តែប្រឈមនឹងបញ្ហាទិន្នន័យរាយប៉ាយ (Data Sparsity) ដែល DVAR អាចជួយដោះស្រាយបាន។
ការប្រើប្រាស់បច្ចេកទេសសម្របខ្លួន (Adaptive Learning) នឹងជួយបង្កើនបទពិសោធន៍អ្នកប្រើប្រាស់ក្នុងស្រុក និងបង្កើនអត្រានៃការលក់សម្រាប់អាជីវកម្មឌីជីថលនៅកម្ពុជា។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Macro-view and Micro-view | គំនិតដែលបែងចែកចំណូលចិត្តអ្នកប្រើប្រាស់ជាពីរកម្រិត៖ ទស្សនៈម៉ាក្រូ (Macro) គឺជាចំណាប់អារម្មណ៍ទូទៅលើគ្រប់ប្រភេទធាតុ រីឯទស្សនៈមីក្រូ (Micro) គឺជាចំណូលចិត្តលម្អិតដែលប្រែប្រួលទៅតាមប្រភេទជាក់លាក់នីមួយៗនៃធាតុ។ | ដូចជាមនុស្សម្នាក់ចូលចិត្តមើល "ភាពយន្ត" ទូទៅ (ម៉ាក្រូ) ប៉ុន្តែសម្រាប់រឿង "កំប្លែង" គាត់ចូលចិត្តតួអង្គ A រីឯរឿង "វាយប្រហារ" គាត់ចូលចិត្តតួអង្គ B (មីក្រូ)។ |
| Heterogeneous Information Network (HIN) | ជាប្រភេទនៃក្រាហ្វទិន្នន័យដែលមានផ្ទុកនូវប្រភេទថ្នាំង (Nodes) និងការតភ្ជាប់ (Edges) ច្រើនប្រភេទផ្សេងៗគ្នា (ដូចជា អ្នកប្រើប្រាស់, ទំនិញ, ប្រភេទ) ដើម្បីតំណាងឱ្យទំនាក់ទំនងដ៏ស្មុគស្មាញនៅក្នុងប្រព័ន្ធ។ | ប្រៀបដូចជាផែនទីមួយដែលមិនត្រឹមតែបង្ហាញផ្លូវថ្នល់ប៉ុណ្ណោះទេ តែថែមទាំងបង្ហាញទីតាំងហាង សាលារៀន និងទំនាក់ទំនងរវាងមនុស្សនៅក្នុងតំបន់នោះផងដែរ។ |
| Meta-paths | ជាលំដាប់នៃទំនាក់ទំនងដែលភ្ជាប់ថ្នាំងពីរនៅក្នុងបណ្តាញ HIN ដើម្បីកំណត់ពីអត្ថន័យនៃទំនាក់ទំនងរវាងពួកវា (ឧទាហរណ៍៖ អ្នកប្រើប្រាស់ -> ទំនិញ -> ប្រភេទ -> ទំនិញ)។ | ដូចជាការរកឃើញទំនាក់ទំនងរវាងមនុស្សពីរនាក់ដោយនិយាយថា "យើងទាំងពីរធ្លាប់ទិញទំនិញប្រភេទដូចគ្នា" ដែលជាផ្លូវភ្ជាប់ទំនាក់ទំនងតាមរយៈការទិញ។ |
| Hypernetworks | ជាបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត (Neural Network) មួយដែលរៀនបង្កើតប៉ារ៉ាម៉ែត្រ (Weights) សម្រាប់បណ្តាញមួយផ្សេងទៀត ដើម្បីឱ្យបណ្តាញនោះអាចសម្របខ្លួនទៅនឹងទិន្នន័យបញ្ចូលថ្មីៗដោយស្វ័យប្រវត្តិ។ | ប្រៀបបានទៅនឹងមេជាងម្នាក់ដែលប្រាប់កូនជាងឱ្យផ្លាស់ប្តូររបៀបធ្វើការភ្លាមៗទៅតាមប្រភេទការងារដែលចូលមកដល់ ដើម្បីឱ្យការងារនោះមានប្រសិទ្ធភាពបំផុត។ |
| Feature-wise Linear Modulation (FiLM) | ជាបច្ចេកទេសគណិតវិទ្យាមួយដែលអនុញ្ញាតឱ្យម៉ូដែលកែប្រែលក្ខណៈសម្បត្តិនៃទិន្នន័យដោយការគុណ (Scaling) និងបូក (Shifting) ដើម្បីសម្របទៅនឹងលក្ខខណ្ឌណាមួយ (ដូចជាប្រភេទនៃទំនិញ)។ | ដូចជាការកែសម្រួលសំឡេង (Volume) និង បាស (Bass) នៃវិទ្យុដោយស្វ័យប្រវត្តិទៅតាមប្រភេទបទចម្រៀងដែលកំពុងចាក់ ដើម្បីឱ្យស្តាប់ទៅពិរោះបំផុត។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖