បញ្ហា (The Problem)៖ ប្រព័ន្ធណែនាំ (Recommender systems) ភាគច្រើនតែងតែផ្តោតតែលើភាពត្រឹមត្រូវ ដោយពឹងផ្អែកលើប្រវត្តិអន្តរកម្មចាស់ៗ ដែលបណ្តាលឱ្យមានភាពលម្អៀង និងធ្វើឱ្យអ្នកប្រើប្រាស់ទទួលបានការណែនាំដដែលៗដោយខ្វះភាពចម្រុះ។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះស្នើឡើងនូវប្រព័ន្ធ DyHuCoG ដែលជាការរួមបញ្ចូលគ្នានៃទ្រឹស្តីល្បែងសហប្រតិបត្តិការ (Cooperative game theory) ជាមួយនឹងបណ្តាញសរសៃប្រសាទកម្រិតខ្ពស់។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| DyHuCoG (Proposed) ម៉ូដែលស្នើឡើង DyHuCoG (Dynamic Hypergraph Cooperative Game) |
មានសមត្ថភាពខ្ពស់ក្នុងការធ្វើឱ្យមានតុល្យភាពរវាងភាពត្រឹមត្រូវ ភាពចម្រុះ និងការគ្របដណ្តប់នៃកាតាឡុកទំនិញ ព្រមទាំងមានភាពងាយស្រួលក្នុងការបកស្រាយលទ្ធផល (Interpretability)។ | ទាមទារថាមពលគណនា និងរយៈពេលបង្វឹក (Training time) ខ្ពស់ជាងម៉ូដែលទូទៅប្រហែល 1.78 ដង ដោយសារការគណនាតម្លៃ Shapley។ | ទទួលបានលទ្ធផលខ្ពស់បំផុតដោយ NDCG@20 = 0.2775 លើទិន្នន័យ MovieLens-1M និង 0.0306 លើ Amazon-Book។ |
| HPCF (Hypergraph Projection Enhanced CF) ម៉ូដែល HPCF |
ជាម៉ូដែលកំពូលនាពេលថ្មីៗនេះ (State-of-the-art) ដែលប្រើប្រាស់បណ្តាញហាយភើក្រាហ្វបានយ៉ាងល្អក្នុងការចាប់យកទំនាក់ទំនងទិន្នន័យ។ | នៅខ្វះសមត្ថភាពក្នុងការផ្តល់ទម្ងន់ដោយស្វ័យប្រវត្តិទៅលើចំណូលចិត្តជាក់លាក់របស់អ្នកប្រើប្រាស់ ដែលធ្វើឱ្យភាពចម្រុះនៃការណែនាំនៅមានកម្រិត។ | ទទួលបាន NDCG@20 កម្រិត 0.2528 លើទិន្នន័យ MovieLens-1M។ |
| LightGCN ម៉ូដែល LightGCN |
មានរចនាសម្ព័ន្ធសាមញ្ញ និងមានប្រសិទ្ធភាពខ្ពស់ក្នុងការគណនា និងដំណើរការលឿន។ | ងាយរងឥទ្ធិពលពីទំនិញដែលពេញនិយមខ្លាំង (Popularity bias) ដែលធ្វើឱ្យការណែនាំខ្វះភាពចម្រុះ និងមិនសូវជួយដល់ទំនិញថ្មីៗ។ | ទទួលបាន NDCG@20 កម្រិត 0.2130 លើទិន្នន័យ MovieLens-1M។ |
| MF (Matrix Factorization) ម៉ូដែល MF |
ជាម៉ូដែលមូលដ្ឋានគ្រឹះដែលមានភាពសាមញ្ញបំផុត និងងាយស្រួលក្នុងការសរសេរកូដបង្កើតឡើង។ | មានដំណើរការខ្សោយខ្លាំងនៅពេលជួបប្រទះទិន្នន័យដែលស្តួចស្តើង (Sparse data) និងមិនអាចចាប់យកទំនាក់ទំនងស្មុគស្មាញបាន។ | ទទួលបានលទ្ធផលទាបបំផុតដោយ NDCG@20 ត្រឹមតែ 0.1200 លើ MovieLens-1M និង 0.0049 លើ Amazon-Book។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះទាមទារធនធានកុំព្យូទ័រ និងផ្នែករឹងកម្រិតខ្ពស់ ជាពិសេសសម្រាប់ការគណនាតម្លៃ Shapley នៅក្នុងបណ្តាញសរសៃប្រសាទកម្រិតជ្រៅក្នុងទ្រង់ទ្រាយធំ។
ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យពី MovieLens និង Amazon ដែលឆ្លុះបញ្ចាំងជាចម្បងពីឥរិយាបថរបស់អ្នកប្រើប្រាស់នៅក្នុងបស្ចិមប្រទេស។ សម្រាប់បរិបទប្រទេសកម្ពុជា ចំណូលចិត្ត វប្បធម៌ និងអាកប្បកិរិយានៃការទិញទំនិញ ឬការប្រើប្រាស់មាតិកាឌីជីថលអាចមានភាពខុសប្លែកគ្នាខ្លាំង ដែលទាមទារឱ្យមានការប្រមូលទិន្នន័យក្នុងស្រុកដើម្បីយកមកបង្វឹកម៉ូដែលនេះឡើងវិញដើម្បីចៀសវាងភាពលម្អៀង។
ម៉ូដែលនេះមានសក្តានុពលខ្ពស់ណាស់ក្នុងការកែលម្អប្រព័ន្ធណែនាំពាណិជ្ជកម្មអេឡិចត្រូនិក និងមាតិកាឌីជីថលនៅក្នុងប្រទេសកម្ពុជា។
សរុបមក ការអនុវត្តបច្ចេកវិទ្យា DyHuCoG អាចជួយធុរកិច្ចក្នុងស្រុកផ្តល់ជូនបទពិសោធន៍អតិថិជនដ៏ប្រសើរ និងមានភាពចម្រុះ ប៉ុន្តែវាទាមទារការវិនិយោគជាមុនលើហេដ្ឋារចនាសម្ព័ន្ធទិន្នន័យ និងអ្នកជំនាញ AI ។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Shapley value | ជាទ្រឹស្តីគណិតវិទ្យាក្នុងល្បែងសហប្រតិបត្តិការ ដែលត្រូវបានប្រើដើម្បីគណនា និងបែងចែកឥទ្ធិពល ឬតម្លៃនៃការចូលរួមរបស់ធាតុនីមួយៗឱ្យបានយុត្តិធម៌បំផុត។ ក្នុងការសិក្សានេះ វាវាស់ស្ទង់ថាអន្តរកម្មនីមួយៗរួមចំណែកប៉ុណ្ណាដល់ភាពត្រឹមត្រូវនៃការណែនាំ។ | ដូចជាការបែងចែកប្រាក់រង្វាន់ដល់សមាជិកក្រុមនីមួយៗទៅតាមទំហំការងារ និងលទ្ធផលជាក់ស្តែងដែលពួកគេម្នាក់ៗបានខិតខំធ្វើ មិនមែនគ្រាន់តែចែកស្មើៗគ្នានោះទេ។ |
| Hypergraph | ជាប្រភេទក្រាហ្វកម្រិតខ្ពស់នៅក្នុងគណិតវិទ្យា ដែលខ្សែភ្ជាប់មួយ (Hyperedge) អាចភ្ជាប់ចំណុច (Nodes) ច្រើនជាងពីរក្នុងពេលតែមួយ។ វាជួយឱ្យកុំព្យូទ័រយល់ពីទំនាក់ទំនងស្មុគស្មាញរវាង អ្នកប្រើប្រាស់ ទំនិញ និងបរិបទក្នុងពេលតែមួយ។ | ដូចជាគ្រុបឆាត (Group Chat) ដែលមនុស្សជាច្រើនអាចទាក់ទងគ្នាក្នុងពេលតែមួយ ខុសពីការឆាតពីរនាក់ទល់នឹងពីរនាក់ (ក្រាហ្វធម្មតា)។ |
| Collaborative Filtering | ជាបច្ចេកទេសមូលដ្ឋានក្នុងប្រព័ន្ធណែនាំ ដែលធ្វើការទស្សន៍ទាយចំណូលចិត្តរបស់អ្នកប្រើប្រាស់ម្នាក់ ដោយផ្អែកលើទិន្នន័យប្រវត្តិ និងអាកប្បកិរិយារបស់អ្នកប្រើប្រាស់ផ្សេងទៀតដែលមានចំណូលចិត្តស្រដៀងគ្នា។ | ដូចជាការដែលមិត្តភក្តិរបស់អ្នកដែលមានចំណូលចិត្តមើលរឿងស្រដៀងអ្នក បានណែនាំរឿងថ្មីមួយឱ្យអ្នកមើល ព្រោះគេជឿថាអ្នកក៏នឹងចូលចិត្តរឿងនោះដែរ។ |
| Normalized Discounted Cumulative Gain (NDCG) | ជារង្វាស់ស្តង់ដារសម្រាប់វាយតម្លៃគុណភាពនៃការរៀបចំចំណាត់ថ្នាក់របស់ប្រព័ន្ធណែនាំ។ វាផ្តល់ពិន្ទុខ្ពស់ប្រសិនបើទំនិញដែលអ្នកប្រើប្រាស់ពេញចិត្តខ្លាំងត្រូវបានបង្ហាញនៅលេខរៀងខាងលើគេនៃបញ្ជី។ | ដូចជាការដាក់សៀវភៅដែលអ្នកចង់អានបំផុតនៅខាងលើគេនៃគំនរសៀវភៅ ដើម្បីឱ្យអ្នកងាយស្រួលទាញយកភ្លាមៗ ដោយមិនបាច់កកាយរកនៅខាងក្រោម។ |
| Cold-start | ជាបញ្ហាប្រឈមដ៏ធំនៅក្នុងប្រព័ន្ធណែនាំ នៅពេលដែលមានអ្នកប្រើប្រាស់ថ្មី ឬទំនិញថ្មីទើបតែបញ្ចូលក្នុងប្រព័ន្ធ ដែលធ្វើឱ្យប្រព័ន្ធមិនទាន់មានទិន្នន័យប្រវត្តិគ្រប់គ្រាន់ដើម្បីធ្វើការទស្សន៍ទាយចំណូលចិត្តឱ្យបានត្រឹមត្រូវ។ | ដូចជាអ្នកទើបតែដើរចូលហាងកាហ្វេមួយជាលើកដំបូង ហើយអ្នកឆុងកាហ្វេមិនដឹងថាត្រូវណែនាំកាហ្វេអ្វីដល់អ្នក ព្រោះគេមិនធ្លាប់ស្គាល់អ្នកពីមុនមក។ |
| Intra-list Diversity | ជាការវាស់ស្ទង់ភាពខុសគ្នា ឬភាពចម្រុះនៃទំនិញដែលបានបង្ហាញនៅក្នុងបញ្ជីណែនាំតែមួយ។ ការបង្កើនភាពចម្រុះនេះជួយកាត់បន្ថយការបង្ហាញទំនិញដដែលៗ និងជួយឱ្យអ្នកប្រើប្រាស់ស្វែងរកអ្វីដែលថ្មី (ទម្លុះរនាំង Filter Bubble)។ | ដូចជាការរៀបចំចានម្ហូបនៅលើតុដែលមានទាំងសម្ល ឆា ស្ងោរ និងបំពង មិនមែនមានតែម្ហូបឆាទាំងអស់នោះទេ ដើម្បីឱ្យអាហារកាន់តែមានឱជារស។ |
| Cooperative Game | ជាទ្រឹស្តីល្បែងដែលតួអង្គ (អ្នកលេង) ធ្វើសហប្រតិបត្តិការជាក្រុម (បង្កើតជាសម្ព័ន្ធភាព) ដើម្បីសម្រេចបាននូវគោលដៅរួម ឬទទួលបានអត្ថប្រយោជន៍អតិបរមា ជាជាងការប្រកួតប្រជែងគ្នា។ | ដូចជាក្រុមនិស្សិតដែលធ្វើការងារជាក្រុម (Assignment) ដោយម្នាក់ៗបញ្ចេញសមត្ថភាពរៀងៗខ្លួន ដើម្បីទទួលបានពិន្ទុរួមខ្ពស់បំផុត។ |
| Bayesian Personalized Ranking (BPR) | ជាក្បួនដោះស្រាយម៉ាស៊ីនរៀនដែលប្រើសម្រាប់ធ្វើការរៀបចំចំណាត់ថ្នាក់តាមចំណូលចិត្តបុគ្គល ដោយបង្វឹកប្រព័ន្ធឱ្យកំណត់ទម្ងន់ទំនិញដែលអ្នកប្រើប្រាស់ធ្លាប់មានអន្តរកម្ម ឱ្យមានចំណាត់ថ្នាក់ខ្ពស់ជាងទំនិញដែលពួកគេមិនធ្លាប់ស្គាល់។ | ដូចជាការបង្រៀនកុំព្យូទ័រឱ្យចេះទាយថា 'ប្រសិនបើអ្នកធ្លាប់ចុច Like លើរូបឆ្កែ នោះអ្នកប្រាកដជាចូលចិត្តរូបឆ្កែ ជាងរូបសត្វល្អិតដែលអ្នកមិនធ្លាប់ចុចមើលសោះ'។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖