Original Title: Dynamic Recommender Systems with Real-time Shapley Value-based Contribution Adjustment
Source: doi.org/10.22266/ijies2025.1031.16
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ប្រព័ន្ធផ្តល់អនុសាសន៍សកម្មជាមួយនឹងការកែតម្រូវការចូលរួមផ្អែកលើតម្លៃ Shapley ក្នុងពេលវេលាជាក់ស្តែង

ចំណងជើងដើម៖ Dynamic Recommender Systems with Real-time Shapley Value-based Contribution Adjustment

អ្នកនិពន្ធ៖ Redwane Nesmaoui (Mohammed V University in Rabat, Morocco), Mouad Louhichi, Mohamed Lazaar

ឆ្នាំបោះពុម្ព៖ 2025, International Journal of Intelligent Engineering and Systems

វិស័យសិក្សា៖ Computer Science

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ប្រព័ន្ធផ្តល់អនុសាសន៍ (Recommender systems) ភាគច្រើនខ្វះតម្លាភាពដោយដំណើរការជា "ប្រអប់ខ្មៅ" (black boxes) និងជួបការលំបាកក្នុងការសម្របខ្លួនទៅនឹងការផ្លាស់ប្តូរចំណង់ចំណូលចិត្តរបស់អ្នកប្រើប្រាស់។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានស្នើឡើងនូវក្របខ័ណ្ឌផ្អែកលើតម្លៃ Adaptive Shapley ដែលត្រូវបានអនុវត្តទៅលើវិធីសាស្ត្រចម្រោះដោយសហការ (collaborative filtering) ចំនួនបួន និងត្រូវបានវាយតម្លៃលើសំណុំទិន្នន័យខ្នាតធំចំនួនពីរ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Baseline Collaborative Filtering (UBCF, IBCF, MF, NCF)
វិធីសាស្ត្រចម្រោះដោយសហការមូលដ្ឋាន (គ្មានការបន្ថែមតម្លៃ Shapley)
មានភាពសាមញ្ញក្នុងការអនុវត្ត និងមានប្រសិទ្ធភាពខ្ពស់សម្រាប់ទិន្នន័យទូទៅ។ ប្រើប្រាស់ធនធានគណនា និងអង្គចងចាំ (RAM) តិចជាង និងមានដំណើរការលឿនជាង។ មិនអាចពន្យល់ពីមូលហេតុនៃការផ្តល់អនុសាសន៍បានទេ (ដំណើរការជា Black-box) និងខ្វះភាពបត់បែននៅពេលចំណូលចិត្តរបស់អ្នកប្រើប្រាស់ផ្លាស់ប្តូរលឿន។ មានពិន្ទុ F1-score ចន្លោះពី 0.685 ដល់ 0.841 និងភាពសុក្រឹត (Precision) ត្រឹម 0.698 ដល់ 0.886 ។
Adaptive Shapley Value-enhanced CF (SHAP-UBCF, SHAP-IBCF, SHAP-MF, SHAP-NCF)
ការចម្រោះដោយសហការរួមបញ្ចូលតម្លៃ Adaptive Shapley ក្នុងពេលវេលាជាក់ស្តែង
ផ្តល់ការពន្យល់យ៉ាងច្បាស់លាស់ថាហេតុអ្វីបានជាទំនិញត្រូវបានណែនាំ (Explainable AI) និងអាចកែតម្រូវទម្ងន់នៃទិន្នន័យចាស់ៗបានលឿនតាមការផ្លាស់ប្តូរចំណូលចិត្ត។ បង្កើនភាពត្រឹមត្រូវខ្ពស់ជាងមុន។ ទាមទារធនធានគណនាច្រើនជាងមុន ដោយបង្កើនពេលវេលាបង្វឹកពី ៣០% ទៅ ៨៣% ព្រមទាំងត្រូវការទំហំអង្គចងចាំធំជាងមុនប្រមាណ ១.២ ដង។ បង្កើន F1-score រហូតដល់ ១០.៩% និងបង្កើន Precision រហូតដល់ ១៣.៣% បើធៀបនឹងវិធីសាស្ត្រមូលដ្ឋាន ដោយរក្សាភាពយឺតយ៉ាវទាបជាង ២៥ មីលីវិនាទី ដដែល។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះតម្រូវឱ្យមានកុំព្យូទ័រដែលមានសមត្ថភាពខ្ពស់ក្នុងការគណនាប៉ាន់ស្មានតម្លៃ Monte Carlo សម្រាប់ Shapley Values ក្នុងពេលវេលាជាក់ស្តែង ទោះបីជាពេលវេលាប្រតិកម្មនៅតែលឿនក៏ដោយ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះផ្តោតលើសំណុំទិន្នន័យពី Amazon និង MovieLens ដែលផ្អែកលើការវាយតម្លៃដោយផ្ទាល់ (Explicit Feedback) របស់អ្នកប្រើប្រាស់នៅតំបន់អឺរ៉ុប និងអាមេរិក។ សម្រាប់បរិបទប្រទេសកម្ពុជា អ្នកប្រើប្រាស់ភាគច្រើនពឹងផ្អែកលើបណ្ដាញសង្គមសម្រាប់ការទិញទំនិញ (Social Commerce) ហើយទិន្នន័យជាទូទៅគឺជាការចុចមើល ឬទិញដោយប្រយោល (Implicit Feedback) ដែលតម្រូវឱ្យម៉ូដែលនេះត្រូវមានការកែតម្រូវបន្ថែមទើបអាចប្រើប្រាស់បានប្រកបដោយប្រសិទ្ធភាព។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាយ៉ាងណាក៏ដោយ វិធីសាស្ត្រនៃការផ្តល់អនុសាសន៍ប្រកបដោយតម្លាភាពនេះ មានសក្តានុពលខ្ពស់ខ្លាំងក្នុងការជួយពង្រឹងអាជីវកម្មឌីជីថលនៅកម្ពុជា ដែលកំពុងមានសន្ទុះរីកចម្រើន។

ការធ្វើសមាហរណកម្មនូវបច្ចេកវិទ្យា Explainable AI នេះនឹងជួយបង្កើនទំនុកចិត្ត និងការពេញចិត្តរបស់អ្នកប្រើប្រាស់ខ្មែរមកលើកម្មវិធីឌីជីថល តាមរយៈការបើកចំហរពីរបៀបដែលម៉ូដែលធ្វើការសម្រេចចិត្ត។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ជំហានទី១៖ សិក្សាមូលដ្ឋានគ្រឹះនៃ Recommender Systems: ចាប់ផ្តើមដោយការរៀនពីវិធីសាស្ត្រចម្រោះទិន្នន័យ Collaborative Filtering ជាមូលដ្ឋាន ដោយប្រើប្រាស់បណ្ណាល័យ SurpriseScikit-learn នៅក្នុងភាសា Python ដើម្បីយល់ពីការណែនាំ Item-based និង User-based។
  2. ជំហានទី២៖ ស្វែងយល់ពី Game Theory និង Explainable AI: សិក្សាពីគោលគំនិតនៃ Shapley Values ពី Cooperative Game Theory និងរបៀបដែលវាបែងចែកឥទ្ធិពលទៅលើអថេរនីមួយៗ ដោយអនុវត្តសាកល្បងជាមួយបណ្ណាល័យ SHAP លើសំណុំទិន្នន័យសាមញ្ញ។
  3. ជំហានទី៣៖ អភិវឌ្ឍម៉ូដែល Deep Learning សម្រាប់ប្រព័ន្ធណែនាំ: សរសេរកូដដើម្បីបង្កើតម៉ូដែល Neural Collaborative Filtering (NCF) ជាទម្រង់ Multi-Layer Perceptron ដោយប្រើប្រាស់ PyTorch ដើម្បីរៀនពីទំនាក់ទំនងរវាងអ្នកប្រើប្រាស់ និងទំនិញ។
  4. ជំហានទី៤៖ ធ្វើសមាហរណកម្ម Adaptive Shapley Values ក្នុងកូដ: សរសេរអនុគមន៍ដើម្បីគណនាតម្លៃ Monte Carlo Approximation របស់ Shapley នៅក្នុងពេលវេលាជាក់ស្តែង (Real-time) ដើម្បីកែតម្រូវទម្ងន់ (Weights) នៃទិន្នន័យចាស់ៗ មុនពេលបញ្ចេញលទ្ធផលណែនាំចុងក្រោយ។
  5. ជំហានទី៥៖ សាកល្បងផ្ទាល់ជាមួយទិន្នន័យកម្ពុជា (Implicit Data): ប្រមូលទិន្នន័យនៃការចុចមើល (Clickstream) ឬប្រវត្តិទិញទំនិញពីកម្មវិធីទូរស័ព្ទក្នុងស្រុកណាមួយ ឬទាញយកពី Kaggle មកសាកល្បងកែតម្រូវម៉ូដែល និងវាស់ស្ទង់ពីល្បឿនដំណើរការ (Latency Test) ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Adaptive Shapley Values ជាវិធីសាស្ត្រគណនាបែបសេដ្ឋកិច្ចហ្គេម (Game Theory) ដែលត្រូវបានកែច្នៃដើម្បីវាស់ស្ទង់និងផ្តល់ពិន្ទុពីឥទ្ធិពលនៃការប្រាស្រ័យទាក់ទងនីមួយៗរបស់អ្នកប្រើប្រាស់ទៅលើការផ្តល់អនុសាសន៍ក្នុងពេលវេលាជាក់ស្តែង។ ដូចជាការបែងចែកប្រាក់រង្វាន់ដល់សមាជិកក្រុមនីមួយៗ ដោយផ្អែកលើទំហំនៃការខិតខំប្រឹងប្រែងពិតប្រាកដដែលពួកគេបានចូលរួមក្នុងការងារនោះ។
Collaborative Filtering ជាបច្ចេកទេសផ្តល់អនុសាសន៍ដោយទស្សន៍ទាយចំណូលចិត្តរបស់អ្នកប្រើប្រាស់ម្នាក់ តាមរយៈការវិភាគលើទិន្នន័យចំណូលចិត្តរបស់អ្នកប្រើប្រាស់ដទៃទៀតដែលមានលក្ខណៈស្រដៀងគ្នា។ ដូចជាការសួរមិត្តភក្តិដែលមានចំណូលចិត្តមើលកុនស្រដៀងយើង ថាតើរឿងមួយណាដែលយើងគួរមើលបន្ទាប់។
Matrix Factorization ជាវិធីសាស្ត្រគណិតវិទ្យាក្នុងការបំបែកតារាងទិន្នន័យធំមួយ (រវាងអ្នកប្រើប្រាស់និងទំនិញ) ទៅជាតារាងតូចៗពីរ ដើម្បីស្វែងរកលក្ខណៈកំបាំង (Latent Features) និងទស្សន៍ទាយចំណូលចិត្តដែលបាត់បង់។ ដូចជាការបំបែកទឹកក្រឡុកមួយកែវទៅជាធាតុផ្សំដើម (ផ្លែឈើ ស្ករ ទឹកដោះគោ) ដើម្បីដឹងថាហេតុអ្វីបានជាវាមានរសជាតិឆ្ងាញ់សម្រាប់មនុស្សម្នាក់ៗ។
Neural Collaborative Filtering (NCF) ជាការប្រើប្រាស់បណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត (Deep Learning) ដើម្បីរៀនពីទំនាក់ទំនងដ៏ស្មុគស្មាញ និងមិនត្រង់រវាងអ្នកប្រើប្រាស់និងទំនិញ ដែលមានប្រសិទ្ធភាពខ្ពស់ជាងវិធីសាស្ត្រគណិតវិទ្យាធម្មតា។ ដូចជាការជួលអ្នកស៊ើបអង្កេតដ៏ពូកែម្នាក់ដែលប្រើប្រាស់ប្រព័ន្ធកុំព្យូទ័រទំនើប ដើម្បីស្វែងរកទំនាក់ទំនងអាថ៌កំបាំងរវាងអតិថិជននិងទំនិញ។
Explainable AI ជាប្រព័ន្ធបញ្ញាសិប្បនិម្មិតដែលត្រូវបានរចនាឡើងដើម្បីផ្តល់ការពន្យល់យ៉ាងច្បាស់លាស់ដល់មនុស្ស ថាហេតុអ្វីបានជាវាធ្វើការសម្រេចចិត្ត ឬផ្តល់លទ្ធផលបែបនោះ។ ដូចជាគ្រូពេទ្យដែលមិនត្រឹមតែចេញវេជ្ជបញ្ជាឱ្យអ្នកជំងឺនោះទេ ប៉ុន្តែថែមទាំងពន្យល់ពីមូលហេតុ និងឥទ្ធិពលនៃថ្នាំនីមួយៗយ៉ាងក្បោះក្បាយ។
Monte Carlo sampling ជាបច្ចេកទេសស្ថិតិដែលប្រើការបង្កើតសំណាកចៃដន្យជាច្រើនដង ដើម្បីប៉ាន់ស្មានតម្លៃលទ្ធផលដ៏ស្មុគស្មាញ (ដូចជាតម្លៃ Shapley) ដែលជួយកាត់បន្ថយពេលវេលាគណនារបស់កុំព្យូទ័រ។ ដូចជាការភ្លក់ទឹកស៊ុបមួយស្លាបព្រាពីក្នុងឆ្នាំងធំ ដើម្បីដឹងពីរស់ជាតិសរុប ដោយមិនបាច់ផឹកទឹកស៊ុបនោះឱ្យអស់ទាំងឆ្នាំងនោះទេ។
F1-Score ជារង្វាស់ដែលរួមបញ្ចូលគ្នារវាងភាពសុក្រឹត (Precision) និងភាពគ្របដណ្ដប់ (Recall) ដើម្បីវាយតម្លៃពីភាពត្រឹមត្រូវជារួមរបស់ម៉ូដែល ដោយរក្សាតុល្យភាពរវាងចំណុចទាំងពីរ។ ដូចជាការវាយតម្លៃអ្នកចាំទីម្នាក់ ដោយមើលទាំងសមត្ថភាពចាប់បាល់បានត្រឹមត្រូវ (មិនឡប់) និងសមត្ថភាពហក់សង្គ្រោះបាល់បានគ្រប់ជ្រុងនៃទី (មិនឱ្យលិច)។
Latent Features ជាលក្ខណៈ ឬទម្រង់លាក់កំបាំងដែលម៉ូដែលទាញយកពីទិន្នន័យជាក់ស្តែង ឧទាហរណ៍ដូចជាប្រភេទរឿង (កំប្លែង ស្នេហា) ដែលអ្នកប្រើប្រាស់ចូលចិត្តដោយមិនដឹងខ្លួន។ ដូចជាទេពកោសល្យលាក់កំបាំងរបស់មនុស្សម្នាក់ ដែលយើងមិនអាចមើលឃើញដោយផ្ទាល់ ប៉ុន្តែអាចដឹងបានតាមរយៈសកម្មភាពប្រចាំថ្ងៃរបស់គេ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖