បញ្ហា (The Problem)៖ ប្រព័ន្ធផ្តល់អនុសាសន៍ (Recommender systems) ភាគច្រើនខ្វះតម្លាភាពដោយដំណើរការជា "ប្រអប់ខ្មៅ" (black boxes) និងជួបការលំបាកក្នុងការសម្របខ្លួនទៅនឹងការផ្លាស់ប្តូរចំណង់ចំណូលចិត្តរបស់អ្នកប្រើប្រាស់។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានស្នើឡើងនូវក្របខ័ណ្ឌផ្អែកលើតម្លៃ Adaptive Shapley ដែលត្រូវបានអនុវត្តទៅលើវិធីសាស្ត្រចម្រោះដោយសហការ (collaborative filtering) ចំនួនបួន និងត្រូវបានវាយតម្លៃលើសំណុំទិន្នន័យខ្នាតធំចំនួនពីរ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Baseline Collaborative Filtering (UBCF, IBCF, MF, NCF) វិធីសាស្ត្រចម្រោះដោយសហការមូលដ្ឋាន (គ្មានការបន្ថែមតម្លៃ Shapley) |
មានភាពសាមញ្ញក្នុងការអនុវត្ត និងមានប្រសិទ្ធភាពខ្ពស់សម្រាប់ទិន្នន័យទូទៅ។ ប្រើប្រាស់ធនធានគណនា និងអង្គចងចាំ (RAM) តិចជាង និងមានដំណើរការលឿនជាង។ | មិនអាចពន្យល់ពីមូលហេតុនៃការផ្តល់អនុសាសន៍បានទេ (ដំណើរការជា Black-box) និងខ្វះភាពបត់បែននៅពេលចំណូលចិត្តរបស់អ្នកប្រើប្រាស់ផ្លាស់ប្តូរលឿន។ | មានពិន្ទុ F1-score ចន្លោះពី 0.685 ដល់ 0.841 និងភាពសុក្រឹត (Precision) ត្រឹម 0.698 ដល់ 0.886 ។ |
| Adaptive Shapley Value-enhanced CF (SHAP-UBCF, SHAP-IBCF, SHAP-MF, SHAP-NCF) ការចម្រោះដោយសហការរួមបញ្ចូលតម្លៃ Adaptive Shapley ក្នុងពេលវេលាជាក់ស្តែង |
ផ្តល់ការពន្យល់យ៉ាងច្បាស់លាស់ថាហេតុអ្វីបានជាទំនិញត្រូវបានណែនាំ (Explainable AI) និងអាចកែតម្រូវទម្ងន់នៃទិន្នន័យចាស់ៗបានលឿនតាមការផ្លាស់ប្តូរចំណូលចិត្ត។ បង្កើនភាពត្រឹមត្រូវខ្ពស់ជាងមុន។ | ទាមទារធនធានគណនាច្រើនជាងមុន ដោយបង្កើនពេលវេលាបង្វឹកពី ៣០% ទៅ ៨៣% ព្រមទាំងត្រូវការទំហំអង្គចងចាំធំជាងមុនប្រមាណ ១.២ ដង។ | បង្កើន F1-score រហូតដល់ ១០.៩% និងបង្កើន Precision រហូតដល់ ១៣.៣% បើធៀបនឹងវិធីសាស្ត្រមូលដ្ឋាន ដោយរក្សាភាពយឺតយ៉ាវទាបជាង ២៥ មីលីវិនាទី ដដែល។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះតម្រូវឱ្យមានកុំព្យូទ័រដែលមានសមត្ថភាពខ្ពស់ក្នុងការគណនាប៉ាន់ស្មានតម្លៃ Monte Carlo សម្រាប់ Shapley Values ក្នុងពេលវេលាជាក់ស្តែង ទោះបីជាពេលវេលាប្រតិកម្មនៅតែលឿនក៏ដោយ។
ការសិក្សានេះផ្តោតលើសំណុំទិន្នន័យពី Amazon និង MovieLens ដែលផ្អែកលើការវាយតម្លៃដោយផ្ទាល់ (Explicit Feedback) របស់អ្នកប្រើប្រាស់នៅតំបន់អឺរ៉ុប និងអាមេរិក។ សម្រាប់បរិបទប្រទេសកម្ពុជា អ្នកប្រើប្រាស់ភាគច្រើនពឹងផ្អែកលើបណ្ដាញសង្គមសម្រាប់ការទិញទំនិញ (Social Commerce) ហើយទិន្នន័យជាទូទៅគឺជាការចុចមើល ឬទិញដោយប្រយោល (Implicit Feedback) ដែលតម្រូវឱ្យម៉ូដែលនេះត្រូវមានការកែតម្រូវបន្ថែមទើបអាចប្រើប្រាស់បានប្រកបដោយប្រសិទ្ធភាព។
ទោះបីជាយ៉ាងណាក៏ដោយ វិធីសាស្ត្រនៃការផ្តល់អនុសាសន៍ប្រកបដោយតម្លាភាពនេះ មានសក្តានុពលខ្ពស់ខ្លាំងក្នុងការជួយពង្រឹងអាជីវកម្មឌីជីថលនៅកម្ពុជា ដែលកំពុងមានសន្ទុះរីកចម្រើន។
ការធ្វើសមាហរណកម្មនូវបច្ចេកវិទ្យា Explainable AI នេះនឹងជួយបង្កើនទំនុកចិត្ត និងការពេញចិត្តរបស់អ្នកប្រើប្រាស់ខ្មែរមកលើកម្មវិធីឌីជីថល តាមរយៈការបើកចំហរពីរបៀបដែលម៉ូដែលធ្វើការសម្រេចចិត្ត។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Adaptive Shapley Values | ជាវិធីសាស្ត្រគណនាបែបសេដ្ឋកិច្ចហ្គេម (Game Theory) ដែលត្រូវបានកែច្នៃដើម្បីវាស់ស្ទង់និងផ្តល់ពិន្ទុពីឥទ្ធិពលនៃការប្រាស្រ័យទាក់ទងនីមួយៗរបស់អ្នកប្រើប្រាស់ទៅលើការផ្តល់អនុសាសន៍ក្នុងពេលវេលាជាក់ស្តែង។ | ដូចជាការបែងចែកប្រាក់រង្វាន់ដល់សមាជិកក្រុមនីមួយៗ ដោយផ្អែកលើទំហំនៃការខិតខំប្រឹងប្រែងពិតប្រាកដដែលពួកគេបានចូលរួមក្នុងការងារនោះ។ |
| Collaborative Filtering | ជាបច្ចេកទេសផ្តល់អនុសាសន៍ដោយទស្សន៍ទាយចំណូលចិត្តរបស់អ្នកប្រើប្រាស់ម្នាក់ តាមរយៈការវិភាគលើទិន្នន័យចំណូលចិត្តរបស់អ្នកប្រើប្រាស់ដទៃទៀតដែលមានលក្ខណៈស្រដៀងគ្នា។ | ដូចជាការសួរមិត្តភក្តិដែលមានចំណូលចិត្តមើលកុនស្រដៀងយើង ថាតើរឿងមួយណាដែលយើងគួរមើលបន្ទាប់។ |
| Matrix Factorization | ជាវិធីសាស្ត្រគណិតវិទ្យាក្នុងការបំបែកតារាងទិន្នន័យធំមួយ (រវាងអ្នកប្រើប្រាស់និងទំនិញ) ទៅជាតារាងតូចៗពីរ ដើម្បីស្វែងរកលក្ខណៈកំបាំង (Latent Features) និងទស្សន៍ទាយចំណូលចិត្តដែលបាត់បង់។ | ដូចជាការបំបែកទឹកក្រឡុកមួយកែវទៅជាធាតុផ្សំដើម (ផ្លែឈើ ស្ករ ទឹកដោះគោ) ដើម្បីដឹងថាហេតុអ្វីបានជាវាមានរសជាតិឆ្ងាញ់សម្រាប់មនុស្សម្នាក់ៗ។ |
| Neural Collaborative Filtering (NCF) | ជាការប្រើប្រាស់បណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត (Deep Learning) ដើម្បីរៀនពីទំនាក់ទំនងដ៏ស្មុគស្មាញ និងមិនត្រង់រវាងអ្នកប្រើប្រាស់និងទំនិញ ដែលមានប្រសិទ្ធភាពខ្ពស់ជាងវិធីសាស្ត្រគណិតវិទ្យាធម្មតា។ | ដូចជាការជួលអ្នកស៊ើបអង្កេតដ៏ពូកែម្នាក់ដែលប្រើប្រាស់ប្រព័ន្ធកុំព្យូទ័រទំនើប ដើម្បីស្វែងរកទំនាក់ទំនងអាថ៌កំបាំងរវាងអតិថិជននិងទំនិញ។ |
| Explainable AI | ជាប្រព័ន្ធបញ្ញាសិប្បនិម្មិតដែលត្រូវបានរចនាឡើងដើម្បីផ្តល់ការពន្យល់យ៉ាងច្បាស់លាស់ដល់មនុស្ស ថាហេតុអ្វីបានជាវាធ្វើការសម្រេចចិត្ត ឬផ្តល់លទ្ធផលបែបនោះ។ | ដូចជាគ្រូពេទ្យដែលមិនត្រឹមតែចេញវេជ្ជបញ្ជាឱ្យអ្នកជំងឺនោះទេ ប៉ុន្តែថែមទាំងពន្យល់ពីមូលហេតុ និងឥទ្ធិពលនៃថ្នាំនីមួយៗយ៉ាងក្បោះក្បាយ។ |
| Monte Carlo sampling | ជាបច្ចេកទេសស្ថិតិដែលប្រើការបង្កើតសំណាកចៃដន្យជាច្រើនដង ដើម្បីប៉ាន់ស្មានតម្លៃលទ្ធផលដ៏ស្មុគស្មាញ (ដូចជាតម្លៃ Shapley) ដែលជួយកាត់បន្ថយពេលវេលាគណនារបស់កុំព្យូទ័រ។ | ដូចជាការភ្លក់ទឹកស៊ុបមួយស្លាបព្រាពីក្នុងឆ្នាំងធំ ដើម្បីដឹងពីរស់ជាតិសរុប ដោយមិនបាច់ផឹកទឹកស៊ុបនោះឱ្យអស់ទាំងឆ្នាំងនោះទេ។ |
| F1-Score | ជារង្វាស់ដែលរួមបញ្ចូលគ្នារវាងភាពសុក្រឹត (Precision) និងភាពគ្របដណ្ដប់ (Recall) ដើម្បីវាយតម្លៃពីភាពត្រឹមត្រូវជារួមរបស់ម៉ូដែល ដោយរក្សាតុល្យភាពរវាងចំណុចទាំងពីរ។ | ដូចជាការវាយតម្លៃអ្នកចាំទីម្នាក់ ដោយមើលទាំងសមត្ថភាពចាប់បាល់បានត្រឹមត្រូវ (មិនឡប់) និងសមត្ថភាពហក់សង្គ្រោះបាល់បានគ្រប់ជ្រុងនៃទី (មិនឱ្យលិច)។ |
| Latent Features | ជាលក្ខណៈ ឬទម្រង់លាក់កំបាំងដែលម៉ូដែលទាញយកពីទិន្នន័យជាក់ស្តែង ឧទាហរណ៍ដូចជាប្រភេទរឿង (កំប្លែង ស្នេហា) ដែលអ្នកប្រើប្រាស់ចូលចិត្តដោយមិនដឹងខ្លួន។ | ដូចជាទេពកោសល្យលាក់កំបាំងរបស់មនុស្សម្នាក់ ដែលយើងមិនអាចមើលឃើញដោយផ្ទាល់ ប៉ុន្តែអាចដឹងបានតាមរយៈសកម្មភាពប្រចាំថ្ងៃរបស់គេ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖