បញ្ហា (The Problem)៖ អ្នកលក់រាយ ជាពិសេសហាងផ្ទាល់ដែលគ្មានប្រព័ន្ធទំនើបដូច Amazon ជួបការលំបាកក្នុងការវិភាគទិន្នន័យប្រតិបត្តិការដ៏ធំ ដើម្បីស្វែងរកទំនាក់ទំនងផលិតផលដែលលាក់កំបាំងសម្រាប់កែលម្អការលក់ និងសេវាកម្មអតិថិជន។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះស្នើឡើងនូវផ្ទាំងគ្រប់គ្រងលើបណ្តាញអ៊ិនធឺណិត (Web-based Dashboard) ដោយប្រើប្រាស់បច្ចេកទេសទាញយកទិន្នន័យ (Data Mining) ជាពិសេសក្បួនដោះស្រាយ Apriori ដើម្បីអនុវត្តការវិភាគកន្ត្រកទីផ្សារលើទិន្នន័យប្រតិបត្តិការរបស់អតិថិជន។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Apriori Algorithm (Proposed) ក្បួនដោះស្រាយ Apriori (ស្នើឡើងក្នុងការសិក្សា) |
មានភាពសាមញ្ញក្នុងការស្វែងរកទំនាក់ទំនងរវាងផលិតផល (Association Rules) ដែលស័ក្តិសមសម្រាប់ហាងលក់រាយផ្ទាល់ក្នុងការស្វែងយល់ពីទម្លាប់ទិញរបស់អតិថិជន។ | ទាមទារដំណើរការគណនាច្រើនលើទិន្នន័យធំ (Scans) ដែលអាចធ្វើឱ្យយឺត ប្រសិនបើមិនមានការកំណត់តម្លៃគាំទ្រអប្បបរមា (Minimum Support) ឱ្យបានត្រឹមត្រូវ។ | ទទួលបានតម្លៃគាំទ្រ (Support) ជាមធ្យមពី ៣៣% ទៅ ៤០% និងតម្លៃទំនុកចិត្ត (Confidence) ពី ៤៣% ទៅ ៨០% ក្នុងការកំណត់ទំនាក់ទំនងផលិតផល។ |
| User-based Collaborative Filtering (CF) ប្រព័ន្ធណែនាំផ្អែកលើអ្នកប្រើប្រាស់ (ត្រូវបានលើកឡើងក្នុងឯកសារយោង) |
មានប្រសិទ្ធភាពខ្ពស់ក្នុងការផ្តល់ការណែនាំផលិតផលផ្ទាល់ខ្លួនសម្រាប់អតិថិជនម្នាក់ៗ ដែលពេញនិយមបំផុតសម្រាប់ហាងអនឡាញខ្នាតធំដូចជា Amazon។ | ត្រូវការទិន្នន័យប្រវត្តិអ្នកប្រើប្រាស់លម្អិត (ការស្វែងរក ប្រវត្តិទិញ) ដែលពិបាកនិងស្ទើរតែមិនអាចប្រមូលបានសម្រាប់ហាងទំនិញផ្ទាល់ (Physical Stores) ធម្មតា។ | ប្រព័ន្ធនេះបានជួយ Amazon បង្កើនការលក់រហូតដល់ ២៩% (ឈានដល់ ១២.៨៣ ពាន់លានដុល្លារ) ក្នុងត្រីមាសទី២ នៃឆ្នាំសារពើពន្ធរបស់ខ្លួន។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តប្រព័ន្ធវិភាគនេះមិនទាមទារធនធានកុំព្យូទ័រធំដុំពេកទេ ប៉ុន្តែតម្រូវឱ្យមានទិន្នន័យប្រតិបត្តិការច្បាស់លាស់ និងការរៀបចំផ្ទាំងគ្រប់គ្រង (Dashboard) ដែលងាយស្រួលប្រើសម្រាប់ម្ចាស់ហាង។
ការសិក្សានេះបានទាញយកទិន្នន័យពីហាងលក់រាយកណ្តាលមួយឈ្មោះថា 'Central Retail X' ដែលមិនបានបញ្ជាក់ទីតាំងភូមិសាស្ត្រច្បាស់លាស់ (ទោះជាអ្នកនិពន្ធមកពីប្រទេសប៉ាគីស្ថានក្តី)។ អាកប្បកិរិយា និងវប្បធម៌នៃការទិញទំនិញមានភាពខុសគ្នាពីតំបន់មួយទៅតំបន់មួយ ដូច្នេះការយកមកអនុវត្តនៅកម្ពុជា ទាមទារឱ្យមានការប្រើប្រាស់ទិន្នន័យក្នុងស្រុកដើម្បីទទួលបានលទ្ធផលជាក់ស្តែង។
បច្ចេកទេសកន្ត្រកទីផ្សារនេះមានសក្តានុពលខ្ពស់ និងងាយស្រួលអនុវត្តសម្រាប់អាជីវកម្មលក់រាយនៅប្រទេសកម្ពុជា ដែលកំពុងរីកចម្រើនយ៉ាងឆាប់រហ័ស។
ការរួមបញ្ចូលគ្នារវាងក្បួនដោះស្រាយ Apriori និងចំណុចប្រទាក់ងាយស្រួលប្រើ (Dashboard) នឹងជួយពង្រឹងសមត្ថភាពប្រកួតប្រជែងរបស់អាជីវកម្មកម្ពុជា តាមរយៈការធ្វើសេចក្តីសម្រេចចិត្តផ្អែកលើទិន្នន័យ (Data-driven) ជាជាងការស្មាន។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Market Basket Analysis | ការវិភាគកន្ត្រកទីផ្សារ គឺជាបច្ចេកទេសទាញយកទិន្នន័យដែលអ្នកលក់រាយប្រើប្រាស់ដើម្បីស្វែងយល់ពីអាកប្បកិរិយាទិញទំនិញរបស់អតិថិជន ដោយស្វែងរកទំនាក់ទំនងរវាងផលិតផលដែលគេច្រើនទិញជាមួយគ្នាក្នុងវិក័យប័ត្រតែមួយ។ | ដូចជាការតាមដានមើលកន្ត្រកផ្សារបស់អតិថិជន ដើម្បីដឹងថាបើគាត់ទិញនំប៉័ង តើគាត់នឹងទិញទឹកដោះគោដែរឬទេ។ |
| Apriori Algorithm | ក្បួនដោះស្រាយ Apriori គឺជាវិធីសាស្ត្រគណនាក្នុង Data Mining ដែលប្រើសម្រាប់ស្វែងរកសំណុំទំនិញដែលកើតឡើងញឹកញាប់ (Frequent Itemsets) នៅក្នុងមូលដ្ឋានទិន្នន័យប្រតិបត្តិការ ដើម្បីបង្កើតវិធានទំនាក់ទំនង និងទស្សន៍ទាយការទិញបន្ទាប់។ | ដូចជាម៉ាស៊ីនរែងម្សៅដែលត្រងយកតែបន្សំទំនិញណាដែលអតិថិជនទិញញឹកញាប់បំផុតចេញពីវិក័យប័ត្ររាប់ពាន់សន្លឹក។ |
| Association Rule | វិធានទំនាក់ទំនង គឺជាច្បាប់មានទម្រង់ 'ប្រសិនបើ... នោះ...' (If-Then) ដែលបង្ហាញពីប្រូបាប៊ីលីតេនៃទំនាក់ទំនងរវាងផលិតផលពីរ ឬច្រើននៅក្នុងប្រតិបត្តិការតែមួយ ដោយប្រើរង្វាស់ Support និង Confidence។ | ដូចជាច្បាប់ទស្សន៍ទាយមួយដែលប្រាប់ថា 'ប្រសិនបើអតិថិជនទិញកាហ្វេ នោះគាត់មានភាគរយខ្ពស់ក្នុងការទិញស្ករ'។ |
| Support | នៅក្នុងវិធានទំនាក់ទំនង Support គឺជារង្វាស់ដែលបង្ហាញពីភាគរយនៃប្រតិបត្តិការសរុបដែលផ្ទុកនូវសំណុំទំនិញជាក់លាក់ណាមួយ (ឧទាហរណ៍៖ ទំនិញ A និង B ទិញជាមួយគ្នា)។ វាជួយក្បួនដោះស្រាយក្នុងការជម្រុះចោលបន្សំទំនិញដែលកម្រមានអ្នកទិញ។ | ដូចជាការវាស់ស្ទង់ភាពពេញនិយមនៃមុខម្ហូបមួយនៅក្នុងភោជនីយដ្ឋាន ដោយមើលថាមានតុប៉ុន្មានភាគរយដែលកុម្ម៉ង់ម្ហូបនោះ។ |
| Confidence | Confidence គឺជារង្វាស់នៃភាពជឿជាក់លើវិធានទំនាក់ទំនង ដែលវាស់ស្ទង់ថា តើអតិថិជនមានប្រូបាប៊ីលីតេប៉ុន្មានភាគរយក្នុងការទិញផលិតផល B (Consequent) ប្រសិនបើពួកគេបានទិញផលិតផល A (Antecedent) រួចហើយ។ | ដូចជាការសន្និដ្ឋានថា ក្នុងចំណោមមនុស្ស ១០ នាក់ដែលទិញសាប៊ូកក់សក់ តើមានប៉ុន្មាននាក់ដែលទិញក្រែមបន្ទន់សក់តាមក្រោយក្នុងវិក័យប័ត្រតែមួយ។ |
| Data mining | ការទាញយកទិន្នន័យ ឬការស្វែងរកចំណេះដឹងក្នុងមូលដ្ឋានទិន្នន័យ (KDD) គឺជាដំណើរការប្រើប្រាស់កុំព្យូទ័រដើម្បីវិភាគ និងស្វែងរកគំរូ និន្នាការ ឬព័ត៌មានដែលមានតម្លៃ ដែលលាក់កំបាំងក្នុងសំណុំទិន្នន័យប្រតិបត្តិការដ៏ធំ។ | ដូចជាការរែងរកមាស (ព័ត៌មានមានតម្លៃ) ចេញពីគំនរដីនិងខ្សាច់ដ៏ធំ (ទិន្នន័យរាយប៉ាយរាប់លានជួរ)។ |
| Clustering Analysis | ការវិភាគចង្កោម គឺជាវិធីសាស្ត្របែងចែកទិន្នន័យប្រភេទ Unsupervised Learning ដែលប្រមូលផ្តុំវត្ថុ ឬអតិថិជនដែលមានលក្ខណៈស្រដៀងគ្នាខ្ពស់ទៅក្នុងក្រុមតែមួយ ដោយមិនមានការកំណត់ស្លាក (Label) ឬចំណាត់ថ្នាក់ជាមុន។ | ដូចជាការចាត់ថ្នាក់សិស្សក្នុងទីធ្លាសាលាជាក្រុមៗដោយស្វ័យប្រវត្តិ ផ្អែកលើចំណូលចិត្តលេងកីឡារបស់ពួកគេ ដោយមិនបាច់មានគ្រូប្រាប់មុន។ |
| Frequent itemset | សំណុំទំនិញញឹកញាប់ គឺជាបណ្តុំនៃផលិតផលដែលលេចឡើងជាមួយគ្នានៅក្នុងទិន្នន័យប្រតិបត្តិការច្រើនជាង ឬស្មើនឹងកម្រិតកំណត់អប្បបរមា (Minimum Support Threshold) ដែលត្រូវបានកំណត់ដោយអ្នកវិភាគ។ | ដូចជាការកត់សម្គាល់ឃើញថា 'ប៊ិច និងសៀវភៅ' គឺជាគូទំនិញដែលសិស្សានុសិស្សតែងតែទិញជាមួយគ្នាជារៀងរាល់ថ្ងៃនៅដើមឆ្នាំសិក្សា។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖