Original Title: Penerapan Data Mining Untuk Potensi Promo Penjualan Tiket Menggunakan Basket Algoritma
Source: dx.doi.org
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការអនុវត្តការជីកយករ៉ែទិន្នន័យ (Data Mining) សម្រាប់សក្តានុពលប្រូម៉ូសិនលក់សំបុត្រដោយប្រើក្បួនដោះស្រាយកន្ត្រកទីផ្សារ

ចំណងជើងដើម៖ Penerapan Data Mining Untuk Potensi Promo Penjualan Tiket Menggunakan Basket Algoritma

អ្នកនិពន្ធ៖ Andi Supriadi Chan (Universitas Putera Batam Kepri)

ឆ្នាំបោះពុម្ព៖ 2017 Jurnal Edik Informatika

វិស័យសិក្សា៖ Information Systems

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ទីភ្នាក់ងារទេសចរណ៍ PT. Bandar Madani 165 នៅទីក្រុង Batam ជួបការលំបាកក្នុងការកំណត់យុទ្ធសាស្ត្រប្រូម៉ូសិនលក់សំបុត្រយន្តហោះឱ្យមានប្រសិទ្ធភាព ដោយសារខ្វះការវិភាគទិន្នន័យប្រតិបត្តិការទិញលក់ដ៏ច្រើនកន្លងមក។

វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះប្រើប្រាស់វិធីសាស្ត្រវិភាគកន្ត្រកទីផ្សារ (Market Basket Analysis) តាមរយៈក្បួនដោះស្រាយ Apriori ដើម្បីស្វែងរកលំនាំនៃទំនាក់ទំនងទំនិញដែលអតិថិជនតែងតែទិញរួមគ្នា។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Apriori Algorithm (Market Basket Analysis)
ក្បួនដោះស្រាយ Apriori (ការវិភាគកន្ត្រកទីផ្សារ)
មានប្រសិទ្ធភាពខ្ពស់ក្នុងការស្វែងរកលំនាំនៃការទិញទំនិញរួមគ្នាដោយស្វ័យប្រវត្តិ។ អាចដោះស្រាយនិងទាញយកចំណេះដឹងពីទិន្នន័យប្រតិបត្តិការធំៗបានយ៉ាងរហ័ស។ ទាមទារទិន្នន័យប្រតិបត្តិការក្នុងបរិមាណច្រើនទើបអាចរកឃើញលំនាំដែលមានភាពសុក្រឹតខ្ពស់ និងតម្រូវឱ្យមានចំណេះដឹងផ្នែកកុំព្យូទ័រ។ រកឃើញវិធានសមាគមសំខាន់ៗ (ឧ. ទិញសំបុត្រ Sriwijaya ឬ Batik នឹងទិញសំបុត្រ Lion) ដែលមានអត្រា Support ៤០% និង Confidence ៨០% សម្រាប់ធ្វើប្រូម៉ូសិន។
Manual Pattern Analysis (Baseline/Traditional Method)
ការវិភាគលំនាំដោយដៃ (ប្រព័ន្ធចាស់)
ងាយស្រួលយល់ និងមិនត្រូវការចំណេះដឹងផ្នែកកុំព្យូទ័រ កម្មវិធីស្មុគស្មាញ ឬអ្នកជំនាញទិន្នន័យនោះទេ។ ចំណាយពេលយូរខ្លាំង ងាយនឹងមានកំហុស និងមិនអាចធ្វើការវិភាគលើទិន្នន័យប្រតិបត្តិការរាប់ពាន់រាប់ម៉ឺនក្នុងពេលតែមួយបានឡើយ។ មិនអាចកំណត់កញ្ចប់ប្រូម៉ូសិនបានច្បាស់លាស់ ដោយសារគ្មានតួលេខគណិតវិទ្យា (Support និង Confidence) គាំទ្រការសម្រេចចិត្ត។

ការចំណាយលើធនធាន (Resource Cost)៖ ឯកសារនេះមិនបានបញ្ជាក់លម្អិតអំពីតម្រូវការផ្នែករឹង (Hardware) ឬកម្មវិធី (Software) ជាក់លាក់នោះទេ ប៉ុន្តែផ្អែកតាមបរិបទនៃការសិក្សា ការអនុវត្តវិធីសាស្ត្រនេះទាមទារធនធានជាមូលដ្ឋានដូចខាងក្រោម៖

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងដោយប្រើប្រាស់ទិន្នន័យប្រតិបត្តិការលក់សំបុត្រយន្តហោះក្នុងស្រុករបស់ទីភ្នាក់ងារទេសចរណ៍នៅទីក្រុង Batam ប្រទេសឥណ្ឌូនេស៊ី។ អាកប្បកិរិយារបស់អតិថិជន និងជម្រើសក្រុមហ៊ុនអាកាសចរណ៍ (ដូចជា Garuda, Lion, Batik) គឺឆ្លុះបញ្ចាំងតែពីបរិបទប្រទេសឥណ្ឌូនេស៊ីប៉ុណ្ណោះ។ សម្រាប់ប្រទេសកម្ពុជា លទ្ធផលអត្រាភាគរយជាក់លាក់នេះមិនអាចយកមកអនុវត្តផ្ទាល់បានទេ ប៉ុន្តែគំរូវិធីសាស្ត្រនៃការវិភាគនេះគឺមានតម្លៃអាចយកមកអនុវត្តលើទិន្នន័យក្នុងស្រុកបានយ៉ាងល្អ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រវិភាគកន្ត្រកទីផ្សារ (Market Basket Analysis) នេះគឺមានសក្តានុពល និងសារៈប្រយោជន៍ខ្លាំងណាស់សម្រាប់ជួយដល់ការធ្វើទីផ្សារអាជីវកម្មនៅប្រទេសកម្ពុជា។

សរុបមក ការអនុវត្តក្បួនដោះស្រាយ Apriori នឹងជួយឱ្យអាជីវកម្មនៅកម្ពុជាអាចផ្លាស់ប្តូរពីការធ្វើប្រូម៉ូសិនដោយស្មាន ទៅជាការសម្រេចចិត្តផ្អែកលើទិន្នន័យច្បាស់លាស់ ដើម្បីបង្កើនប្រាក់ចំណេញ។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ប្រមូល និងរៀបចំទិន្នន័យប្រតិបត្តិការ (Data Collection & Preparation): ចាប់ផ្តើមប្រមូលទិន្នន័យប្រវត្តិលក់ប្រចាំថ្ងៃរបស់អាជីវកម្មអ្នកពីប្រព័ន្ធ Point of Sale (POS)។ សម្អាតទិន្នន័យ (Data Cleaning) រួចបំប្លែងវាទៅជាទម្រង់ Tabular Format ដែលកត់ត្រាពីប្រភេទមុខទំនិញនីមួយៗនៅក្នុងវិក្កយបត្រតែមួយ។
  2. ជ្រើសរើសឧបករណ៍សម្រាប់វិភាគទិន្នន័យ (Tool Selection): សិក្សាប្រើប្រាស់កម្មវិធី Data Mining ដែលមិនទាមទារកូដច្រើនដូចជា RapidMinerWEKA។ សម្រាប់អ្នកមានជំនាញសរសេរកូដ អាចប្រើប្រាស់ភាសា Python ជាមួយនឹងបណ្ណាល័យ mlxtendpandas ដើម្បីដំណើរការ។
  3. អនុវត្តក្បួនដោះស្រាយ (Apply Apriori Algorithm): បញ្ចូលទិន្នន័យទៅក្នុងកម្មវិធី រួចកំណត់តម្លៃអប្បបរមាសម្រាប់ Support (ឧ. ១០% នៃប្រតិបត្តិការសរុប) និង Confidence (ឧ. ៧០%) ដើម្បីចម្រាញ់យកតែបណ្តុំទំនិញ (Frequent Itemsets) ដែលកើតឡើងញឹកញាប់ និងច្បាស់លាស់បំផុត។
  4. បង្កើតវិធានសមាគម និងយុទ្ធសាស្ត្រប្រូម៉ូសិន (Generate Rules & Strategy): វិភាគលទ្ធផល Association Rules ដែលទទួលបាន ដើម្បីបង្កើតជាយុទ្ធសាស្ត្រលក់ជាក់ស្តែង។ ឧទាហរណ៍ បង្កើតកញ្ចប់បញ្ចុះតម្លៃពិសេស (Cross-selling promos) សម្រាប់ទំនិញដែលតែងតែត្រូវទិញរួមគ្នា ដើម្បីជំរុញឱ្យអតិថិជនចំណាយប្រាក់ច្រើនជាងមុន។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Data Mining ជាដំណើរការនៃការទាញយកព័ត៌មាន លំនាំ ឬចំណេះដឹងដែលលាក់កំបាំងពីក្នុងមូលដ្ឋានទិន្នន័យដ៏ធំ ដើម្បីយកមកវិភាគ និងប្រើប្រាស់ក្នុងការទស្សន៍ទាយឬធ្វើការសម្រេចចិត្តក្នុងអាជីវកម្ម។ ដូចជាការរែងរកមាស (ព័ត៌មានមានតម្លៃ) ចេញពីគំនរដីនិងខ្សាច់ដ៏ធំ (ទិន្នន័យឆៅរាប់ពាន់រាប់ម៉ឺន)។
Market Basket Analysis ជាបច្ចេកទេសវិភាគទិន្នន័យមួយប្រភេទដើម្បីស្វែងយល់ពីទម្លាប់នៃការទិញទំនិញរបស់អតិថិជន ដោយសង្កេតមើលថាតើទំនិញអ្វីខ្លះដែលពួកគេតែងតែទិញរួមគ្នានៅក្នុងកន្ត្រក ឬវិក្កយបត្រតែមួយ។ ដូចជាការលួចពិនិត្យមើលកន្ត្រកផ្សាររបស់ភ្ញៀវ ដើម្បីដឹងថាបើគាត់ទិញនំប៉័ង គាត់នឹងទិញទឹកដោះគោឬយៈសាពូនមីជាមួយគ្នាដែរឬទេ។
Apriori Algorithm ជាក្បួនដោះស្រាយគណិតវិទ្យាដ៏ពេញនិយមមួយក្នុង Data Mining ដែលប្រើសម្រាប់ស្វែងរកបណ្តុំទំនិញ (Itemset) ដែលលេចឡើងញឹកញាប់ ដើម្បីយកទៅបង្កើតជាវិធានសមាគម (Association Rule)។ ដូចជាម៉ាស៊ីនគិតលេខស្វ័យប្រវត្តិដែលជួយប្រាប់យើងថា ក្នុងចំណោមអ្នកទិញ១០០នាក់ តើមានប៉ុន្មាននាក់ដែលទិញសាប៊ូនិងច្រាសដុសធ្មេញក្នុងពេលតែមួយ។
Frequent Itemset ជាបណ្តុំនៃទំនិញ ឬមុខសេវាកម្ម (ចាប់ពី២ឡើងទៅ) ដែលតែងតែត្រូវបានអតិថិជនទិញរួមគ្នាយ៉ាងញឹកញាប់ ដោយបំពេញតាមលក្ខខណ្ឌអប្បបរមា (Minimum Support) ដែលប្រព័ន្ធបានកំណត់ទុក។ ដូចជាពាក្យថា "បាយ និងសាច់ជ្រូក" ដែលជាបន្សំអាហារដែលគេតែងតែកម្ម៉ង់ញ៉ាំជាមួយគ្នាស្ទើររាល់ព្រឹក។
Support ជារង្វាស់ភាគរយដែលបង្ហាញពីភាពញឹកញាប់នៃការលេចឡើងនូវបណ្តុំទំនិញណាមួយ ធៀបទៅនឹងចំនួនប្រតិបត្តិការទិញលក់សរុបទាំងអស់នៅក្នុងប្រព័ន្ធ។ បើថ្ងៃនេះមានអតិថិជន១០នាក់ ហើយមាន៤នាក់បានទិញសំបុត្រក្រុមហ៊ុន Garuda នោះមានន័យថាតម្លៃ Support របស់សំបុត្រ Garuda គឺ ៤០%។
Confidence ជារង្វាស់ភាគរយដែលបង្ហាញពីភាពប្រាកដប្រជា ឬភាពខ្លាំងនៃទំនាក់ទំនងរវាងទំនិញពីរ ពោលគឺប្រសិនបើអតិថិជនទិញទំនិញ A តើមានឱកាសប៉ុន្មានភាគរយដែលពួកគេនឹងទិញទំនិញ B បន្តទៀត។ ដូចជាការទស្សន៍ទាយថា បើមិត្តភក្តិអ្នកទិញសំបុត្រកុន គាត់មានឱកាស ៨០% ថានឹងទិញពោតលីង (Popcorn) ញ៉ាំជាមួយគ្នាជាមិនខាន។
Association Rule ជាវិធានដែលត្រូវបានបង្កើតឡើងចេញពីលទ្ធផលនៃការវិភាគ ដើម្បីបង្ហាញពីទំនាក់ទំនងក្នុងទម្រង់ "ប្រសិនបើ... នោះ..." (If-Then) រវាងទំនិញ ដែលជួយសម្រួលដល់ការរៀបចំយុទ្ធសាស្ត្រលក់ដូរ។ ដូចជាច្បាប់ចម្លងដែលប្រាប់អ្នកលក់ថា "ប្រសិនបើភ្ញៀវទិញសំបុត្រយន្តហោះម៉ាក Sriwijaya នោះត្រូវតែសួរលក់សំបុត្រម៉ាក Lion បន្ត ព្រោះឱកាសដែលគាត់ទិញមានដល់ទៅ ៨០%"។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖