Original Title: Implementasi Algoritma Apriori dalam Association Rule Mining untuk Optimalisasi Strategi Pemasaran Retail: Literature Review Sistematis
Source: www.researchgate.net
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការអនុវត្តក្បួនដោះស្រាយ Apriori ក្នុងការស្វែងរកច្បាប់សមាគម (Association Rule Mining) សម្រាប់ការធ្វើឱ្យប្រសើរឡើងនូវយុទ្ធសាស្រ្តទីផ្សារលក់រាយ៖ ការពិនិត្យអក្សរសិល្ប៍ជាប្រព័ន្ធ

ចំណងជើងដើម៖ Implementasi Algoritma Apriori dalam Association Rule Mining untuk Optimalisasi Strategi Pemasaran Retail: Literature Review Sistematis

អ្នកនិពន្ធ៖ Siti Fauziah (Bina Nusantara University)

ឆ្នាំបោះពុម្ព៖ N/A

វិស័យសិក្សា៖ Computer Science / Data Mining

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ អត្ថបទនេះដោះស្រាយបញ្ហានៃការវាយតម្លៃលើប្រសិទ្ធភាព និងចន្លោះប្រហោងនៃការប្រើប្រាស់ក្បួនដោះស្រាយ Apriori នៅក្នុងការស្វែងរកច្បាប់សមាគម (Association Rule Mining) ដើម្បីបង្កើនប្រសិទ្ធភាពយុទ្ធសាស្រ្តទីផ្សារលក់រាយ។

វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះប្រើប្រាស់វិធីសាស្រ្តរំលឹកអក្សរសិល្ប៍ជាប្រព័ន្ធ (Systematic Literature Review) ដោយធ្វើការវិភាគស៊ីជម្រៅលើអត្ថបទស្រាវជ្រាវចំនួន ៥ ដែលពាក់ព័ន្ធនឹងការអនុវត្តក្បួនដោះស្រាយនេះនៅក្នុងវិស័យលក់រាយ និងពាណិជ្ជកម្មអេឡិចត្រូនិក។

ការទាញយកទិន្នន័យពហុវិមាត្រ (Multidimensional Data Mining)
ក្បួនដោះស្រាយអាទិភាព (Apriori Algorithm)
ការស្វែងរកច្បាប់សមាគម (Association Rule Mining)
ការវិភាគកញ្ចប់ទីផ្សារ (Market Basket Analysis)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ក្បួនដោះស្រាយ Apriori មានប្រសិទ្ធភាពខ្ពស់ក្នុងការស្វែងរកគំរូនៃការទិញរបស់អតិថិជន ដើម្បីគាំទ្រដល់ការសម្រេចចិត្តលើចំណងជើងយុទ្ធសាស្ត្រទីផ្សារ ដូចជាការលក់ទំនិញជាកញ្ចប់ (Bundling) និងការផ្សព្វផ្សាយ។
ទោះជាយ៉ាងណាក៏ដោយ ការស្រាវជ្រាវបច្ចុប្បន្នភាគច្រើនមានចំណុចខ្វះខាត ដោយសារការពឹងផ្អែកតែលើក្បួន Apriori តែមួយមុខ ដោយមិនមានការប្រៀបធៀបជាមួយក្បួនដែលលឿន និងមានប្រសិទ្ធភាពជាង ដូចជា FP-Growth ជាដើម។
គម្លាតនៃការស្រាវជ្រាវមួយទៀតគឺ កង្វះការផ្ទៀងផ្ទាត់តាមបែបជាក់ស្តែង (Empirical Validation) ទៅលើផលប៉ះពាល់ហិរញ្ញវត្ថុពិតប្រាកដ និងការមិនទាន់បានគិតគូរឱ្យបានគ្រប់ជ្រុងជ្រោយពីកត្តារដូវកាល ឬផលប៉ះពាល់នៃការធ្វើប្រូម៉ូសិន។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Apriori Algorithm ក្បួនដោះស្រាយ Apriori (ការស្វែងរកច្បាប់សមាគម)	ងាយស្រួលក្នុងការស្វែងរកគំរូទិញទំនិញ និងបកប្រែទៅជាការអនុវត្តជាក់ស្តែង ព្រមទាំងផ្តល់នូវច្បាប់សមាគមច្បាស់លាស់។ វាជួយភ្ជាប់លទ្ធផលវិភាគទៅនឹងការសម្រេចចិត្តរបស់អ្នកគ្រប់គ្រង។	មានភាពយឺតយ៉ាវ និងមិនសូវមានប្រសិទ្ធភាពបើប្រៀបធៀបទៅនឹងក្បួនដោះស្រាយផ្សេងទៀតនៅពេលប្រើលើទិន្នន័យធំៗ (Big Data)។ លទ្ធផលច្រើនតែមានលក្ខណៈពណ៌នា (Descriptive) ដោយមិនមានការបញ្ជាក់ពីទំនាក់ទំនងហេតុនិងផលច្បាស់លាស់។	ស្វែងរកឃើញច្បាប់សមាគមជាច្រើន (ឧទាហរណ៍ ១១៨ ច្បាប់ក្នុងអត្ថបទទី៣) ដែលមានតម្លៃ Support និង Confidence ច្បាស់លាស់ សម្រាប់ប្រើប្រាស់ក្នុងយុទ្ធសាស្ត្រលក់ទំនិញជាកញ្ចប់ (Bundling)។
FP-Growth Algorithm ក្បួនដោះស្រាយ FP-Growth (ជម្រើសប្រៀបធៀបដែលត្រូវបានលើកឡើង)	ត្រូវបានលើកឡើងនៅក្នុងឯកសារថាជាជម្រើសក្បួនដោះស្រាយដែលមានប្រសិទ្ធភាព និងលឿនជាង Apriori ជាពិសេសសម្រាប់ការវិភាគលើសំណុំទិន្នន័យប្រតិបត្តិការដែលមានទំហំធំ។	មិនត្រូវបានយកមកប្រើប្រាស់ ឬធ្វើការប្រៀបធៀបឱ្យបានទូលំទូលាយនៅក្នុងការសិក្សាទាំង៥ ដែលត្រូវបានពិនិត្យនៅក្នុងអត្ថបទនេះនៅឡើយទេ។	ឯកសារបានចង្អុលបង្ហាញថា ការមិនប្រើប្រាស់ ឬប្រៀបធៀបជាមួយ FP-Growth គឺជាចន្លោះប្រហោង (Gap) នៃការស្រាវជ្រាវបច្ចុប្បន្ន។

ការចំណាយលើធនធាន (Resource Cost)៖ ឯកសារមិនបានបញ្ជាក់លម្អិតពីថ្លៃដើម ឬតម្រូវការផ្នែករឹងនោះទេ ប៉ុន្តែផ្អែកលើធម្មជាតិនៃក្បួនដោះស្រាយ វាទាមទារធនធានទិន្នន័យនិងផ្នែកទន់ជាចាំបាច់។

Dataset: ទិន្នន័យប្រតិបត្តិការទិញលក់របស់អតិថិជន (Transaction Data) ដែលអាចមានទំហំធំ (Big Data) អាស្រ័យលើទំហំនៃអាជីវកម្មលក់រាយ ឬ e-commerce។
Software: កម្មវិធី ឬឧបករណ៍សម្រាប់ធ្វើ Data Mining និងដំណើរការក្បួនដោះស្រាយ ដើម្បីទាញយកច្បាប់សមាគម (Association Rules)។
Expertise: អ្នកជំនាញវិភាគទិន្នន័យដែលអាចកំណត់ប៉ារ៉ាម៉ែត្រ Support និង Confidence ព្រមទាំងអាចបកប្រែលទ្ធផលទៅជាយុទ្ធសាស្ត្រទីផ្សារបាន។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សាទាំង៥ដែលបានលើកយកមកពិនិត្យ ភាគច្រើនផ្តោតលើទិន្នន័យទីផ្សារនៅក្នុងប្រទេសឥណ្ឌូនេស៊ី (ផ្សារទំនើប ឱសថស្ថាន និងពាណិជ្ជកម្មអេឡិចត្រូនិក)។ ដោយសារបរិបទទីផ្សារឥណ្ឌូនេស៊ី និងកម្ពុជាមានភាពស្រដៀងគ្នាខ្លះក្នុងការអភិវឌ្ឍ លទ្ធផលនេះអាចជាគំរូល្អ ប៉ុន្តែកម្ពុជាចាំបាច់ត្រូវមានទិន្នន័យក្នុងស្រុកផ្ទាល់ខ្លួន ដោយសារអាកប្បកិរិយាអ្នកប្រើប្រាស់ ការឆ្លើយតបនឹងការបញ្ចុះតម្លៃ និងកត្តារដូវកាលអាចមានភាពខុសគ្នា។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសារៈប្រយោជន៍ និងអាចយកមកអនុវត្តបានយ៉ាងមានប្រសិទ្ធភាព សម្រាប់ពង្រីកយុទ្ធសាស្ត្រទីផ្សារក្នុងវិស័យលក់រាយនៅប្រទេសកម្ពុជា។

ផ្សារទំនើប និងម៉ាត (Supermarkets and Marts): អាជីវកម្មដូចជា Makro, Aeon Mall ឬ ម៉ាតតូចៗ អាចប្រើប្រាស់ក្បួននេះដើម្បីរៀបចំយុទ្ធសាស្ត្រលក់ទំនិញជាកញ្ចប់ (Product Bundling) និងរៀបចំទីតាំងទំនិញនៅលើធ្នើរឱ្យកាន់តែទាក់ទាញ។
ឱសថស្ថាន (Pharmacies): ឱសថស្ថានធំៗដូចជា Ucare Pharmacy ឬ Pharmacie de la Gare អាចវិភាគលើប្រវត្តិទិញថ្នាំ ដើម្បីយល់ពីគំរូនៃផលិតផលសុខភាពដែលអតិថិជនតែងទិញជាមួយគ្នា សម្រាប់ផ្តល់ជាការណែនាំបន្ថែម។
ពាណិជ្ជកម្មអេឡិចត្រូនិក (E-commerce platforms): កម្មវិធីទិញទំនិញអនឡាញ ឬដឹកជញ្ជូនដូចជា Nham24 និង Foodpanda អាចប្រើក្បួនដោះស្រាយនេះដើម្បីបង្កើតប្រព័ន្ធណែនាំ (Recommendation System) ផ្តោតលើផលិតផលដែលតែងតែទិញជាមួយគ្នាដោយស្វ័យប្រវត្តិ។

សរុបមក ការប្រើប្រាស់ Data Mining តាមរយៈក្បួន Apriori នឹងជួយឱ្យអ្នកលក់រាយនៅកម្ពុជាផ្លាស់ប្តូរពីការលក់ដោយផ្អែកលើការស្មាន ទៅជាការរៀបចំយុទ្ធសាស្ត្រផ្អែកលើទិន្នន័យពិតប្រាកដ (Data-driven decisions)។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

ការប្រមូល និងសម្អាតទិន្នន័យ (Data Collection & Preprocessing): ប្រមូលទិន្នន័យប្រតិបត្តិការលក់ (POS data) របស់អាជីវកម្មគោលដៅ និងធ្វើការសម្អាតទិន្នន័យដែលបាត់បង់ ឬមិនត្រឹមត្រូវ ដោយប្រើប្រាស់បណ្ណាល័យ Pandas នៅក្នុង Python ដើម្បីរៀបចំវាជាទម្រង់ One-Hot Encoding។
ការអនុវត្តក្បួនដោះស្រាយ (Algorithm Implementation): ប្រើប្រាស់កញ្ចប់បណ្ណាល័យ mlxtend (Machine Learning Extensions) នៅក្នុង Python ដើម្បីដំណើរការមុខងារ apriori និង association_rules ទៅលើសំណុំទិន្នន័យដែលបានសម្អាតរួច។
ការកំណត់ប៉ារ៉ាម៉ែត្រ (Parameter Tuning): ធ្វើការសាកល្បងកែប្រែកម្រិតអប្បបរមានៃ Support និង Confidence ដើម្បីច្រោះយកតែច្បាប់សមាគមណាដែលកើតឡើងញឹកញាប់ និងមានភាពប្រាកដប្រជាខ្ពស់ ដែលមានអត្ថន័យផ្នែកអាជីវកម្ម។
ការវាយតម្លៃ និងប្រៀបធៀប (Evaluation & Comparison): សរសេរកូដដើម្បីដំណើរការក្បួនដោះស្រាយ FP-Growth (មាននៅក្នុង mlxtend.frequent_patterns) ស្របគ្នា ដើម្បីប្រៀបធៀបល្បឿននៃការគណនា និងប្រសិទ្ធភាព ជាពិសេសនៅពេលទិន្នន័យកាន់តែធំ។
ការធ្វើតេស្តសាកល្បងក្នុងទីផ្សារ (A/B Testing for Validation): យកច្បាប់សមាគមដែលបានរកឃើញ ទៅបង្កើតជាយុទ្ធសាស្ត្រលក់ជាកញ្ចប់ (Bundling Strategy) នៅតាមហាង ឬនៅលើកម្មវិធី (App) បន្ទាប់មកអនុវត្តវិធីសាស្ត្រ A/B Testing ដើម្បីវាស់ស្ទង់មើលការកើនឡើងនៃប្រាក់ចំណេញពិតប្រាកដ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Data Mining	ការរុករកទិន្នន័យ គឺជាដំណើរការនៃការទាញយកលំនាំ (Patterns) ឬព័ត៌មានដែលមានប្រយោជន៍ពីក្នុងបណ្តុំទិន្នន័យដ៏ធំ ដើម្បីយកមកវិភាគ និងគាំទ្រដល់ការសម្រេចចិត្តអាជីវកម្ម ឬព្យាករណ៍ពីនិន្នាការនាពេលអនាគត។	ដូចជាការរែងរកមាសចេញពីគំនរខ្សាច់ដ៏ធំ ដើម្បីយករបស់ដែលមានតម្លៃបំផុត។
Association Rule Mining	ជាបច្ចេកទេសមួយក្នុង Data Mining ដែលប្រើសម្រាប់ស្វែងរកទំនាក់ទំនង ឬច្បាប់នៃការកើតឡើងជាមួយគ្នារវាងអថេរផ្សេងៗនៅក្នុងបណ្តុំទិន្នន័យធំៗ ពិសេសការរកមើលថាទំនិញណាខ្លះដែលអតិថិជនតែងតែទិញជាមួយគ្នាក្នុងពេលតែមួយ។	ដូចជាការសង្កេតរកមើលច្បាប់ទម្លាប់ថា រាល់ពេលដែលមានអ្នកទិញនំប៉័ង ពួកគេតែងតែទិញប៊ឺរមកជាមួយដែរជានិច្ច។
Apriori Algorithm	ក្បួនដោះស្រាយតាមលំដាប់លំដោយមួយ ដែលត្រូវបានប្រើដើម្បីស្វែងរកសំណុំទំនិញដែលកើតឡើងញឹកញាប់ (Frequent Itemsets) សម្រាប់បង្កើតជាច្បាប់សមាគម ដោយវាធ្វើការកាត់បន្ថយជម្រើសដែលមិនសូវសំខាន់ចោលជាបន្តបន្ទាប់ដើម្បីចំណេញពេលរុករក។	ដូចជាការទាយទុកមុនថា បើអ្នកមិនចូលចិត្តញ៉ាំសាច់គោទេ អ្នកក៏ប្រហែលជាមិនកុម្ម៉ង់ស៊ុបគោដែរ ដូច្នេះគេមិនចាំបាច់សួរនាំរឿងស៊ុបគោទៀតដើម្បីចំណេញពេល។
FP-Growth	ជាក្បួនដោះស្រាយសម្រាប់ស្វែងរកសំណុំទំនិញញឹកញាប់ដូច Apriori ដែរ ប៉ុន្តែវាមានប្រសិទ្ធភាព និងលឿនជាង ដោយសារវាមិនចាំបាច់បង្កើតទិន្នន័យសាកល្បងច្រើនដង តែវាប្រើរចនាសម្ព័ន្ធដើមឈើ (Tree Structure) ដើម្បីផ្ទុកទិន្នន័យសង្ខេប។	ជំនួសឱ្យការរាប់ទំនិញម្តងមួយៗច្រើនសារ (Apriori) FP-Growth ប្រៀបដូចជាការគូរផែនទីដើមឈើតែម្តង ដើម្បីមើលថាតើផ្លូវណាដែលមានអ្នកដើរកាត់ច្រើនជាងគេបំផុត។
Market Basket Analytics	ការវិភាគកញ្ចប់ទីផ្សារ គឺជាការសិក្សាលើទម្លាប់នៃការទិញរបស់អតិថិជន ដើម្បីស្វែងយល់ថាតើផលិតផលអ្វីខ្លះដែលពួកគេតែងទិញដាក់ក្នុងកញ្ចប់ ឬរទេះតែមួយ សម្រាប់យកទៅរៀបចំប្រូម៉ូសិន យុទ្ធសាស្ត្រលក់ ឬការដាក់តាំងទំនិញនៅលើធ្នើរ។	ដូចជាអ្នកលក់សង្កេតមើលកន្ត្រកផ្សាររបស់អ្នកទិញ ដើម្បីដឹងថាបើគេដាក់លក់ទឹកត្រីនៅជិតអំបិល តើគេអាចលក់ដាច់ជាងមុនឬអត់។
Support	ជារង្វាស់មួយនៅក្នុង Association Rule Mining ដែលបង្ហាញពីភាគរយ ឬភាពញឹកញាប់នៃសំណុំទំនិញណាមួយ ដែលត្រូវបានទិញ ធៀបទៅនឹងចំនួនប្រតិបត្តិការទិញលក់សរុបទាំងអស់។ វាជួយប្រាប់ថាទំនិញនោះពេញនិយមកម្រិតណា។	បើក្នុងចំណោមអតិថិជន ១០០នាក់ មាន ២០នាក់ទិញកាហ្វេ នោះតម្លៃ Support របស់កាហ្វេគឺ ២០%។
Confidence	ជារង្វាស់ដែលប្រាប់ពីភាពប្រាកដប្រជាថា ប្រសិនបើអតិថិជនទិញទំនិញ A ហើយ តើមានឱកាសប៉ុន្មានភាគរយដែលពួកគេនឹងទិញទំនិញ B បន្ថែមទៀត។ វាកំណត់កម្លាំងនៃទំនាក់ទំនងរវាងទំនិញទាំងពីរ។	បើមានមនុស្ស ១០នាក់ទិញទូរស័ព្ទ ហើយក្នុងនោះមាន ៨នាក់ទិញស្រោមទូរស័ព្ទបន្ថែម នោះ Confidence គឺ ៨០%។
A/B testing	វិធីសាស្ត្រពិសោធន៍ដើម្បីប្រៀបធៀបយុទ្ធសាស្ត្រពីរផ្សេងគ្នា (A និង B) ក្នុងបរិស្ថានជាក់ស្តែង ដើម្បីវាស់ស្ទង់ថាតើកំណែមួយណាមានដំណើរការ ឬផ្តល់លទ្ធផលល្អជាង ដោយផ្អែកលើទិន្នន័យនៃការឆ្លើយតបរបស់អ្នកប្រើប្រាស់ពិតប្រាកដ។	ដូចជាការសាកល្បងបិទផ្ទាំងពាណិជ្ជកម្មពណ៌ក្រហមនៅហាងទី១ និងពណ៌ខៀវនៅហាងទី២ រួចតាមដានមើលថាតើហាងមួយណាមានអតិថិជនចូលច្រើនជាង។
Bundling	យុទ្ធសាស្រ្តលក់ដែលអាជីវកម្មចងផលិតផល ឬសេវាកម្មច្រើនបញ្ចូលគ្នា ហើយលក់ចេញជាកញ្ចប់តែមួយ ដែលភាគច្រើនត្រូវបានដាក់លក់ក្នុងតម្លៃថោកជាងការទិញរាយរាច់ ដើម្បីជំរុញទំហំនៃការលក់។	ដូចជាការទិញឈុតអាហារ (ដែលមានប៊ឺហ្គឺរ ដំឡូងបំពង និងកូកាកូឡាស្រាប់) ក្នុងតម្លៃពិសេស ជំនួសឱ្យការទិញវាដាច់ដោយឡែកពីគ្នា។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖