បញ្ហា (The Problem)៖ ការវិវត្តនៃឧបករណ៍ហោះហើរគ្មានមនុស្សបើក (UAVs) ឬដ្រូន បានបង្កឲ្យមានក្តីបារម្ភផ្នែកសន្តិសុខ ដោយសារពួកវាអាចត្រូវបានប្រើប្រាស់ដើម្បីផ្ទុកគ្រឿងផ្ទុះ ឬអាវុធសម្រាប់ការវាយប្រហារផ្សេងៗ ហើយការរកឃើញថាតើដ្រូនកំពុងផ្ទុកទម្ងន់ឬអត់នៅមានកម្រិតនៅឡើយ។
វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះបានប្រើប្រាស់ក្បួនដោះស្រាយការរៀនដោយម៉ាស៊ីន (Machine Learning algorithms) ដើម្បីកំណត់អត្តសញ្ញាណ និងចំណាត់ថ្នាក់ដ្រូនដែលកំពុងផ្ទុកទម្ងន់ ដោយផ្អែកលើការវិភាគទិន្នន័យសំឡេងដែលពួកវាបានបញ្ចេញ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Individual Feature + Machine Learning (e.g., MFCC with SVM) ការប្រើប្រាស់លក្ខណៈពិសេសទោល + ម៉ូដែលរៀនដោយម៉ាស៊ីន (ឧទាហរណ៍ MFCC ជាមួយ SVM) |
ចំណាយពេលគណនាតិច និងដំណើរការទាញយកលក្ខណៈពិសេស (Feature Extraction) លឿន ដោយសារទំហំទិន្នន័យបញ្ចូលតូចជាង។ | ការផ្តោតលើលក្ខណៈពិសេសតែមួយមិនអាចផ្តល់ព័ត៌មានគ្រប់គ្រាន់ដើម្បីឈានដល់ភាពត្រឹមត្រូវអតិបរមាបានទេ ជាពិសេសក្នុងស្ថានភាពមានសំឡេងរំខាន។ | ទទួលបានភាពត្រឹមត្រូវខ្ពស់បំផុត ៩៨.៦% (សម្រាប់ម៉ូដែល SVM) និង ៩៩.៧% (សម្រាប់ MFCC ក្នុង GNB)។ |
| Feature Combination + Standard ML (Proposed Method) ការប្រើប្រាស់បន្សំនៃលក្ខណៈពិសេស + ម៉ូដែលរៀនដោយម៉ាស៊ីន (វិធីសាស្ត្រដែលបានស្នើ) |
ផ្តល់ភាពត្រឹមត្រូវខ្ពស់បំផុត និងមានស្ថិរភាពលើគ្រប់ម៉ូដែល ML ព្រមទាំងងាយស្រួលពន្យល់ពីលទ្ធផល (Explainability) ដោយមិនប្រើប្រាស់ធនធានកុំព្យូទ័រធំដុំ។ | ទាមទារពេលវេលាបន្ថែមបន្តិចបន្តួចសម្រាប់ការគណនា និងទាញយកលក្ខណៈពិសេស (mfcc, chroma, mel, contrast, tonnetz) ចូលគ្នា។ | សម្រេចបានភាពត្រឹមត្រូវជាមធ្យម ៩៩% ដោយឡើងដល់ ៩៩.៧% សម្រាប់ម៉ូដែល GNB និង Neural Network។ |
| Micro-Doppler Radar Signatures (Baseline from Pallotta et al.) ការប្រើប្រាស់រ៉ាដា Micro-Doppler (វិធីសាស្ត្រពីការស្រាវជ្រាវមុនៗ) |
មិនសូវរងឥទ្ធិពលពីបរិស្ថានដែលមានសំឡេងរំខាន (Environmental noise) ដូចជាសំឡេងខ្យល់ ឬចរាចរណ៍។ | ត្រូវការឧបករណ៍រ៉ាដាដែលមានតម្លៃថ្លៃ និងទាមទារធនធានគណនាខ្ពស់សម្រាប់ដំណើរការទិន្នន័យ។ | ភាពត្រឹមត្រូវជាមធ្យមត្រឹមតែ ៩២.៦១% ប៉ុណ្ណោះក្នុងការធ្វើចំណាត់ថ្នាក់បន្ទុកដ្រូន។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះមិនតម្រូវឲ្យមានធនធានកុំព្យូទ័រ ឬឧបករណ៍ថ្លៃៗនោះទេ ដោយប្រើប្រាស់ត្រឹមតែកុំព្យូទ័រយួរដៃផ្ទាល់ខ្លួនធម្មតាសម្រាប់ការទាញយកលក្ខណៈពិសេស និងការបង្វឹកម៉ូដែល។
ការសិក្សានេះត្រូវបានធ្វើឡើងនៅឧទ្យាន McAllister ក្នុងរដ្ឋ Indiana សហរដ្ឋអាមេរិក ដោយប្រើប្រាស់ដ្រូនតែ២ម៉ូដែល និងប្រភេទបន្ទុកតែមួយគត់ (ដបទឹក 500ml)។ សម្រាប់ប្រទេសកម្ពុជា ទិន្នន័យនេះមិនទាន់អាចគ្របដណ្តប់បរិបទជាក់ស្តែងបានទាំងស្រុងនោះទេ ដោយសារកម្ពុជាមានប្រភេទសំឡេងរំខានផ្សេងៗ (ដូចជាសំឡេងម៉ូតូ សត្វល្អិត) អាកាសធាតុខុសគ្នា និងការប្រើប្រាស់ដ្រូនកែច្នៃចម្រុះ ដែលទាមទារឲ្យមានការប្រមូលទិន្នន័យក្នុងស្រុកបន្ថែមដើម្បីបង្វឹកម៉ូដែលឲ្យបានច្បាស់លាស់។
បច្ចេកវិទ្យាតាមដានដ្រូនតាមរយៈសំឡេងនេះ មានសក្តានុពលខ្ពស់សម្រាប់ការយកមកអនុវត្តនៅកម្ពុជា ដោយសារវាជាដំណោះស្រាយចំណាយតិចជាងការប្រើប្រាស់រ៉ាដា។
ជារួម វិធីសាស្ត្រនេះអាចក្លាយជាឧបករណ៍សន្តិសុខដ៏មានប្រសិទ្ធភាព និងសន្សំសំចៃសម្រាប់ស្ថាប័នរដ្ឋ និងឯកជននៅកម្ពុជា ប្រសិនបើមានការស្រាវជ្រាវបន្ថែមដើម្បីសម្របម៉ូដែលនេះទៅនឹងបរិស្ថានសំឡេងក្នុងស្រុក។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Feature Extraction | គឺជាដំណើរការនៃការទាញយកព័ត៌មាន ឬលក្ខណៈសម្បត្តិសំខាន់ៗចេញពីទិន្នន័យឆៅ (ដូចជាឯកសារសំឡេងរវល់ៗ) ដើម្បីបំប្លែងវាទៅជាទម្រង់វ៉ិចទ័រលេខដែលកុំព្យូទ័រអាចយល់ និងយកទៅសិក្សាបានយ៉ាងងាយស្រួលដោយមិនមានភាពស្មុគស្មាញ។ | ដូចជាការស្តាប់មនុស្សម្នាក់និយាយ រួចកត់ត្រាតែចំណុចសំខាន់ៗ (កម្ពស់សំឡេង និងល្បឿន) ជាជាងការចងចាំគ្រប់ពាក្យពេចន៍ទាំងអស់របស់គាត់។ |
| mfcc | ជាបច្ចេកទេសទាញយកលក្ខណៈពិសេសនៃសំឡេង ដោយក្លែងធ្វើតាមរបៀបដែលត្រចៀកមនុស្សស្តាប់ឮ (វាផ្តោតលើរលកសំឡេងប្រេកង់ទាបច្រើនជាងប្រេកង់ខ្ពស់) ដើម្បីកំណត់អត្តសញ្ញាណប្រភព និងទម្រង់នៃសំឡេងម៉ូទ័ររបស់ដ្រូន។ | ដូចជាឧបករណ៍តម្រងសំឡេងឆ្លាតវៃ ដែលជួយឲ្យកុំព្យូទ័រស្តាប់ និងបែងចែកសំឡេងដ្រូនបានដូចទៅនឹងត្រចៀករបស់មនុស្សយើងដែរ។ |
| Support Vector Machine (SVM) | ជាក្បួនដោះស្រាយរៀនដោយម៉ាស៊ីន (Machine Learning) ដែលព្យាយាមគូសបន្ទាត់ ឬបង្កើតព្រំដែនដ៏ល្អបំផុតមួយ ដើម្បីបែងចែកក្រុមទិន្នន័យពីរប្រភេទផ្សេងគ្នា (ឧទាហរណ៍៖ ដ្រូនមានផ្ទុកទម្ងន់ និងដ្រូនគ្មានផ្ទុកទម្ងន់) ឲ្យដាច់ពីគ្នាច្បាស់លាស់បំផុតដោយមានគម្លាតធំទូលាយ។ | ដូចជាការគូសបន្ទាត់លើដីដើម្បីញែកក្រុមក្មេងពាក់អាវក្រហម និងក្រុមក្មេងពាក់អាវខៀវឲ្យនៅម្ខាងម្នាក់ ដោយធានាថាបន្ទាត់នោះនៅចំកណ្តាលឃ្លាតពីក្មេងទាំងសងខាងឆ្ងាយបំផុត។ |
| K-Nearest Neighbor (KNN) | ជាម៉ូដែលចំណាត់ថ្នាក់ដែលសម្រេចចិត្តថាទិន្នន័យថ្មីមួយ (ឧ. សំឡេងដ្រូនថ្មី) គួរតែស្ថិតក្នុងក្រុមណា ដោយផ្អែកលើការប្រៀបធៀបភាពស្រដៀងគ្នារបស់វាទៅនឹងទិន្នន័យចាស់ៗដែលនៅក្បែរវាបំផុតចំនួន K (ក្នុងឯកសារនេះគេកំណត់ K=6)។ | ដូចជាការទស្សន៍ទាយចំណង់ចំណូលចិត្តរបស់សិស្សថ្មីម្នាក់ ដោយមើលទៅលើសិស្សចាស់៦នាក់ផ្សេងទៀតដែលមានចរិតលក្ខណៈស្រដៀងគេបំផុត។ |
| Neural Network (NN) | ជាប្រព័ន្ធម៉ូដែលបញ្ញាសិប្បនិម្មិតដែលត្រូវបានរចនាឡើងដោយត្រាប់តាមបណ្តាញកោសិកាខួរក្បាលរបស់មនុស្ស ដែលមានស្រទាប់ (Layers) ជាច្រើនតភ្ជាប់គ្នា ដើម្បីរៀនស្គាល់លំនាំស្មុគស្មាញពីទិន្នន័យសំឡេង និងធ្វើការសម្រេចចិត្តបានត្រឹមត្រូវ។ | ដូចជាក្រុមការងារមួយដែលមានបុគ្គលិកច្រើនជាន់ថ្នាក់ ដោយអ្នកថ្នាក់ក្រោមវិភាគព័ត៌មានរួចបញ្ជូនបន្តទៅអ្នកថ្នាក់លើ រហូតដល់មេធំបំផុតអាចធ្វើការសម្រេចចិត្តបានយ៉ាងសុក្រឹត។ |
| chroma | ជារង្វាស់លក្ខណៈពិសេសនៃសំឡេងដែលតំណាងឱ្យកម្រិតថាមពលនៃសម្លេងធៀបនឹងណោតភ្លេងទាំង១២ (Pitch classes) ដើម្បីអាចយល់ពីទម្រង់ភ្លេង ឬចង្វាក់ (Rhythmic patterns) នៃសញ្ញាសំឡេងរបស់ស្លាបចាក់ដ្រូន។ | ដូចជាការស្តាប់បទចម្រៀងមួយ រួចកត់សម្គាល់តែណោតភ្លេងគោល (ដូ រ៉េ មី...) ដែលលេចធ្លោជាងគេនៅក្នុងវិនាទីនីមួយៗ ដោយមិនខ្វល់ពីអ្នកច្រៀង។ |
| tonnetz | ជាបច្ចេកទេសទាញយកលក្ខណៈពិសេសដែលគណនាពីភាពសុខដុម (Harmony) និងទំនាក់ទំនងនៃសំឡេងនៅក្នុងលំហធរណីមាត្រ ដើម្បីស្វែងយល់ពីរបៀបដែលប្រេកង់សំឡេងខុសៗគ្នាលាយឡំចូលគ្នា។ | ដូចជាការមើលផែនទីសាច់ពណ៌ ដែលបង្ហាញពីភាពស៊ីចង្វាក់គ្នានៃសំឡេងផ្សេងៗដែលបន្លឺឡើងព្រមគ្នា។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖