បញ្ហា (The Problem)៖ ការសម្គាល់អារម្មណ៍មនុស្សតាមរយៈសញ្ញាខួរក្បាល (EEG) ជារឿយៗជួបប្រទះនឹងបញ្ហាទិន្នន័យមិនមានតុល្យភាព (Imbalanced Data) ដូចជាក្នុងសំណុំទិន្នន័យ DEAP ដែលធ្វើឱ្យភាពត្រឹមត្រូវនៃការវាយតម្លៃអារម្មណ៍មានកម្រិតទាប។ ការសិក្សានេះព្យាយាមដោះស្រាយបញ្ហាអតុល្យភាពនេះដើម្បីបង្កើនប្រសិទ្ធភាពក្នុងការសម្គាល់អារម្មណ៍។
វិធីសាស្ត្រ (The Methodology)៖ ការសិក្សានេះបានស្នើឡើងនូវបច្ចេកទេសបង្កើតទិន្នន័យបន្ថែមសម្រាប់ក្រុមភាគតិច (Radius-SMOTE) រួមផ្សំជាមួយម៉ូដែលទាញយកលក្ខណៈពិសេស និងម៉ូដែលចំណាត់ថ្នាក់តាមបែប Deep Learning។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| CNN with Radius-SMOTE បណ្ដាញសរសៃប្រសាទ CNN ជាមួយការបង្កើតទិន្នន័យ Radius-SMOTE (ស្នើឡើង) |
អាចដោះស្រាយបញ្ហាទិន្នន័យមិនមានតុល្យភាពបានយ៉ាងល្អ និងផ្តល់ភាពត្រឹមត្រូវខ្ពស់បំផុតក្នុងការសម្គាល់អារម្មណ៍។ | ទាមទារធនធានកុំព្យូទ័រខ្ពស់ និងចំណាយពេលយូរក្នុងការហ្វឹកហាត់ម៉ូដែល ដោយសារការប្រើប្រាស់ទិន្នន័យតំណាងរាងជា 3D Cube។ | ទទួលបានភាពត្រឹមត្រូវ ៨២,១១% សម្រាប់ Arousal និង ៧៨,៩៩% សម្រាប់ Valence។ |
| Decision Tree with Radius-SMOTE មែកធាងសេចក្តីសម្រេច (Decision Tree) ជាមួយ Radius-SMOTE (ស្នើឡើង) |
ដំណើរការលឿន ងាយស្រួលបកស្រាយ និងមិនត្រូវការទិន្នន័យបញ្ចូលជាទម្រង់ 3D Cube ស្មុគស្មាញនោះទេ។ | ភាពត្រឹមត្រូវនៅមានកម្រិតទាបជាងម៉ូដែល Deep Learning (CNN)។ | ទទួលបានភាពត្រឹមត្រូវ ៧៨,៧៨% សម្រាប់ Arousal និង ៧៥,១៤% សម្រាប់ Valence។ |
| CNN without Oversampling (Yang et al.) បណ្ដាញសរសៃប្រសាទ CNN ដោយគ្មានការបន្ថែមទិន្នន័យ (យោងតាម Yang et al.) |
មិនត្រូវការឆ្លងកាត់ដំណាក់កាលបង្កើតទិន្នន័យសិប្បនិម្មិត ដែលធ្វើឱ្យដំណើរការរៀបចំទិន្នន័យមានភាពសាមញ្ញ។ | រងផលប៉ះពាល់យ៉ាងខ្លាំងពីអតុល្យភាពនៃទិន្នន័យ ដែលធ្វើឱ្យការទស្សន៍ទាយលម្អៀងទៅរកក្រុមភាគច្រើន (Majority Class)។ | ទទួលបានភាពត្រឹមត្រូវត្រឹមតែ ៦៩,៥៥% សម្រាប់ Arousal និង ៦៨,៥៦% សម្រាប់ Valence។ |
| SVM with Random Oversampling (Ding et al.) ម៉ូដែល SVM ជាមួយ Random Oversampling (យោងតាម Ding et al.) |
ងាយស្រួលក្នុងការអនុវត្តជាងវិធីសាស្ត្រ SMOTE ព្រោះវាគ្រាន់តែថតចម្លងទិន្នន័យដែលមានស្រាប់។ | ងាយប្រឈមនឹងបញ្ហា Overfitting (ទន្ទេញចាំទិន្នន័យ) ដោយសារការថតចម្លងទិន្នន័យដដែលៗច្រើនដង។ | ទទួលបានភាពត្រឹមត្រូវ ៧៦,៦៧% សម្រាប់ Arousal និង ៧២,៩៥% សម្រាប់ Valence។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ទោះបីជាឯកសារមិនបានបញ្ជាក់លម្អិតពីទំហំកម្លាំងម៉ាស៊ីនក៏ពិតមែន ប៉ុន្តែការប្រើប្រាស់បណ្ដាញ Deep Learning (CNN) ជាមួយទិន្នន័យតំណាងជា 3D Cube ទាមទារធនធានកុំព្យូទ័រធម្យមទៅខ្ពស់។
ការសិក្សានេះប្រើប្រាស់សំណុំទិន្នន័យ DEAP ដែលប្រមូលពីអ្នកចូលរួមចំនួន ៣២នាក់ (អាយុ ១៩-៣៧ឆ្នាំ) នៅក្នុងមន្ទីរពិសោធន៍លោកខាងលិច។ កត្តានេះអាចជះឥទ្ធិពលនៅពេលយកមកអនុវត្តនៅកម្ពុជា ដោយសារការឆ្លើយតបនៃអារម្មណ៍ និងរលកខួរក្បាលអាចមានភាពខុសគ្នាយ៉ាងខ្លាំងទៅតាមវប្បធម៌ បរិបទសង្គម និងកម្រិតនៃការយល់ដឹង។
បច្ចេកទេសដោះស្រាយទិន្នន័យគ្មានតុល្យភាពនេះ មានសក្ដានុពលខ្ពស់សម្រាប់ការស្រាវជ្រាវបច្ចេកវិទ្យាវាស់ស្ទង់អារម្មណ៍នៅកម្ពុជា។
ជារួម បច្ចេកទេស Radius-SMOTE អាចជួយអ្នកស្រាវជ្រាវកម្ពុជាដោះស្រាយបញ្ហាកង្វះខាតទិន្នន័យគំរូ (Imbalanced Data) ក្នុងវិស័យ AI និងសុខាភិបាលបានយ៉ាងមានប្រសិទ្ធភាព និងចំណាយដើមទុនទាបក្នុងការកែច្នៃទិន្នន័យ។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Electroencephalogram (EEG) | ជាវិធីសាស្ត្រក្នុងការវាស់ស្ទង់សកម្មភាពអគ្គិសនីនៃខួរក្បាលរបស់មនុស្ស ដោយការបិទសេនស័រ (Electrodes) នៅលើស្បែកក្បាល ដើម្បីថតយកកម្រិតរលកខួរក្បាលពេលមានប្រតិកម្មទៅនឹងរំញោចអ្វីមួយ។ | ដូចជាម៉ាស៊ីនថតសំឡេងដែលយើងបិទជាប់ក្បាលដើម្បីលួចស្តាប់រលកសញ្ញាអគ្គិសនីដែលកោសិកាខួរក្បាលកំពុងនិយាយគ្នា។ |
| Radius-SMOTE | ជាបច្ចេកទេសបង្កើតទិន្នន័យសិប្បនិម្មិតបន្ថែមសម្រាប់ក្រុមទិន្នន័យដែលមានចំនួនតិច (Minority Class) ដោយកំណត់ដែនកាំរង្វង់ (Radius) ដើម្បីចៀសវាងការបង្កើតទិន្នន័យត្រួតស៊ីគ្នាជាមួយក្រុមទិន្នន័យដែលមានចំនួនច្រើនរួចទៅហើយ។ | ដូចជាការចម្លងមនុស្សបន្ថែមដាក់នៅទីតាំងដែលស្ងាត់ ដោយកំណត់គម្លាតសុវត្ថិភាពដើម្បីកុំឱ្យពួកគេទៅឈរជាន់កន្លែងដែលមានមនុស្សកកកុញច្រើនរួចទៅហើយ។ |
| Differential Entropy (DE) | ជាវិធីសាស្ត្រគណិតវិទ្យាក្នុងការទាញយកលក្ខណៈពិសេសពីរលកសញ្ញាខួរក្បាល ដោយវាស់ស្ទង់កម្រិតនៃភាពស្មុគស្មាញ និងការប្រែប្រួលនៃរលកសញ្ញាទាំងនោះដើម្បីតំណាងឱ្យកម្រិតនៃអារម្មណ៍។ | ដូចជាការវាស់ស្ទង់មើលថាតើទឹកសមុទ្រកំពុងតែស្ងប់ស្ងាត់ ឬមានរលកបោកបក់ខ្លាំងកម្រិតណា ដើម្បីដឹងពីស្ថានភាពអាកាសធាតុពិតប្រាកដ។ |
| Convolutional Neural Network (CNN) | ជាប្រភេទម៉ូដែលបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិត (Deep Learning) ដែលមានសមត្ថភាពខ្ពស់ក្នុងការវិភាគទិន្នន័យទម្រង់ជាក្រឡាចត្រង្គ (ដូចជារូបភាព ឬទិន្នន័យ 3D Cube) ដើម្បីទាញយកលក្ខណៈសម្គាល់សំខាន់ៗដោយស្វ័យប្រវត្តិ។ | ដូចជាភ្នែកនិងខួរក្បាលរបស់មនុស្សដែលអាចមើលឃើញរូបភាពមួយ រួចដឹងភ្លាមៗថាវាជារូបឆ្មា ឬរូបឆ្កែ ដោយគ្រាន់តែសម្គាល់តាមទម្រង់ត្រចៀក ឬភ្នែករបស់វា។ |
| Imbalanced Data | ជាបញ្ហានៅក្នុងសំណុំទិន្នន័យដែលក្រុមទិន្នន័យម្ខាងមានចំនួនច្រើនលើសលប់ (Majority Class) ខណៈក្រុមទិន្នន័យម្ខាងទៀតមានចំនួនតិចតួចពេក ដែលធ្វើឱ្យម៉ូដែល AI រៀនសូត្របានលម្អៀង និងទស្សន៍ទាយខុសនៅពេលជួបក្រុមភាគតិច។ | ដូចជាគ្រូបង្រៀនម្នាក់ដែលចំណាយពេលបង្រៀនតែសិស្សពូកែ៣០នាក់ និងមិនសូវខ្វល់ពីសិស្សខ្សោយ២នាក់ ធ្វើឱ្យការប្រឡងរបស់សិស្សខ្សោយធ្លាក់ជានិច្ច។ |
| 3D Cube | ជាវិធីសាស្ត្ររៀបចំទិន្នន័យលក្ខណៈពិសេសរបស់រលកខួរក្បាល (DE features) ឱ្យទៅជាទម្រង់ម៉ាទ្រីស ៣ វិមាត្រ ដោយផ្គុំប្រេកង់រលកផ្សេងៗគ្នាចូលគ្នាជាស្រទាប់ៗ ដើម្បីងាយស្រួលសម្រាប់ម៉ូដែល CNN ធ្វើការវិភាគ។ | ដូចជាការយកនំសាំងវិចដែលមានស្រទាប់សាច់ បន្លែ និងស៊ុត មកត្រួតស៊ីគ្នា ដើម្បីឱ្យម៉ាស៊ីនស្កេនមើលឃើញរសជាតិទាំងមូលក្នុងពេលតែមួយ។ |
| Arousal and Valence | ជារង្វាស់ពីរវិមាត្រសម្រាប់វាយតម្លៃអារម្មណ៍របស់មនុស្ស។ Arousal វាស់ពីកម្រិតនៃភាពរំភើប (ពីស្ងប់ស្ងាត់ទៅរំភើបខ្លាំង) ចំណែក Valence វាស់ពីកម្រិតនៃភាពវិជ្ជមាន ឬអវិជ្ជមាននៃអារម្មណ៍ (ពីសោកសៅទៅសប្បាយចិត្ត)។ | ដូចជាការស្តាប់វិទ្យុ ដែល Arousal គឺកម្រិតសំឡេង (ខ្លាំងឬខ្សោយ) ចំណែកឯ Valence គឺប្រភេទប៉ុស្តិ៍វិទ្យុ (ប៉ុស្តិ៍ចម្រៀងកម្សាន្ត ឬប៉ុស្តិ៍ព័ត៌មានដ៏សែនក្រៀមក្រំ)។ |
| Feature Extraction | ជាដំណើរការនៃការបំប្លែងទិន្នន័យឆៅដ៏ច្រើនសន្ធឹកសន្ធាប់ (ដូចជារលកសញ្ញាខួរក្បាលជាបន្តបន្ទាប់) ទៅជាសំណុំនៃតួលេខឬលក្ខណៈសំខាន់ៗដែលម៉ាស៊ីន (AI) អាចយល់ និងរៀនសូត្របានប្រកបដោយប្រសិទ្ធភាព។ | ដូចជាការចម្រាញ់យកតែទឹកផ្លែឈើសុទ្ធចេញពីផ្លែឈើទាំងមូលទម្ងន់ច្រើនគីឡូ ដើម្បីងាយស្រួលយកទៅធ្វើភេសជ្ជៈភ្លាមៗដោយមិនបាច់ទំពា។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖