Original Title: Acoustic Detection of Forest Wood-Boring Insects Under Co-Infestations
Source: doi.org/10.3390/insects16121241
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការរកឃើញតាមរយៈសំឡេងនៃសត្វល្អិតចោះឈើក្នុងព្រៃក្រោមការរាតត្បាតរួមគ្នា

ចំណងជើងដើម៖ Acoustic Detection of Forest Wood-Boring Insects Under Co-Infestations

អ្នកនិពន្ធ៖ Qi Jiang, Yujie Liu, Yu Sun, Lili Ren, Youqing Luo

ឆ្នាំបោះពុម្ព៖ 2025 Insects

វិស័យសិក្សា៖ Entomology and Bioacoustics

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហានៃការរកឃើញទាន់ពេលវេលានូវសត្វល្អិតចោះឈើ (Wood-boring pests) ដែលរស់នៅលាក់ខ្លួនក្នុងដើមឈើ ជាពិសេសក្នុងស្ថានភាពស្មុគស្មាញដែលមានសត្វល្អិតច្រើនប្រភេទរាតត្បាត និងបញ្ចេញសំឡេងក្នុងពេលតែមួយ (Co-infestations)។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានប្រមូលសញ្ញារំញ័រសំឡេងនៃការស៊ីរបស់សត្វល្អិតចំនួន ៤ ប្រភេទ ហើយបានបង្កើតសំណុំទិន្នន័យសម្រាប់ស្ថានភាពរាតត្បាតចំនួន ៣ ផ្សេងៗគ្នា ដើម្បីធ្វើតេស្តប្រៀបធៀបសមត្ថភាពរបស់ម៉ូដែលកុំព្យូទ័រ។

ការប្រមូលសញ្ញាសំឡេងរំញ័រពេលស៊ី (Feeding vibration signals recording) ពីសត្វល្អិតដូចជា S. bifasciatus, P. aubei, A. planipennis, និង S. insularis
ការបង្កើតម៉ូដែលរៀនដោយម៉ាស៊ីន (Machine Learning models) ដូចជា Random Forest, SVM, និង ANN ដោយផ្អែកលើអថេរលក្ខណៈសំឡេង (Acoustic feature variables)
ការបង្កើតម៉ូដែលរៀនស៊ីជម្រៅ (Deep Learning models) ដូចជា AlexNet, ResNet, និង VGG ដោយផ្អែកលើរូបភាពវិសាលគមសំឡេង (Spectrograms)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ម៉ូដែល Machine Learning ទទួលបានភាពត្រឹមត្រូវល្អឥតខ្ចោះ (១០០%) សម្រាប់ស្ថានភាពដែលមានសត្វល្អិតតែមួយប្រភេទ ប៉ុន្តែបានធ្លាក់ចុះភាពត្រឹមត្រូវយ៉ាងខ្លាំងនៅពេលមានសញ្ញាសំឡេងចម្រុះបញ្ចូលគ្នា។
ម៉ូដែល Deep Learning ជាពិសេសម៉ូដែល ResNet រក្សាបាននូវភាពត្រឹមត្រូវខ្ពស់ចន្លោះពី ៨៥.០% ទៅ ៨៨.៧៥% សូម្បីតែនៅក្នុងស្ថានភាពស្មុគស្មាញដែលមានសញ្ញាសំឡេងត្រួតស៊ីគ្នាក៏ដោយ។
ការប្រើប្រាស់រូបភាពវិសាលគមសំឡេង (Spectrograms) ជាមួយម៉ូដែល Deep Learning បង្ហាញពីឧត្តមភាពក្នុងការកាត់បន្ថយការរំខានពីសញ្ញាចម្រុះ ដែលផ្តល់ជាមូលដ្ឋានគ្រឹះដ៏ល្អសម្រាប់ការអភិវឌ្ឍឧបករណ៍តាមដានជាក់ស្តែង (Real-time detection devices)។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Machine Learning Models (RF, SVM, ANN) using Acoustic Features ម៉ូដែលរៀនដោយម៉ាស៊ីន (RF, SVM, ANN) ដោយប្រើអថេរលក្ខណៈសំឡេង	ដំណើរការបានល្អឥតខ្ចោះនិងមានភាពត្រឹមត្រូវខ្ពស់បំផុត សម្រាប់ការរកឃើញសត្វល្អិតតែមួយប្រភេទ។ ត្រូវការទិន្នន័យហ្វឹកហាត់និងកម្លាំងម៉ាស៊ីនតិចតួច។	ភាពត្រឹមត្រូវធ្លាក់ចុះយ៉ាងខ្លាំងនៅពេលជួបប្រទះស្ថានភាពដែលមានសំឡេងសត្វល្អិតច្រើនប្រភេទរាតត្បាតលាយឡំគ្នា។	ភាពត្រឹមត្រូវទូទៅ (OA) ទទួលបាន ១០០% សម្រាប់សត្វល្អិត១ប្រភេទ ប៉ុន្តែធ្លាក់ចុះក្រោម ៧៥% សម្រាប់សញ្ញាសំឡេងចម្រុះ។
Deep Learning Models (AlexNet, VGG) using Spectrograms ម៉ូដែលរៀនស៊ីជម្រៅ (AlexNet, VGG) ដោយប្រើរូបភាពវិសាលគមសំឡេង	អាចទាញយកលក្ខណៈពិសេសនៃសំឡេងដោយស្វ័យប្រវត្តិ និងមានសមត្ថភាពកាត់បន្ថយការរំខានពីសញ្ញាចម្រុះបានល្អជាងម៉ូដែល ML ប្រពៃណី។	ត្រូវការសំណុំទិន្នន័យធំសម្រាប់ការហ្វឹកហាត់ និងទាមទារកម្លាំងម៉ាស៊ីនកុំព្យូទ័រខ្ពស់ជាងមុន។	ភាពត្រឹមត្រូវទូទៅ (OA) មានចន្លោះពី ៧៧.៥% ទៅ ៨៦.៩% ក្នុងស្ថានភាពមានសញ្ញាសំឡេងចម្រុះ។
Deep Learning Model (ResNet) using Spectrograms ម៉ូដែលរៀនស៊ីជម្រៅ (ResNet) ដោយប្រើរូបភាពវិសាលគមសំឡេង	មានប្រសិទ្ធភាពខ្ពស់បំផុតក្នុងការបែងចែកសំឡេងសត្វល្អិតចម្រុះ និងរក្សាភាពត្រឹមត្រូវខ្ពស់ទោះបីជាសញ្ញាសំឡេងត្រួតស៊ីគ្នាក៏ដោយ។	ទាមទារកុំព្យូទ័រដែលមានក្រាហ្វិកកាត (GPU) ខ្លាំង ដើម្បីដំណើរការហ្វឹកហាត់ដោយរលូន និងប្រើប្រាស់ថាមពលច្រើន។	ទទួលបានភាពត្រឹមត្រូវទូទៅ (OA) ខ្ពស់បំផុតចន្លោះពី ៨៥.០% ទៅ ៨៨.៧៥% ក្នុងស្ថានភាពសញ្ញាសំឡេងចម្រុះស្មុគស្មាញ។

ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះទាមទារឧបករណ៍ចាប់សញ្ញាសំឡេងរំញ័រពិសេសប្រកបដោយភាពចាប់អារម្មណ៍ខ្ពស់ និងកម្លាំងម៉ាស៊ីនកុំព្យូទ័រដែលមានក្រាហ្វិកកាត (GPU) សម្រាប់ដំណើរការហ្វឹកហាត់ម៉ូដែល Deep Learning។

Hardware (Computing): កុំព្យូទ័រមាន CPU AMD R7 6800H និងក្រាហ្វិកកាត NVIDIA GeForce RTX 3060 (8 GB VRAM) រួមជាមួយបន្ទះ TX2 development board សម្រាប់បង្កើតប្រព័ន្ធ IoT។
Hardware (Sensor): ឧបករណ៍ចាប់សញ្ញាសំឡេង AED-2010L ដែលបានកែច្នៃភ្ជាប់ជាមួយឧបករណ៍ពង្រីកសំឡេង (Amplifier) និងកាតប្រមូលទិន្នន័យ។
Software: ប្រើប្រាស់ Python (3.9.7), PyTorch (1.9.0), TensorFlow, CUDA (11.6), R software និងកម្មវិធី Adobe Audition ជាមួយ Raven Pro 1.6 សម្រាប់វិភាគសំឡេង។
Dataset: សំណុំទិន្នន័យសំឡេងរំញ័រពេលស៊ីរបស់សត្វល្អិតចោះឈើចំនួន ៤ ប្រភេទ ដែលថតពីកំណត់ឈើក្នុងមន្ទីរពិសោធន៍ និងទីវាលរយៈពេល ៧ ថ្ងៃ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រមូលទិន្នន័យសំឡេងសត្វល្អិត និងប្រភេទឈើ (P. orientalis និង F. chinensis) មកពីកសិដ្ឋានព្រៃឈើក្នុងទីក្រុងប៉េកាំង ប្រទេសចិន ដែលមានអាកាសធាតុត្រជាក់។ សម្រាប់ប្រទេសកម្ពុជាដែលមានអាកាសធាតុត្រូពិច ប្រភេទសត្វល្អិតចោះឈើ និងប្រភេទដើមឈើគឺមានភាពខុសគ្នាស្រឡះ ដូច្នេះទិន្នន័យដើមនេះមិនអាចយកមកប្រើផ្ទាល់បានទេ ហើយទាមទារឲ្យមានការប្រមូលទិន្នន័យសំឡេងសត្វល្អិតក្នុងស្រុកជាមុនសិន។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាសំណុំទិន្នន័យមិនអាចប្រើប្រាស់ផ្ទាល់ក៏ដោយ វិធីសាស្ត្រនៃការតាមដានសត្វល្អិតតាមរយៈសំឡេងនេះមានសក្តានុពល និងសារៈសំខាន់ខ្លាំងណាស់សម្រាប់កម្ពុជា។

ការអភិរក្សព្រៃឈើ (តំបន់ព្រៃឡង់ និងជួរភ្នំក្រវាញ): អាចប្រើដើម្បីតាមដាននិងការពារការបំផ្លាញដើមឈើប្រណីតពីសំណាក់សត្វល្អិតចោះឈើ ដោយពុំចាំបាច់កាត់ ឬធ្វើឲ្យខូចខាតដើមឈើ (Non-destructive method)។
វិស័យកសិកម្មដំណាំឧស្សាហកម្ម (ខេត្តកំពង់ធំ និងរតនគិរី): អាចប្រើប្រាស់តាមចម្ការស្វាយចន្ទី ឬកៅស៊ូ ដើម្បីរកឃើញការវាយប្រហាររបស់ដង្កូវចោះដើមទាន់ពេលវេលា ដែលជួយកាត់បន្ថយការខាតបង់ទិន្នផលរបស់កសិករ។
ការគ្រប់គ្រងដើមឈើចំណាស់ (តំបន់ឧទ្យានអង្គរ): អាចជួយអាជ្ញាធរជាតិអប្សរាក្នុងការតាមដានសុខភាពដើមឈើធំៗចំណាស់ៗជុំវិញតំបន់ប្រាសាទ ដើម្បីការពារហានិភ័យនៃការដួលរលំដោយសារសត្វល្អិតស៊ីខាងក្នុង។

បច្ចេកវិទ្យានេះផ្តល់នូវដំណោះស្រាយទំនើបនិងប្រកបដោយនិរន្តរភាពសម្រាប់ការត្រួតពិនិត្យសុខភាពដើមឈើ ដែលអាចកាត់បន្ថយការខាតបង់សេដ្ឋកិច្ច និងបរិស្ថាននៅកម្ពុជាយ៉ាងមានប្រសិទ្ធភាពប្រសិនបើមានការកែច្នៃស្របតាមបរិបទក្នុងស្រុក។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះនៃការវិភាគសញ្ញាសំឡេង (Audio Signal Processing): ស្វែងយល់ពីរបៀបបំប្លែងសញ្ញាសំឡេង (Audio waveforms) ទៅជារូបភាពវិសាលគមសំឡេង (Spectrograms) ដោយប្រើប្រាស់បណ្ណាល័យ Librosa ឬ SciPy នៅក្នុងភាសា Python។
អនុវត្តការកសាងម៉ូដែល Deep Learning សម្រាប់ការចាត់ថ្នាក់រូបភាព: ចាប់ផ្តើមសិក្សានិងហ្វឹកហាត់ម៉ូដែលបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតជ្រៅ (CNN) ជាពិសេសម៉ូដែល ResNet តាមរយៈ PyTorch ឬ TensorFlow ដើម្បីចំណាត់ថ្នាក់រូបភាព Spectrograms។
រៀបចំប្រព័ន្ធប្រមូលទិន្នន័យសំឡេងតម្លៃថោក (Low-cost IoT Data Collection): សាកល្បងប្រើប្រាស់ Raspberry Pi ឬ ESP32 ភ្ជាប់ជាមួយសេនស័រចាប់រំញ័រសំឡេង (Piezoelectric sensors) ដើម្បីថតសំឡេងសត្វល្អិតសាកល្បងនៅតាមដើមឈើក្នុងបរិវេណសាកលវិទ្យាល័យ។
កសាងសំណុំទិន្នន័យសត្វល្អិតក្នុងស្រុក (Local Pest Acoustic Dataset): ចុះប្រមូលទិន្នន័យនិងបិទស្លាកចំណាត់ថ្នាក់ (Labeling) សំឡេងសត្វល្អិតចោះឈើលើដំណាំជាក់ស្តែងនៅកម្ពុជា (ឧ. ចម្ការស្វាយចន្ទី) ដោយប្រើប្រាស់កម្មវិធីឥតគិតថ្លៃដូចជា Audacity ឬ Raven Lite។
អភិវឌ្ឍប្រព័ន្ធតាមដានពេលវេលាជាក់ស្តែងឆ្លាតវៃ (Smart Real-time Monitoring): បញ្ចូលម៉ូដែលដែលបានហ្វឹកហាត់រួចទៅក្នុងឧបករណ៍ Edge Computing (ឧទាហរណ៍ NVIDIA Jetson Nano) ដើម្បីវិភាគលទ្ធផលផ្ទាល់នៅនឹងកន្លែង និងបញ្ជូនទិន្នន័យជូនដំណឹងដល់អ្នកប្រើប្រាស់។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
Spectrogram	គឺជារូបភាពតំណាងឱ្យវិសាលគមនៃប្រេកង់សំឡេងដែលប្រែប្រួលទៅតាមពេលវេលា។ ក្នុងតួនៃអត្ថបទនេះ វាបំប្លែងសញ្ញាសំឡេងសត្វល្អិតទៅជារូបភាព (២វិមាត្រ) ដែលអនុញ្ញាតឱ្យកុំព្យូទ័រអាចមើលឃើញ ទាញយកលក្ខណៈពិសេស និងវិភាគបានយ៉ាងងាយស្រួលដោយប្រើម៉ូដែលរៀនស៊ីជម្រៅ (Deep Learning)។	ដូចជាការថតកាំរស្មីអ៊ិច (X-ray) នៃសំឡេង ដោយកន្លែងណាមានពណ៌ក្រហមឆ្អៅមានន័យថាសំឡេងនៅត្រង់នោះមានកម្លាំងខ្លាំងបំផុត។
Co-infestation	ជាស្ថានភាពឬបាតុភូតជីវសាស្ត្រដែលសត្វល្អិតចង្រៃចាប់ពីពីរប្រភេទឡើងទៅ កំពុងវាយប្រហារ ចូលរស់នៅ និងស៊ីកកេររំលាយដើមឈើតែមួយក្នុងពេលដំណាលគ្នា ដែលធ្វើឱ្យរលកសញ្ញាសំឡេងរបស់ពួកវាលាយឡំគ្នា (Mixed signals) និងបង្កការលំបាកយ៉ាងខ្លាំងក្នុងការបែងចែកអត្តសញ្ញាណ។	ដូចជាមានចោរពីរក្រុមផ្សេងគ្នាកំពុងលួចគាស់ផ្ទះតែមួយក្នុងពេលតែមួយ ដែលធ្វើឱ្យប៉ូលីសពិបាកស្តាប់ដឹងថាសំឡេងណាជារបស់ក្រុមមួយណា។
Feeding vibration signals	ជារលកសញ្ញាឬរំញ័រមេកានិចដែលកើតឡើងនៅពេលដង្កូវសត្វល្អិតកំពុងខាំកកេរ ឬបំបែកសរសៃសាច់ឈើនៅខាងក្នុងដើម។ រំញ័រនេះត្រូវបានចាប់យកដោយឧបករណ៍សេនស័រ (Acoustic Sensor) ដើម្បីបញ្ជាក់ពីវត្តមានរបស់សត្វល្អិតដោយពុំចាំបាច់កាប់សាច់ឈើដើម្បីមើលនោះទេ។	ដូចជាសំឡេងញ័រនៃការទំពារស្រួយៗ ដែលយើងអាចស្តាប់ឮនៅពេលមិត្តភក្តិអង្គុយជិតកំពុងទំពារនំកញ្ចប់ក្នុងមាត់បិទជិត។
ResNet	វាជាស្ថាបត្យកម្មនៃបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតជ្រៅ (CNN Architecture) មួយប្រភេទដែលមានស្រទាប់រៀនសូត្រជាច្រើន ហើយប្រើប្រាស់បច្ចេកទេសតភ្ជាប់ផ្លូវកាត់ (Skip connections) ដើម្បីចៀសវាងការបាត់បង់ព័ត៌មានពេលកំពុងហ្វឹកហាត់ ដែលជួយឱ្យវាមានភាពសុក្រឹតខ្ពស់ក្នុងការបែងចែករូបភាព Spectrogram ស្មុគស្មាញ។	ដូចជាសិស្សពូកែដែលចេះបង្កើតផ្លូវកាត់ (Shortcut) ដើម្បីបញ្ជូនចម្លើយដោយផ្ទាល់ទៅគ្រូដោយមិនបាច់ហុចកាត់សិស្សផ្សេងទៀត ដែលការពារកុំឱ្យចម្លើយនោះប្រែប្រួលឬខុសពីដើម។
Feature variables	ជាតម្លៃលេខជាក់លាក់ (ដូចជា កម្រិតសំឡេងខ្លាំងបំផុត, ថាមពលសំឡេងសរុប, និងប្រេកង់កម្រិតកំពូល) ដែលអ្នកស្រាវជ្រាវទាញយកពីសញ្ញាសំឡេងឆៅ ដើម្បីយកទៅធ្វើជាធាតុចូល (Inputs) សម្រាប់បង្រៀនម៉ូដែល Machine Learning ឱ្យចេះចំណាត់ថ្នាក់ប្រភេទសត្វល្អិត។	ដូចជាការកត់ត្រាត្រឹមតែ កម្ពស់ ទម្ងន់ និងទំហំស្បែកជើងរបស់មនុស្សម្នាក់ៗ ដើម្បីងាយស្រួលប្រៀបធៀបនិងសម្គាល់អត្តសញ្ញាណដោយមិនបាច់មើលមុខផ្ទាល់។
Acoustic attenuation	ការចុះខ្សោយនៃកម្លាំង ថាមពល ឬទំហំនៃរលកសំឡេង នៅពេលវាធ្វើដំណើរឆ្លងកាត់មជ្ឈដ្ឋានណាមួយ (ដូចជាសាច់ឈើ)។ បាតុភូតនេះធ្វើឱ្យសេនស័រចាប់សញ្ញាបានខ្សោយឬខូចទ្រង់ទ្រាយសញ្ញា ប្រសិនបើដាក់សេនស័រនៅឆ្ងាយពីទីតាំងដែលសត្វល្អិតកំពុងស៊ីពេក។	ដូចជាការស្រែកហៅមិត្តភក្តិពីចម្ងាយ សំឡេងរបស់យើងនឹងខ្សោយទៅៗតាមកម្លាំងខ្យល់និងចម្ងាយ រហូតដល់គេស្តាប់លែងឮ។
Short-time Fourier transform (STFT)	ជាបច្ចេកទេសគណិតវិទ្យាដែលកាត់សញ្ញាសំឡេងវែងៗទៅជាកង់តូចៗ (ជារយៈពេលខ្លី) រួចបំប្លែងរលកសំឡេងនៅតាមកង់នីមួយៗនោះឱ្យទៅជាប្រេកង់ ដើម្បីបង្កើតជារូបភាព Spectrogram ដែលបង្ហាញពីបម្រែបម្រួលសំឡេងតាមពេលវេលា។	ដូចជាការយកកញ្ចក់ព្រីស (Prism) មកបំបែកពន្លឺព្រះអាទិត្យពណ៌ស ឱ្យទៅជាពណ៌ឥន្ទធនូ ៧ពណ៌ ដើម្បីងាយស្រួលមើលថាតើពន្លឺនោះមានលាយឡំពណ៌អ្វីខ្លះ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖