Original Title: Acoustic Detection of Forest Wood-Boring Insects Under Co-Infestations
Source: doi.org/10.3390/insects16121241
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការរកឃើញតាមរយៈសំឡេងនៃសត្វល្អិតចោះឈើក្នុងព្រៃក្រោមការរាតត្បាតរួមគ្នា

ចំណងជើងដើម៖ Acoustic Detection of Forest Wood-Boring Insects Under Co-Infestations

អ្នកនិពន្ធ៖ Qi Jiang, Yujie Liu, Yu Sun, Lili Ren, Youqing Luo

ឆ្នាំបោះពុម្ព៖ 2025 Insects

វិស័យសិក្សា៖ Entomology and Bioacoustics

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហានៃការរកឃើញទាន់ពេលវេលានូវសត្វល្អិតចោះឈើ (Wood-boring pests) ដែលរស់នៅលាក់ខ្លួនក្នុងដើមឈើ ជាពិសេសក្នុងស្ថានភាពស្មុគស្មាញដែលមានសត្វល្អិតច្រើនប្រភេទរាតត្បាត និងបញ្ចេញសំឡេងក្នុងពេលតែមួយ (Co-infestations)។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានប្រមូលសញ្ញារំញ័រសំឡេងនៃការស៊ីរបស់សត្វល្អិតចំនួន ៤ ប្រភេទ ហើយបានបង្កើតសំណុំទិន្នន័យសម្រាប់ស្ថានភាពរាតត្បាតចំនួន ៣ ផ្សេងៗគ្នា ដើម្បីធ្វើតេស្តប្រៀបធៀបសមត្ថភាពរបស់ម៉ូដែលកុំព្យូទ័រ។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Machine Learning Models (RF, SVM, ANN) using Acoustic Features
ម៉ូដែលរៀនដោយម៉ាស៊ីន (RF, SVM, ANN) ដោយប្រើអថេរលក្ខណៈសំឡេង
ដំណើរការបានល្អឥតខ្ចោះនិងមានភាពត្រឹមត្រូវខ្ពស់បំផុត សម្រាប់ការរកឃើញសត្វល្អិតតែមួយប្រភេទ។ ត្រូវការទិន្នន័យហ្វឹកហាត់និងកម្លាំងម៉ាស៊ីនតិចតួច។ ភាពត្រឹមត្រូវធ្លាក់ចុះយ៉ាងខ្លាំងនៅពេលជួបប្រទះស្ថានភាពដែលមានសំឡេងសត្វល្អិតច្រើនប្រភេទរាតត្បាតលាយឡំគ្នា។ ភាពត្រឹមត្រូវទូទៅ (OA) ទទួលបាន ១០០% សម្រាប់សត្វល្អិត១ប្រភេទ ប៉ុន្តែធ្លាក់ចុះក្រោម ៧៥% សម្រាប់សញ្ញាសំឡេងចម្រុះ។
Deep Learning Models (AlexNet, VGG) using Spectrograms
ម៉ូដែលរៀនស៊ីជម្រៅ (AlexNet, VGG) ដោយប្រើរូបភាពវិសាលគមសំឡេង
អាចទាញយកលក្ខណៈពិសេសនៃសំឡេងដោយស្វ័យប្រវត្តិ និងមានសមត្ថភាពកាត់បន្ថយការរំខានពីសញ្ញាចម្រុះបានល្អជាងម៉ូដែល ML ប្រពៃណី។ ត្រូវការសំណុំទិន្នន័យធំសម្រាប់ការហ្វឹកហាត់ និងទាមទារកម្លាំងម៉ាស៊ីនកុំព្យូទ័រខ្ពស់ជាងមុន។ ភាពត្រឹមត្រូវទូទៅ (OA) មានចន្លោះពី ៧៧.៥% ទៅ ៨៦.៩% ក្នុងស្ថានភាពមានសញ្ញាសំឡេងចម្រុះ។
Deep Learning Model (ResNet) using Spectrograms
ម៉ូដែលរៀនស៊ីជម្រៅ (ResNet) ដោយប្រើរូបភាពវិសាលគមសំឡេង
មានប្រសិទ្ធភាពខ្ពស់បំផុតក្នុងការបែងចែកសំឡេងសត្វល្អិតចម្រុះ និងរក្សាភាពត្រឹមត្រូវខ្ពស់ទោះបីជាសញ្ញាសំឡេងត្រួតស៊ីគ្នាក៏ដោយ។ ទាមទារកុំព្យូទ័រដែលមានក្រាហ្វិកកាត (GPU) ខ្លាំង ដើម្បីដំណើរការហ្វឹកហាត់ដោយរលូន និងប្រើប្រាស់ថាមពលច្រើន។ ទទួលបានភាពត្រឹមត្រូវទូទៅ (OA) ខ្ពស់បំផុតចន្លោះពី ៨៥.០% ទៅ ៨៨.៧៥% ក្នុងស្ថានភាពសញ្ញាសំឡេងចម្រុះស្មុគស្មាញ។

ការចំណាយលើធនធាន (Resource Cost)៖ ការស្រាវជ្រាវនេះទាមទារឧបករណ៍ចាប់សញ្ញាសំឡេងរំញ័រពិសេសប្រកបដោយភាពចាប់អារម្មណ៍ខ្ពស់ និងកម្លាំងម៉ាស៊ីនកុំព្យូទ័រដែលមានក្រាហ្វិកកាត (GPU) សម្រាប់ដំណើរការហ្វឹកហាត់ម៉ូដែល Deep Learning។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះប្រមូលទិន្នន័យសំឡេងសត្វល្អិត និងប្រភេទឈើ (P. orientalis និង F. chinensis) មកពីកសិដ្ឋានព្រៃឈើក្នុងទីក្រុងប៉េកាំង ប្រទេសចិន ដែលមានអាកាសធាតុត្រជាក់។ សម្រាប់ប្រទេសកម្ពុជាដែលមានអាកាសធាតុត្រូពិច ប្រភេទសត្វល្អិតចោះឈើ និងប្រភេទដើមឈើគឺមានភាពខុសគ្នាស្រឡះ ដូច្នេះទិន្នន័យដើមនេះមិនអាចយកមកប្រើផ្ទាល់បានទេ ហើយទាមទារឲ្យមានការប្រមូលទិន្នន័យសំឡេងសត្វល្អិតក្នុងស្រុកជាមុនសិន។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាសំណុំទិន្នន័យមិនអាចប្រើប្រាស់ផ្ទាល់ក៏ដោយ វិធីសាស្ត្រនៃការតាមដានសត្វល្អិតតាមរយៈសំឡេងនេះមានសក្តានុពល និងសារៈសំខាន់ខ្លាំងណាស់សម្រាប់កម្ពុជា។

បច្ចេកវិទ្យានេះផ្តល់នូវដំណោះស្រាយទំនើបនិងប្រកបដោយនិរន្តរភាពសម្រាប់ការត្រួតពិនិត្យសុខភាពដើមឈើ ដែលអាចកាត់បន្ថយការខាតបង់សេដ្ឋកិច្ច និងបរិស្ថាននៅកម្ពុជាយ៉ាងមានប្រសិទ្ធភាពប្រសិនបើមានការកែច្នៃស្របតាមបរិបទក្នុងស្រុក។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃការវិភាគសញ្ញាសំឡេង (Audio Signal Processing): ស្វែងយល់ពីរបៀបបំប្លែងសញ្ញាសំឡេង (Audio waveforms) ទៅជារូបភាពវិសាលគមសំឡេង (Spectrograms) ដោយប្រើប្រាស់បណ្ណាល័យ LibrosaSciPy នៅក្នុងភាសា Python
  2. អនុវត្តការកសាងម៉ូដែល Deep Learning សម្រាប់ការចាត់ថ្នាក់រូបភាព: ចាប់ផ្តើមសិក្សានិងហ្វឹកហាត់ម៉ូដែលបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតជ្រៅ (CNN) ជាពិសេសម៉ូដែល ResNet តាមរយៈ PyTorchTensorFlow ដើម្បីចំណាត់ថ្នាក់រូបភាព Spectrograms។
  3. រៀបចំប្រព័ន្ធប្រមូលទិន្នន័យសំឡេងតម្លៃថោក (Low-cost IoT Data Collection): សាកល្បងប្រើប្រាស់ Raspberry PiESP32 ភ្ជាប់ជាមួយសេនស័រចាប់រំញ័រសំឡេង (Piezoelectric sensors) ដើម្បីថតសំឡេងសត្វល្អិតសាកល្បងនៅតាមដើមឈើក្នុងបរិវេណសាកលវិទ្យាល័យ។
  4. កសាងសំណុំទិន្នន័យសត្វល្អិតក្នុងស្រុក (Local Pest Acoustic Dataset): ចុះប្រមូលទិន្នន័យនិងបិទស្លាកចំណាត់ថ្នាក់ (Labeling) សំឡេងសត្វល្អិតចោះឈើលើដំណាំជាក់ស្តែងនៅកម្ពុជា (ឧ. ចម្ការស្វាយចន្ទី) ដោយប្រើប្រាស់កម្មវិធីឥតគិតថ្លៃដូចជា AudacityRaven Lite
  5. អភិវឌ្ឍប្រព័ន្ធតាមដានពេលវេលាជាក់ស្តែងឆ្លាតវៃ (Smart Real-time Monitoring): បញ្ចូលម៉ូដែលដែលបានហ្វឹកហាត់រួចទៅក្នុងឧបករណ៍ Edge Computing (ឧទាហរណ៍ NVIDIA Jetson Nano) ដើម្បីវិភាគលទ្ធផលផ្ទាល់នៅនឹងកន្លែង និងបញ្ជូនទិន្នន័យជូនដំណឹងដល់អ្នកប្រើប្រាស់។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Spectrogram គឺជារូបភាពតំណាងឱ្យវិសាលគមនៃប្រេកង់សំឡេងដែលប្រែប្រួលទៅតាមពេលវេលា។ ក្នុងតួនៃអត្ថបទនេះ វាបំប្លែងសញ្ញាសំឡេងសត្វល្អិតទៅជារូបភាព (២វិមាត្រ) ដែលអនុញ្ញាតឱ្យកុំព្យូទ័រអាចមើលឃើញ ទាញយកលក្ខណៈពិសេស និងវិភាគបានយ៉ាងងាយស្រួលដោយប្រើម៉ូដែលរៀនស៊ីជម្រៅ (Deep Learning)។ ដូចជាការថតកាំរស្មីអ៊ិច (X-ray) នៃសំឡេង ដោយកន្លែងណាមានពណ៌ក្រហមឆ្អៅមានន័យថាសំឡេងនៅត្រង់នោះមានកម្លាំងខ្លាំងបំផុត។
Co-infestation ជាស្ថានភាពឬបាតុភូតជីវសាស្ត្រដែលសត្វល្អិតចង្រៃចាប់ពីពីរប្រភេទឡើងទៅ កំពុងវាយប្រហារ ចូលរស់នៅ និងស៊ីកកេររំលាយដើមឈើតែមួយក្នុងពេលដំណាលគ្នា ដែលធ្វើឱ្យរលកសញ្ញាសំឡេងរបស់ពួកវាលាយឡំគ្នា (Mixed signals) និងបង្កការលំបាកយ៉ាងខ្លាំងក្នុងការបែងចែកអត្តសញ្ញាណ។ ដូចជាមានចោរពីរក្រុមផ្សេងគ្នាកំពុងលួចគាស់ផ្ទះតែមួយក្នុងពេលតែមួយ ដែលធ្វើឱ្យប៉ូលីសពិបាកស្តាប់ដឹងថាសំឡេងណាជារបស់ក្រុមមួយណា។
Feeding vibration signals ជារលកសញ្ញាឬរំញ័រមេកានិចដែលកើតឡើងនៅពេលដង្កូវសត្វល្អិតកំពុងខាំកកេរ ឬបំបែកសរសៃសាច់ឈើនៅខាងក្នុងដើម។ រំញ័រនេះត្រូវបានចាប់យកដោយឧបករណ៍សេនស័រ (Acoustic Sensor) ដើម្បីបញ្ជាក់ពីវត្តមានរបស់សត្វល្អិតដោយពុំចាំបាច់កាប់សាច់ឈើដើម្បីមើលនោះទេ។ ដូចជាសំឡេងញ័រនៃការទំពារស្រួយៗ ដែលយើងអាចស្តាប់ឮនៅពេលមិត្តភក្តិអង្គុយជិតកំពុងទំពារនំកញ្ចប់ក្នុងមាត់បិទជិត។
ResNet វាជាស្ថាបត្យកម្មនៃបណ្ដាញសរសៃប្រសាទសិប្បនិម្មិតកម្រិតជ្រៅ (CNN Architecture) មួយប្រភេទដែលមានស្រទាប់រៀនសូត្រជាច្រើន ហើយប្រើប្រាស់បច្ចេកទេសតភ្ជាប់ផ្លូវកាត់ (Skip connections) ដើម្បីចៀសវាងការបាត់បង់ព័ត៌មានពេលកំពុងហ្វឹកហាត់ ដែលជួយឱ្យវាមានភាពសុក្រឹតខ្ពស់ក្នុងការបែងចែករូបភាព Spectrogram ស្មុគស្មាញ។ ដូចជាសិស្សពូកែដែលចេះបង្កើតផ្លូវកាត់ (Shortcut) ដើម្បីបញ្ជូនចម្លើយដោយផ្ទាល់ទៅគ្រូដោយមិនបាច់ហុចកាត់សិស្សផ្សេងទៀត ដែលការពារកុំឱ្យចម្លើយនោះប្រែប្រួលឬខុសពីដើម។
Feature variables ជាតម្លៃលេខជាក់លាក់ (ដូចជា កម្រិតសំឡេងខ្លាំងបំផុត, ថាមពលសំឡេងសរុប, និងប្រេកង់កម្រិតកំពូល) ដែលអ្នកស្រាវជ្រាវទាញយកពីសញ្ញាសំឡេងឆៅ ដើម្បីយកទៅធ្វើជាធាតុចូល (Inputs) សម្រាប់បង្រៀនម៉ូដែល Machine Learning ឱ្យចេះចំណាត់ថ្នាក់ប្រភេទសត្វល្អិត។ ដូចជាការកត់ត្រាត្រឹមតែ កម្ពស់ ទម្ងន់ និងទំហំស្បែកជើងរបស់មនុស្សម្នាក់ៗ ដើម្បីងាយស្រួលប្រៀបធៀបនិងសម្គាល់អត្តសញ្ញាណដោយមិនបាច់មើលមុខផ្ទាល់។
Acoustic attenuation ការចុះខ្សោយនៃកម្លាំង ថាមពល ឬទំហំនៃរលកសំឡេង នៅពេលវាធ្វើដំណើរឆ្លងកាត់មជ្ឈដ្ឋានណាមួយ (ដូចជាសាច់ឈើ)។ បាតុភូតនេះធ្វើឱ្យសេនស័រចាប់សញ្ញាបានខ្សោយឬខូចទ្រង់ទ្រាយសញ្ញា ប្រសិនបើដាក់សេនស័រនៅឆ្ងាយពីទីតាំងដែលសត្វល្អិតកំពុងស៊ីពេក។ ដូចជាការស្រែកហៅមិត្តភក្តិពីចម្ងាយ សំឡេងរបស់យើងនឹងខ្សោយទៅៗតាមកម្លាំងខ្យល់និងចម្ងាយ រហូតដល់គេស្តាប់លែងឮ។
Short-time Fourier transform (STFT) ជាបច្ចេកទេសគណិតវិទ្យាដែលកាត់សញ្ញាសំឡេងវែងៗទៅជាកង់តូចៗ (ជារយៈពេលខ្លី) រួចបំប្លែងរលកសំឡេងនៅតាមកង់នីមួយៗនោះឱ្យទៅជាប្រេកង់ ដើម្បីបង្កើតជារូបភាព Spectrogram ដែលបង្ហាញពីបម្រែបម្រួលសំឡេងតាមពេលវេលា។ ដូចជាការយកកញ្ចក់ព្រីស (Prism) មកបំបែកពន្លឺព្រះអាទិត្យពណ៌ស ឱ្យទៅជាពណ៌ឥន្ទធនូ ៧ពណ៌ ដើម្បីងាយស្រួលមើលថាតើពន្លឺនោះមានលាយឡំពណ៌អ្វីខ្លះ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖