Original Title: 无人机先进地面站关键技术综述
Source: doi.org/10.11887/j.cn.202302001
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការសិក្សាស្រាវជ្រាវអំពីបច្ចេកវិទ្យាគន្លឹះនៃស្ថានីយបញ្ជាដ្រូន (UAV) ទំនើបលើដី

ចំណងជើងដើម៖ 无人机先进地面站关键技术综述

អ្នកនិពន្ធ៖ XIANG Xiaojia (National University of Defense Technology), TAN Qin, WANG Chang, ZHOU Han, TANG Dengqing, NIU Yifeng

ឆ្នាំបោះពុម្ព៖ 2023 JOURNAL OF NATIONAL UNIVERSITY OF DEFENSE TECHNOLOGY

វិស័យសិក្សា៖ Unmanned Aerial Vehicles (UAV) Command and Control

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយតម្រូវការក្នុងការកែលម្អប្រសិទ្ធភាពនៃការបញ្ជា និងគ្រប់គ្រងដោយមនុស្ស (Human-in-the-loop) សម្រាប់យន្តហោះគ្មានមនុស្សបើក (UAVs) តាមរយៈការត្រួតពិនិត្យ និងវិភាគបច្ចេកវិទ្យាគន្លឹះនៃស្ថានីយបញ្ជាទំនើបលើដីនាពេលបច្ចុប្បន្ន។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានពិនិត្យប្រព័ន្ធស្ថានីយបញ្ជាដ្រូនទំនើបក្នុងស្រុកនិងបរទេសយ៉ាងទូលំទូលាយ ដោយប្រើប្រាស់ក្របខណ្ឌរង្វិលជុំនៃការបញ្ជា និងត្រួតពិនិត្យ OODA (Observe, Orient, Decide, Act) ដើម្បីចាត់ថ្នាក់បច្ចេកវិទ្យា។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Traditional Hardware (Mouse/Keyboard/Joystick)
ឧបករណ៍រឹងប្រពៃណី (កណ្ដុរ ក្ដារចុច ដងបញ្ជា)
មានភាពសុក្រឹតខ្ពស់ ភាពយឺតយ៉ាវទាប (Low latency) និងផ្តល់អារម្មណ៍ឆ្លើយតបច្បាស់លាស់។ មិនមានលក្ខណៈធម្មជាតិ និងមិនសូវផ្តល់បទពិសោធន៍ស៊ីជម្រៅ (Immersive) សម្រាប់ការគ្រប់គ្រងបរិស្ថាន 3D ស្មុគស្មាញ។ នៅតែជាប្រព័ន្ធគោលសម្រាប់ការបញ្ជាកម្រិតមូលដ្ឋាន ប៉ុន្តែមិនស័ក្តិសមសម្រាប់បញ្ជាហ្វូងដ្រូនច្រើនគ្រឿងឡើយ។
Somatosensory / Gesture Control
ការបញ្ជាតាមរយៈកាយវិការ និងចលនារាងកាយ
មានលក្ខណៈធម្មជាតិ ងាយស្រួលរៀនប្រើ និងអនុញ្ញាតឱ្យធ្វើអន្តរកម្មដោយផ្ទាល់ជាមួយបរិស្ថាន 3D។ រងឥទ្ធិពលពីចម្ងាយ ពន្លឺ និងទាមទារឧបករណ៍ចាប់សញ្ញាពិសេស (ដូចជាស្រោមដៃ ឬកាមេរ៉ា) ដែលអាចនាំឱ្យមានភាពរអាក់រអួល។ ប្រើប្រាស់ឧបករណ៍ចាប់សញ្ញាដូចជា Kinect និង Leap Motion ទទួលបានជោគជ័យក្នុងការសម្គាល់កាយវិការក្នុងបរិស្ថានសិប្បនិម្មិត។
Voice Control
ការបញ្ជាដោយប្រើសំឡេង
មានលក្ខណៈធម្មជាតិបំផុត មិនចាំបាច់ប្រើដៃ និងមានប្រសិទ្ធភាពខ្ពស់ក្នុងការបញ្ជូនពាក្យបញ្ជា។ ងាយរងការរំខានពីសំឡេងបរិស្ថាន (Noise) និងពិបាកក្នុងការប្រើដើម្បីបញ្ជូនព័ត៌មានដែលស្មុគស្មាញខ្លាំង។ ប្រព័ន្ធទំនើបភាគច្រើនប្រើប្រាស់វេទិកា AI ដូចជា iFlytek ដែលធានាបាននូវស្ថិរភាព និងភាពជឿជាក់លើការសម្គាល់សំឡេងកម្រិតខ្ពស់។
Brain-Computer Interface (BCI)
ចំណុចប្រទាក់ខួរក្បាល-កុំព្យូទ័រ (ការបញ្ជាដោយរលកខួរក្បាល)
មិនចាំបាច់ប្រើដៃ ឬសកម្មភាពរាងកាយ អាចដោះស្រាយព័ត៌មានអរូបី និងមានភាពរហ័ស។ ភាពត្រឹមត្រូវនៃការសម្គាល់នៅមានកម្រិតទាប ងាយមានសញ្ញារំខាន និងទាមទារការផ្តោតអារម្មណ៍ខ្ពស់ពីអ្នកបញ្ជា។ នៅជាការស្រាវជ្រាវកម្រិតមូលដ្ឋាននៅឡើយ ដោយសារបញ្ហាអត្រានៃភាពត្រឹមត្រូវនៃការសម្គាល់សញ្ញា (Signal recognition accuracy) ទាប។
Multi-modal Interaction
អន្តរកម្មពហុទម្រង់ (រួមបញ្ចូលសំឡេង កាយវិការ ។ល។)
រួមបញ្ចូលចំណុចខ្លាំងនៃវិធីសាស្ត្រនីមួយៗ បង្កើនប្រសិទ្ធភាព និងកាត់បន្ថយសម្ពាធការងារក្នុងបរិស្ថានស្មុគស្មាញ។ មានភាពស្មុគស្មាញខ្លាំងក្នុងការធ្វើសមាហរណកម្មទិន្នន័យ (Data fusion) និងចំណាយថ្លៃដើមខ្ពស់។ ត្រូវបានដាក់បញ្ចូលក្នុងគំនិតរចនាកាប៊ីនយន្តហោះទំនើបនាពេលអនាគត ដើម្បីជួយសម្រាលបន្ទុកការងាររបស់អ្នកបញ្ជា។

ការចំណាយលើធនធាន (Resource Cost)៖ ទោះបីជាឯកសារមិនបានបញ្ជាក់ពីតម្លៃជាតួលេខជាក់លាក់ក្ដី ប៉ុន្តែការអនុវត្តស្ថានីយបញ្ជាទំនើបនេះទាមទារការវិនិយោគខ្ពស់លើផ្នែករឹងសម្រាប់ដំណើរការក្រាហ្វិក ឧបករណ៍ចាប់សញ្ញា និងហេដ្ឋារចនាសម្ព័ន្ធទិន្នន័យ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះគឺជាឯកសារ Review ដែលផ្អែកលើការអភិវឌ្ឍប្រព័ន្ធយោធានិងឧស្សាហកម្មកម្រិតខ្ពស់នៅសហរដ្ឋអាមេរិក កាណាដា និងប្រទេសចិន។ សម្រាប់កម្ពុជា ការអនុវត្តប្រព័ន្ធកម្រិតនេះទាំងស្រុងអាចនឹងជួបប្រទះបញ្ហាប្រឈម ដោយសារកង្វះខាតហេដ្ឋារចនាសម្ព័ន្ធទិន្នន័យ 3D GIS ក្នុងស្រុកដែលមានភាពសុក្រឹតខ្ពស់ និងបន្ទះឈីប AI កម្រិតខ្ពស់។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកវិទ្យាស្ថានីយបញ្ជាដ្រូនទំនើបនេះមានសក្តានុពលខ្ពស់ក្នុងការយកមកកែច្នៃប្រើប្រាស់ក្នុងវិស័យគន្លឹះនៅកម្ពុជា ប្រសិនបើត្រូវបានបង្រួមទំហំ (Scale down) ឱ្យស្របតាមតម្រូវការជាក់ស្តែង។

ការចាប់ផ្តើមពីការប្រើប្រាស់ប្រព័ន្ធជួយសម្រេចចិត្ត AI សម្រាប់ការគ្រប់គ្រងហ្វូងដ្រូនក្នុងកសិកម្ម គឺជាជំហានដំបូងដ៏មានប្រសិទ្ធភាពបំផុតសម្រាប់កម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សា និងអនុវត្តកម្មវិធីបញ្ជាកម្រិតមូលដ្ឋាន: និស្សិតគប្បីចាប់ផ្តើមដំឡើង និងធ្វើការសាកល្បងជាមួយកម្មវិធីស្ថានីយបញ្ជាកូដចំហ (Open-Source) ដូចជា QGroundControl ឬ Mission Planner ដើម្បីយល់ច្បាស់ពីដំណើរការរង្វិលជុំ OODA និងការរៀបចំផ្លូវហោះហើរ (Path Planning)។
  2. អនុវត្តការសាងសង់បរិស្ថាន 3D (3D Environment Construction): ប្រមូលទិន្នន័យរូបភាពពីដ្រូនពិតប្រាកដ ហើយប្រើប្រាស់កម្មវិធីដូចជា WebODM ឬ Pix4D ដើម្បីបង្កើតផែនទី 3D (Photogrammetry) រួចធ្វើសមាហរណកម្មជាមួយទិន្នន័យប្រព័ន្ធ GIS (ឧទាហរណ៍ ArcGIS ឬ QGIS)។
  3. អភិវឌ្ឍចំណុចប្រទាក់បញ្ជាបែប VR/AR: ប្រើប្រាស់ម៉ាស៊ីនហ្គេមដូចជា Unity 3D ឬ Unreal Engine ផ្សំជាមួយកញ្ចប់កម្មវិធី MAVLink ដើម្បីអភិវឌ្ឍស្ថានីយបញ្ជាគំរូមួយដែលអាចបង្ហាញផែនទីត្រីមាត្រ និងព័ត៌មានពីដ្រូនក្នុងទម្រង់ VR/AR។
  4. សាកល្បងក្បួនដោះស្រាយបញ្ញាសិប្បនិម្មិត (AI Algorithms): សរសេរកូដដោយប្រើប្រាស់ Python ដើម្បីសាកល្បងក្បួនដោះស្រាយការរៀបចំផ្លូវហោះហើរ (ដូចជា A* Algorithm) និងការបែងចែកភារកិច្ចសម្រាប់ដ្រូនច្រើនគ្រឿង (Multi-UAV) ក្នុងបរិស្ថាន Simulation ដូចជា ROS (Robot Operating System)។
  5. ធ្វើសមាហរណកម្មអន្តរកម្មមនុស្ស-កុំព្យូទ័រ (HCI): អភិវឌ្ឍមុខងារបន្ថែមលើស្ថានីយបញ្ជា ដោយភ្ជាប់ជាមួយឧបករណ៍ចាប់សញ្ញាដូចជា កាមេរ៉ា Kinect សម្រាប់សម្គាល់កាយវិការ ឬប្រើប្រាស់ Google Speech-to-Text API ដើម្បីបញ្ជូនបញ្ជាទៅកាន់ដ្រូនតាមរយៈសំឡេង។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
OODA loop ក្របខណ្ឌនៃរង្វិលជុំបញ្ជាដែលមាន៤ដំណាក់កាលគឺ ការសង្កេត (Observe) ការវាយតម្លៃ (Orient) ការសម្រេចចិត្ត (Decide) និងការអនុវត្ត (Act) ដែលជួយឱ្យប្រព័ន្ធបញ្ជាដ្រូនអាចដំណើរការទិន្នន័យ និងឆ្លើយតបទៅនឹងស្ថានការណ៍បានលឿន។ ដូចជាដំណើរការរបស់កីឡាករម្នាក់ដែលត្រូវសម្លឹងមើលកូនបាល់ (Observe) គិតពីទីតាំងខ្លួនឯង (Orient) សម្រេចចិត្តថានឹងវាយរបៀបណា (Decide) រួចទើបវាយវាចេញទៅ (Act)។
Immersive display បច្ចេកវិទ្យាបង្ហាញរូបភាព (ដូចជា VR ឬ AR) ដែលបង្កើតបរិស្ថានត្រីមាត្រ (3D) ព័ទ្ធជុំវិញអ្នកប្រើប្រាស់ ធ្វើឱ្យពួកគេមានអារម្មណ៍ថាខ្លួនកំពុងស្ថិតនៅក្នុងទីតាំងសមរភូមិផ្ទាល់ និងងាយស្រួលយល់ពីស្ថានភាពជុំវិញដ្រូន។ ដូចជាការពាក់វ៉ែនតា 3D មើលកុន ដែលធ្វើឱ្យយើងមានអារម្មណ៍ថាបានចូលទៅក្នុងសាច់រឿងដោយផ្ទាល់ ជំនួសឱ្យការមើលត្រឹមអេក្រង់ទូរទស្សន៍ធម្មតា។
Task allocation ដំណើរការប្រើប្រាស់ក្បួនដោះស្រាយគណិតវិទ្យា ឬបញ្ញាសិប្បនិម្មិត (AI) ដើម្បីបែងចែកភារកិច្ចជាក់លាក់ទៅឱ្យដ្រូននីមួយៗនៅក្នុងហ្វូងដ្រូនច្រើនគ្រឿង ដោយធានាបាននូវប្រសិទ្ធភាពខ្ពស់ និងចំណាយពេលតិច។ ដូចជាមេការសំណង់ដែលចាត់ចែងកូនចៅម្នាក់ៗឱ្យទៅធ្វើការងារផ្សេងៗគ្នាទៅតាមជំនាញរបស់ពួកគេ ដើម្បីឱ្យការសាងសង់ឆាប់រួចរាល់។
Conflict resolution យន្តការសម្រាប់គណនា និងដោះស្រាយបញ្ហាជាន់គ្នាពេលហោះហើរ ដូចជាការរៀបចំផ្លូវចៀសវាងកុំឱ្យដ្រូនហោះបុកគ្នា ឬការសម្របសម្រួលពេលមានដ្រូនច្រើនដណ្ដើមគោលដៅតែមួយ។ ដូចជាប៉ូលីសចរាចរណ៍ដែលជួយសម្រួលរថយន្តនៅផ្លូវបំបែកខ្វែងកុំឱ្យបើកបុកគ្នា។
Point cloud បណ្ដុំនៃចំណុចទិន្នន័យរាប់លាននៅក្នុងលំហត្រីមាត្រ (3D) ដែលប្រមូលបានដោយឧបករណ៍សេនស័រ (ដូចជា Lidar) ដើម្បីយកមកចងក្រងជារូបរាងវត្ថុ ឬទីតាំងភូមិសាស្ត្រជាក់ស្តែងនៅក្នុងកុំព្យូទ័រ។ ដូចជាការយកគ្រាប់ខ្សាច់តូចៗរាប់លានគ្រាប់មកតម្រៀបគ្នាបង្កើតជារូបចម្លាក់ 3D នៃអគារ ឬភ្នំមួយអញ្ចឹងដែរ។
Multimodal interaction ការរួមបញ្ចូលគ្នានូវវិធីសាស្ត្របញ្ជាច្រើនទម្រង់ (ដូចជាការប្រើប្រាស់សំឡេង កាយវិការដៃ ឬចលនាភ្នែក) ក្នុងពេលតែមួយ ដើម្បីបញ្ជូនពាក្យបញ្ជាទៅកាន់កុំព្យូទ័រប្រកបដោយប្រសិទ្ធភាព និងកាត់បន្ថយសម្ពាធការងារ។ ដូចជាពេលយើងនិយាយប្រាប់មិត្តភក្តិឱ្យ "មើលទីនោះ" ព្រមទាំងយកដៃចង្អុលទៅទិសនោះក្នុងពេលតែមួយ ដើម្បីឱ្យគេងាយយល់។
Brain-Computer Interface បច្ចេកវិទ្យាដែលចាប់យករលកសញ្ញាអគ្គិសនីពីខួរក្បាលមនុស្ស រួចបំប្លែងវាទៅជាពាក្យបញ្ជាកុំព្យូទ័រ ដើម្បីបញ្ជាដ្រូនដោយមិនចាំបាច់ប្រើដៃ ឬសំឡេងទាល់តែសោះ។ ដូចជាការប្រើប្រាស់ "ថាមពលចិត្ត" នៅក្នុងរឿងប្រឌិតវិទ្យាសាស្ត្រ ដើម្បីបញ្ជាវត្ថុឱ្យផ្លាស់ទីដោយគ្រាន់តែគិត។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖