Original Title: 无人机先进地面站关键技术综述
Source: doi.org/10.11887/j.cn.202302001
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការសិក្សាស្រាវជ្រាវអំពីបច្ចេកវិទ្យាគន្លឹះនៃស្ថានីយបញ្ជាដ្រូន (UAV) ទំនើបលើដី

ចំណងជើងដើម៖ 无人机先进地面站关键技术综述

អ្នកនិពន្ធ៖ XIANG Xiaojia (National University of Defense Technology), TAN Qin, WANG Chang, ZHOU Han, TANG Dengqing, NIU Yifeng

ឆ្នាំបោះពុម្ព៖ 2023 JOURNAL OF NATIONAL UNIVERSITY OF DEFENSE TECHNOLOGY

វិស័យសិក្សា៖ Unmanned Aerial Vehicles (UAV) Command and Control

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយតម្រូវការក្នុងការកែលម្អប្រសិទ្ធភាពនៃការបញ្ជា និងគ្រប់គ្រងដោយមនុស្ស (Human-in-the-loop) សម្រាប់យន្តហោះគ្មានមនុស្សបើក (UAVs) តាមរយៈការត្រួតពិនិត្យ និងវិភាគបច្ចេកវិទ្យាគន្លឹះនៃស្ថានីយបញ្ជាទំនើបលើដីនាពេលបច្ចុប្បន្ន។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានពិនិត្យប្រព័ន្ធស្ថានីយបញ្ជាដ្រូនទំនើបក្នុងស្រុកនិងបរទេសយ៉ាងទូលំទូលាយ ដោយប្រើប្រាស់ក្របខណ្ឌរង្វិលជុំនៃការបញ្ជា និងត្រួតពិនិត្យ OODA (Observe, Orient, Decide, Act) ដើម្បីចាត់ថ្នាក់បច្ចេកវិទ្យា។

ការបង្កើតបរិស្ថានភារកិច្ច (Task environment construction) ដោយប្រើប្រាស់ទិន្នន័យ GIS និងសេនស័រឡាស៊ែរ (Lidar)
ការបង្ហាញស្ថានភាពសមរភូមិជាក់ស្តែងស៊ីជម្រៅ (Battlefield situation immersive display) តាមរយៈបច្ចេកវិទ្យា VR និង AR
ការជួយសម្រេចចិត្តដោយបញ្ញាសិប្បនិម្មិត (Intelligent assisted decision-making) សម្រាប់ការបែងចែកការងារ និងការរៀបចំផ្លូវហោះហើរ
អន្តរកម្មធម្មជាតិរវាងមនុស្សនិងកុំព្យូទ័រ (Naturalized human-computer interaction) តាមរយៈសំឡេង កាយវិការ និងរលកខួរក្បាល

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ការសាងសង់បរិស្ថានត្រីមាត្រ (3D) រួមបញ្ចូលជាមួយការបង្ហាញបែប VR/AR បង្កើនការយល់ដឹងពីស្ថានភាពសមរភូមិរបស់អ្នកបញ្ជាបានយ៉ាងប្រសើរជាងផែនទី 2D ប្រពៃណី។
ប្រព័ន្ធជួយសម្រេចចិត្តឆ្លាតវៃ (Intelligent decision support) មានប្រសិទ្ធភាពខ្ពស់ក្នុងការដោះស្រាយជម្លោះ បែងចែកភារកិច្ច និងគូសវាសផ្លូវហោះហើរសម្រាប់ប្រតិបត្តិការដ្រូនច្រើនគ្រឿង (Multi-UAV) ក្នុងពេលតែមួយ។
ការអភិវឌ្ឍនាពេលអនាគតទាមទារឱ្យមានរបកគំហើញថ្មីៗក្នុងការបន្ស៊ាំអន្តរកម្មមនុស្ស និងម៉ាស៊ីនពហុទម្រង់ ដើម្បីបំពេញតម្រូវការគ្រប់គ្រងហ្វូងដ្រូន (Swarms) និងការសហការគ្នារវាងប្រព័ន្ធមានមនុស្ស និងគ្មានមនុស្សបើក។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Traditional Hardware (Mouse/Keyboard/Joystick) ឧបករណ៍រឹងប្រពៃណី (កណ្ដុរ ក្ដារចុច ដងបញ្ជា)	មានភាពសុក្រឹតខ្ពស់ ភាពយឺតយ៉ាវទាប (Low latency) និងផ្តល់អារម្មណ៍ឆ្លើយតបច្បាស់លាស់។	មិនមានលក្ខណៈធម្មជាតិ និងមិនសូវផ្តល់បទពិសោធន៍ស៊ីជម្រៅ (Immersive) សម្រាប់ការគ្រប់គ្រងបរិស្ថាន 3D ស្មុគស្មាញ។	នៅតែជាប្រព័ន្ធគោលសម្រាប់ការបញ្ជាកម្រិតមូលដ្ឋាន ប៉ុន្តែមិនស័ក្តិសមសម្រាប់បញ្ជាហ្វូងដ្រូនច្រើនគ្រឿងឡើយ។
Somatosensory / Gesture Control ការបញ្ជាតាមរយៈកាយវិការ និងចលនារាងកាយ	មានលក្ខណៈធម្មជាតិ ងាយស្រួលរៀនប្រើ និងអនុញ្ញាតឱ្យធ្វើអន្តរកម្មដោយផ្ទាល់ជាមួយបរិស្ថាន 3D។	រងឥទ្ធិពលពីចម្ងាយ ពន្លឺ និងទាមទារឧបករណ៍ចាប់សញ្ញាពិសេស (ដូចជាស្រោមដៃ ឬកាមេរ៉ា) ដែលអាចនាំឱ្យមានភាពរអាក់រអួល។	ប្រើប្រាស់ឧបករណ៍ចាប់សញ្ញាដូចជា Kinect និង Leap Motion ទទួលបានជោគជ័យក្នុងការសម្គាល់កាយវិការក្នុងបរិស្ថានសិប្បនិម្មិត។
Voice Control ការបញ្ជាដោយប្រើសំឡេង	មានលក្ខណៈធម្មជាតិបំផុត មិនចាំបាច់ប្រើដៃ និងមានប្រសិទ្ធភាពខ្ពស់ក្នុងការបញ្ជូនពាក្យបញ្ជា។	ងាយរងការរំខានពីសំឡេងបរិស្ថាន (Noise) និងពិបាកក្នុងការប្រើដើម្បីបញ្ជូនព័ត៌មានដែលស្មុគស្មាញខ្លាំង។	ប្រព័ន្ធទំនើបភាគច្រើនប្រើប្រាស់វេទិកា AI ដូចជា iFlytek ដែលធានាបាននូវស្ថិរភាព និងភាពជឿជាក់លើការសម្គាល់សំឡេងកម្រិតខ្ពស់។
Brain-Computer Interface (BCI) ចំណុចប្រទាក់ខួរក្បាល-កុំព្យូទ័រ (ការបញ្ជាដោយរលកខួរក្បាល)	មិនចាំបាច់ប្រើដៃ ឬសកម្មភាពរាងកាយ អាចដោះស្រាយព័ត៌មានអរូបី និងមានភាពរហ័ស។	ភាពត្រឹមត្រូវនៃការសម្គាល់នៅមានកម្រិតទាប ងាយមានសញ្ញារំខាន និងទាមទារការផ្តោតអារម្មណ៍ខ្ពស់ពីអ្នកបញ្ជា។	នៅជាការស្រាវជ្រាវកម្រិតមូលដ្ឋាននៅឡើយ ដោយសារបញ្ហាអត្រានៃភាពត្រឹមត្រូវនៃការសម្គាល់សញ្ញា (Signal recognition accuracy) ទាប។
Multi-modal Interaction អន្តរកម្មពហុទម្រង់ (រួមបញ្ចូលសំឡេង កាយវិការ ។ល។)	រួមបញ្ចូលចំណុចខ្លាំងនៃវិធីសាស្ត្រនីមួយៗ បង្កើនប្រសិទ្ធភាព និងកាត់បន្ថយសម្ពាធការងារក្នុងបរិស្ថានស្មុគស្មាញ។	មានភាពស្មុគស្មាញខ្លាំងក្នុងការធ្វើសមាហរណកម្មទិន្នន័យ (Data fusion) និងចំណាយថ្លៃដើមខ្ពស់។	ត្រូវបានដាក់បញ្ចូលក្នុងគំនិតរចនាកាប៊ីនយន្តហោះទំនើបនាពេលអនាគត ដើម្បីជួយសម្រាលបន្ទុកការងាររបស់អ្នកបញ្ជា។

ការចំណាយលើធនធាន (Resource Cost)៖ ទោះបីជាឯកសារមិនបានបញ្ជាក់ពីតម្លៃជាតួលេខជាក់លាក់ក្ដី ប៉ុន្តែការអនុវត្តស្ថានីយបញ្ជាទំនើបនេះទាមទារការវិនិយោគខ្ពស់លើផ្នែករឹងសម្រាប់ដំណើរការក្រាហ្វិក ឧបករណ៍ចាប់សញ្ញា និងហេដ្ឋារចនាសម្ព័ន្ធទិន្នន័យ។

Hardware: ម៉ាស៊ីនកុំព្យូទ័រដែលមានសមត្ថភាពខ្ពស់ (High-performance computing) សម្រាប់ Rendering ក្រាហ្វិក 3D/VR/AR និងឧបករណ៍ចាប់សញ្ញាដូចជា Lidar, Kinect, Leap Motion, និងកាស VR (Head-mounted displays)។
Software: ប្រព័ន្ធ GIS សម្រាប់គ្រប់គ្រងទិន្នន័យផែនទី (ArcGIS, Google Earth), ម៉ាស៊ីនហ្គេម និងប្រព័ន្ធ Simulation (ដូចជា VBS), ព្រមទាំងក្បួនដោះស្រាយ AI សម្រាប់បែងចែកភារកិច្ច។
Dataset: ទិន្នន័យភូមិសាស្ត្រ GIS ក្នុងតំបន់ប្រតិបត្តិការ, ទិន្នន័យពពកចំណុច (Point Clouds) ពី Lidar, និងរូបភាពពីដ្រូន (Photogrammetry) សម្រាប់សាងសង់បរិស្ថាន 3D ។
Expertise: ត្រូវការអ្នកជំនាញផ្នែកវិស្វកម្មអាកាសចរណ៍ បញ្ញាសិប្បនិម្មិត (AI) ប្រព័ន្ធព័ត៌មានភូមិសាស្ត្រ (GIS) និងការអភិវឌ្ឍអន្តរកម្មមនុស្ស-កុំព្យូទ័រ (HCI)។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះគឺជាឯកសារ Review ដែលផ្អែកលើការអភិវឌ្ឍប្រព័ន្ធយោធានិងឧស្សាហកម្មកម្រិតខ្ពស់នៅសហរដ្ឋអាមេរិក កាណាដា និងប្រទេសចិន។ សម្រាប់កម្ពុជា ការអនុវត្តប្រព័ន្ធកម្រិតនេះទាំងស្រុងអាចនឹងជួបប្រទះបញ្ហាប្រឈម ដោយសារកង្វះខាតហេដ្ឋារចនាសម្ព័ន្ធទិន្នន័យ 3D GIS ក្នុងស្រុកដែលមានភាពសុក្រឹតខ្ពស់ និងបន្ទះឈីប AI កម្រិតខ្ពស់។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

បច្ចេកវិទ្យាស្ថានីយបញ្ជាដ្រូនទំនើបនេះមានសក្តានុពលខ្ពស់ក្នុងការយកមកកែច្នៃប្រើប្រាស់ក្នុងវិស័យគន្លឹះនៅកម្ពុជា ប្រសិនបើត្រូវបានបង្រួមទំហំ (Scale down) ឱ្យស្របតាមតម្រូវការជាក់ស្តែង។

វិស័យកសិកម្ម (ឧ. ខេត្តបាត់ដំបង និងពោធិ៍សាត់): អាចប្រើប្រាស់ក្បួនដោះស្រាយការបែងចែកភារកិច្ច (Task Allocation) សម្រាប់បញ្ជាហ្វូងដ្រូន (Drone Swarms) ឱ្យបាញ់ថ្នាំកសិកម្ម ឬតាមដានផលដំណាំនៅលើផ្ទៃដីធំៗដោយស្វ័យប្រវត្តិ។
ការគ្រប់គ្រងគ្រោះមហន្តរាយ (តំបន់ជុំវិញបឹងទន្លេសាប): ការរួមបញ្ចូលប្រព័ន្ធ GIS និងការបង្កើតផែនទី 3D ពីដ្រូន អាចជួយឱ្យក្រុមសង្គ្រោះវាយតម្លៃស្ថានភាពទឹកជំនន់បានលឿន និងចាត់ចែងផ្លូវហោះហើរដ្រូនដើម្បីទម្លាក់ស្បៀង។
ការត្រួតពិនិត្យ និងការពារព្រៃឈើ (តំបន់ភ្នំក្រវាញ): ការបង្ហាញទិដ្ឋភាពបែប AR/VR រួមជាមួយការធ្វើផែនទី Lidar អាចជួយមន្ត្រីឧទ្យាននុរក្សល្បាតតំបន់ព្រៃក្រាស់ៗ និងស្វែងរកសកម្មភាពកាប់ឈើខុសច្បាប់ប្រកបដោយសុវត្ថិភាព។

ការចាប់ផ្តើមពីការប្រើប្រាស់ប្រព័ន្ធជួយសម្រេចចិត្ត AI សម្រាប់ការគ្រប់គ្រងហ្វូងដ្រូនក្នុងកសិកម្ម គឺជាជំហានដំបូងដ៏មានប្រសិទ្ធភាពបំផុតសម្រាប់កម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សា និងអនុវត្តកម្មវិធីបញ្ជាកម្រិតមូលដ្ឋាន: និស្សិតគប្បីចាប់ផ្តើមដំឡើង និងធ្វើការសាកល្បងជាមួយកម្មវិធីស្ថានីយបញ្ជាកូដចំហ (Open-Source) ដូចជា QGroundControl ឬ Mission Planner ដើម្បីយល់ច្បាស់ពីដំណើរការរង្វិលជុំ OODA និងការរៀបចំផ្លូវហោះហើរ (Path Planning)។
អនុវត្តការសាងសង់បរិស្ថាន 3D (3D Environment Construction): ប្រមូលទិន្នន័យរូបភាពពីដ្រូនពិតប្រាកដ ហើយប្រើប្រាស់កម្មវិធីដូចជា WebODM ឬ Pix4D ដើម្បីបង្កើតផែនទី 3D (Photogrammetry) រួចធ្វើសមាហរណកម្មជាមួយទិន្នន័យប្រព័ន្ធ GIS (ឧទាហរណ៍ ArcGIS ឬ QGIS)។
អភិវឌ្ឍចំណុចប្រទាក់បញ្ជាបែប VR/AR: ប្រើប្រាស់ម៉ាស៊ីនហ្គេមដូចជា Unity 3D ឬ Unreal Engine ផ្សំជាមួយកញ្ចប់កម្មវិធី MAVLink ដើម្បីអភិវឌ្ឍស្ថានីយបញ្ជាគំរូមួយដែលអាចបង្ហាញផែនទីត្រីមាត្រ និងព័ត៌មានពីដ្រូនក្នុងទម្រង់ VR/AR។
សាកល្បងក្បួនដោះស្រាយបញ្ញាសិប្បនិម្មិត (AI Algorithms): សរសេរកូដដោយប្រើប្រាស់ Python ដើម្បីសាកល្បងក្បួនដោះស្រាយការរៀបចំផ្លូវហោះហើរ (ដូចជា A* Algorithm) និងការបែងចែកភារកិច្ចសម្រាប់ដ្រូនច្រើនគ្រឿង (Multi-UAV) ក្នុងបរិស្ថាន Simulation ដូចជា ROS (Robot Operating System)។
ធ្វើសមាហរណកម្មអន្តរកម្មមនុស្ស-កុំព្យូទ័រ (HCI): អភិវឌ្ឍមុខងារបន្ថែមលើស្ថានីយបញ្ជា ដោយភ្ជាប់ជាមួយឧបករណ៍ចាប់សញ្ញាដូចជា កាមេរ៉ា Kinect សម្រាប់សម្គាល់កាយវិការ ឬប្រើប្រាស់ Google Speech-to-Text API ដើម្បីបញ្ជូនបញ្ជាទៅកាន់ដ្រូនតាមរយៈសំឡេង។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
OODA loop	ក្របខណ្ឌនៃរង្វិលជុំបញ្ជាដែលមាន៤ដំណាក់កាលគឺ ការសង្កេត (Observe) ការវាយតម្លៃ (Orient) ការសម្រេចចិត្ត (Decide) និងការអនុវត្ត (Act) ដែលជួយឱ្យប្រព័ន្ធបញ្ជាដ្រូនអាចដំណើរការទិន្នន័យ និងឆ្លើយតបទៅនឹងស្ថានការណ៍បានលឿន។	ដូចជាដំណើរការរបស់កីឡាករម្នាក់ដែលត្រូវសម្លឹងមើលកូនបាល់ (Observe) គិតពីទីតាំងខ្លួនឯង (Orient) សម្រេចចិត្តថានឹងវាយរបៀបណា (Decide) រួចទើបវាយវាចេញទៅ (Act)។
Immersive display	បច្ចេកវិទ្យាបង្ហាញរូបភាព (ដូចជា VR ឬ AR) ដែលបង្កើតបរិស្ថានត្រីមាត្រ (3D) ព័ទ្ធជុំវិញអ្នកប្រើប្រាស់ ធ្វើឱ្យពួកគេមានអារម្មណ៍ថាខ្លួនកំពុងស្ថិតនៅក្នុងទីតាំងសមរភូមិផ្ទាល់ និងងាយស្រួលយល់ពីស្ថានភាពជុំវិញដ្រូន។	ដូចជាការពាក់វ៉ែនតា 3D មើលកុន ដែលធ្វើឱ្យយើងមានអារម្មណ៍ថាបានចូលទៅក្នុងសាច់រឿងដោយផ្ទាល់ ជំនួសឱ្យការមើលត្រឹមអេក្រង់ទូរទស្សន៍ធម្មតា។
Task allocation	ដំណើរការប្រើប្រាស់ក្បួនដោះស្រាយគណិតវិទ្យា ឬបញ្ញាសិប្បនិម្មិត (AI) ដើម្បីបែងចែកភារកិច្ចជាក់លាក់ទៅឱ្យដ្រូននីមួយៗនៅក្នុងហ្វូងដ្រូនច្រើនគ្រឿង ដោយធានាបាននូវប្រសិទ្ធភាពខ្ពស់ និងចំណាយពេលតិច។	ដូចជាមេការសំណង់ដែលចាត់ចែងកូនចៅម្នាក់ៗឱ្យទៅធ្វើការងារផ្សេងៗគ្នាទៅតាមជំនាញរបស់ពួកគេ ដើម្បីឱ្យការសាងសង់ឆាប់រួចរាល់។
Conflict resolution	យន្តការសម្រាប់គណនា និងដោះស្រាយបញ្ហាជាន់គ្នាពេលហោះហើរ ដូចជាការរៀបចំផ្លូវចៀសវាងកុំឱ្យដ្រូនហោះបុកគ្នា ឬការសម្របសម្រួលពេលមានដ្រូនច្រើនដណ្ដើមគោលដៅតែមួយ។	ដូចជាប៉ូលីសចរាចរណ៍ដែលជួយសម្រួលរថយន្តនៅផ្លូវបំបែកខ្វែងកុំឱ្យបើកបុកគ្នា។
Point cloud	បណ្ដុំនៃចំណុចទិន្នន័យរាប់លាននៅក្នុងលំហត្រីមាត្រ (3D) ដែលប្រមូលបានដោយឧបករណ៍សេនស័រ (ដូចជា Lidar) ដើម្បីយកមកចងក្រងជារូបរាងវត្ថុ ឬទីតាំងភូមិសាស្ត្រជាក់ស្តែងនៅក្នុងកុំព្យូទ័រ។	ដូចជាការយកគ្រាប់ខ្សាច់តូចៗរាប់លានគ្រាប់មកតម្រៀបគ្នាបង្កើតជារូបចម្លាក់ 3D នៃអគារ ឬភ្នំមួយអញ្ចឹងដែរ។
Multimodal interaction	ការរួមបញ្ចូលគ្នានូវវិធីសាស្ត្របញ្ជាច្រើនទម្រង់ (ដូចជាការប្រើប្រាស់សំឡេង កាយវិការដៃ ឬចលនាភ្នែក) ក្នុងពេលតែមួយ ដើម្បីបញ្ជូនពាក្យបញ្ជាទៅកាន់កុំព្យូទ័រប្រកបដោយប្រសិទ្ធភាព និងកាត់បន្ថយសម្ពាធការងារ។	ដូចជាពេលយើងនិយាយប្រាប់មិត្តភក្តិឱ្យ "មើលទីនោះ" ព្រមទាំងយកដៃចង្អុលទៅទិសនោះក្នុងពេលតែមួយ ដើម្បីឱ្យគេងាយយល់។
Brain-Computer Interface	បច្ចេកវិទ្យាដែលចាប់យករលកសញ្ញាអគ្គិសនីពីខួរក្បាលមនុស្ស រួចបំប្លែងវាទៅជាពាក្យបញ្ជាកុំព្យូទ័រ ដើម្បីបញ្ជាដ្រូនដោយមិនចាំបាច់ប្រើដៃ ឬសំឡេងទាល់តែសោះ។	ដូចជាការប្រើប្រាស់ "ថាមពលចិត្ត" នៅក្នុងរឿងប្រឌិតវិទ្យាសាស្ត្រ ដើម្បីបញ្ជាវត្ថុឱ្យផ្លាស់ទីដោយគ្រាន់តែគិត។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖