បញ្ហា (The Problem)៖ ការស្រាវជ្រាវនេះដោះស្រាយបញ្ហានៃភាពមិនប្រាកដប្រជានៃភាពរឹងមាំរបស់ប្រព័ន្ធរៀនរបស់ម៉ាស៊ីន (Machine Learning Classifiers) ក្នុងការងារសុវត្ថិភាព ជាពិសេសនៅពេលប្រឈមមុខនឹងការវាយប្រហារដែលមានបំណងគេចវេះពីការរកឃើញ។
វិធីសាស្ត្រ (The Methodology)៖ អ្នកនិពន្ធបានស្នើឡើងនូវវិធីសាស្ត្រទូទៅមួយ ដោយប្រើប្រាស់ការកែប្រែតាមបែបសេនេទិច ដើម្បីស្វែងរកវ៉ារ្យ៉ង់នៃមេរោគដែលអាចគេចផុតពីការចាប់បានដោយស្វ័យប្រវត្តិ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Genetic Programming Evasion (Proposed Method) ការគេចវេះដោយប្រើកម្មវិធីសេនេទិច (វិធីសាស្ត្រស្នើឡើង) |
មានសមត្ថភាពស្វ័យប្រវត្តិកម្មខ្ពស់ អាចរកឃើញចំណុចខ្សោយនៃម៉ូដែលដោយមិនចាំបាច់ដឹងពីទិន្នន័យខាងក្នុង (Black-box access) និងសម្រេចបានជោគជ័យ ១០០%។ | ទាមទារធនធានកុំព្យូទ័រច្រើនសម្រាប់ដំណើរការ Sandbox និងប្រើពេលយូរជាងការវាយប្រហារដោយដៃបន្តិច (ប្រហែល ៦ ថ្ងៃសម្រាប់សំណាក ៥០០)។ | អត្រាគេចវេះ ១០០% (100% Evasion Rate) លើទាំងម៉ូដែល PDFrate និង Hidost។ |
| Manual/Ad-hoc Evasion (Traditional Approach) ការគេចវេះដោយដៃ ឬតាមការស្មាន (វិធីសាស្ត្របុរាណ) |
អាចធ្វើទៅបានលឿនប្រសិនបើអ្នកវាយប្រហារមានចំណេះដឹងស៊ីជម្រៅអំពីរបៀបដែលប្រព័ន្ធដំណើរការ។ | ត្រូវការអ្នកជំនាញកម្រិតខ្ពស់ ហើយជារឿយៗមិនអាចអនុវត្តបានលើចំនួនមេរោគច្រើនដោយស្វ័យប្រវត្តិ ឬមិនអាចទាយដឹងពីលក្ខណៈវិនិច្ឆ័យរបស់ AI។ | មិនមានប្រសិទ្ធភាពគ្រប់គ្រាន់ក្នុងការវាយតម្លៃភាពរឹងមាំរបស់ម៉ូដែល AI ទាំងមូលនោះទេ។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការពិសោធន៍នេះទាមទារធនធានកុំព្យូទ័រមធ្យម ប៉ុន្តែត្រូវការបរិស្ថានពិសោធន៍ដែលស្មុគស្មាញ (Virtualization)។
ការសិក្សានេះប្រើប្រាស់សំណាកមេរោគពី Contagio archive ដែលជាទិន្នន័យសាធារណៈ។ ទោះបីជាវាល្អសម្រាប់ការស្រាវជ្រាវ ប៉ុន្តែសម្រាប់បរិបទកម្ពុជា មេរោគដែលវាយប្រហារជាក់ស្តែងអាចមានលក្ខណៈខុសប្លែកគ្នា (ដូចជាការប្រើប្រាស់ពុម្ពអក្សរខ្មែរ ឬឯកសាររដ្ឋបាល) ដែលមិនមាននៅក្នុងទិន្នន័យនេះ។
វិធីសាស្ត្រនេះមានសារៈសំខាន់ខ្លាំងសម្រាប់វិស័យសន្តិសុខសាយប័រនៅកម្ពុជា ដើម្បីត្រៀមខ្លួនទប់ទល់នឹងការវាយប្រហារដោយប្រើ AI។
លទ្ធផលនៃការសិក្សានេះគឺជាការដាស់តឿនមួយថា ស្ថាប័ននៅកម្ពុជាមិនគួរពឹងផ្អែកទាំងស្រុងលើ AI ក្នុងការចាប់មេរោគនោះទេ ព្រោះវាអាចត្រូវបានគេបន្លំបានយ៉ាងងាយ។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Genetic Programming (GP) | ជាបច្ចេកទេសមួយនៃបញ្ញាសិប្បនិម្មិតដែលយកគំរូតាមដំណើរវិវត្តន៍នៃធម្មជាតិ (Natural Selection)។ នៅក្នុងអត្ថបទនេះ វាត្រូវបានប្រើដើម្បីកែប្រែកូដមេរោគដោយចៃដន្យ (ដូចជាការផ្លាស់ប្តូរហ្សែន) រហូតដល់រកឃើញទម្រង់មួយដែលអាចគេចផុតពីការចាប់បានរបស់ប្រព័ន្ធសុវត្ថិភាព។ | ដូចជាការបង្កាត់ពូជដំណាំជាច្រើនជំនាន់ ដើម្បីទទួលបានផ្លែឈើដែលមានរសជាតិឆ្ងាញ់ និងធន់នឹងសត្វល្អិតបំផុត។ |
| Evasion Attack | គឺជាការប៉ុនប៉ងរបស់អ្នកវាយប្រហារក្នុងការកែប្រែទិន្នន័យ (ដូចជាឯកសារ PDF មេរោគ) ក្នុងគោលបំណងបោកបញ្ឆោតប្រព័ន្ធ AI ឱ្យយល់ច្រឡំថាវាជាឯកសារសុវត្ថិភាព ខណៈដែលវានៅតែមានសមត្ថភាពបង្កគ្រោះថ្នាក់ដដែល។ | ប្រៀបដូចជាចោរដែលពាក់ឯកសណ្ឋានប៉ូលិស ដើម្បីដើរកាត់ប៉ុស្តិ៍ត្រួតពិនិត្យដោយមិនឱ្យគេចាប់បាន។ |
| Oracle | នៅក្នុងបរិបទនៃការស្រាវជ្រាវនេះ Oracle គឺជាប្រព័ន្ធ ឬយន្តការមួយដែលផ្តល់នូវ «ចម្លើយដ៏ត្រឹមត្រូវ» ថាតើឯកសារមួយពិតជាមេរោគ ឬអត់ ដោយមិនពឹងផ្អែកលើការទស្សន៍ទាយរបស់ AI ឡើយ (ជាធម្មតាប្រើ Sandbox ដើម្បីពិនិត្យជាក់ស្តែង)។ | ដូចជាសន្លឹកចម្លើយវិញ្ញាសាប្រឡង ដែលគ្រូប្រើដើម្បីផ្ទៀងផ្ទាត់ថាចម្លើយរបស់សិស្សត្រូវ ឬខុស។ |
| Feature Space | ជាលំហគណិតវិទ្យាដែលតំណាងឱ្យលក្ខណៈសម្បត្តិផ្សេងៗនៃទិន្នន័យ។ ប្រព័ន្ធ AI មើលឯកសារមិនមែនជាអក្សរទេ ប៉ុន្តែជាចំណុចនៅក្នុងលំហនេះ។ ការវាយប្រហារគឺព្យាយាមផ្លាស់ទីចំណុចតំណាងមេរោគ ទៅក្នុងតំបន់ដែល AI ស្គាល់ថាជា «ឯកសារល្អ»។ | ដូចជាការកំណត់អត្តសញ្ញាណមនុស្សដោយប្រើ កម្ពស់ ទម្ងន់ និងពណ៌ភ្នែក (Features) ជំនួសឱ្យការប្រើឈ្មោះ ឬរូបថត។ |
| Sandbox | ជាបរិស្ថានកុំព្យូទ័រដាច់ដោយឡែក និងមានសុវត្ថិភាព ដែលត្រូវបានប្រើដើម្បីដំណើរការកូដដែលគួរឱ្យសង្ស័យ។ វាអនុញ្ញាតឱ្យអ្នកស្រាវជ្រាវមើលឃើញពីឥរិយាបថពិតប្រាកដរបស់មេរោគ ដោយមិនធ្វើឱ្យប៉ះពាល់ដល់ប្រព័ន្ធកុំព្យូទ័រទាំងមូល។ | ដូចជាបន្ទប់ពិសោធន៍ដែលមានកញ្ចក់ការពារ ដែលអ្នកវិទ្យាសាស្ត្រអាចសិក្សាពីមេរោគកាចសាហាវដោយមិនខ្លាចឆ្លង។ |
| Structural Paths | គឺជាវិធីសាស្ត្រនៃការវិភាគឯកសារ PDF ដោយមើលទៅលើរចនាសម្ព័ន្ធដើមឈើ (Tree structure) នៃឯកសារនោះ ថាតើវត្ថុ (Object) នីមួយៗតភ្ជាប់គ្នាដូចម្តេច។ ម៉ូដែល Hidost ប្រើប្រាស់វិធីនេះដើម្បីចាប់មេរោគ។ | ដូចជាការមើលប្លង់ផ្ទះដើម្បីដឹងថាបន្ទប់ណាជាប់បន្ទប់ណា ជាជាងការមើលតែគ្រឿងសង្ហារិមនៅក្នុងផ្ទះនោះ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖