Original Title: Activity Report 2001
Source: www.idiap.ch
Document Type: Report
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original report for full accuracy.

របាយការណ៍សកម្មភាពឆ្នាំ ២០០១

ចំណងជើងដើម៖ Activity Report 2001

អ្នកនិពន្ធ៖ Dalle Molle Institute for Perceptual Artificial Intelligence (IDIAP)

ឆ្នាំបោះពុម្ព៖ 2002 IDIAP

វិស័យសិក្សា៖ Artificial Intelligence

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា/ប្រធានបទ (The Problem/Topic)៖ របាយការណ៍នេះបង្ហាញពីវឌ្ឍនភាព សមិទ្ធផល និងទិសដៅស្រាវជ្រាវរបស់វិទ្យាស្ថាន IDIAP ក្នុងឆ្នាំ ២០០១ ដែលផ្តោតលើបញ្ញាសិប្បនិម្មិត (AI) និងអន្តរកម្មពហុមធ្យោបាយ (Multimodal Interaction) រវាងមនុស្សនិងកុំព្យូទ័រ។

វិធីសាស្ត្រ (Approach)៖ វិទ្យាស្ថានបានរៀបចំរចនាសម្ព័ន្ធការស្រាវជ្រាវជាបីក្រុមធំៗ ដើម្បីដោះស្រាយបញ្ហាអន្តរកម្មដោយប្រើសំឡេង រូបភាព និងទិន្នន័យ៖

សេចក្តីសន្និដ្ឋានសំខាន់ៗ (Key Conclusions)៖

២. ការរកឃើញសំខាន់ៗ (Key Findings)

របាយការណ៍សកម្មភាពឆ្នាំ ២០០១ បង្ហាញពីភាពជោគជ័យដ៏ធំធេងរបស់វិទ្យាស្ថាន IDIAP លើការស្រាវជ្រាវបញ្ញាសិប្បនិម្មិត (AI) ជាពិសេសការទទួលបានតួនាទីជាស្ថាប័នដឹកនាំគម្រោងស្រាវជ្រាវថ្នាក់ជាតិស្វីសស្តីពីអន្តរកម្មពហុមធ្យោបាយ (Multimodal Interaction)។ វិទ្យាស្ថានបានពង្រីកគម្រោងស្រាវជ្រាវ ការបោះពុម្ពផ្សាយ និងការផ្ទេរបច្ចេកវិទ្យាទៅកាន់វិស័យឧស្សាហកម្មយ៉ាងជោគជ័យ។

ការរកឃើញ (Finding) ព័ត៌មានលម្អិត (Detail) ភស្តុតាង (Evidence)
តួនាទីជាស្ថាប័នដឹកនាំមជ្ឈមណ្ឌលស្រាវជ្រាវថ្នាក់ជាតិ (Leading House of NCCR) វិទ្យាស្ថាន IDIAP ត្រូវបានជ្រើសរើសជាស្ថាប័នដឹកនាំគម្រោងស្រាវជ្រាវរយៈពេលវែង (IM)2 ដែលផ្តោតលើការគ្រប់គ្រងព័ត៌មានអន្តរកម្មពហុមធ្យោបាយ ដោយមានការចូលរួមពីសាកលវិទ្យាល័យធំៗជាច្រើននៅស្វីស និងអន្តរជាតិ។ ទទួលបានមូលនិធិ ១៥.៤ លានហ្វ្រង់ស្វីស (CHF) ពីមូលនិធិជាតិស្វីស (SNSF) និង ១៦.២ លានហ្វ្រង់ស្វីសពីភាគីពាក់ព័ន្ធសម្រាប់រយៈពេល ៤ ឆ្នាំទៅមុខ។
កំណើននៃគម្រោងស្រាវជ្រាវជាតិនិងអន្តរជាតិ (Growth in Research Projects) សកម្មភាពស្រាវជ្រាវនិងអភិវឌ្ឍន៍ (R&D) របស់វិទ្យាស្ថានមានការកើនឡើងគួរឱ្យកត់សម្គាល់ ដែលគ្របដណ្តប់លើផ្នែក Speech Processing, Computer Vision និង Machine Learning។ គិតត្រឹមឆ្នាំ ២០០១ វិទ្យាស្ថានមានគម្រោង SNSF ចំនួន ១៤ និងគម្រោងអឺរ៉ុប (EC/OFES) ចំនួន ១៣ កំពុងដំណើរការ។
កំណើននៃការបោះពុម្ពផ្សាយវិទ្យាសាស្ត្រអន្តរជាតិ (Growth in Scientific Publications) គុណភាពនិងបរិមាណនៃការស្រាវជ្រាវរបស់ IDIAP ត្រូវបានទទួលស្គាល់ជាអន្តរជាតិ ជាមួយនឹងការកើនឡើងនៃចំនួនការបោះពុម្ពផ្សាយស្នាដៃស្រាវជ្រាវថ្មីៗ។ ក្នុងឆ្នាំ ២០០១ វិទ្យាស្ថានបានបោះពុម្ពសៀវភៅ/ជំពូកសៀវភៅចំនួន ៥ អត្ថបទក្នុងទិនានុប្បវត្តិចំនួន ១៤ ឯកសារសន្និសីទអន្តរជាតិចំនួន ៥១ និងរបាយការណ៍ស្រាវជ្រាវខាងក្នុងចំនួន ៤៦។
ការផ្ទេរបច្ចេកវិទ្យាទៅកាន់ឧស្សាហកម្ម (Technology Transfer to Industry) IDIAP បានសហការយ៉ាងជិតស្និទ្ធជាមួយវិស័យឯកជន និងបានប្រើប្រាស់លទ្ធផលនៃការស្រាវជ្រាវដើម្បីបង្កើតជាផលិតផលពាណិជ្ជកម្ម និងក្រុមហ៊ុនបំបែកចេញ (Spin-off)។ គម្រោង InfoVOX ត្រូវបានអនុវត្តដោយសហការជាមួយក្រុមហ៊ុន Swisscom, Omedia S.A. និងក្រុមហ៊ុន Spin-off របស់ខ្លួនគឺ VOXAccess S.A. ក្នុងការអភិវឌ្ឍប្រព័ន្ធ Interactive Voice Response (IVR)។

៣. អនុសាសន៍ (Recommendations)

ទោះបីជារបាយការណ៍នេះជារបាយការណ៍សកម្មភាពរបស់ស្ថាប័នស្រាវជ្រាវនៅប្រទេសស្វីសកាលពីឆ្នាំ ២០០១ ក៏ដោយ វាបានផ្តល់នូវគំរូយុទ្ធសាស្ត្រដ៏រឹងមាំ និងមានតម្លៃបំផុតសម្រាប់ការកសាងប្រព័ន្ធអេកូឡូស៊ីនៃការស្រាវជ្រាវ AI នៅក្នុងប្រទេសកម្ពុជា។

គោលដៅ (Target) សកម្មភាព (Action) អាទិភាព (Priority)
រាជរដ្ឋាភិបាល និងក្រសួងអប់រំ យុវជន និងកីឡា (Government and MoEYS) គួររៀបចំយន្តការផ្តល់មូលនិធិស្រាវជ្រាវថ្នាក់ជាតិរយៈពេលវែង (National Research Fund) ស្រដៀងនឹងគំរូ SNSF ដើម្បីគាំទ្រដល់គម្រោងស្រាវជ្រាវបច្ចេកវិទ្យាជឿនលឿន និងការសិក្សាថ្នាក់បណ្ឌិត (PhD) នៅតាមសាកលវិទ្យាល័យរដ្ឋ។ ខ្ពស់ (High)
សាកលវិទ្យាល័យ និងវិទ្យាស្ថានស្រាវជ្រាវ (Universities and Research Institutes) គួរផ្តួចផ្តើមបង្កើតមជ្ឈមណ្ឌលស្រាវជ្រាវពហុជំនាញ ដោយប្រមូលផ្តុំអ្នកស្រាវជ្រាវផ្នែក AI មកពីស្ថាប័នផ្សេងៗ (ដូចជា CADT, ITC, RUPP) ដើម្បីធ្វើការរួមគ្នាលើគម្រោងធំៗ ដូចជាការអភិវឌ្ឍប្រព័ន្ធដំណើរការភាសាខ្មែរ (Khmer NLP & Speech Processing)។ ខ្ពស់ (High)
វិស័យឯកជន និងក្រុមហ៊ុនបច្ចេកវិទ្យា (Private Sector and Tech Companies) គួរសហការជាមួយស្ថាប័នស្រាវជ្រាវដើម្បីធ្វើពាណិជ្ជកម្មលើលទ្ធផលស្រាវជ្រាវ (Commercialization) និងបង្កើតជាក្រុមហ៊ុន Spin-off ដែលដោះស្រាយបញ្ហាជាក់ស្តែងនៅក្នុងសង្គមកម្ពុជា។ មធ្យម (Medium)

៤. បរិបទកម្ពុជា (Cambodia Context)

របាយការណ៍នេះមានសារៈសំខាន់សម្រាប់ប្រទេសកម្ពុជា ដែលបច្ចុប្បន្នកំពុងជំរុញការអភិវឌ្ឍសេដ្ឋកិច្ចនិងរដ្ឋាភិបាលឌីជីថល។ ការសិក្សាពីគំរូនៃភាពជោគជ័យរបស់វិទ្យាស្ថាន IDIAP អាចជួយកម្ពុជាក្នុងការរៀបចំរចនាសម្ព័ន្ធមជ្ឈមណ្ឌលស្រាវជ្រាវថ្នាក់ជាតិ ការទាក់ទាញមូលនិធិ និងការបណ្តុះបណ្តាលធនធានមនុស្សកម្រិតខ្ពស់ផ្នែក AI។

ផលប៉ះពាល់មូលដ្ឋាន (Local Implications)៖

ការកសាងមជ្ឈមណ្ឌលនៃសមត្ថភាពស្រាវជ្រាវថ្នាក់ជាតិ (National Centre of Competence) ដោយមានការគាំទ្រពីរដ្ឋាភិបាល និងវិស័យឯកជន គឺជាជំហានយុទ្ធសាស្ត្រដ៏ចាំបាច់បំផុត ដើម្បីឱ្យកម្ពុជាអាចចាប់យកនិងធ្វើជាម្ចាស់លើបច្ចេកវិទ្យា AI ប្រកបដោយឯករាជ្យភាព។

៥. ផែនការអនុវត្ត (Implementation Roadmap)

ដើម្បីអនុវត្តតាមអនុសាសន៍នៃរបាយការណ៍នេះ គួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. រៀបចំផែនការមេសម្រាប់ការស្រាវជ្រាវ AI ថ្នាក់ជាតិ (Develop a National AI Research Masterplan): រដ្ឋាភិបាលដោយមានការចូលរួមពីក្រសួងពាក់ព័ន្ធ (MISTI, MPTC, MoEYS) ត្រូវកំណត់គោលដៅស្រាវជ្រាវអាទិភាព និងរៀបចំបង្កើតគម្រោង "Pôle National de Recherche" តាមគំរូប្រទេសស្វីស។
  2. បង្កើតមូលនិធិស្រាវជ្រាវនិងនវានុវត្តន៍ (Establish Research and Innovation Funds): រៀបចំកញ្ចប់ថវិកាជាតិ និងកៀរគរជំនួយអន្តរជាតិ ដើម្បីផ្តល់មូលនិធិគាំទ្រដល់និស្សិតថ្នាក់បណ្ឌិត និងគម្រោងស្រាវជ្រាវរយៈពេល ៣ ទៅ ៥ ឆ្នាំ នៅតាមសាកលវិទ្យាល័យ និងវិទ្យាស្ថានសាធារណៈ។
  3. កសាងហេដ្ឋារចនាសម្ព័ន្ធទិន្នន័យ (Build Data Infrastructure): ប្រមូល ចងក្រង និងរៀបចំទិន្នន័យពិតប្រាកដក្នុងស្រុកទំហំធំ (Large-scale Datasets/Corpus) សម្រាប់ភាសាខ្មែរ រូបភាព និងសំឡេង ដើម្បីគាំទ្រដល់ដំណើរការបង្វឹក (Training) ម៉ូដែល Machine Learning។
  4. ជំរុញកិច្ចសហប្រតិបត្តិការអន្តរជាតិ (Promote International Collaboration): បង្កើតភាពជាដៃគូ (MoU/Joint Research) ជាមួយវិទ្យាស្ថានស្រាវជ្រាវកំពូលៗលើពិភពលោក (ដូចជា IDIAP, ស្ថាប័ននៅអឺរ៉ុប ឬអាស៊ី) សម្រាប់ការផ្លាស់ប្តូរអ្នកស្រាវជ្រាវ ការណែនាំនិស្សិត PhD រួមគ្នា និងការផ្ទេរចំណេះដឹង។

៦. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Hidden Markov Models (HMM) ម៉ូடல்ស្ថិតិដែលប្រើប្រាស់យ៉ាងទូលំទូលាយនៅក្នុងការសម្គាល់សំឡេង (Speech Recognition) ដើម្បីទស្សន៍ទាយលំដាប់លំដោយនៃពាក្យ ឬលក្ខណៈសំឡេងដែលមិនស្គាល់ ដោយផ្អែកលើទិន្នន័យសំឡេងបន្តបន្ទាប់ដែលទទួលបាន។ ដូចជាការទស្សន៍ទាយពាក្យបន្ទាប់ដែលមនុស្សម្នាក់នឹងនិយាយ ដោយផ្អែកលើប្រវត្តិពាក្យដែលគាត់ទើបតែបាននិយាយរួច។
Support Vector Machine (SVM) ក្បួនដោះស្រាយ (Algorithm) នៃការរៀនម៉ាស៊ីន (Machine Learning) សម្រាប់ចាត់ថ្នាក់ទិន្នន័យ (Classification) ដែលត្រូវបានប្រើប្រាស់ច្រើនក្នុងការសម្គាល់មុខ ទម្រង់អក្សរ និងការវិភាគទិន្នន័យបរិស្ថានក្នុងទំហំធំ។ ដូចជាការគូសបន្ទាត់ព្រំដែនដ៏ល្អបំផុតមួយដើម្បីបំបែកវត្ថុពីរប្រភេទផ្សេងគ្នា (ឧទាហរណ៍៖ បំបែករូបភាពសត្វឆ្មា និងសត្វឆ្កែ) ឱ្យនៅដាច់ពីគ្នា។
Multimodal Interaction ប្រព័ន្ធអន្តរកម្មដែលអនុញ្ញាតឱ្យអ្នកប្រើប្រាស់បញ្ជាកុំព្យូទ័រតាមរយៈមធ្យោបាយច្រើនជាងមួយក្នុងពេលតែមួយ ដូចជាការបញ្ចេញសំឡេងរួមផ្សំជាមួយកាយវិការ ការប៉ះ ទិសដៅនៃការសម្លឹង ឬចលនាមុខ។ ដូចជាពេលយើងនិយាយប្រាប់ទូរសព្ទឱ្យ "លុបរូបនេះចោល" ស្របពេលដែលដៃរបស់យើងកំពុងចង្អុលទៅលើរូបថតនោះ។
Biometrics ការប្រើប្រាស់លក្ខណៈរូបសាស្ត្រ ឬអាកប្បកិរិយារបស់មនុស្ស (ដូចជា ក្រយៅដៃ ទម្រង់មុខ ឬសំឡេង) ដើម្បីផ្ទៀងផ្ទាត់និងបញ្ជាក់អត្តសញ្ញាណ សម្រាប់ការពារសន្តិសុខនិងគ្រប់គ្រងសិទ្ធិចូលប្រើប្រាស់ប្រព័ន្ធព័ត៌មាន។ ដូចជាការប្រើប្រាស់ទម្រង់មុខ ឬក្រយៅដៃរបស់យើងដើម្បីដោះសោទូរសព្ទដៃ ជំនួសឱ្យការវាយលេខសម្ងាត់។
Automatic Speech Recognition (ASR) បច្ចេកវិទ្យាដែលបំប្លែងសំឡេងនិយាយរបស់មនុស្សទៅជាអត្ថបទ (Text) ឬពាក្យបញ្ជាសម្រាប់ឱ្យកុំព្យូទ័រយល់និងអនុវត្តតាម ដែលជាស្នូលនៃប្រព័ន្ធអន្តរកម្មបញ្ជាដោយសំឡេង។ ដូចជាអ្នកលេខាដែលអង្គុយស្តាប់ និងកត់ត្រាទុកនូវរាល់ពាក្យពេចន៍ដែលយើងបាននិយាយទៅជាអក្សរដោយស្វ័យប្រវត្តិ។
Optical Character Recognition (OCR) បច្ចេកវិទ្យាដែលប្រើសម្រាប់ស្កេនរូបភាពនៃអត្ថបទ (ទាំងអក្សរបោះពុម្ព និងអក្សរសរសេរដៃ) រួចបំប្លែងវាទៅជាទម្រង់អត្ថបទឌីជីថលដែលអាចកែសម្រួល ឬស្វែងរកបាននៅក្នុងកុំព្យូទ័រ។ ដូចជាការថតរូបសៀវភៅមួយទំព័រ ហើយកម្មវិធីបំប្លែងរូបនោះទៅជាអក្សរនៅក្នុងកុំព្យូទ័រ ដែលយើងអាចលុបឬសរសេរថែមបានដោយសេរី។
Artificial Neural Networks (ANN) ប្រព័ន្ធកុំព្យូទ័រដែលត្រូវបានបង្កើតឡើងដោយត្រាប់តាមទម្រង់នៃប្រព័ន្ធសរសៃប្រសាទរបស់ខួរក្បាលមនុស្ស ដើម្បីឱ្យម៉ាស៊ីនអាចរៀនសូត្រពីទិន្នន័យ ស្គាល់ទម្រង់ស្មុគស្មាញ និងធ្វើការសម្រេចចិត្តដោយខ្លួនឯង។ ដូចជាការបង្រៀនក្មេងតូចម្នាក់ឱ្យស្គាល់សត្វដំរី ដោយបង្ហាញរូបដំរីជាច្រើនសន្លឹក រហូតដល់ក្មេងនោះអាចចំណាំលក្ខណៈដំរីបានដោយខ្លួនឯងនៅពេលក្រោយ។

៧. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖