Original Title: Reading Ancient Scripts: Investigating the Human Visual System for Artificial Intelligence in Palaeography
Source: www.trismegistos.org
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការអានអក្សរបុរាណ៖ ការស៊ើបអង្កេតប្រព័ន្ធគំហើញរបស់មនុស្សសម្រាប់បញ្ញាសិប្បនិម្មិតក្នុងវិទ្យាសាស្ត្រអក្សរបុរាណ

ចំណងជើងដើម៖ Reading Ancient Scripts: Investigating the Human Visual System for Artificial Intelligence in Palaeography

អ្នកនិពន្ធ៖ Ségolène Tarte (University of Oxford, United Kingdom), Rachel Mairs (University of Reading, United Kingdom), Mihaela Duta (University of Oxford, United Kingdom), Chrystalina Antoniades (University of Oxford, United Kingdom)

ឆ្នាំបោះពុម្ព៖ N/A

វិស័យសិក្សា៖ Artificial Intelligence in Palaeography

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហាប្រឈមក្នុងការសម្គាល់អក្សរសរសេរដោយដៃបុរាណ និងស្វែងរកការយល់ដឹងពីរបៀបដែលប្រព័ន្ធគំហើញរបស់មនុស្សដំណើរការភាពប្រែប្រួលនៃរូបរាងអក្សរ ដើម្បីកែលម្អប្រព័ន្ធបញ្ញាសិប្បនិម្មិត (AI)។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានរចនាការពិសោធន៍ដោយប្រើវិធីសាស្ត្រចម្រុះរវាងជាតិពន្ធុវិទ្យា និងវិទ្យាសាស្ត្រការយល់ដឹង (Cognitive sciences) ដើម្បីសាកល្បងការសម្គាល់អក្សរ Demotic របស់មនុស្ស។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Static Passive Familiarisation
ការធ្វើឱ្យស៊ាំបែបអសកម្ម (បង្ហាញរូបភាពអក្សរដដែលៗ)
ងាយស្រួលក្នុងការអនុវត្ត និងចំណាយពេលតិចក្នុងការបង្ហាញរូបភាពដល់អ្នកស្ម័គ្រចិត្ត។ មិនមានការចូលរួមពីចលនាសាច់ដុំ (Motor feedback) ដែលអាចធ្វើឱ្យការចងចាំរូបរាងអក្សរមានកម្រិត។ លទ្ធផលជាក់ស្តែងមិនទាន់ត្រូវបានបោះពុម្ពផ្សាយនៅឡើយទេ (កំពុងស្ថិតក្នុងដំណាក់កាលរង់ចាំទិន្នន័យ)។
Static Active Familiarisation
ការធ្វើឱ្យស៊ាំបែបសកម្ម (បង្ហាញរូបភាពអក្សរ និងតម្រូវឱ្យគូរតាម)
ជំរុញឱ្យមានការចងចាំកាន់តែច្បាស់តាមរយៈសកម្មភាពគូរផ្ទាល់ (Motor feedback) និងអន្តរកម្ម។ ទាមទារឧបករណ៍បន្ថែម (Tablet និង Stylus) និងចំណាយពេលយូរជាងក្នុងការពិសោធន៍។ លទ្ធផលជាក់ស្តែងមិនទាន់ត្រូវបានបោះពុម្ពផ្សាយនៅឡើយទេ (កំពុងស្ថិតក្នុងដំណាក់កាលរង់ចាំទិន្នន័យ)។
Dynamic Familiarisation
ការធ្វើឱ្យស៊ាំបែបថាមវន្ត (បង្ហាញវីដេអូពីរបៀបសរសេរអក្សរ)
បង្ហាញពីលំដាប់នៃការគូរគំនូសអក្សរ (Stroke order) ដែលជួយឱ្យយល់ពីទម្រង់កកើតនៃអក្សរ។ ទាមទារការរៀបចំទិន្នន័យស្មុគស្មាញជាង (ត្រូវបង្កើតវីដេអូគំនូរជីវចលសម្រាប់ការសរសេរអក្សរនីមួយៗ)។ លទ្ធផលជាក់ស្តែងមិនទាន់ត្រូវបានបោះពុម្ពផ្សាយនៅឡើយទេ (កំពុងស្ថិតក្នុងដំណាក់កាលរង់ចាំទិន្នន័យ)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការរៀបចំការពិសោធន៍នេះតម្រូវឱ្យមានទាំងឧបករណ៍បច្ចេកវិទ្យាអន្តរកម្ម និងកិច្ចសហការពីអ្នកជំនាញពហុវិស័យ ដើម្បីធានាបាននូវភាពត្រឹមត្រូវនៃទិន្នន័យ។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះផ្តោតលើអក្សរ Demotic នៃអេហ្ស៊ីបបុរាណ ដោយប្រើប្រាស់ទិន្នន័យឈ្មោះក្រិក និងធ្វើការពិសោធន៍ជាមួយអ្នកស្ម័គ្រចិត្តនៅក្នុងបរិបទបណ្ណាល័យសាកលវិទ្យាល័យ (ទំនងជានៅចក្រភពអង់គ្លេស)។ លក្ខខណ្ឌនេះអាចបង្កើតភាពលម្អៀងខាងវប្បធម៌ និងប្រភេទអក្សរ។ សម្រាប់ប្រទេសកម្ពុជា ការយល់ដឹងពីការរចនាទិន្នន័យនេះមានសារៈសំខាន់ណាស់ ព្រោះយើងមានអក្សរបុរាណផ្ទាល់ខ្លួន (ដូចជាអក្សរខ្មែរបុរាណ) ដែលទាមទារការជ្រើសរើសទិន្នន័យតំណាងឱ្យបានត្រឹមត្រូវនិងទូលំទូលាយ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្ររួមបញ្ចូលវិទ្យាសាស្ត្រការយល់ដឹង (Cognitive science) ជាមួយ AI នៅក្នុងការសិក្សានេះ មានសក្តានុពលខ្ពស់សម្រាប់ការងារអភិរក្ស និងសិក្សាឯកសារប្រវត្តិសាស្ត្រនៅប្រទេសកម្ពុជា។

ការអនុវត្តវិធីសាស្ត្រនេះមិនត្រឹមតែជួយកែលម្អប្រព័ន្ធ AI សម្រាប់ការអានអក្សរខ្មែរបុរាណប៉ុណ្ណោះទេ ថែមទាំងជួយរក្សាទុកចំណេះដឹងរបស់អ្នកជំនាញ ដែលបច្ចុប្បន្នមានចំនួនតិចតួចនៅក្នុងប្រទេសកម្ពុជា។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ស្វែងយល់ពីបច្ចេកវិទ្យាសម្គាល់រូបភាព: សិក្សាពីមូលដ្ឋានគ្រឹះនៃ Computer Vision និង Optical Character Recognition (OCR) ដោយអនុវត្តជាមួយឧបករណ៍ដូចជា OpenCV ឬ Tesseract OCR ដើម្បីយល់ពីរបៀបដែលម៉ាស៊ីនវិភាគរូបភាពអក្សរ។
  2. ប្រមូល និងរៀបចំទិន្នន័យអក្សរបុរាណខ្មែរ: សហការជាមួយស្ថាប័នស្រាវជ្រាវវប្បធម៌ ដើម្បីប្រមូលរូបភាពសិលាចារឹក ឬសាស្ត្រាស្លឹករឹត។ បន្ទាប់មក ប្រើប្រាស់កម្មវិធីកែច្នៃរូបភាព ដើម្បីកាត់យករូបភាពអក្សរនីមួយៗ លុបពណ៌ (Grayscale) និងតម្រឹមពន្លឺ (Histogram alignment) ដូចដែលបានរៀបរាប់ក្នុងឯកសារ។
  3. រចនាការពិសោធន៍ប្រមូលទិន្នន័យការយល់ដឹង (Cognitive Data): បង្កើតកម្មវិធីសាមញ្ញមួយនៅលើ Tablet ដែលអនុញ្ញាតឱ្យអ្នកប្រើប្រាស់សាកល្បងមើល និងគូរតាមអក្សរខ្មែរបុរាណ (Static active familiarisation) ដើម្បីប្រមូលទិន្នន័យគន្លងចលនា (Stroke paths) និងពេលវេលាប្រតិកម្ម។
  4. អភិវឌ្ឍ និងបង្ហាត់ម៉ូដែល Machine Learning: ប្រើប្រាស់ទិន្នន័យរូបភាព និងទិន្នន័យអន្តរកម្មដែលប្រមូលបាន ដើម្បីហ្វឹកហាត់ប្រព័ន្ធសរសៃប្រសាទសិប្បនិម្មិត (ឧទាហរណ៍ Convolutional Neural Networks - CNNs) ឱ្យសម្គាល់អក្សរបុរាណ ដោយពិចារណាលើលក្ខណៈពិសេសដែលប្រព័ន្ធគំហើញរបស់មនុស្សប្រើប្រាស់។
  5. វាយតម្លៃ និងប្រៀបធៀបជាមួយអ្នកជំនាញ: យកលទ្ធផលនៃការសម្គាល់អក្សររបស់ម៉ូដែល AI ទៅប្រៀបធៀបជាមួយការបកប្រែរបស់អ្នកជំនាញសិលាចារឹក។ កំណត់ចំណុចខ្សោយរបស់ AI និងធ្វើការកែតម្រូវទិន្នន័យ ឬក្បួនដោះស្រាយ ដើម្បីបង្កើនភាពសុក្រឹតជាបន្តបន្ទាប់។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Palaeography ការសិក្សាអំពីប្រវត្តិ ទម្រង់ និងការវិវត្តនៃអក្សរសរសេរដោយដៃនាសម័យបុរាណ ដើម្បីយល់ពីអត្ថន័យ អត្តសញ្ញាណអ្នកសរសេរ និងកាលបរិច្ឆេទនៃឯកសារប្រវត្តិសាស្ត្រ។ ដូចជាការធ្វើជាអ្នកស៊ើបអង្កេតប្រវត្តិសាស្ត្រ ដែលព្យាយាមអានអក្សរព្រិលៗ ឬកកាយអត្ថន័យពីសំបុត្រចាស់ៗរាប់ពាន់ឆ្នាំមុន។
Demotic script ជាប្រភេទអក្សរបុរាណរបស់ប្រទេសអេហ្ស៊ីប ដែលបានវិវត្តនិងត្រូវគេប្រើយ៉ាងទូលំទូលាយសម្រាប់ការសរសេរប្រចាំថ្ងៃ លើឯកសាររដ្ឋបាល និងអក្សរសិល្ប៍ ក្នុងរយៈពេលប្រមាណ១០សតវត្សរ៍ ដោយមានទម្រង់ប្រែប្រួលយ៉ាងខ្លាំង។ ដូចជាអក្សរឆ្លាក់លើជញ្ជាំងប្រាសាទបុរាណ ដែលត្រូវបានគេយកមកសរសេរកាត់ៗឱ្យលឿននិងសាមញ្ញជាងមុនសម្រាប់ប្រើប្រាស់រាល់ថ្ងៃ។
Motor feedback ដំណើរការដែលខួរក្បាលទទួលបានព័ត៌មានពីចលនានៃសាច់ដុំដៃនៅពេលយើងសរសេរ ឬគូរ ដែលជួយឱ្យប្រព័ន្ធចងចាំរបស់មនុស្សកត់ត្រារូបរាងអក្សរបានកាន់តែច្បាស់ជាងការគ្រាន់តែមើលនឹងភ្នែកទទេពុំមានសកម្មភាព។ ដូចជាពេលដែលយើងរៀនជិះកង់ ដែលរាងកាយយើងចងចាំសកម្មភាពទប់លំនឹងនោះដោយស្វ័យប្រវត្តិតាមរយៈចលនាផ្ទាល់ទោះជាយើងមិនបានគិតក៏ដោយ។
Ethnographic methodologies វិធីសាស្ត្រស្រាវជ្រាវបែបគុណវិស័យ ដែលផ្តោតលើការចុះទៅសង្កេត និងការប្រាស្រ័យទាក់ទងដោយផ្ទាល់ជាមួយមនុស្ស (ដូចជាអ្នកអានអក្សរបុរាណ) នៅក្នុងបរិយាកាសធម្មជាតិរបស់ពួកគេ ដើម្បីយល់ពីទម្លាប់ និងវិធីសាស្ត្រជាក់ស្តែងដែលពួកគេប្រើ។ ដូចជាការចុះទៅរស់នៅជាមួយអ្នកភូមិដើម្បីស្វែងយល់ពីរបៀបរស់នៅ និងការគិតរបស់ពួកគេផ្ទាល់ ជាជាងការគ្រាន់តែផ្ញើកម្រងសំណួរឱ្យពួកគេបំពេញតាមក្រដាស។
Histogram alignment បច្ចេកទេសក្នុងប្រព័ន្ធកុំព្យូទ័រ (Computer Vision) សម្រាប់កែសម្រួលរូបភាពឯកសារប្រវត្តិសាស្ត្រផ្សេងៗឱ្យមានកម្រិតពន្លឺ និងភាពច្បាស់ (Contrast) ស្មើគ្នា ដើម្បីលុបបំបាត់ស្នាមប្រឡាក់នានា និងងាយស្រួលក្នុងការប្រៀបធៀបរូបរាងអក្សរសុទ្ធសាធ។ ដូចជាការប្រើប្រាស់ Filter កែពណ៌រូបថតជាច្រើនសន្លឹកដែលថតនៅកន្លែងខុសគ្នា ឱ្យមើលទៅមានពន្លឺ និងពណ៌ស្រដៀងគ្នា ដើម្បីដាក់បញ្ចូលគ្នាក្នុងអាល់ប៊ុមតែមួយបានស្អាត។
Neural network techniques ក្បួនដោះស្រាយក្នុងបញ្ញាសិប្បនិម្មិត (AI) ដែលត្រូវបានរចនាឡើងដោយយកគំរូតាមបណ្តាញសរសៃប្រសាទក្នុងខួរក្បាលមនុស្ស ដើម្បីបង្រៀនកុំព្យូទ័រឱ្យរៀនសម្គាល់ទិន្នន័យស្មុគស្មាញ និងទាញយកលំនាំពីទិន្នន័យទាំងនោះ (ដូចជាការសម្គាល់អក្សរសរសេរដោយដៃជាដើម)។ ដូចជាការបង្ហាត់ក្មេងតូចម្នាក់ឱ្យស្គាល់សត្វឆ្មា ដោយបង្ហាញរូបភាពឆ្មាជាច្រើនសន្លឹក រហូតដល់ក្មេងនោះអាចចំណាំបានដោយខ្លួនឯង ទោះជួបឆ្មាប្រភេទថ្មីក៏ដោយ។
Cognitive sciences ការសិក្សាអន្តរវិជ្ជាដែលរួមបញ្ចូលចិត្តវិទ្យា ប្រព័ន្ធសរសៃប្រសាទ និង AI ដែលផ្តោតលើដំណើរការរបស់ខួរក្បាល និងចិត្ត ដើម្បីយល់ពីរបៀបដែលមនុស្សគិត រៀនសូត្រ ចងចាំ និងយល់ឃើញព័ត៌មានជុំវិញខ្លួន។ ដូចជាការសិក្សាស្វែងយល់ពី "ម៉ាស៊ីនខាងក្នុង" នៃក្បាលរបស់យើង ថាតើវាដំណើរការយ៉ាងដូចម្តេចនៅពេលយើងព្យាយាមអានអក្សរដែលសរសេរញីញ័រ។
Determinatives និមិត្តសញ្ញានៅក្នុងអក្សរបុរាណមួយចំនួន ដែលមិនមានសំឡេងអាន ប៉ុន្តែត្រូវបានបន្ថែមនៅចុងពាក្យដើម្បីបញ្ជាក់ពីប្រភេទនៃពាក្យនោះ ជួយបែងចែកពាក្យដែលសរសេរ ឬបញ្ចេញសំឡេងដូចគ្នា ប៉ុន្តែមានអត្ថន័យខុសគ្នា។ ដូចជាការសរសេរសញ្ញា 💡 (អំពូលភ្លើង) នៅជាប់ពាក្យ "គំនិត" ក្នុងសារអេឡិចត្រូនិក ដើម្បីបញ្ជាក់ប្រាប់អ្នកអានថាវាជារឿងភ្លឺស្វាង មិនមែនជាគំនិតអាក្រក់នោះទេ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖