Original Title: A Talking Rosetta Stone
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

សិលាចារឹករ៉ូសែតតាដែលអាចនិយាយបាន

ចំណងជើងដើម៖ A Talking Rosetta Stone

អ្នកនិពន្ធ៖ Greg Lauzon

ឆ្នាំបោះពុម្ព៖ 2017

វិស័យសិក្សា៖ Linguistics and Archival Science

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហានៃការបាត់បង់ភាសានៅទូទាំងពិភពលោក (ភាសាមួយស្លាប់ជារៀងរាល់ពីរវិនាទី) និងហានិភ័យនៃភាពហួសសម័យនៃប្រព័ន្ធផ្ទុកទិន្នន័យឌីជីថល ដែលធ្វើឱ្យការអភិរក្សសំឡេង និងភាសាសម្រាប់មនុស្សជំនាន់ក្រោយជួបការលំបាកយ៉ាងខ្លាំង។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកនិពន្ធបានប្រៀបធៀបវិធីសាស្ត្រនៃការអភិរក្សទិន្នន័យបែបអាណាឡូក និងឌីជីថល ដោយលើកយកគោលការណ៍កាត់ក្ដីភាសាពីអតីតកាលមកធ្វើជាគំរូ និងស្នើឡើងនូវប្រព័ន្ធអក្ខរក្រមថ្មីផ្អែកលើរូបភាពសំឡេង។

ការវិភាគប្រវត្តិសាស្ត្រនៃការបកប្រែភាសា (Rosetta Stone Historical Analysis)
ការប្រៀបធៀបទម្រង់អភិរក្សអាណាឡូក និងឌីជីថល (Analog vs. Digital Format Comparison)
ការប្រើប្រាស់រូបភាពរលកសំឡេង (Spectrograms and Waveforms)
ការបង្កើតអក្សររូបភាពសំឡេង (Spectroglyphs Creation)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

ទម្រង់ឌីជីថលមានហានិភ័យខ្ពស់ក្នុងការបាត់បង់ទិន្នន័យ ដោយសារការផ្លាស់ប្តូរនិងការហួសសម័យនៃបច្ចេកវិទ្យា (Digital obsolescence) បើប្រៀបធៀបទៅនឹងទម្រង់រូបវន្ត និងអាណាឡូក ដែលមានលក្ខណៈអចិន្ត្រៃយ៍ជាង។
រូបភាពរលកសំឡេង (Waveforms/Spectrograms) គឺជាទម្រង់ដើមមិនប្រែប្រួល ដែលអាចឱ្យមនុស្សនៅអនាគតទាញយកសំឡេងចេញពីរូបភាពបានដោយប្រើឧបករណ៍អុបទិកសាមញ្ញ ដោយមិនពឹងផ្អែកលើកូដកម្មវិធីកុំព្យូទ័រស្មុគស្មាញ។
អ្នកនិពន្ធស្នើឱ្យប្រើប្រាស់ 'Spectroglyphs' ដែលជារូបភាពតំណាងឱ្យទម្រង់ប្រេកង់សំឡេង (Formants) ចំនួន ៤៤ ប្រភេទ មកបង្កើតជាអក្ខរក្រមសកល (Universal Alphabet) សម្រាប់អភិរក្ស និងបញ្ចេញសំឡេងភាសាដែលជិតផុតពូជឡើងវិញប្រកបដោយភាពសុក្រឹត។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Digital Preservation (Binary/Formats) ការអភិរក្សទម្រង់ឌីជីថល (ប្រើកូដគោលពីរ និងឯកសារកុំព្យូទ័រ)	ងាយស្រួលក្នុងការបញ្ជូន រៀបចំកែច្នៃ និងរក្សាទុកទិន្នន័យបានច្រើនដោយមិនងាយមានសំឡេងរំខាន។	ប្រឈមនឹងភាពហួសសម័យនៃបច្ចេកវិទ្យា (Digital Obsolescence) ត្រូវការកម្មវិធីនិងឧបករណ៍អានជាក់លាក់ និងពឹងផ្អែកខ្លាំងលើអ្នកថែរក្សាទិន្នន័យដើម្បីបម្លែងឯកសារជាបន្តបន្ទាប់។	ឯកសារឌីជីថលមានហានិភ័យខូចខាតឬមិនអាចអានបានក្នុងរយៈពេលខ្លី (ឧទាហរណ៍៖ គម្រោងថាស Doomsday មិនអាចអានបានក្នុងរយៈពេលត្រឹមតែ ១៦ ឆ្នាំ)។
Analog Waveforms / Phonautograms ការអភិរក្សទម្រង់រលកសំឡេងអាណាឡូក	ជាទម្រង់ធម្មជាតិ (Elemental) ដែលមិនប្រែប្រួលតាមពេលវេលា និងអាចអានយកសំឡេងមកវិញបាន ទោះបីឆ្លងកាត់រាប់ពាន់ឆ្នាំ។	ទម្រង់រលកសំឡេងមានភាពស្មុគស្មាញ មានការត្រួតស៊ីគ្នាពិបាកនឹងមើលដោយភ្នែកទទេដើម្បីបែងចែកថាជាសំឡេងឬពាក្យអ្វី។	ការប្រើប្រាស់បច្ចេកវិទ្យា Optical imaging អាចទាញយកសំឡេងដែលបានកត់ត្រាអាយុកាល ១៥០ ឆ្នាំ (តាំងពីឆ្នាំ ១៨៦០) មកវិញបានជោគជ័យ។
Spectroglyphs (Proposed) អក្សររូបភាពសូរសព្ទ (ការស្នើឡើងដោយអ្នកនិពន្ធ)	អាចអានដោយភ្នែកទទេជាអក្ខរក្រមសកលផង និងអាចបំប្លែងចាក់ជាសំឡេងដើមវិញបានផង ដោយមិនពឹងផ្អែកលើការកំណត់កូដកុំព្យូទ័រតាមចិត្ត។	ត្រូវការផ្ដាច់យកតែទម្រង់ប្រេកង់សំខាន់ៗ (Formants) ពីរូបភាពទាំងមូល ហើយសំឡេងដែលចាក់ត្រឡប់មកវិញអាចមានលក្ខណៈស្រដៀងសំឡេងសំយោគ (Synthetic sound)។	បង្កើតបានជាអក្ខរក្រមដែលមិនប្រែប្រួល ដែលរូបភាពនីមួយៗតំណាងឱ្យសំឡេងជាក់លាក់មួយរយភាគរយ ខុសពីអក្ខរក្រមអន្តរជាតិ (IPA) ដែលគ្រាន់តែជាការកំណត់សន្មត។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តវិធីសាស្ត្រនេះមិនទាមទារបច្ចេកវិទ្យាស្មុគស្មាញពេកសម្រាប់ការអាននៅអនាគតនោះទេ ប៉ុន្តែសម្រាប់ពេលបច្ចុប្បន្ន វាទាមទារកម្មវិធីនិងធនធានដើម្បីវិភាគ និងបង្កើតរូបភាពសំឡេង។

Software: កម្មវិធី Freeware សម្រាប់ធ្វើការវិភាគ Reverse Fourier Analysis ដើម្បីបំប្លែងទិន្នន័យរូបភាពទៅជាឯកសារសំឡេង (Audio File)។
Hardware: ឧបករណ៍ Optical Imaging ឬឧបករណ៍ពង្រីករូបភាព (Microscopes) ដែលមានកម្រិតពង្រីកយ៉ាងតិច 100x សម្រាប់អានទិន្នន័យដែលបានឆ្លាក់ក្នុងទំហំតូច (Micro-engraving)។
Expertise: ចំណេះដឹងផ្នែកភាសាវិទ្យា (Linguistics) និងសូរសព្ទ (Acoustics) ក្នុងការញែកទម្រង់ប្រេកង់ Formants នៃសំឡេងនីមួយៗ ដើម្បីបង្កើតជាអក្ខរក្រម Spectroglyph។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ឯកសារនេះផ្អែកលើការវិភាគអក្សរប្រវត្តិសាស្ត្រអឺរ៉ុប អេស៊ីបបុរាណ និងសំឡេងភាសាអង់គ្លេស (៤៤ សូរសព្ទ) ដោយមិនបានធ្វើតេស្តលម្អិតលើភាសាអាស៊ីទេ។ សម្រាប់ប្រទេសកម្ពុជា វាជារឿងសំខាន់ក្នុងការស្រាវជ្រាវថាតើ Spectroglyphs អាចកត់ត្រាលក្ខណៈស្មុគស្មាញនៃសំនៀង (Tones) និងខ្យល់សំឡេងអន្លាយ ដែលមានក្នុងភាសាខ្មែរនិងភាសាជនជាតិដើមភាគតិចបានកម្រិតណា។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់និងអាចច្នៃប្រឌិតបាន សម្រាប់ការកត់ត្រានិងអភិរក្សភាសាជនជាតិដើមភាគតិចនៅកម្ពុជាដែលមិនមានប្រព័ន្ធអក្សរសរសេរផ្ទាល់ខ្លួន។

ការអភិរក្សភាសាជនជាតិដើមភាគតិចនៅខេត្តមណ្ឌលគិរី និងរតនគិរី: ភាសាដូចជា ព្នង គួយ ឬទំពួន ភាគច្រើនពឹងផ្អែកលើការនិយាយប្រាប់តៗគ្នា (Oral Traditions)។ ការប្រើ Spectroglyphs អាចជួយកត់ត្រាសំឡេងអ្នកនិយាយដើមជាទម្រង់រូបភាពដែលនៅគង់វង្សយូរអង្វែង សម្រាប់អ្នកស្រាវជ្រាវជំនាន់ក្រោយ។
បណ្ណសារដ្ឋានជាតិ និងវិទ្យាស្ថានភាសាជាតិកម្ពុជា: ស្ថាប័នទាំងនេះអាចអនុវត្តគោលគំនិតនៃការបោះពុម្ពឬឆ្លាក់រលកសំឡេងសុន្ទរកថាប្រវត្តិសាស្ត្រ ឬទម្រង់អក្សរខ្មែរបុរាណទុកជា Physical media ជាជាងការពឹងផ្អែកតែលើ Hard Drive ឬ Cloud តែមួយមុខ ដែលងាយនឹងខូចខាត។

សរុបមក ប្រសិនបើមានការសហការរវាងសាកលវិទ្យាល័យបច្ចេកវិទ្យា និងអ្នកភាសាវិទ្យានៅកម្ពុជា វិធីសាស្ត្រនេះនឹងក្លាយជាដំណោះស្រាយដ៏រឹងមាំមួយដើម្បីការពារមិនឱ្យវប្បធម៌ និងភាសាតំបន់បាត់បង់ជារៀងរហូត។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះនៃសូរសព្ទ និងរលកសំឡេង: ស្វែងយល់ពីរបៀបនៃការបង្កើតរលកសំឡេងដោយប្រើប្រាស់កម្មវិធី Praat ឬ Audacity ដើម្បីវិភាគមើលទម្រង់ប្រេកង់ (Formants) នៃសូរសព្ទស្រៈនិងព្យញ្ជនៈរបស់ភាសាខ្មែរ និងភាសាជនជាតិដើមភាគតិច។
ប្រមូលទិន្នន័យសំឡេងភាសាដែលជិតផុតពូជ: ចុះស្រាវជ្រាវផ្ទាល់ជាមួយសហគមន៍ ដើម្បីថតសំឡេងសន្ទនា និងរឿងព្រេងនានាពីចាស់ព្រឹទ្ធាចារ្យ រួចរក្សាទុកក្នុងទម្រង់ឌីជីថលគុណភាពខ្ពស់បំផុត (Lossless Audio ដូចជា WAV ឬ FLAC)។
បង្កើត និងច្នៃរូបភាព Spectrograms ទៅជា Spectroglyphs: ប្រើប្រាស់មុខងារវិភាគសំឡេងដើម្បីទាញយក Spectrograms រួចប្រើកម្មវិធី Adobe Photoshop ឬកម្មវិធីកូដ Python (Librosa) ដើម្បីកាត់បន្ថយសំឡេងរំខានខាងក្រៅ និងរំលេចយកតែបន្ទាត់កោងសំខាន់ៗ (Formants) ដែលតំណាងឱ្យពាក្យនីមួយៗ ឱ្យក្លាយជាអក្សររូបភាពដែលអាចអានបាន។
សាកល្បងបំប្លែងរូបភាពទៅជាសំឡេងវិញ (Reverse Analysis): ប្រើប្រាស់កម្មវិធី Photosounder ឬ ARSS (Analysis & Resynthesis Sound Spectrograph) ដើម្បីធ្វើការ Inverse Fourier Transform សាកល្បងចាក់រូបភាព Spectroglyphs ទាំងនោះទៅជាសំឡេងវិញ និងធ្វើការផ្ទៀងផ្ទាត់កម្រិតភាពច្បាស់នៃអត្ថន័យ។
រៀបចំចងក្រងបណ្ណសាររូបភាពសំឡេងរយៈពេលវែង: សហការជាមួយស្ថាប័នពាក់ព័ន្ធ ដើម្បីបោះពុម្ពរូបភាពអក្ខរក្រមសំឡេង (Spectroglyphs) អមជាមួយអក្សរខ្មែរនិងសេចក្តីពន្យល់ ទៅលើសម្ភារៈដែលមិនងាយពុកផុយ (ដូចជាសន្លឹកអាលុយមីញ៉ូម ឬកញ្ចក់) ដើម្បីធានាបាននូវអាយុកាលរក្សាទុកាប់រយឆ្នាំតទៅមុខ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
phonautograph	វាជាឧបករណ៍ដំបូងបង្អស់ក្នុងប្រវត្តិសាស្ត្រដែលត្រូវបានប្រើដើម្បីថតរលកសំឡេងពីខ្យល់ ដោយគូសវាសទម្រង់រលកនោះនៅលើក្រដាសប្រឡាក់ផេះ។ ទោះវាថតបាន តែនៅសម័យនោះគេមិនទាន់មានបច្ចេកវិទ្យាអាចចាក់សំឡេងនោះឱ្យឮវិញបានទេ។	ដូចជាម៉ាស៊ីនវាស់រញ្ជួយដី (Seismograph) ដែលគូសខ្សែញ័រៗលើក្រដាស ប៉ុន្តែឧបករណ៍នេះវាស់និងគូររំញ័រនៃសំឡេងមនុស្សនិយាយជំនួសវិញ។
obsolescence of technology	គឺជាស្ថានភាពដែលទិន្នន័យឌីជីថល (ដូចជាឯកសារកុំព្យូទ័រ) លែងអាចបើកអានបាន ដោយសារតែឧបករណ៍ ឬកម្មវិធីកុំព្យូទ័រដែលប្រើសម្រាប់អានវា បានផ្លាស់ប្តូរ ហួសសម័យ និងលែងមានអ្នកប្រើប្រាស់បន្ត។	ដូចជាការរក្សាទុកវីដេអូក្នុងកាសែត VCD ដែលនៅសម័យនេះអ្នកពិបាកនឹងរកម៉ាស៊ីនចាក់កាសែតនោះដើម្បីមើលវាណាស់។
Spectrograms	វាជារូបភាពតំណាងឱ្យសំឡេង ដែលបង្ហាញពីកម្រិតប្រេកង់ (កម្ពស់សំឡេង) នៅលើអ័ក្សបញ្ឈរ និងពេលវេលានៅលើអ័ក្សផ្តេក ព្រមទាំងបង្ហាញពីកម្រិតខ្លាំងឬខ្សោយនៃសំឡេងតាមរយៈពណ៌។	ដូចជាផែនទីកម្ដៅ (Heatmap) ដែលបង្ហាញពីចំណុចក្តៅឬត្រជាក់ ប៉ុន្តែនេះគឺជាផែនទីបង្ហាញពីចំណុចខ្ពស់និងទាបនៃរលកសំឡេងតាមពេលវេលា។
reverse fourier analysis	វាគឺជាដំណើរការបំប្លែងត្រឡប់ពីទម្រង់រូបភាពនៃរលកសំឡេង (Spectrogram) ទៅជាសំឡេងដែលអាចស្តាប់ឮបានវិញ ដោយប្រើប្រាស់កម្មវិធីកុំព្យូទ័រក្នុងការគណនាប្រេកង់រូបភាពនោះ។	ដូចជាការយកសៀវភៅដែលមានតែអក្សរតន្ត្រី (ណោតភ្លេង) មកលេងជាភ្លេងឱ្យយើងស្តាប់ឮពិតៗ។
formants	គឺជាចំណុចកំពូលនៃប្រេកង់សំឡេងដែលបង្កើតឡើងដោយទម្រង់នៃបំពង់កនិងមាត់របស់មនុស្ស។ វាកំណត់នូវលក្ខណៈសម្គាល់នៃស្រៈនីមួយៗ ដែលធ្វើឱ្យយើងអាចបែងចែកសំឡេងនិយាយផ្សេងៗគ្នាបាននៅក្នុងរូបភាព Spectrogram។	ដូចជាស្នាមម្រាមដៃអញ្ចឹងដែរ ប៉ុន្តែវាជាស្នាមសម្គាល់រូបរាងនៅក្នុងសំឡេងដែលបញ្ជាក់ថាអ្នកកំពុងបញ្ចេញសំឡេងអក្សរអ្វីពិតប្រាកដ។
spectroglyphs	គឺជាការច្នៃប្រឌិតទម្រង់រូបភាពសំឡេង (Spectrogram) ឱ្យក្លាយទៅជាអក្សររូបភាពសាមញ្ញដែលអាចអានបានដោយភ្នែកផង និងអាចយកទៅបំប្លែងជាសំឡេងដើមវិញបានផង ដើម្បីរក្សាទុកភាសាឱ្យនៅគង់វង្សយូរអង្វែង។	ដូចជាអក្សររូបភាពរបស់ជនជាតិអេស៊ីបបុរាណ (Hieroglyphs) ប៉ុន្តែអក្សររូបភាពនេះគឺជារូបរាងពិតៗនៃសំឡេងមនុស្សពេលនិយាយ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖