Original Title: A Talking Rosetta Stone
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

សិលាចារឹករ៉ូសែតតាដែលអាចនិយាយបាន

ចំណងជើងដើម៖ A Talking Rosetta Stone

អ្នកនិពន្ធ៖ Greg Lauzon

ឆ្នាំបោះពុម្ព៖ 2017

វិស័យសិក្សា៖ Linguistics and Archival Science

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហានៃការបាត់បង់ភាសានៅទូទាំងពិភពលោក (ភាសាមួយស្លាប់ជារៀងរាល់ពីរវិនាទី) និងហានិភ័យនៃភាពហួសសម័យនៃប្រព័ន្ធផ្ទុកទិន្នន័យឌីជីថល ដែលធ្វើឱ្យការអភិរក្សសំឡេង និងភាសាសម្រាប់មនុស្សជំនាន់ក្រោយជួបការលំបាកយ៉ាងខ្លាំង។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកនិពន្ធបានប្រៀបធៀបវិធីសាស្ត្រនៃការអភិរក្សទិន្នន័យបែបអាណាឡូក និងឌីជីថល ដោយលើកយកគោលការណ៍កាត់ក្ដីភាសាពីអតីតកាលមកធ្វើជាគំរូ និងស្នើឡើងនូវប្រព័ន្ធអក្ខរក្រមថ្មីផ្អែកលើរូបភាពសំឡេង។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Digital Preservation (Binary/Formats)
ការអភិរក្សទម្រង់ឌីជីថល (ប្រើកូដគោលពីរ និងឯកសារកុំព្យូទ័រ)
ងាយស្រួលក្នុងការបញ្ជូន រៀបចំកែច្នៃ និងរក្សាទុកទិន្នន័យបានច្រើនដោយមិនងាយមានសំឡេងរំខាន។ ប្រឈមនឹងភាពហួសសម័យនៃបច្ចេកវិទ្យា (Digital Obsolescence) ត្រូវការកម្មវិធីនិងឧបករណ៍អានជាក់លាក់ និងពឹងផ្អែកខ្លាំងលើអ្នកថែរក្សាទិន្នន័យដើម្បីបម្លែងឯកសារជាបន្តបន្ទាប់។ ឯកសារឌីជីថលមានហានិភ័យខូចខាតឬមិនអាចអានបានក្នុងរយៈពេលខ្លី (ឧទាហរណ៍៖ គម្រោងថាស Doomsday មិនអាចអានបានក្នុងរយៈពេលត្រឹមតែ ១៦ ឆ្នាំ)។
Analog Waveforms / Phonautograms
ការអភិរក្សទម្រង់រលកសំឡេងអាណាឡូក
ជាទម្រង់ធម្មជាតិ (Elemental) ដែលមិនប្រែប្រួលតាមពេលវេលា និងអាចអានយកសំឡេងមកវិញបាន ទោះបីឆ្លងកាត់រាប់ពាន់ឆ្នាំ។ ទម្រង់រលកសំឡេងមានភាពស្មុគស្មាញ មានការត្រួតស៊ីគ្នាពិបាកនឹងមើលដោយភ្នែកទទេដើម្បីបែងចែកថាជាសំឡេងឬពាក្យអ្វី។ ការប្រើប្រាស់បច្ចេកវិទ្យា Optical imaging អាចទាញយកសំឡេងដែលបានកត់ត្រាអាយុកាល ១៥០ ឆ្នាំ (តាំងពីឆ្នាំ ១៨៦០) មកវិញបានជោគជ័យ។
Spectroglyphs (Proposed)
អក្សររូបភាពសូរសព្ទ (ការស្នើឡើងដោយអ្នកនិពន្ធ)
អាចអានដោយភ្នែកទទេជាអក្ខរក្រមសកលផង និងអាចបំប្លែងចាក់ជាសំឡេងដើមវិញបានផង ដោយមិនពឹងផ្អែកលើការកំណត់កូដកុំព្យូទ័រតាមចិត្ត។ ត្រូវការផ្ដាច់យកតែទម្រង់ប្រេកង់សំខាន់ៗ (Formants) ពីរូបភាពទាំងមូល ហើយសំឡេងដែលចាក់ត្រឡប់មកវិញអាចមានលក្ខណៈស្រដៀងសំឡេងសំយោគ (Synthetic sound)។ បង្កើតបានជាអក្ខរក្រមដែលមិនប្រែប្រួល ដែលរូបភាពនីមួយៗតំណាងឱ្យសំឡេងជាក់លាក់មួយរយភាគរយ ខុសពីអក្ខរក្រមអន្តរជាតិ (IPA) ដែលគ្រាន់តែជាការកំណត់សន្មត។

ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តវិធីសាស្ត្រនេះមិនទាមទារបច្ចេកវិទ្យាស្មុគស្មាញពេកសម្រាប់ការអាននៅអនាគតនោះទេ ប៉ុន្តែសម្រាប់ពេលបច្ចុប្បន្ន វាទាមទារកម្មវិធីនិងធនធានដើម្បីវិភាគ និងបង្កើតរូបភាពសំឡេង។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ឯកសារនេះផ្អែកលើការវិភាគអក្សរប្រវត្តិសាស្ត្រអឺរ៉ុប អេស៊ីបបុរាណ និងសំឡេងភាសាអង់គ្លេស (៤៤ សូរសព្ទ) ដោយមិនបានធ្វើតេស្តលម្អិតលើភាសាអាស៊ីទេ។ សម្រាប់ប្រទេសកម្ពុជា វាជារឿងសំខាន់ក្នុងការស្រាវជ្រាវថាតើ Spectroglyphs អាចកត់ត្រាលក្ខណៈស្មុគស្មាញនៃសំនៀង (Tones) និងខ្យល់សំឡេងអន្លាយ ដែលមានក្នុងភាសាខ្មែរនិងភាសាជនជាតិដើមភាគតិចបានកម្រិតណា។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់និងអាចច្នៃប្រឌិតបាន សម្រាប់ការកត់ត្រានិងអភិរក្សភាសាជនជាតិដើមភាគតិចនៅកម្ពុជាដែលមិនមានប្រព័ន្ធអក្សរសរសេរផ្ទាល់ខ្លួន។

សរុបមក ប្រសិនបើមានការសហការរវាងសាកលវិទ្យាល័យបច្ចេកវិទ្យា និងអ្នកភាសាវិទ្យានៅកម្ពុជា វិធីសាស្ត្រនេះនឹងក្លាយជាដំណោះស្រាយដ៏រឹងមាំមួយដើម្បីការពារមិនឱ្យវប្បធម៌ និងភាសាតំបន់បាត់បង់ជារៀងរហូត។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. សិក្សាមូលដ្ឋានគ្រឹះនៃសូរសព្ទ និងរលកសំឡេង: ស្វែងយល់ពីរបៀបនៃការបង្កើតរលកសំឡេងដោយប្រើប្រាស់កម្មវិធី PraatAudacity ដើម្បីវិភាគមើលទម្រង់ប្រេកង់ (Formants) នៃសូរសព្ទស្រៈនិងព្យញ្ជនៈរបស់ភាសាខ្មែរ និងភាសាជនជាតិដើមភាគតិច។
  2. ប្រមូលទិន្នន័យសំឡេងភាសាដែលជិតផុតពូជ: ចុះស្រាវជ្រាវផ្ទាល់ជាមួយសហគមន៍ ដើម្បីថតសំឡេងសន្ទនា និងរឿងព្រេងនានាពីចាស់ព្រឹទ្ធាចារ្យ រួចរក្សាទុកក្នុងទម្រង់ឌីជីថលគុណភាពខ្ពស់បំផុត (Lossless Audio ដូចជា WAV ឬ FLAC)។
  3. បង្កើត និងច្នៃរូបភាព Spectrograms ទៅជា Spectroglyphs: ប្រើប្រាស់មុខងារវិភាគសំឡេងដើម្បីទាញយក Spectrograms រួចប្រើកម្មវិធី Adobe Photoshop ឬកម្មវិធីកូដ Python (Librosa) ដើម្បីកាត់បន្ថយសំឡេងរំខានខាងក្រៅ និងរំលេចយកតែបន្ទាត់កោងសំខាន់ៗ (Formants) ដែលតំណាងឱ្យពាក្យនីមួយៗ ឱ្យក្លាយជាអក្សររូបភាពដែលអាចអានបាន។
  4. សាកល្បងបំប្លែងរូបភាពទៅជាសំឡេងវិញ (Reverse Analysis): ប្រើប្រាស់កម្មវិធី PhotosounderARSS (Analysis & Resynthesis Sound Spectrograph) ដើម្បីធ្វើការ Inverse Fourier Transform សាកល្បងចាក់រូបភាព Spectroglyphs ទាំងនោះទៅជាសំឡេងវិញ និងធ្វើការផ្ទៀងផ្ទាត់កម្រិតភាពច្បាស់នៃអត្ថន័យ។
  5. រៀបចំចងក្រងបណ្ណសាររូបភាពសំឡេងរយៈពេលវែង: សហការជាមួយស្ថាប័នពាក់ព័ន្ធ ដើម្បីបោះពុម្ពរូបភាពអក្ខរក្រមសំឡេង (Spectroglyphs) អមជាមួយអក្សរខ្មែរនិងសេចក្តីពន្យល់ ទៅលើសម្ភារៈដែលមិនងាយពុកផុយ (ដូចជាសន្លឹកអាលុយមីញ៉ូម ឬកញ្ចក់) ដើម្បីធានាបាននូវអាយុកាលរក្សាទុកាប់រយឆ្នាំតទៅមុខ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
phonautograph វាជាឧបករណ៍ដំបូងបង្អស់ក្នុងប្រវត្តិសាស្ត្រដែលត្រូវបានប្រើដើម្បីថតរលកសំឡេងពីខ្យល់ ដោយគូសវាសទម្រង់រលកនោះនៅលើក្រដាសប្រឡាក់ផេះ។ ទោះវាថតបាន តែនៅសម័យនោះគេមិនទាន់មានបច្ចេកវិទ្យាអាចចាក់សំឡេងនោះឱ្យឮវិញបានទេ។ ដូចជាម៉ាស៊ីនវាស់រញ្ជួយដី (Seismograph) ដែលគូសខ្សែញ័រៗលើក្រដាស ប៉ុន្តែឧបករណ៍នេះវាស់និងគូររំញ័រនៃសំឡេងមនុស្សនិយាយជំនួសវិញ។
obsolescence of technology គឺជាស្ថានភាពដែលទិន្នន័យឌីជីថល (ដូចជាឯកសារកុំព្យូទ័រ) លែងអាចបើកអានបាន ដោយសារតែឧបករណ៍ ឬកម្មវិធីកុំព្យូទ័រដែលប្រើសម្រាប់អានវា បានផ្លាស់ប្តូរ ហួសសម័យ និងលែងមានអ្នកប្រើប្រាស់បន្ត។ ដូចជាការរក្សាទុកវីដេអូក្នុងកាសែត VCD ដែលនៅសម័យនេះអ្នកពិបាកនឹងរកម៉ាស៊ីនចាក់កាសែតនោះដើម្បីមើលវាណាស់។
Spectrograms វាជារូបភាពតំណាងឱ្យសំឡេង ដែលបង្ហាញពីកម្រិតប្រេកង់ (កម្ពស់សំឡេង) នៅលើអ័ក្សបញ្ឈរ និងពេលវេលានៅលើអ័ក្សផ្តេក ព្រមទាំងបង្ហាញពីកម្រិតខ្លាំងឬខ្សោយនៃសំឡេងតាមរយៈពណ៌។ ដូចជាផែនទីកម្ដៅ (Heatmap) ដែលបង្ហាញពីចំណុចក្តៅឬត្រជាក់ ប៉ុន្តែនេះគឺជាផែនទីបង្ហាញពីចំណុចខ្ពស់និងទាបនៃរលកសំឡេងតាមពេលវេលា។
reverse fourier analysis វាគឺជាដំណើរការបំប្លែងត្រឡប់ពីទម្រង់រូបភាពនៃរលកសំឡេង (Spectrogram) ទៅជាសំឡេងដែលអាចស្តាប់ឮបានវិញ ដោយប្រើប្រាស់កម្មវិធីកុំព្យូទ័រក្នុងការគណនាប្រេកង់រូបភាពនោះ។ ដូចជាការយកសៀវភៅដែលមានតែអក្សរតន្ត្រី (ណោតភ្លេង) មកលេងជាភ្លេងឱ្យយើងស្តាប់ឮពិតៗ។
formants គឺជាចំណុចកំពូលនៃប្រេកង់សំឡេងដែលបង្កើតឡើងដោយទម្រង់នៃបំពង់កនិងមាត់របស់មនុស្ស។ វាកំណត់នូវលក្ខណៈសម្គាល់នៃស្រៈនីមួយៗ ដែលធ្វើឱ្យយើងអាចបែងចែកសំឡេងនិយាយផ្សេងៗគ្នាបាននៅក្នុងរូបភាព Spectrogram។ ដូចជាស្នាមម្រាមដៃអញ្ចឹងដែរ ប៉ុន្តែវាជាស្នាមសម្គាល់រូបរាងនៅក្នុងសំឡេងដែលបញ្ជាក់ថាអ្នកកំពុងបញ្ចេញសំឡេងអក្សរអ្វីពិតប្រាកដ។
spectroglyphs គឺជាការច្នៃប្រឌិតទម្រង់រូបភាពសំឡេង (Spectrogram) ឱ្យក្លាយទៅជាអក្សររូបភាពសាមញ្ញដែលអាចអានបានដោយភ្នែកផង និងអាចយកទៅបំប្លែងជាសំឡេងដើមវិញបានផង ដើម្បីរក្សាទុកភាសាឱ្យនៅគង់វង្សយូរអង្វែង។ ដូចជាអក្សររូបភាពរបស់ជនជាតិអេស៊ីបបុរាណ (Hieroglyphs) ប៉ុន្តែអក្សររូបភាពនេះគឺជារូបរាងពិតៗនៃសំឡេងមនុស្សពេលនិយាយ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖