បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហានៃការស្វែងរកព័ត៌មាននៅក្នុងគម្ពីរអាល់គួរអាន ដោយសារប្រព័ន្ធបច្ចុប្បន្នភាគច្រើនពឹងផ្អែកតែលើការស្វែងរកពាក្យគន្លឹះ (Keyword search) ដែលមិនអាចស្វែងយល់ពីអត្ថន័យស៊ីជម្រៅ និងបរិបទនៃអត្ថបទ។
វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានប្រើប្រាស់បច្ចេកវិទ្យាបណ្ដាញន័យ (Semantic Web) ដើម្បីបង្កើតជាគំរូអុនតូឡូស៊ី និងក្របខណ្ឌស្វែងរកតាមន័យ។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Traditional Keyword Search ការស្វែងរកតាមពាក្យគន្លឹះបែបប្រពៃណី |
ងាយស្រួលក្នុងការរៀបចំនិងមានប្រើប្រាស់យ៉ាងទូលំទូលាយនៅលើគេហទំព័រ ឬកម្មវិធីស្វែងរកទូទៅ។ | មានលក្ខណៈឋិតិវន្ត (Static) មិនអាចយល់ពីអត្ថន័យស៊ីជម្រៅ ឬបរិបទនៃពាក្យ និងមិនអាចទាញយកព័ត៌មានដែលនិយាយដោយប្រយោលបានឡើយ។ | មិនអាចផ្តល់ចម្លើយចំពោះសំណួរដែលទាមទារការសន្និដ្ឋានន័យធៀប ឬបរិបទស្មុគស្មាញនៅក្នុងគម្ពីរអាល់គួរអាន។ |
| Ontology-Based Semantic Search ការស្វែងរកតាមន័យផ្អែកលើអុនតូឡូស៊ី |
អាចយល់ពីបរិបទ និងទំនាក់ទំនងអរូបីរវាងគោលគំនិតផ្សេងៗ ដែលអនុញ្ញាតឱ្យម៉ាស៊ីនធ្វើការសន្និដ្ឋាន (Inference) ឆ្លើយតបសំណួរស្មុគស្មាញបាន។ | ទាមទារការស្រាវជ្រាវដោយដៃយ៉ាងច្រើន ត្រូវការការប្រុងប្រយ័ត្នខ្ពស់ក្នុងការកំណត់អត្ថន័យ និងតម្រូវឱ្យមានការចូលរួមពីអ្នកជំនាញ។ | ប្រព័ន្ធអាចឆ្លើយតបយ៉ាងត្រឹមត្រូវទៅនឹងសំណួរ SPARQL ស្មុគស្មាញ (ឧទាហរណ៍៖ រកឃើញ "ត្រី" ពេលសួរថាតើសត្វណាដែលលេបព្យាការី ហើយរស់នៅក្នុងសមុទ្រ)។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការអភិវឌ្ឍប្រព័ន្ធស្វែងរកតាមន័យនេះទាមទារធនធានកម្លាំងពលកម្មដោយដៃយ៉ាងច្រើន ជាពិសេសពេលវេលាសម្រាប់ការស្រាវជ្រាវឯកសារ និងការសហការពីអ្នកជំនាញ។
ការសិក្សានេះផ្តោតទាំងស្រុងលើគម្ពីរអាល់គួរអាន និងអត្ថបទសាសនាឥស្លាម ដោយផ្អែកលើការបកប្រែភាសាអង់គ្លេសរបស់លោក Pickthall ប៉ុណ្ណោះ ដែលធ្វើឱ្យប្រព័ន្ធនេះបម្រើគោលដៅតែមួយគត់សម្រាប់សាសនាឥស្លាម។ សម្រាប់ប្រទេសកម្ពុជា វិធីសាស្ត្រនេះគឺមានសារៈសំខាន់មិនត្រឹមតែសម្រាប់សហគមន៍ខ្មែរឥស្លាមប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងអាចធ្វើជាគំរូដ៏ល្អសម្រាប់ការៀបចំប្រព័ន្ធស្រាវជ្រាវឯកសារសាសនា និងប្រវត្តិសាស្ត្រជាតិផងដែរ។
វិធីសាស្ត្របណ្ដាញន័យ (Semantic Web) នេះមានអត្ថប្រយោជន៍យ៉ាងខ្លាំងសម្រាប់ការអភិរក្ស និងការធ្វើបរិវត្តកម្មឌីជីថលលើឯកសារសំខាន់ៗនៅកម្ពុជា។
ជារួម ការប្រើប្រាស់បច្ចេកវិទ្យា Ontology អាចបំប្លែងឯកសារអត្ថបទបុរាណនៅកម្ពុជា ទៅជាប្រភពចំណេះដឹងឌីជីថលដែលអាចរុករកបានយ៉ាងឆ្លាតវៃ និងមានភាពសុក្រឹតខ្ពស់។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Semantic Search | ការស្វែងរកទិន្នន័យដោយយល់ពីអត្ថន័យ និងបរិបទនៃពាក្យ មិនមែនគ្រាន់តែផ្ទៀងផ្ទាត់អក្ខរាវិរុទ្ធនៃពាក្យគន្លឹះ (Keywords) នោះទេ។ វាអនុញ្ញាតឱ្យប្រព័ន្ធយល់ពីអ្វីដែលអ្នកប្រើប្រាស់ចង់បានពិតប្រាកដ ទោះបីជាពួកគេប្រើពាក្យខុសគ្នាក៏ដោយ។ | ដូចជាបណ្ណារក្សដ៏ឆ្លាតវៃម្នាក់ ដែលដឹងថាអ្នកចង់បានសៀវភៅអ្វី ទោះបីជាអ្នកប្រាប់តែសាច់រឿងត្រួសៗដោយមិនចាំចំណងជើងក៏ដោយ។ |
| Ontology | ការរៀបចំចាត់ថ្នាក់ចំណេះដឹងឬទិន្នន័យជារចនាសម្ព័ន្ធ ដោយកំណត់ពីគោលគំនិត (Concepts) ព្រមទាំងទំនាក់ទំនង (Relationships) រវាងគោលគំនិតទាំងនោះនៅក្នុងវិស័យណាមួយ ដើម្បីឱ្យម៉ាស៊ីនកុំព្យូទ័រអាចយល់បាន។ | ដូចជាការគូសផែនទីមែកធាងគ្រួសារ ដែលបង្ហាញយ៉ាងច្បាស់ថាអ្នកណាជាកូន អ្នកណាជាឪពុកម្តាយ ដើម្បីឱ្យកុំព្យូទ័រយល់ពីខ្សែស្រឡាយនិងទំនាក់ទំនង។ |
| SPARQL | ភាសាសំណួរ (Query Language) ពិសេសមួយដែលត្រូវបានប្រើប្រាស់សម្រាប់ទាញយកនិងកែប្រែទិន្នន័យពីប្រព័ន្ធផ្ទុកទិន្នន័យដែលមានរចនាសម្ព័ន្ធបែបបណ្ដាញន័យ (Semantic Web) ដូចជាទិន្នន័យប្រភេទ RDF ជាដើម។ | ដូចជាភាសាកូដសម្ងាត់មួយដែលអ្នកស៊ើបអង្កេតប្រើ ដើម្បីសួរចម្លើយសាក្សី (ទិន្នន័យ) ឱ្យឆ្លើយចំគោលដៅនិងមានហេតុផលត្រឹមត្រូវ។ |
| WordNet | មូលដ្ឋានទិន្នន័យវចនានុក្រមអេឡិចត្រូនិក ដែលចងក្រងពាក្យជាក្រុមៗតាមអត្ថន័យដូចគ្នា (Synonyms) និងបង្ហាញពីទំនាក់ទំនងតក្កវិជ្ជារវាងពាក្យទាំងនោះ ជួយឱ្យប្រព័ន្ធស្វែងរកយល់ពីបម្រែបម្រួលនៃពាក្យ។ | ដូចជាសៀវភៅវចនានុក្រមឆ្លាតវៃ ដែលមិនត្រឹមតែប្រាប់ន័យពាក្យ តែប្រាប់ថាតើពាក្យនោះមានសាច់ញាតិឬពាក្យដែលមានន័យស្រដៀងគ្នាអ្វីខ្លះ។ |
| RDF triples | ទម្រង់ស្តង់ដារសម្រាប់រៀបចំទិន្នន័យនៅលើបណ្តាញន័យ ដោយបែងចែកព័ត៌មានជាបីផ្នែកគឺ៖ ប្រធានបទ (Subject) កិរិយាឬទំនាក់ទំនង (Predicate) និង កម្មបទ (Object)។ | ដូចជាការបង្កើតប្រយោគខ្លីៗងាយៗ (ឧទាហរណ៍៖ "ឆ្មា" "ស៊ី" "ត្រី") ដើម្បីឱ្យម៉ាស៊ីនកុំព្យូទ័រងាយស្រួលអាន កត់ត្រា និងយល់ពីអត្ថន័យ។ |
| Reasoner | កម្មវិធីកុំព្យូទ័រ (Inference Engine) ដែលអាចទាញសេចក្តីសន្និដ្ឋានបែបតក្កវិជ្ជាដោយស្វ័យប្រវត្តិ ពីព័ត៌មានឬច្បាប់ដែលគេបានផ្តល់ឱ្យនៅក្នុង Ontology ដើម្បីបង្កើតជាចំណេះដឹងថ្មីដែលមិនបានសរសេរផ្ទាល់។ | ដូចជាខួរក្បាលអ្នកស៊ើបអង្កេត ដែលអាចសន្និដ្ឋានថា "បើ A ជាកូន B ហើយ B ជាកូន C នោះ A គឺជាចៅរបស់ C" ដោយមិនបាច់មានឯកសារបញ្ជាក់ផ្ទាល់។ |
| Semantic Web | បណ្តាញអ៊ីនធឺណិតជំនាន់ថ្មី (Web 3.0) ដែលផ្ទុកទិន្នន័យមានរចនាសម្ព័ន្ធច្បាស់លាស់ ជួយឱ្យកុំព្យូទ័រអាចយល់ វិភាគ និងផ្សារភ្ជាប់ព័ត៌មានពីប្រភពផ្សេងៗគ្នាដោយស្វ័យប្រវត្តិ ជំនួសឱ្យការគ្រាន់តែអានអត្ថបទធម្មតា។ | ដូចជាបណ្ណាល័យពិភពលោកមួយ ដែលសៀវភៅគ្រប់ក្បាលចេះទាក់ទងនិងពន្យល់អត្ថន័យប្រាប់គ្នាទៅវិញទៅមក មិនមែនត្រឹមតែជាក្រដាសស្ងៀមៗនោះទេ។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖