បញ្ហា (The Problem)៖ ឯកសារនេះដោះស្រាយបញ្ហាប្រឈមក្នុងការរៀបចំ និងការរុករកទិន្នន័យនៃបណ្តាញសេម៉ង់ទិច (Semantic Web) ដែលមានទំហំធំ និងគ្មានរចនាសម្ព័ន្ធច្បាស់លាស់ ដោយសារភាពស្មុគស្មាញនៃទម្រង់ទិន្នន័យ RDF ធៀបនឹងទម្រង់ Object-Oriented ទូទៅ។
វិធីសាស្ត្រ (The Methodology)៖ ការស្រាវជ្រាវនេះប្រើប្រាស់វិធីសាស្ត្រក្នុងការអភិវឌ្ឍប្រព័ន្ធថ្មី និងការធ្វើតេស្តវាយតម្លៃដោយអ្នកប្រើប្រាស់ (User Evaluation) តាមរយៈគម្រោងសំខាន់ៗចំនួនពីរ៖
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Keyword Search ការស្វែងរកតាមពាក្យគន្លឹះ |
ជាវិធីសាស្ត្រដែលអ្នកប្រើប្រាស់ទូទៅធ្លាប់ស្គាល់ និងមានភាពស៊ាំក្នុងការប្រើប្រាស់ប្រចាំថ្ងៃ។ | ពិបាកក្នុងការស្វែងរកព័ត៌មានជាក់លាក់ពីទិន្នន័យដែលមានរចនាសម្ព័ន្ធស្មុគស្មាញ ហើយងាយនឹងជួបបញ្ហាទាល់ច្រក (គ្មានលទ្ធផល)។ | មានតែ ១៥.៥៥% នៃសំណួរដែលត្រូវបានឆ្លើយត្រឹមត្រូវ ហើយ ៤០% មិនអាចរកចម្លើយបានទាល់តែសោះ។ |
| Explicit Queries (SPARQL/N3) ការប្រើប្រាស់កូដសួរផ្ទាល់ |
មានភាពបត់បែន និងមានថាមពលខ្ពស់បំផុតក្នុងការទាញយកទិន្នន័យជាក់លាក់សម្រាប់អ្នកជំនាញកូដ។ | ទាមទារចំណេះដឹងសរសេរកូដកម្រិតខ្ពស់ ធ្វើឱ្យអ្នកប្រើប្រាស់ទូទៅមិនអាចប្រើប្រាស់បាន និងងាយនឹងមានកំហុស។ | មានតែ ១៥.៥៥% នៃសំណួរដែលត្រូវបានឆ្លើយត្រឹមត្រូវ ហើយ ៦០% នៃអ្នកប្រើប្រាស់បោះបង់ការស្វែងរក។ |
| Faceted Browser (BrowseRDF) ការរុករកតាមចំណាត់ថ្នាក់ |
មានភាពងាយស្រួលមើល ជួយណែនាំអ្នកប្រើប្រាស់តាមរយៈជម្រើសជាក់លាក់ និងការពារមិនឱ្យជួបការស្វែងរកដែលគ្មានលទ្ធផល (No dead-ends)។ | អាចមានភាពយឺតយ៉ាវនៅពេលទិន្នន័យមានទំហំធំខ្លាំង (លើសពី១លានទិន្នន័យ) និងទាមទារការរៀបចំមុខងាររុករកឱ្យបានល្អ។ | ៧៤.២៩% នៃសំណួរត្រូវបានឆ្លើយត្រឹមត្រូវ ហើយមានល្បឿនលឿនជាង Keyword ៣០% និងលឿនជាង Query ៣៥៦%។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការអភិវឌ្ឍ និងដំណើរការប្រព័ន្ធរុករកនេះទាមទារធនធានកម្រិតមធ្យម ដោយផ្តោតសំខាន់លើហេដ្ឋារចនាសម្ព័ន្ធកម្មវិធី (Software) និងការរៀបចំទិន្នន័យ។
ការសិក្សានេះត្រូវបានធ្វើឡើងដោយមានអ្នកចូលរួមតេស្តត្រឹមតែ ១៥នាក់ នៅវិទ្យាស្ថានស្រាវជ្រាវ DERI ប្រទេសអៀរឡង់ ដោយប្រើប្រាស់ទិន្នន័យ FBI និង Citeseer។ ចំនួនអ្នកសាកល្បងដ៏តិចតួចនេះ អាចនឹងមិនតំណាងឱ្យឥរិយាបថរបស់អ្នកប្រើប្រាស់ទូទៅ ជាពិសេសនៅក្នុងបរិបទប្រទេសកម្ពុជា ដែលអ្នកប្រើប្រាស់អាចមានកម្រិតអក្ខរកម្មឌីជីថលខុសៗគ្នា។
ទោះជាយ៉ាងណាក៏ដោយ បច្ចេកវិទ្យា Faceted Navigation នេះមានសក្តានុពល និងអត្ថប្រយោជន៍យ៉ាងធំធេងក្នុងការរៀបចំប្រព័ន្ធទិន្នន័យនៅក្នុងប្រទេសកម្ពុជា។
ការអនុវត្តបច្ចេកវិទ្យា Semantic Web នេះនឹងជួយបំប្លែងទិន្នន័យដ៏ស្មុគស្មាញរបស់ស្ថាប័នរដ្ឋ និងអប់រំនៅកម្ពុជា ឱ្យក្លាយជាប្រព័ន្ធដែលងាយស្រួលរុករកបំផុតសម្រាប់ប្រជាជនទូទៅ។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Semantic Web | បណ្តាញសេម៉ង់ទិចគឺជាការពង្រីកបន្ថែមនៃបណ្តាញអ៊ីនធឺណិតបច្ចុប្បន្ន ដែលផ្តល់អត្ថន័យ (Semantics) ដល់ទិន្នន័យដើម្បីឱ្យម៉ាស៊ីន ឬកុំព្យូទ័រអាចអាន យល់ ផ្សារភ្ជាប់ និងទាញយកព័ត៌មានមកវិភាគដោយស្វ័យប្រវត្តិ ជំនួសឱ្យការគ្រាន់តែបង្ហាញទំព័រវ៉ិបសាយសម្រាប់តែមនុស្សអាន។ | វាដូចជាបណ្ណាល័យដែលសៀវភៅនីមួយៗចេះប្រាប់បណ្ណារក្សថាខ្លួនឯងនិយាយពីអ្វី ដើម្បីឱ្យបណ្ណារក្ស(កុំព្យូទ័រ)អាចរៀបចំនិងរកចម្លើយឱ្យយើងបានរហ័ស។ |
| Resource Description Framework (RDF) | វាជាស្តង់ដារទម្រង់ទិន្នន័យគោលរបស់ Semantic Web ដែលប្រើសម្រាប់ពណ៌នាអំពីធនធាននានានៅលើអ៊ីនធឺណិតក្នុងទម្រង់ជាតំណភ្ជាប់បីផ្នែក "ប្រធានបទ-កិរិយាសព្ទ-កម្មបទ" (Triple) ដើម្បីប្រាប់ពីលក្ខណៈ ឬទំនាក់ទំនងរវាងវត្ថុមួយទៅវត្ថុមួយទៀត។ | វាដូចជាការសរសេរប្រយោគខ្លីៗប្រាប់កុំព្យូទ័រថា "កក្កដា (ប្រធានបទ) ស្គាល់ (កិរិយា) មករា (កម្មបទ)"។ |
| Faceted browsing | ជាវិធីសាស្ត្រក្នុងការរុករកទិន្នន័យដ៏ច្រើនសន្ធឹកសន្ធាប់តាមរយៈការបំបែកទិន្នន័យជាចំណាត់ថ្នាក់ ឬជ្រុង (Facets) ផ្សេងៗគ្នា ដែលអនុញ្ញាតឱ្យអ្នកប្រើប្រាស់អាចច្រោះយកតែព័ត៌មានដែលខ្លួនចង់បានជាបន្តបន្ទាប់ ដោយមិនបាច់វាយពាក្យស្វែងរក ហើយជួយមិនឱ្យមានបញ្ហារកមិនឃើញទិន្នន័យ។ | វាដូចជាការទិញខោអាវតាមអនឡាញ ដែលអ្នកអាចចុចរើស "ទំហំ" រួចរើស "ពណ៌" និង "ម៉ាក" ជាបន្តបន្ទាប់ដើម្បីចម្រាញ់រកខោអាវដែលត្រូវចិត្តបំផុត។ |
| Object-relational mapping (ORM) | គឺជាបច្ចេកទេសសរសេរកម្មវិធីដែលធ្វើស្ពានភ្ជាប់ចន្លោះប្រហោងរវាងមូលដ្ឋានទិន្នន័យ (ដែលផ្ទុកទិន្នន័យជាតារាង ឬជា Triples) និងកម្មវិធី (ដែលមើលទិន្នន័យជា Objects) ធ្វើឱ្យអ្នកសរសេរកូដអាចទាញយកទិន្នន័យមកប្រើប្រាស់បានងាយស្រួលតាមបែប Object-Oriented ដោយមិនបាច់សរសេរកូដសួរ (Queries) ស្មុគស្មាញ។ | វាដូចជាអ្នកបកប្រែភាសាដែលជួយបកប្រែសំណួរពីភាសាមនុស្ស (កម្មវិធីកុំព្យូទ័រ) ទៅជាភាសាឯកសារ (មូលដ្ឋានទិន្នន័យ) ដោយស្វ័យប្រវត្តិ។ |
| SPARQL | វាគឺជាភាសាសួរទិន្នន័យស្តង់ដារ (Query Language) ដែលត្រូវបានបង្កើតឡើងដោយស្ថាប័ន W3C សម្រាប់ប្រើប្រាស់ដើម្បីទាញយក និងរៀបចំទិន្នន័យដែលរក្សាទុកក្នុងទម្រង់ RDF របស់បណ្តាញ Semantic Web។ | វាប្រៀបបាននឹងកាតាឡុកសំណួរ ដែលយើងប្រើសម្រាប់ប្រាប់បណ្ណារក្សឱ្យទៅទាញយកសៀវភៅណាដែលមានលក្ខណៈជាក់លាក់ចេញពីបណ្ណាល័យដ៏ធំ។ |
| Ontology | នៅក្នុងវិទ្យាសាស្ត្រកុំព្យូទ័រ វាជាការបង្កើតគំរូទិន្នន័យដែលកំណត់ពីវាក្យសព្ទ គោលគំនិត និងទំនាក់ទំនងរវាងវត្ថុនានានៅក្នុងវិស័យណាមួយច្បាស់លាស់ (Conceptualization) ដើម្បីឱ្យប្រព័ន្ធកុំព្យូទ័រផ្សេងៗគ្នាអាចយល់អត្ថន័យទិន្នន័យបានដូចគ្នា។ | វាដូចជាវចនានុក្រមនិងសៀវភៅផែនទីគំនិតរួមបញ្ចូលគ្នា ដែលប្រាប់កុំព្យូទ័រថា "ឆ្កែ" គឺជា "សត្វ" ហើយ "សត្វ" ត្រូវការ "ចំណី"។ |
| open-world assumption | គឺជាគោលការណ៍មួយនៃ Semantic Web ដែលសន្មតថាព័ត៌មានដែលយើងមិនទាន់ដឹង ឬមិនមាននៅក្នុងប្រព័ន្ធ មិនមែនមានន័យថាវាខុស ឬមិនពិតនោះទេ គ្រាន់តែវាជាព័ត៌មានដែលមិនទាន់ត្រូវបានគេបញ្ចូលប៉ុណ្ណោះ។ | វាដូចជាការដែលយើងមិនឃើញឈ្មោះសិស្សម្នាក់ក្នុងបញ្ជីអវត្តមាន យើងមិនអាចសន្និដ្ឋានថាគាត់មកសាលានោះទេ គាត់អាចនឹងមក ឬក៏គ្រូគ្រាន់តែភ្លេចកត់ឈ្មោះគាត់។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖