បញ្ហា (The Problem)៖ ភាពលំបាកក្នុងការស្វែងរក និងធ្វើសមាហរណកម្មព័ត៌មានជាក់លាក់នៅលើអ៊ីនធឺណិតបច្ចុប្បន្ន ដោយសារតែទិន្នន័យគ្មានរចនាសម្ព័ន្ធ ដែនកំណត់នៃការប្រើប្រាស់ពាក្យគន្លឹះ និងភាពស្រពិចស្រពិលនៃភាសាធម្មជាតិ។
វិធីសាស្ត្រ (The Methodology)៖ ឯកសារនេះពិនិត្យ និងពន្យល់ពីរចនាសម្ព័ន្ធជាស្រទាប់នៃបច្ចេកវិទ្យាវែបស៊ីម៉ែនទិក (Semantic Web technologies) ដែលត្រូវបានប្រើប្រាស់សម្រាប់បង្កើតអុនតូឡូស៊ី (Ontologies) និងទាញយកចំណេះដឹង។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Keyword-based HTML Web វែបប្រពៃណីផ្អែកលើពាក្យគន្លឹះ (HTML) |
ងាយស្រួលប្រើប្រាស់សម្រាប់អ្នកប្រើប្រាស់ទូទៅ និងមិនតម្រូវឱ្យរៀនបច្ចេកវិទ្យាថ្មីក្នុងការរុករកទិន្នន័យ។ | ពិបាកស្វែងរកព័ត៌មានជាក់លាក់ មានបញ្ហាពាក្យមានន័យច្រើន (Ambiguity) និងមិនអាចអានយល់ដោយម៉ាស៊ីន។ | ម៉ាស៊ីនស្វែងរកពឹងផ្អែកតែលើការផ្គូផ្គងពាក្យគន្លឹះ ដោយមិនយល់ពីបរិបទនិងអត្ថន័យពិតប្រាកដនៃទិន្នន័យ។ |
| XML and XML Schema ការរៀបចំរចនាសម្ព័ន្ធដោយ XML និង XMLS |
ផ្តល់រចនាសម្ព័ន្ធទិន្នន័យច្បាស់លាស់ ងាយស្រួលផ្លាស់ប្តូរទិន្នន័យរវាងប្រព័ន្ធ និងអាចអានបានដោយមនុស្សនិងម៉ាស៊ីន។ | មិនមានផ្តល់អត្ថន័យ (Semantics) ទៅឱ្យទិន្នន័យនោះទេ វាគ្រាន់តែជារចនាសម្ព័ន្ធសេចក្តីប្រកាសប៉ុណ្ណោះ។ | ដើរតួជាទម្រង់មូលដ្ឋាន (Syntax layer) សម្រាប់បច្ចេកវិទ្យាដទៃទៀតដូចជា RDF និង OWL ឱ្យដំណើរការបាន។ |
| Resource Description Framework (RDF & RDFS) ក្របខ័ណ្ឌពិពណ៌នាធនធាន (RDF/S) |
ផ្តល់អត្ថន័យជាមូលដ្ឋានតាមរយៈទម្រង់ត្រីកោណ (Subject, Predicate, Object) ដែលអនុញ្ញាតឱ្យងាយស្រួលភ្ជាប់ទិន្នន័យពីប្រភពផ្សេងៗ។ | សមត្ថភាពផ្នែកតក្កវិជ្ជានៅមានកម្រិត មិនទាន់អាចធ្វើការសន្និដ្ឋានប្រកបដោយភាពស្មុគស្មាញខ្ពស់បាននៅឡើយ។ | បង្កើតបានជាក្រាហ្វទិន្នន័យ (RDF Graph) ដែលអាចអាននិងដំណើរការដោយកម្មវិធីភ្នាក់ងារសូហ្វវែរបាន។ |
| Web Ontology Language (OWL) ភាសាអុនតូឡូស៊ីវែប (OWL) |
មានសមត្ថភាពតក្កវិជ្ជាកម្រិតខ្ពស់ (Description Logic) អាចបង្កើតវិធានស្មុគស្មាញ និងអនុញ្ញាតឱ្យម៉ាស៊ីនធ្វើការសន្និដ្ឋាន (Reasoning) រកទំនាក់ទំនងថ្មីៗដោយស្វ័យប្រវត្តិ។ | មានភាពស្មុគស្មាញខ្ពស់ក្នុងការអភិវឌ្ឍ ទាមទារអ្នកជំនាញដែលមានចំណេះដឹងស៊ីជម្រៅផ្នែកវិស្វកម្មចំណេះដឹង។ | ផ្តល់លទ្ធភាពបង្កើតពិភពអុនតូឡូស៊ីដ៏សម្បូរបែប ដែលអាចធ្វើការគិតវិភាគដូចមនុស្សសម្រាប់ប្រព័ន្ធស្វ័យប្រវត្តិកម្ម។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ឯកសារនេះមិនបានបញ្ជាក់ពីទំហំផ្ទុក ឬថាមពលកុំព្យូទ័រជាក់លាក់នោះទេ ប៉ុន្តែការអនុវត្តបច្ចេកវិទ្យា Semantic Web ជាទូទៅទាមទារហេដ្ឋារចនាសម្ព័ន្ធសូហ្វវែរ និងធនធានមនុស្សជំនាញខ្ពស់។
ការសិក្សានេះគឺជាអត្ថបទពិនិត្យឡើងវិញនូវទ្រឹស្តីទូទៅ (Review paper) ដែលសរសេរដោយអ្នកស្រាវជ្រាវនៅប្រទេសអូទ្រីស ដោយមិនមានប្រើប្រាស់សំណុំទិន្នន័យភូមិសាស្ត្រជាក់លាក់ណាមួយឡើយ ក្រៅពីការលើកឧទាហរណ៍សម្មតិកម្មអំពីប្រព័ន្ធសាកលវិទ្យាល័យ និងការកក់សំបុត្រ។ សម្រាប់ប្រទេសកម្ពុជា នេះមានន័យថាការអនុវត្តបច្ចេកវិទ្យានេះចាំបាច់ត្រូវមានការកសាងអុនតូឡូស៊ី និងវាក្យសព្ទ (Vocabularies) ផ្ទាល់ខ្លួន ដើម្បីធានាថាវាស្របតាមបរិបទភាសាខ្មែរ និងប្រព័ន្ធចាត់ថ្នាក់ក្នុងស្រុក។
បច្ចេកវិទ្យា Semantic Web មានសក្តានុពលខ្ពស់ណាស់សម្រាប់ស្ថាប័នរដ្ឋ និងឯកជននៅកម្ពុជា ក្នុងការធ្វើសមាហរណកម្មទិន្នន័យដែលនៅរាយប៉ាយ។
ទោះបីជាការចាប់ផ្តើមដំបូងទាមទារពេលវេលា និងធនធានខ្ពស់ក្នុងការរៀបចំរចនាសម្ព័ន្ធ ប៉ុន្តែបច្ចេកវិទ្យានេះនឹងផ្តល់នូវអត្ថប្រយោជន៍ដ៏ធំធេងសម្រាប់ការគ្រប់គ្រងចំណេះដឹងប្រកបដោយនិរន្តរភាព។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Semantic Web | គឺជាទម្រង់បន្ថែមនៃវែបបច្ចុប្បន្ន (Web 3.0) ដែលព័ត៌មានត្រូវបានរៀបចំជារចនាសម្ព័ន្ធច្បាស់លាស់ និងមានអត្ថន័យ ដើម្បីឱ្យកុំព្យូទ័រ (ឬភ្នាក់ងារសូហ្វវែរ) អាចអាន យល់ និងទាញយកការសន្និដ្ឋានដោយស្វ័យប្រវត្តិ។ | ដូចជាការបង្រៀនកុំព្យូទ័រឱ្យចេះអាន និងយល់អត្ថន័យនៃអត្ថបទនៅលើអ៊ីនធឺណិត មិនមែនគ្រាន់តែចាំផ្គូផ្គងពាក្យគន្លឹះនោះទេ។ |
| Ontology | គឺជាការបង្កើតគំរូទិន្នន័យដែលពិពណ៌នាអំពីពាក្យ គោលគំនិត និងទំនាក់ទំនងរវាងវត្ថុផ្សេងៗនៅក្នុងដែនកំណត់ណាមួយ ដើម្បីបង្កើតជារចនាសម្ព័ន្ធអត្ថន័យ (Semantic structure) សម្រាប់ឱ្យកុំព្យូទ័រអាចយល់បាន។ | ដូចជាការបង្កើតផែនទីគំនិត (Mind map) ដ៏ធំមួយដែលប្រាប់កុំព្យូទ័រថា "សិស្ស" ត្រូវតែរៀននៅ "សាកលវិទ្យាល័យ" ហើយ "គ្រូ" គឺជាអ្នក "បង្រៀន"។ |
| Resource Description Framework (RDF) | គឺជាភាសាមូលដ្ឋាន (Framework) សម្រាប់ពិពណ៌នាធនធាននៅលើវែបស៊ីម៉ែនទិក ដោយរៀបចំទិន្នន័យជាទម្រង់ត្រីកោណមានបីផ្នែកគឺ៖ ប្រធានបទ (Subject) កិរិយា/លក្ខណៈ (Predicate) និងកម្មវត្ថុ (Object)។ | ដូចជាការបង្កើតប្រយោគសាមញ្ញៗដើម្បីប្រាប់ព័ត៌មានទៅកុំព្យូទ័រ ឧទាហរណ៍៖ "បូរមី (Subject) រៀននៅ (Predicate) សាកលវិទ្យាល័យ (Object)"។ |
| Web Ontology Language (OWL) | គឺជាភាសាតំណាងចំណេះដឹងដែលត្រូវបានរចនាឡើងដើម្បីបង្កើតអុនតូឡូស៊ីដែលមានភាពស្មុគស្មាញ និងមានសមត្ថភាពតក្កវិជ្ជាខ្ពស់ (Description Logic) ជាង RDF ដោយអនុញ្ញាតឱ្យមានការកំណត់វិធាន និងការសន្និដ្ឋាន។ | ដូចជាសៀវភៅច្បាប់ដ៏តឹងរ៉ឹងមួយដែលប្រាប់កុំព្យូទ័រពីលក្ខខណ្ឌស្មុគស្មាញ ឧទាហរណ៍ "មនុស្សម្នាក់មិនអាចជាឪពុករបស់ខ្លួនឯងបានទេ"។ |
| SPARQL | គឺជាភាសាសម្រាប់សរសេរកូដទាញយក (Query Language) និងរៀបចំទិន្នន័យដែលត្រូវបានរក្សាទុកជាទម្រង់ RDF តាមរយៈការផ្គូផ្គងលំនាំក្រាហ្វ (Graph pattern matching) ជាមួយនឹងលក្ខខណ្ឌច្បាស់លាស់។ | ដូចជាការប្រើប្រាស់ Google Search ដែរ ប៉ុន្តែវាស្វែងរកទិន្នន័យដោយផ្អែកលើអត្ថន័យនិងទំនាក់ទំនង មិនមែនស្វែងរកដោយពាក្យគន្លឹះទូទៅនោះទេ។ |
| Software agents | គឺជាកម្មវិធីកុំព្យូទ័រដែលអាចធ្វើសកម្មភាពដោយស្វ័យប្រវត្តិក្នុងបរិស្ថានណាមួយ (ដូចជាអ៊ីនធឺណិត) ដើម្បីប្រមូលទិន្នន័យ គិតហេតុផល និងសម្រេចចិត្តធ្វើប្រតិបត្តិការជំនួសមនុស្ស ដោយផ្អែកលើចំណេះដឹងដែលបានកំណត់ជាមុន។ | ដូចជាជំនួយការផ្ទាល់ខ្លួននិម្មិតដែលចេះដើររកទិញសំបុត្រយន្តហោះ និងកក់សណ្ឋាគារឱ្យយើងដោយស្វ័យប្រវត្តិ។ |
| Logic Theories | គឺជាសំណុំនៃសេចក្តីប្រកាស (Axioms) និងវិធាននៃការសន្និដ្ឋាន (Inference rules) ដែលកុំព្យូទ័រប្រើប្រាស់ដើម្បីបង្កើតចំណេះដឹងថ្មីៗ ឬបញ្ជាក់ការពិតចេញពីទិន្នន័យដែលមានស្រាប់នៅក្នុងមូលដ្ឋានចំណេះដឹង។ | ដូចជាការប្រើប្រាស់រូបមន្តគណិតវិទ្យាដើម្បីរកចម្លើយថ្មីពីទិន្នន័យដែលគេឱ្យដឹងស្រាប់។ |
| Taxonomy | គឺជាវិធីសាស្ត្រក្នុងការចាត់ថ្នាក់ ឬរៀបចំក្រុមនៃពាក្យ និងវត្ថុផ្សេងៗទៅតាមឋានានុក្រម (Hierarchy) ពីកម្រិតទូទៅទៅកម្រិតជាក់លាក់។ | ដូចជាការរៀបចំថតឯកសារក្នុងកុំព្យូទ័រពីថតធំ (ឧទាហរណ៍៖ សត្វ) ទៅថតតូចៗ (ឧទាហរណ៍៖ សត្វចិញ្ចឹម -> ឆ្កែ)។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖