បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហាទិន្នផលទាបនៅក្នុងការដាំដុះសណ្តែកបាយ តាមរយៈការស្វែងយល់ពីមូលដ្ឋានសេនេទិចនៃទម្ងន់គ្រាប់ ដែលជាលក្ខណៈគោលដៅដ៏សំខាន់សម្រាប់ការបង្កាត់ពូជឱ្យទទួលបានទិន្នផលខ្ពស់។
វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានប្រើប្រាស់កូនកាត់ជំនាន់ F2:3 ចំនួន ១៤២ ខ្សែ ដែលបានមកពីការបង្កាត់រវាងពូជ BARImung 1 និង BARImung 6 ដើម្បីធ្វើការវិភាគផែនទីទីតាំងសេនេទិចបរិមាណ (QTL) នៅទីតាំងចំនួនពីរក្នុងប្រទេសបង់ក្លាដែស។
លទ្ធផលសំខាន់ៗ (The Verdict)៖
| វិធីសាស្ត្រ (Method) | គុណសម្បត្តិ (Pros) | គុណវិបត្តិ (Cons) | លទ្ធផលគន្លឹះ (Key Result) |
|---|---|---|---|
| Otsu Thresholding (Baseline) វិធីសាស្ត្រកំណត់កម្រិតពន្លឺ Otsu (វិធីសាស្ត្រគោល) |
មានភាពសាមញ្ញ ដំណើរការលឿន និងមិនត្រូវការទិន្នន័យបណ្តុះបណ្តាល (Training data) ច្រើននោះទេ។ | មានភាពលំអៀងខ្ពស់នៅពេលមានខ្យល់បោកបក់លើផ្ទៃទឹក ដែលធ្វើឱ្យមានកំហុសក្នុងការកាត់ទីតាំងទឹកចេញពីដី។ | ទទួលបានភាពត្រឹមត្រូវ (Accuracy) ជាមធ្យមត្រឹមតែ ៧២% ប៉ុណ្ណោះ។ |
| Random Forest Classifier ចំណាត់ថ្នាក់ Random Forest |
អាចដំណើរការបានល្អជាមួយទិន្នន័យច្រើនប្រភេទ និងមិនសូវទាមទារកម្លាំងម៉ាស៊ីនកុំព្យូទ័រខ្លាំងពេក។ | ត្រូវការការរៀបចំលក្ខណៈពិសេស (Feature engineering) ដោយដៃ និងមិនអាចចាប់យកទម្រង់រូបភាពស្មុគស្មាញបានល្អ។ | ទទួលបានភាពត្រឹមត្រូវ (Accuracy) កើនដល់ ៨១%។ |
| U-Net Convolutional Neural Network (Proposed) បណ្តាញសរសៃប្រសាទសិប្បនិម្មិត U-Net CNN (វិធីសាស្ត្រស្នើឡើង) |
អាចចាប់យកលក្ខណៈទម្រង់ព្រំប្រទល់ទឹកបានយ៉ាងច្បាស់លាស់ និងមានភាពរឹងមាំក្នុងការកាត់បន្ថយសំឡេងរំខាន (Noise) ពីរូបភាព។ | ទាមទារទិន្នន័យបណ្តុះបណ្តាលច្រើនសន្ធឹកសន្ធាប់ និងត្រូវការម៉ាស៊ីនដែលមានកម្លាំង GPU ខ្លាំងដើម្បីដំណើរការ។ | ទទួលបានភាពត្រឹមត្រូវ (Accuracy) ខ្ពស់បំផុតរហូតដល់ ៩៤% និង F1-Score ០.៩១។ |
ការចំណាយលើធនធាន (Resource Cost)៖ ការអនុវត្តវិធីសាស្ត្រនេះទាមទារឱ្យមានធនធានកុំព្យូទ័រខ្លាំង ជាពិសេសផ្នែករឹងសម្រាប់ការបណ្តុះបណ្តាលម៉ូដែល Deep Learning។
ការសិក្សានេះត្រូវបានអនុវត្តភាគច្រើននៅក្នុងតំបន់អាងទន្លេនៃប្រទេសអភិវឌ្ឍន៍ ដែលមានប្រព័ន្ធធារាសាស្ត្រ និងស្ថានភាពភូមិសាស្ត្រខុសពីប្រទេសកម្ពុជា។ ទិន្នន័យរូបភាព (Dataset) ភាគច្រើនផ្តោតលើតំបន់ទីក្រុង និងតំបន់វាលទំនាបដែលមិនសូវមានដើមឈើក្រាស់។ ចំណុចនេះមានសារៈសំខាន់ណាស់សម្រាប់កម្ពុជា ដោយសារតំបន់លិចទឹករបស់យើងច្រើនតែគ្របដណ្តប់ដោយព្រៃលិចទឹក និងវាលស្រែ ដែលអាចធ្វើឱ្យម៉ូដែលនេះមានភាពលំអៀង និងត្រូវការការបណ្តុះបណ្តាលសារជាថ្មីដោយប្រើទិន្នន័យក្នុងស្រុក។
វិធីសាស្ត្រនេះមានសក្តានុពលខ្ពស់ និងអាចយកមកអនុវត្តបានយ៉ាងមានប្រសិទ្ធភាពសម្រាប់បរិបទនៃប្រទេសកម្ពុជា។
សរុបមក ការសាកល្បងនិងសម្របសម្រួលបច្ចេកវិទ្យានេះនឹងជួយពង្រឹងសមត្ថភាពរបស់កម្ពុជាយ៉ាងខ្លាំងក្នុងការគ្រប់គ្រងគ្រោះមហន្តរាយ និងកាត់បន្ថយការខាតបង់សេដ្ឋកិច្ច។
ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖
| ពាក្យបច្ចេកទេស | ការពន្យល់ជាខេមរភាសា (Khmer Explanation) | និយមន័យសាមញ្ញ (Simple Definition) |
|---|---|---|
| Quantitative Trait Loci (QTL) (ទីតាំងសេនេទិចបរិមាណ) | គឺជាតំបន់ជាក់លាក់នៃ DNA ដែលមានផ្ទុកហ្សែន ឬបណ្តុំហ្សែន ដែលមានឥទ្ធិពលទៅលើលក្ខណៈរូបសាស្ត្រដែលអាចវាស់វែងជារង្វាស់បាន (ឧទាហរណ៍៖ ទម្ងន់គ្រាប់ កម្ពស់ រឺទិន្នផល)។ | ដូចជាការរកឃើញកូដសម្ងាត់នៅលើផែនទីរាងកាយ ដែលកំណត់ថាតើមនុស្សម្នាក់នឹងមានកម្ពស់ប៉ុន្មាន ឬរុក្ខជាតិមួយនឹងមានផ្លែធំប៉ុនណា។ |
| Simple sequence repeat (SSR) markers (សញ្ញាសម្គាល់មីក្រូសាតែលីត ឬ SSR) | ជាបំណែក DNA ខ្លីៗដែលច្រំដដែលៗ ហើយត្រូវបានគេប្រើជាសញ្ញាសម្គាល់នៅក្នុងបណ្តុំសេនេទិច ដើម្បីតាមដានថាតើហ្សែនគោលដៅណាមួយត្រូវបានបន្តពូជពីឪពុកម្តាយទៅកូនឬអត់។ | ដូចជាបង្គោលគីឡូម៉ែត្រនៅលើដងផ្លូវ ដែលជួយប្រាប់អ្នកវិទ្យាសាស្ត្រឱ្យដឹងពីទីតាំងពិតប្រាកដនៃហ្សែនណាមួយនៅលើសរសៃ DNAដ៏វែង។ |
| Composite interval mapping (CIM) (ការធ្វើផែនទីអន្តរកាលចម្រុះ) | ជាវិធីសាស្ត្រស្ថិតិមួយប្រភេទដែលប្រើប្រាស់សញ្ញាសម្គាល់ (Markers) ជាច្រើនក្នុងពេលតែមួយ ដើម្បីកំណត់ទីតាំងរបស់ QTL ឱ្យបានច្បាស់លាស់ ដោយកាត់បន្ថយឥទ្ធិពលរំខានពីហ្សែននៅតំបន់ផ្សេង។ | ដូចជាការប្រើប្រាស់ប្រព័ន្ធ GPS បូករួមនឹងផែនទីលម្អិត ដើម្បីស្វែងរកទីតាំងផ្ទះមួយឱ្យបានច្បាស់លាស់ ដោយកាត់បន្ថយការភាន់ច្រឡំជាមួយផ្ទះអ្នកជិតខាង។ |
| Heritability (ភាពអាចផ្ទេរតាមសេនេទិច / តំណពូជ) | ជារង្វាស់ភាគរយដែលបង្ហាញពីកម្រិតនៃឥទ្ធិពលរបស់ហ្សែន (ធៀបនឹងឥទ្ធិពលបរិស្ថាន) ទៅលើលក្ខណៈអ្វីមួយ។ បើ Heritability ខ្ពស់ មានន័យថាលក្ខណៈនោះត្រូវបានកំណត់ដោយហ្សែនខ្លាំងជាងកត្តាខាងក្រៅ។ | ដូចជាពណ៌ភ្នែករបស់កូនដែលកាត់តាមឪពុកម្តាយទាំងស្រុង (តំណពូជខ្ពស់) ខណៈដែលទម្ងន់ខ្លួនអាចប្រែប្រួលតាមការហូបចុក (បរិស្ថានមានឥទ្ធិពល)។ |
| Polymorphic (ពហុទម្រង់) | សំដៅលើវត្តមាននៃទម្រង់ខុសៗគ្នានៃហ្សែន ឬសញ្ញាសម្គាល់ DNA នៅក្នុងសហគមន៍នៃភាវៈរស់តែមួយ ដែលអនុញ្ញាតឱ្យអ្នកវិទ្យាសាស្ត្រអាចបែងចែកភាពខុសគ្នារវាងបុគ្គល ឬពូជបាន។ | ដូចជាការមានម៉ូតសក់ ឬពណ៌អាវច្រើនប្រភេទខុសៗគ្នានៅក្នុងចំណោមសិស្សក្នុងថ្នាក់តែមួយ ដែលងាយស្រួលចំណាំថានរណាជានរណា។ |
| Marker-assisted selection (ការជ្រើសរើសដោយប្រើសញ្ញាសម្គាល់សេនេទិច) | គឺជាដំណើរការបង្កាត់ពូជដោយប្រយោល ដែលអ្នកស្រាវជ្រាវជ្រើសរើសយករុក្ខជាតិដោយផ្អែកលើការវិភាគ DNA (រកមើលសញ្ញាសម្គាល់ភ្ជាប់នឹងហ្សែនល្អ) ជាជាងការរង់ចាំមើលលទ្ធផលផ្លែផ្កាពេលវាធំពេញវ័យ។ | ដូចជាការមើលសៀវភៅបញ្ជាក់គុណភាពពីរោងចក្រមុននឹងទិញម៉ាស៊ីន ជាជាងទិញយកមកប្រើសិនទើបដឹងថាល្អឬមិនល្អ។ |
| Polygenic inheritance (ការទទួលតំណពូជពហុហ្សែន) | គឺជាស្ថានភាពដែលលក្ខណៈរូបសាស្ត្រមួយ (ឧទាហរណ៍៖ ទម្ងន់គ្រាប់សណ្តែក) ត្រូវបានគ្រប់គ្រង និងកំណត់ដោយហ្សែនជាច្រើនតំបន់រួមបញ្ចូលគ្នា ជាជាងពឹងផ្អែកលើហ្សែនតែមួយគត់។ | ដូចជាការសហការគ្នារបស់កីឡាករ១១នាក់ដើម្បីយកឈ្នះក្នុងការប្រកួតបាល់ទាត់មួយប្រកួត ជាជាងពឹងផ្អែកលើកីឡាករឆ្នើមតែម្នាក់ឯង។ |
អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖
ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖