Original Title: Identification, Structural Analysis, and Expression Profile of Genes Related to Starch Metabolism in Cassava (Manihot esculenta Crantz)
Source: doi.org/10.31817/vjas.2019.2.2.02
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

ការកំណត់អត្តសញ្ញាណ ការវិភាគរចនាសម្ព័ន្ធ និងទម្រង់នៃការបញ្ចេញហ្សែនដែលទាក់ទងនឹងការធ្វើមេតាប៉ូលីសនៃម្សៅក្នុងដំឡូងមី (Manihot esculenta Crantz)

ចំណងជើងដើម៖ Identification, Structural Analysis, and Expression Profile of Genes Related to Starch Metabolism in Cassava (Manihot esculenta Crantz)

អ្នកនិពន្ធ៖ Chu Duc Ha (Agricultural Genetics Institute, Vietnam), Nguyen Van Loc (Vietnam National University of Agriculture), Lai Thi Uyen, Pham Phuong Thu, Pham Thi Ly Thu

ឆ្នាំបោះពុម្ព៖ 2019, Vietnam Journal of Agricultural Sciences

វិស័យសិក្សា៖ Agronomy, Bioinformatics

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះផ្តោតលើការខ្វះខាតការយល់ដឹងអំពីតួនាទីរបស់អង់ស៊ីម UGPase ដែលជាអង់ស៊ីមគន្លឹះក្នុងការផលិតម្សៅនៅក្នុងដំឡូងមី (Manihot esculenta Crantz)។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានធ្វើការកំណត់អត្តសញ្ញាណ និងវិភាគហ្សែនទូទាំងសែនណូម (Genome-wide analysis) ដោយប្រើប្រាស់ទិន្នន័យ RNA-seq និងឧបករណ៍ជីវព័ត៌មានវិទ្យា (Bioinformatics tools)។

ការស្វែងរក និងចំណាត់ថ្នាក់ហ្សែន UGPase ក្នុងសែនណូមដំឡូងមី (UGPase Identification in Cassava Genome)
ការវិភាគរចនាសម្ព័ន្ធ និងទីតាំងនៅលើក្រូម៉ូសូម (Structural and Chromosomal Analysis)
ការវិភាគទម្រង់នៃការបញ្ចេញហ្សែនតាមរយៈទិន្នន័យ RNA-seq (Expression Profiling using RNA-seq data)

លទ្ធផលសំខាន់ៗ (The Verdict)៖

សមាជិកចំនួន ១១ នៃគ្រួសារហ្សែន UGPase (MeUGP) ត្រូវបានរកឃើញនៅក្នុងសែនណូមរបស់ដំឡូងមី ដោយ ១០ ក្នុងចំណោមនោះត្រូវបានរកឃើញទីតាំងនៅលើក្រូម៉ូសូមចំនួន ៦ ផ្សេងគ្នា។
ប្រវែងរចនាសម្ព័ន្ធ DNA នៃហ្សែន MeUGP មានចន្លោះពី ៣២០០ ទៅ ១១៦០១ bp ខណៈដែលប្រវែងលំដាប់កូដ (CDS) មានពី ៨៣១ ទៅ ៣៦៥៤ bp។
ផ្អែកលើទិន្នន័យ RNA-seq ហ្សែន MeUGP4 មានការបញ្ចេញកម្រិតខ្ពស់នៅជាលិកាលូតលាស់ចុងដើម (Shoot apical meristem) ចំណែកឯ MeUGP10 បង្ហាញភាពជាក់លាក់នៅជាលិកាលូតលាស់ចុងឫស (Root apical meristem)។

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method)	គុណសម្បត្តិ (Pros)	គុណវិបត្តិ (Cons)	លទ្ធផលគន្លឹះ (Key Result)
Genome-wide Identification (BlastP & Pfam) ការកំណត់អត្តសញ្ញាណហ្សែនទូទាំងសែនណូម (ប្រើកម្មវិធី BlastP និងទិន្នន័យ Pfam)	ចំណាយពេលលឿន និងមានភាពសុក្រឹតខ្ពស់ក្នុងការស្វែងរកហ្សែនគោលដៅ ដោយពឹងផ្អែកលើទិន្នន័យសែនណូមដែលមានស្រាប់។	ពឹងផ្អែកទាំងស្រុងលើគុណភាពនៃការចងក្រងសែនណូម (Genome assembly) ដែលអាចបាត់បង់ហ្សែនខ្លះ (ឧទាហរណ៍ ហ្សែន MeUGP11 មិនត្រូវបានរកឃើញទីតាំងពិតប្រាកដ)។	រកឃើញសមាជិកហ្សែនចំនួន ១១ នៃគ្រួសារហ្សែន UGPase (MeUGP) នៅក្នុងដំឡូងមី និងកំណត់ទីតាំងហ្សែនចំនួន ១០ លើក្រូម៉ូសូមដោយជោគជ័យ។
RNA-seq Expression Profiling ការវិភាគទម្រង់នៃការបញ្ចេញហ្សែនតាមរយៈទិន្នន័យ RNA-seq	ចំណាយថវិកាតិចដោយប្រើប្រាស់ទិន្នន័យសាធារណៈ (Publicly available data) និងផ្តល់ព័ត៌មានលម្អិតពីសកម្មភាពហ្សែននៅតាមជាលិកាផ្សេងៗគ្នា។	ទិន្នន័យអាចមានដែនកំណត់ត្រឹមតែលក្ខខណ្ឌធម្មតានៃការសិក្សាមុនៗ ដោយមិនបានបង្ហាញពីប្រតិកម្មរបស់ហ្សែនក្រោមសម្ពាធអាកាសធាតុ ឬជំងឺឡើយ។	រកឃើញថាហ្សែន MeUGP4 មានការបញ្ចេញខ្លាំងនៅជាលិកាលូតលាស់ចុងដើម (SAM) ហើយ MeUGP10 បញ្ចេញនៅជាលិកាលូតលាស់ចុងឫស (RAM)។
Phylogenetic Analysis (Neighbor-Joining via MEGA 7.0) ការវិភាគមែកធាងវិវឌ្ឍន៍ពូជសាសន៍ (ប្រើវិធីសាស្ត្រ Neighbor-Joining)	ជួយពន្យល់យ៉ាងច្បាស់ពីទំនាក់ទំនងនៃការពង្រីក និងការវិវត្តរបស់គ្រួសារហ្សែន ព្រមទាំងរចនាសម្ព័ន្ធអ៊ិចសុង/អាំងត្រុង (Exon/Intron)។	ទាមទារការជ្រើសរើសទិន្នន័យប្រូតេអ៊ីនដែលមានគុណភាពខ្ពស់ បើមិនដូច្នេះទេអាចធ្វើឱ្យការគូសមែកធាងមានភាពលម្អៀង។	បង្ហាញថាហ្សែន MeUGP ដែលស្ថិតក្នុងក្រុមជាមួយគ្នា ច្រើនតែមានរចនាសម្ព័ន្ធស្រដៀងគ្នា (ឧទាហរណ៍ MeUGP1 និង MeUGP4 មាន ១៣ អ៊ិចសុង និង ១២ អាំងត្រុង)។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះពឹងផ្អែកទាំងស្រុងលើការវិភាគទិន្នន័យជីវព័ត៌មានវិទ្យាលើកុំព្យូទ័រ (In silico analysis) ដែលមិនទាមទារឧបករណ៍ពិសោធន៍ជីវសាស្រ្តថ្លៃៗឡើយ។

Hardware: កុំព្យូទ័រដែលមានសមត្ថភាពមធ្យម និងការតភ្ជាប់អ៊ីនធឺណិតមានលំនឹង ដើម្បីទាញយកទិន្នន័យសែនណូម។
Software: កម្មវិធីវិភាគទិន្នន័យឥតគិតថ្លៃរួមមាន BioEdit, កម្មវិធីគូសមែកធាង MEGA 7.0 និងឧបករណ៍ផ្ទុកលើគេហទំព័រ GSDS 2.0។
Dataset: ទិន្នន័យសែនណូម និងប្រូតេអូមដំឡូងមីពី Phytozome និងទិន្នន័យ RNA-seq សាធារណៈពីការសិក្សាមុនៗ។
Expertise: ចំណេះដឹងផ្នែកជីវសាស្ត្រម៉ូលេគុល ហ្សែន និងជំនាញប្រើប្រាស់កម្មវិធីជីវព័ត៌មានវិទ្យា (Bioinformatics)។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះត្រូវបានធ្វើឡើងដោយអ្នកស្រាវជ្រាវវៀតណាម ដោយប្រើប្រាស់ទិន្នន័យសែនណូមនៃពូជដំឡូងមី 'AM560-2' និងទិន្នន័យ RNA-seq ដែលមានស្រាប់។ ទោះបីជាវាមិនមែនជាពូជក្នុងស្រុករបស់កម្ពុជាក្តី ប៉ុន្តែដំឡូងមីជាដំណាំសេដ្ឋកិច្ចដ៏សំខាន់នៅកម្ពុជា ដូច្នេះការស្វែងយល់ពីហ្សែនគ្រប់គ្រងមេតាប៉ូលីសនៃម្សៅនេះ គឺមានតម្លៃខ្លាំងសម្រាប់ការបង្កាត់ពូជដំណាំនៅពេលអនាគត។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

វិធីសាស្ត្រស្រាវជ្រាវតាមរយៈជីវព័ត៌មានវិទ្យានេះ មានភាពស័ក្តិសម និងមានតម្លៃខ្លាំងណាស់សម្រាប់ការអនុវត្តនៅតាមស្ថាប័នស្រាវជ្រាវនៅប្រទេសកម្ពុជា ដោយសារវាចំណាយថវិកាតិច។

ការបង្កើនទិន្នផលដំឡូងមីនៅខេត្តបាត់ដំបង និងបន្ទាយមានជ័យ (Cassava Yield Improvement): ព័ត៌មានពីហ្សែន MeUGP4 និង MeUGP10 អាចប្រើប្រាស់ជាសញ្ញាសម្គាល់ (Biomarkers) ដើម្បីជ្រើសរើស និងបង្កាត់ពូជដំឡូងមីដែលផ្តល់ទិន្នផលម្សៅខ្ពស់ ឆ្លើយតបនឹងតម្រូវការរោងចក្រកែច្នៃក្នុងស្រុក។
វិទ្យាស្ថានស្រាវជ្រាវ និងអភិវឌ្ឍន៍កសិកម្មកម្ពុជា (CARDI): អ្នកស្រាវជ្រាវអាចអនុវត្តវិធីសាស្ត្រ In silico នេះ ដើម្បីរុករកហ្សែនសំខាន់ៗក្នុងដំណាំផ្សេងៗទៀត (ដូចជា ស្រូវ ឬពោត) មុននឹងសម្រេចចិត្តធ្វើការពិសោធន៍ជាក់ស្តែងក្នុងវាលស្រែ ដែលជួយសន្សំសំចៃធនធាន។
ការអភិវឌ្ឍធនធានមនុស្សនៅសាកលវិទ្យាល័យភូមិន្ទកសិកម្ម (RUA): សាស្ត្រាចារ្យអាចយកលំនាំនៃការសិក្សានេះ ដាក់ជាប្រធានបទសារណាសម្រាប់និស្សិត ដោយប្រើប្រាស់កុំព្យូទ័រ និងទិន្នន័យសាធារណៈ ដើម្បីពង្រឹងជំនាញជីវព័ត៌មានវិទ្យារបស់ពួកគេ។

ជារួម ការប្រើប្រាស់វិធីសាស្ត្រជីវព័ត៌មានវិទ្យានេះ អាចជួយពន្លឿនការអភិវឌ្ឍពូជដំណាំកសិកម្មនៅកម្ពុជា តាមរយៈការកាត់បន្ថយពេលវេលា និងការចំណាយលើការស្រាវជ្រាវបឋម។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

សិក្សាមូលដ្ឋានគ្រឹះជីវព័ត៌មានវិទ្យា និងទិន្នន័យសាធារណៈ: ចាប់ផ្តើមស្វែងយល់ពីមូលដ្ឋានគ្រឹះនៃ DNA, RNA, ហ្សែន និងប្រូតេអ៊ីន ព្រមទាំងរៀនទាញយកទិន្នន័យសែនណូមដំណាំពីមូលដ្ឋានទិន្នន័យសាធារណៈដូចជា NCBI និង Phytozome។
អនុវត្តការស្រង់ទិន្នន័យ និងកំណត់អត្តសញ្ញាណហ្សែន (Gene Identification): រៀនប្រើប្រាស់ឧបករណ៍ BlastP ដើម្បីស្វែងរកលំដាប់ប្រូតេអ៊ីនហ្សែនស្រដៀងគ្នា និងផ្ទៀងផ្ទាត់រចនាសម្ព័ន្ធដូមែន (Domain) តាមរយៈមូលដ្ឋានទិន្នន័យ Pfam។
វិភាគរចនាសម្ព័ន្ធ និងប្រៀបធៀបហ្សែន (Structural Analysis): ដំឡើង និងអនុវត្តប្រើប្រាស់កម្មវិធី BioEdit សម្រាប់វិភាគលំដាប់កូដ DNA រួចប្រើប្រាស់គេហទំព័រ GSDS 2.0 ដើម្បីទាញយករូបភាពរចនាសម្ព័ន្ធ អ៊ិចសុង/អាំងត្រុង។
គូសមែកធាងវិវឌ្ឍន៍ពូជសាសន៍ (Phylogenetic Tree): រៀនប្រើប្រាស់កម្មវិធី MEGA 7.0 ដើម្បីតម្រៀបលំដាប់ប្រូតេអ៊ីន និងបង្កើតមែកធាងវិវឌ្ឍន៍ពូជសាសន៍ ដោយប្រើវិធីសាស្ត្រ Neighbor-Joining ដើម្បីស្វែងយល់ពីទំនាក់ទំនងនៃហ្សែន។
វិភាគទិន្នន័យបញ្ចេញហ្សែន (Gene Expression Analysis): ស្វែងរកទិន្នន័យ RNA-seq សាធារណៈរបស់ដំណាំណាមួយនៅកម្ពុជា ហើយរៀនបកស្រាយកម្រិត FPKM (Fragments Per Kilobase Million) ដើម្បីកំណត់ពីសកម្មភាពហ្សែននៅតាមជាលិកាផ្សេងៗ រួចចងក្រងជារបាយការណ៍ស្រាវជ្រាវ។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស	ការពន្យល់ជាខេមរភាសា (Khmer Explanation)	និយមន័យសាមញ្ញ (Simple Definition)
UGPase (uridine diphosphate glucose pyrophosphorylase) (អង់ស៊ីម UGPase)	ជាអង់ស៊ីមគន្លឹះដ៏សំខាន់មួយនៅក្នុងរុក្ខជាតិដែលមានតួនាទីជួយជំរុញ និងគ្រប់គ្រងដំណើរការនៃការផលិតម្សៅ (Starch synthesis) ជាពិសេសការកកកុញម្សៅនៅក្នុងមើម។	ដូចជាមេចុងភៅដែលលាយបញ្ជូលគ្រឿងផ្សំដើម្បីធ្វើជានំ (ម្សៅ) ទុកជាស្បៀងបម្រុងសម្រាប់រុក្ខជាតិ។
RNA-seq (RNA sequencing) (ការតម្រៀបលំដាប់ RNA)	ជាបច្ចេកវិទ្យាប្រើសម្រាប់វាស់ស្ទង់ថាតើហ្សែនមួយណាត្រូវបានបើកដំណើរការ (Expressed) និងបញ្ចេញសកម្មភាពខ្លាំងកម្រិតណានៅក្នុងជាលិកាផ្សេងៗនៃរុក្ខជាតិនៅពេលជាក់លាក់ណាមួយ។	ដូចជាម៉ាស៊ីនស្កេនដែលថតមើលថាតើរោងចក្រមួយណា (ហ្សែន) កំពុងបើកដំណើរការផលិតទំនិញនៅពេលនេះ និងរោងចក្រណាដែលបិទទ្វារ។
Genome-wide identification (ការកំណត់អត្តសញ្ញាណទូទាំងសែនណូម)	ជាដំណើរការប្រើប្រាស់កុំព្យូទ័រដើម្បីស្វែងរក និងកំណត់ទីតាំងហ្សែនជាក់លាក់ណាមួយ ឬគ្រួសារហ្សែននៅលើទិន្នន័យក្រូម៉ូសូម ឬសែនណូម (Genome) ទាំងអស់របស់សត្វ ឬរុក្ខជាតិ។	ដូចជាការប្រើប្រព័ន្ធកុំព្យូទ័រដើម្បីស្វែងរកឈ្មោះមនុស្ស និងអាសយដ្ឋានរបស់ពួកគេនៅក្នុងសៀវភៅបញ្ជីឈ្មោះប្រជាជនទូទាំងប្រទេស។
Phylogenetic analysis (ការវិភាគមែកធាងវិវឌ្ឍន៍ពូជសាសន៍)	ជាការសិក្សាប្រៀបធៀបលំដាប់ DNA ឬប្រូតេអ៊ីន ដើម្បីស្វែងយល់ពីទំនាក់ទំនង និងប្រវត្តិនៃការវិវត្តរបស់ហ្សែន ឬពូជអម្បូរផ្សេងៗ តាំងពីអតីតកាលរហូតមកដល់បច្ចុប្បន្ន។	ដូចជាការគូសគំនូសវង្សត្រកូល ដើម្បីមើលថាតើនរណាជាបងប្អូនជីដូនមួយនឹងនរណា ហើយមានដូនតារួមគ្នាមកពីណា។
Shoot apical meristem (SAM) (ជាលិកាលូតលាស់ចុងដើម)	ជាកោសិកាដើម (Stem cells) ដែលស្ថិតនៅចុងកំពូលនៃដើម ឬមែករុក្ខជាតិ ដែលមានសមត្ថភាពបំបែកខ្លួនឥតឈប់ឈរ ដើម្បីបង្កើតជាស្លឹក ផ្កា និងដើមថ្មី។	ដូចជារោងចក្រនៅត្រង់ចុងមែកឈើដែលចេះតែផលិតសន្លឹកឈើ និងពន្លកថ្មីៗរហូតមិនចេះចប់។
FPKM (Fragments Per Kilobase Million) (ឯកតារង្វាស់ FPKM)	ជាខ្នាតរង្វាស់ដែលគេប្រើនៅក្នុងការវិភាគ RNA-seq ដើម្បីកំណត់កម្រិតនៃការបញ្ចេញសកម្មភាពរបស់ហ្សែនណាមួយ។ កាលណាតម្លៃ FPKM កាន់តែខ្ពស់ មានន័យថាហ្សែននោះសកម្មកាន់តែខ្លាំង។	ដូចជាកុងទ័រវាស់ល្បឿនម៉ូតូ ដែលប្រាប់ថាតើហ្សែនកំពុងដើរលឿន (សកម្មខ្លាំង) ឬយឺតកម្រិតណា។
Exon/intron organization (រចនាសម្ព័ន្ធអ៊ិចសុង/អាំងត្រុង)	ជារចនាសម្ព័ន្ធខាងក្នុងរបស់ហ្សែន ដែលមាន អ៊ិចសុង (Exon) ជាផ្នែកផ្ទុកកូដសម្រាប់ផលិតប្រូតេអ៊ីន និង អាំងត្រុង (Intron) ជាផ្នែកដែលមិនមានកូដ ហើយត្រូវកាត់ចោលមុនពេលចម្លងជាប្រូតេអ៊ីន។	ដូចជាការកាត់តវីដេអូ ដែលយើងទុកតែឈុតសំខាន់ៗ (Exon) និងកាត់ចោលឈុតដែលខូច ឬមិនសំខាន់ (Intron) រួចតភ្ជាប់គ្នាជាវីដេអូពេញលេញមួយ។
Subtelomeric regions (តំបន់ក្បែរចុងក្រូម៉ូសូម)	ជាតំបន់ដែលស្ថិតនៅក្បែរផ្នែកចុងបំផុតនៃក្រូម៉ូសូម (Telomere) ដែលជាញឹកញាប់ជាកន្លែងដែលហ្សែនមានការវិវត្ត ការចម្លងបន្ត (Duplication) និងបំរែបំរួលលឿនជាងតំបន់ផ្សេង។	ដូចជាជាយក្រុងដែលកំពុងអភិវឌ្ឍ ដែលងាយនឹងមានការសាងសង់បន្ថែមនិងផ្លាស់ប្តូររហ័ស ជាងតំបន់កណ្តាលក្រុងដែលមានសភាពស្ងប់ស្ងាត់។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖

ប្រធានបទ និងសំណួរស្រាវជ្រាវដែលទាក់ទងនឹងឯកសារនេះ ដែលអ្នកអាចស្វែងរកបន្ថែម៖