小麦F-box基因全基因组鉴定及不同发育时期的表达分析外文翻译资料

 2023-01-07 15:47:29

小麦F-box基因全基因组鉴定及不同发育时期的表达分析

摘要:F-box基因家族在植物开花、昼夜节律调节、光形态发生、种子发育、叶片衰老和激素信号转导等生命进程中通过翻译后修饰在蛋白质降解方面发挥重要作用。F-box基因家族的研究尚未在全物种基因组范围内进行,但是小麦(Triticum aestivum L.)全基因组参考序列的公布使小麦F-box基因的鉴定成为可能。小麦F-box基因家族共有1796个F-box基因,根据C端结构域的不同可分为多个亚家族。小麦F-box基因分布在21条染色体上,由于小麦基因组中存在异六倍体,所以大多数F-box基因与同源染色体上的F-box基因序列同源性较高。此外,本研究还对小麦、水稻和二穗短柄草的F-box基因进行综合分析。小麦不同发育时期的转录组数据和qRT-PCR表达分析结果表明,部分F-box基因在营养和/或种子发育阶段特异性表达。小麦F-box基因鉴定和分类为阐明小麦F-box基因的生物学功能提供可能。

关键词:发育阶段;F-box蛋白;小麦

1 前言

植物的生长发育过程受到多种机制的调节,例如基因表达、蛋白质合成、蛋白质修饰、蛋白质降解以及分子间互作。泛素—蛋白酶体系统通过26S蛋白酶体选择性调节蛋白质降解,是细胞内多种蛋白质翻译后修饰的关键机制。泛素—蛋白酶体系统在信号转导、代谢调节、分化,细胞周期转变和应激反应的调控中发挥重要作用[1,2]。泛素—蛋白酶体系统包括3步级联反应:(1)泛素激活酶E1激活三磷酸腺苷依赖的泛素分子,(2)活化的泛素分子转移给泛素结合酶E2,(3)泛素分子通过泛素连接酶E3与底物蛋白相连[3]。目前的研究已在不同的植物基因组中发现了数百种不同的泛素连接酶E3[4],泛素连接酶E3的数量具有物种特异性[5]。已知几种类型的E3泛素连接酶的特点是存在特定的结构域,包括与E6-AP同源的C端结构域和U-box结构域,以及Cullin-Ring泛素连接酶。RING/U-box能以单个组分起作用,直接将泛素转移到靶蛋白上,而Cullin-RING泛素连接酶是与Skp1-Cullin-F-box(SCF)复合物共同发挥作用的多组分复合物[6]

SCF复合体由Skp1、Cullin、Rbx1和F-box蛋白共同组成,广泛存在于多个物种中[7]。Cullin是SCF复合物的主要结构支架,将Skp1与Rbx1相连,且Skp1通过底物识别结构域与F-box蛋白相连[8]。F-box蛋白的N端有60个氨基酸左右的保守F-box (FBX)结构域,C端具有招募蛋白酶体降解的靶蛋白的蛋白质互作结构域,这些结构域通常作为分类依据。F-box蛋白的C端区含有多种蛋白质-蛋白质相互作用结构域,如富含亮氨酸的重复序列、WD40、Kelch重复序列、F-box相关结构域(FBA)或Tubby (Tub),它们与靶底物结合,赋予F-box蛋白特异性[9]

不同植物基因组中F-box基因家族的数目各有不同。水稻、蒺藜苜蓿、大豆和拟南芥中分别含有678、913、480和656个F-box蛋白[10]。植物基因组中大量F-box蛋白的存在表明,许多SCF复合物通过翻译后修饰在多个生物学过程中调节各种底物并发挥特定的调控作用,如调控开花和昼夜节律[11]、光形态发生[12]、叶片衰老[13]、花器官发育[14]、侧枝分枝[15]、赤霉素信号[16]和生长素信号[17]。拟南芥F-box蛋白的功能研究正在进行,但是小麦F-box蛋白的功能探索还未展开。除此之外,小麦F-box基因尚未按照C端结构域结构分类。

小麦是异源六倍体(2n=6x=42;AABBDD),其庞大的基因组约为17Gbp,由三个密切相关的同源亚基因组组成,其中包含高百分比的重复序列和同源DNA拷贝。本研究参考国际小麦基因组测序联盟(IWGSC)提供的染色体调查序列组装(IWGSC2014)的小麦基因组TGACv1[18],该文件读取了染色体手臂特异性染色体调查序列[19]。近期,中国春面包小麦品种的参考序列与基因注释公开发表[20]。在目前的研究中,基于对小麦基因组的隐马尔可夫模型(HMM)检索,对F-box基因进行了识别、选择和分类,构建系统发育树,并对1796个F-box基因进行染色体定位。对小麦F-box蛋白和水稻F-box蛋白进行共线性分析,并将其作为单子叶植物的分析模型[21]。此外,使用转录组数据对小麦的F-box基因进行不同发育阶段的表达谱分析,包括营养阶段和生殖阶段。本研究的结果提供了F-box蛋白分类和表达的新信息,以上信息可能对小麦不同发育阶段的功能研究具有重要意义。

2 材料与方法

2.1 小麦F-box基因的序列分析和鉴定

IWGSC小麦参考序列v1.0 (https://urgi.versailles.inra.fr/download/iwgsc/IWGSC_RefSeq_Annotations/v1.0/)由Uniteacute; de Recherche Geacute;nomique Info (URGI, https:/urgi.versailles.inra.fr/)提供。利用Pfam数据库提供的F-box (PF00646)、F-box-like (PF12937)、F-box-like2 (PF13013)、FBA1 (PF07734)、FBA2 (PF07735)、FBA3 (PF08268)和FBD (PF08387)结构域的HMM文件对F-box蛋白进行了HMM分析[22]并使用HMMER3对小麦基因组蛋白数据库进行搜索,参数保持默认设置[23]。剔除C端不含有F-box结构域的冗余F-box基因,C端含有FBX的F-box基因则使用SMART[24]和Pfam数据库(Elt;1times;10-5)进行验证。此外,选择Blast2GO生物信息学平台进行F-box基因的功能注释[25]。利用Local BlastX对NCBI检索的禾本科植物家族序列进行肽序列分析,启动基因本体(GO)分析,以构建XML文件。利用UniProt数据库检索基因名称、GO术语和蛋白质序列,参数保持默认设置(Elt;1times;10-6, annotation=55, GO weight=5)。

2.2 系统发育分析和染色体定位

使用ClustalW中的邻接法对选定的小麦F-box蛋白质序列进行系统发育分析(ph文件;Newick格式),并构建进化树(Bootstrapping=1000)。利用ITOL工具构建F-box基因的系统发育树,并利用ClustalW生成文件[26]。使用来自IWGSC参考序列v1.0的信息确定F-box基因的染色体位置,然后使用MapChart2.30[27]绘制染色体定位图。

2.3 F-box基因的共线性分析

从Ensembl数据库(http://plants.ensembl.org/)下载URGI提供的IWGSC参考序列v1.0以及二穗短柄草和水稻基因组序列,用于F-box基因的共线性分析。利用BLASTP算法预测小麦F-box基因与同源染色体基因的序列同源性,当Elt;1times;10-10,序列同一性为90%,位核gt;500,三个子基因组(AA、BB、DD)的同源DNA拷贝具有较高的序列相似性。在小麦对二穗短柄草和水稻的综合分析中,BLASTP的Elt;1times;10-10,序列同源性为gt;80%。Circos用于基因组内和基因组间比较[28]

2.4 植物材料

研究材料选用Woori-mil (Korea RDA accession no.IT172221)times;D-7(韩国大学开发的一种自交系,Fleming*4/3/PIO2580/T83103*2/Hamlet)杂交F10代的单株植物中进化出来的普通小麦[29]。种子于4℃处春化4周以同步生长,然后转移到漂浮在Hoagland溶液上的聚丙烯网(Sigma-Aldrich,St. Louis, MO, USA)的植物培养容器(72times;72times;22mm3; SPL Life Sciences, Seongnam, Gyeonggi-do, Korea)。植物生长于23-26℃和16h/8h环境中。以Zadoks生长量表(Z)[30]为参考,在不同的发育阶段收集了以下植物样品的三个独立的生物重复:Z13叶(三个叶片出现;第1阶段)、Z24叶(主茎和四个分蘖存在;第2阶段)、Z51叶(耳尖叶片刚刚可见,孕穗阶段;第3阶段)、Z61小穗(花期开始;第4阶段)、Z73小穗(早期发育;第5阶段)、Z83小穗(蜡熟初期;第6阶段)和Z91小穗(硬粒期;第7阶段)。每个采集样品在-80◦C下保存,用于后期实验分析。

2.5 RNA测序与表达分析

利用TRIzol试剂(Invitrogen, Waltham, MA, USA)从第1至第4阶段提取叶片总RNA,并用DNaseI处理,以消除基因组DNA污染。根据Meng等人的研究成果[31],从第5期到第7期发育种子的提取总RNA,有效抑制RNA酶活性,从多糖中分离提取最大RNA溶解度。使用Agilent2100生物分析仪(AgilentTechnologies, Amstelven, The Netherlands)评估RNA质量,并使用ND-2000分光度计(ThermoInc., Wilmington, DE, USA)进行RNA定量。从样品中提取的总RNA (10micro;g)用TruSeq RNA样品制备试剂盒(目录#RS-122-2001; Illumina, San Diego, CA, USA)构建RNA测序(RNA-Seq)配对端库。使用Poly (A) RNA选择试剂盒(LEXOGEN, Inc., Vienna, Austria)分离mRNA,并根据使用说明反转录成cDNA。使用Agilent2100生物分析仪检查文库,使用DNA高灵敏度试剂盒评估平均片段大小。使用HiSeq2000平台(Illumina)进行高通量测序[32]。在对齐之前,使用BBduk工具(最小长度gt;20和Qgt;20)去除适配器序列并测试序列质量。构建基因组序列的索引,并使用带有默认参数的HISAT2比对程序将所有读取与小麦基因组序列对齐。使用HTSEQV0.6.1高通量测序框架工作来计数映射到每个基因外显子的读取数量[33]。计算读取每百万个映射读取(RPKM)值的每千个转录本的log2转换,并利用R软件构建了F-box基因在不同发育阶段表达的热图。采用MeV软件对差异表达的F-box基因进行k均值聚类[34]。为了进行定量实时(QRT)-PCR分析,每个RNA样品用DNaseI处理以完全消化污染基因组DNA,并使用PowercDNA合成试剂盒(iNtRON Biotechnology, Seongnam, Gyeonggi-do, Korea)合成第一链cDNA,总RNA为1micro;g,使用iCycleriQTM Real-Time PCR系统(Bio-Rad, Hercules, CA, USA)在25micro;L的反应体积内合成2times;SYBR预混料Ex TaqII (Takara, Shiga, Japan)。利用K均值聚类法对F-box蛋白序列进行比较。根据选定的F-box基因特异性同源区域设计qRT-PCR引物并验证(表S1)。

3 结果

3.1 小麦F-box全基因组鉴定

利用小麦基因组蛋白数据库HMMER3工具对小麦F-box蛋白进行HMM谱分析,共鉴定出4363个F-box基因。对候选F-box基因进行重新验证,利用SMART和Pfam剔除含有冗余序列的基因,从而获得具有FBX结构域的基因。结果共选择含有FBX结构域的1796个F-box基因进行研究(表S2)。根据F-box蛋白含有的FBX结构域和其他结构域将F-box基因分为10个亚家族。肽序列N端仅含有一个FBX结构域的基因是小麦基因组中最丰富的基因亚群(1370个基因)。其他亚家族基因含有的结构域为FBA、FBD、DUF295、Kelch、Tub、PP2、Arm和Cupin_8。这些亚家族中的每一个基因N端含有FBX结构域,C端含有一个或多个已知的功能结构域。小麦基因组中FBA、FBD、DUF295、Kelch、Tub、PP2、Arm和Cupin_8亚家族分别含有101、10

剩余内容已隐藏,支付完成后下载完整资料


英语原文共 16 页,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[271456],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。