拟南芥中编码主要内在蛋白的完整基因为植物中主要内在蛋白的命名提供新框架外文翻译资料

 2023-03-28 13:02:47

拟南芥中编码主要内在蛋白的完整基因为植物中主要内在蛋白的命名提供新框架

作者:Urban Johanson*, Maria Karlsson, Ingela Johansson, Sofia Gustavsson, Sara Sjouml;vall, Laure Fraysse, Alfons R. Weig, and Per Kjellbom

单位: Department of Plant Biochemistry, Lund University, P.O. Box 117, SE–221 00 Lund, Sweden (U.J., M.K., I.J., S.G., S.S., L.F., P.K.); and Department of Plant Physiology, University of Bayreuth, Universitauml;tsstrasse 30, D–95447 Bayreuth, Germany (A.R.W.)

摘要:

主要的内在蛋白(MIPs)促进了小极性分子跨膜的被动运输,MIPs构成了一个非常古老的蛋白质家族,在各种生物体中都发现了不同的形式,包括细菌、真菌、动物和植物。在拟南芥的基因组序列中,我们已经鉴定出了35个不同的MIP编码基因。根据序列相似性,这35个蛋白分为4个不同的亚家族:质膜内在蛋白、液泡体内在蛋白、NOD26样内在蛋白也被称为NOD26样MIPs,以及最近发现的小型基本内在蛋白。在拟南芥中,有13个质膜内在蛋白,10个液泡体内在蛋白,9个NOD26样内在蛋白和3个小的基本内在蛋白。基因结构在每个亚家族中通常是保守的,尽管有丢失内含子的趋势。基于玉米(Zeamays)和拟南芥MIPs(AtMIPs)的系统发育比较,认为该亚科的一般内含子模式是在单子叶和双子叶分裂之前形成的。虽然每个亚家族的基因结构都是独特的,但在其中三个亚家族中,跨膜螺旋在外显子上的编码有一个共同的模式。植物MIPs的命名法在不同的物种之间差异很大,但在同一物种的亚科之间也差异很大。基于所有AtMIPs的系统发育基础,提出了一种新的、更一致的命名法。完整的AtMIPs,连同新的命名法,将有助于从其他物种中分离、分类和标记植物MIPs。

  1. 引言

膜的疏水内部构成了小极性分子快速流动的屏障,主要的内在蛋白质(MIPs)的大型进化保守家族已经进化到促进小极性分子如水和/或甘油通过细胞膜,从细菌到真菌、动物和植物的被动流动。专门运输水的MIP被称为水通道蛋白(AQPs)。膜的通透性通过不同MIPs数量的调节来积极控制,但在某些情况下也通过通道的磷酸化/去磷酸化来控制。植物MIPs可以根据其序列相似性分为不同的亚科。其中两个亚家族以它们在细胞中的主要位置命名,即质膜内在蛋白(PIPs)和液泡体内在蛋白(TIPs)。第三个亚家族被命名为NOD26样MIPs(NLMs;Weig等人,1997)或NOD26样内在蛋白(NIPs;Heymann和Engel,1999)。NOD26是该亚科中第一个被鉴定的成员,位于大豆根瘤中固氮共生体的类菌膜周围(甘氨酸max;Fortinetal.,1987)。这三个亚科在植物中的功能已经得到了广泛的回顾。最近在植物中提出了一个新的第四个MIP亚科。这个亚家族被称为小的基本内在蛋白(SIPs),因为这些蛋白质相对较小,类似于TIPs,但不同于TIPs,因为它们是基本的PIPs。SIPs的底物特异性和细胞内定位尚不清楚。

最近,来自大肠杆菌的甘油促进剂(GlpF)和来自人的水通道(AQP1)的结构分别为2.2和3.8a。尽管存在巨大的进化距离和底物特异性的差异,但两个MIP的整体折叠非常相似(Unger,2000)。由于序列中的直接重复,MIP具有内部对称性。MIP的每一半由两个跨膜螺旋组成,然后是一个带有氨基酸基序Asn-ProAla(NPA)的保守环,并以第三个跨膜螺旋结束。N端和C端以及第一个NPA盒都位于细胞膜的细胞质表面。由于重复序列中跨膜螺旋的数量不均匀,蛋白质后半部分的跨膜螺旋和NPA基序的方向与前半部分相反。NPA盒子后面的序列实际上形成了两个半跨膜螺旋,它们从相反的两侧插入到膜中,并通过两个短螺旋n端两个NPA盒子之间的相互作用相互连接。跨膜区域一起形成一个孔,允许底物绕过膜的疏水部分。GlpF孔内的大部分极性相互作用位点是由高度保守的NPA区域形成的,这些区域一起形成一条极性条纹,允许甘油通过孔。然而,SIPs与GlpF和AQP1的比对显示,SIPs内的极性衬里不同,这表明SIPs与GlpF和AQP1具有不同的底物特异性。MIP结构将成为试图理解不同类别MIPs之间初级结构差异的功能后果的不可或缺的工具。

植物MIPs的命名法令人混淆,在不同的物种和不同的MIP亚科之间也存在差异。个体名称有时反映了MIP是如何被诱导的,蛋白质的大小,与其他MIP的相似性,或者完全没有信息。在大多数已分离出MIPs的植物物种中,已知的MIPs只有很少。在这种不完整的知识上,很难建立一个一致和系统的命名法。拟南芥基因组序列为首次在植物中获得完整的MIPs提供了一个独特的机会,这将为其他植物中MIPs的分类提供了一个框架。然而,来自拟南芥(AtMIPs)的MIPs的名称并不总是一致的或提供有关系统发育关系的信息。这可以通过一种基于系统发育分析的新的AtMIPs命名法来实现,其中这些名称以系统的方式反映了进化稳定的不同分支。新命名法应限于植物基因命名法委员会(CPGN)提出的建议,但也应尽可能保留旧名称,以促进将旧名称翻译为新名称。

本文用不同的系统发育方法对完整的AtMIPs进行了描述和分析。提出了一种新的、更一致的AtMIP命名法。此外,还介绍了所有AtMIP基因的结构,并与基于序列的系统发育分析进行了比较。并对植物MIP的功能方面进行了简要的总结。我们希望这将有助于其他植物的分类,并希望建议的命名法将被接受为标准并用于其他植物。

  1. 结论

2.1 鉴别

拟南芥基因组的完整序列使得识别植物中的所有MIP基因成为可能(拟南芥基因组计划,2000年)。在GenBank中通过blast搜索发现了35个编码完整AtMIPs的不同基因(表I)。此外,还发现了5个编码部分MIP类序列的基因。这些基因要么是部分的,要么被过早的终止密码子打断,因此被认为是无功能的假基因,因为它们缺乏在所有MIPs中保守的完整的跨膜区域。使用TFASTA搜索得到了两个额外的假基因,都与F5I10.2的部分相似,但没有发现额外的全长基因。为了鉴定新的AtMIP基因,并确保基因编码序列的正确注释,将每个基因与之前鉴定的基因进行比较,并克隆出编码AtMIPs的cdna。大多数AtMIP基因的基因组序列注释都是正确的。然而,对于少数基因来说,基因组序列中编码序列的不同注释可能是由于cDNA序列或由于同源性的原因。表一中指定的这些外显子的替代分配,用于本文的所有翻译和分析。

从拟南芥基因组计划中产生的基因组序列中,共鉴定出了15个新的AtMIPs。除AtNIP3;1之外,所有这些都在其他地方描述过。基于AtMIPs的系统发育研究,提出了一种新的、更一致的命名法。

2.2 系统发育与新命名

使用所有AtMIPs的完整对齐长度,距离法得到一棵树(图1)。AtMIPs显然被分为四个不同的亚科,PIPs、TIPs、NIPs和SIPs。这些亚家族的旧名称被保留,除了前NLM亚家族,其中NIP是首选,使命名更加统一(Heymann和Engel,1999)。每个亚家族均可进一步细分为相关蛋白组。AtMIPs的建议名称包括亚家族名称,后面跟着一个表示MIP所属组的数字和一个表示组中的单个MIP的数字。为了在所有组中达到近似相同的差异,在每一组内接受的最大距离为30%。只有两对AtNIPs足够相似,可以根据最大距离为30%的标准形成组。对于AtSIPs,保留SIP1和SIP2s。综上所述,分别只有2个AtPIP和AtSIP组,但分别有5个和7个AtTIP和AtNIP组。这是这些亚科分化差异的结果。AtPIPs构成了一个比任何其他亚科都更同质的亚科。如果将最大散度设置得较低,以尝试将AtPIP2;7和AtPIP2;8作为一个单独的组,那么AtTIP1;3也将形成自己的组。最近发现的AtSIPs在亚科内也有大量的序列变异,同时与其他植物的MIPs非常不同,如树中的长分支所示(图1;Chaumontetal.,2001)。散度的下限将导致三个AtSIP组。

为了提出一种新的命名方法,可以用于从其他植物物种的MIPs分类,重要的是,在拟南芥中识别的类群是稳定的,不依赖于任何特定的系统发育方法。将距离树(图1)与用简约法生成的两个最短的树进行了比较(未显示)。这三棵树的拓扑结构几乎相同,但atpip2的系统发育有一些微小的变化。另一个小的区别是,在简约树中,2个AtTIP2是AtTIP4;1的基础。然而,所有定义的组都是稳定的,并且没有被任何一种方法分割。

AtMIPs的细胞质N端和c端区域的对齐包含了许多间隙,因为这些区域即使在亚家族内也是高度可变的。同源位点的有意义的比对只能进行到最接近的AtMIP同源物。当AtMIPs与其他物种的同源物进行比较时,这些区域也不那么保守。为了调查这些高度可变的区域是否对atmips的分类至关重要,这些区域被排除在分析之外。尽管这些组在树中的位置有一些变化,但无论使用距离法还是简约法,这些个体组都保持稳定。

一种测量系统发育稳定性的方法是计算引导值。对atmip的全长对齐进行了引导测试。用距离法重复100次的结果如图2所示。使用距离法,在至少93%的重复中支持所有的亚家族。使用简约方法生成的引导值通常较低,对AtTIP分支的支持度最弱,只有75%。然而,所定义的组在两种方法中都非常稳定,在距离方法和简约方法中,引导值分别等于或大于99%和89%。从引导值可以清楚地看出,AtPIP2s的内部系统发育和AtTIP类群之间的关系不是很稳定。这些较低的引导值与观察到的用不同方法生成的系统发育树之间的变化相一致(见上文)。

2.3 基因结构

比较所有AtMIP基因的基因结构,发现每个亚家族中内含子的确切位置是独特的、保守的(图3)。此外,内含子的数量一般都是特定于每个亚家族的。所有的AtPIPs都有三个内含子,AtSIPs有两个,大多数AtNIPs都有四个内含子。在AtTIPs中,模式更加多样化;一半的基因有两个内含子,另一半的基因只有一个或没有一个内含子。根据图1中的系统发育树,对AtTIPs中观察到的基因结构的最简单的解释是,内含子1在AtTIP1s和其中两个AtTIP2s中独立丢失。这些可能是独立的事件,因为没有迹象表明这一半的基因有更高的相似性,这表明没有内含子的一半是从一组复制到另一组的。在AtTIP1;3中,第二个内含子也随后丢失了。同样,AtNIPs中与保守基因结构的偏差表明,第二个内含子在AtNIP2;1和AtNIP5;1中独立丢失。此外,第三个内含子在AtNIP3;1中丢失。鉴于AtNIP之间的高度相似性,在这个亚家族的保守基因结构中只有一个例外也就不足为奇了。在AtPIP2;4中,内含子2的位置由于插入一个新的内含子和旧的内含子2的丢失而发生了改变。

关注亚家族的初始基因结构,在内含子丢失之前,跨膜螺旋在外显子上编码的方式组织有一些共同的特征。除AtTIPs外,所有亚家族的螺旋1和螺旋2一起编码在一个单独的外显子上,螺旋3和螺旋4编码在下一个外显子上,螺旋6单独编码在最后一个外显子上。这表明pip、NIPs和sip的共同祖先具有这种类型的基因结构。螺旋5的编码更为多样化。在AtPIPs和AtNIPs中,螺旋5由一个单独的外显子编码,但在AtTIPs和AtSIPs中,螺旋5与螺旋4和螺旋6一起编码,分别与螺旋3和螺旋4一起编码。

  1. 讨论

3.1 鉴定、系统发育和新的命名法

对于一个新发现的蛋白质或一个基因,这个序列通常是第一个,有时也是唯一已知的东西。在大多数情况下,人们会进行爆炸搜索,试图对基因或蛋白质进行分类,以从已经有特征的同源物中了解蛋白质的功能。为了便于鉴定与从其他植物物种中分离出的MIPs或MIP基因最相似的AtMIPs,我们编制了所有AtMIPs的综合列表(表1)。该列表还提供了重要的信息,说明哪些MIPs也可以在其他植物中使用,并可以作为搜索其他物种中MIPs的起点。

从基因组序列中鉴定出35个不同的完整AtMIPs。慕尼黑蛋白质序列信息中心(http://mips.gsf.de/proj/thal/db/tables/tables_func_main.html#pfam)在对MIPpFAM的搜索中也发现了其中33个AtMIPs基序PF00230。在35个基因(加州大学圣地亚哥分校)网站上,所有33个假基因都被列为MIPs,水亲水性图的拓扑分析可在http://www.cbs.umn.edu/Arabidopsis/atprotdb2/famMIP.htm.获得植物MIPs被细分为PIPs、TIPs、NIPs和SIPs四个亚科(约翰逊,2000年7月在瑞典高uml;德堡举行的MIP2000会议上;肖蒙等人,2001年;约翰逊和古斯塔夫松,未发表的数据)。在拟南芥中有13个PIPs,10个TIPs,9个NIPs和3个SIPs。在这35个AtMIPs中,只有AtNIP3;1以前没有报道过。在35个AtMIPs中

剩余内容已隐藏,支付完成后下载完整资料


英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[597781],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。