今天解读的文献是发表在Molecular Plant上的《An angiosperm NLR atlas reveals that NLR gene reduction is associated with ecological specialization and signal transduction component deletion》
,该研究通过构建被子植物NLR抗病基因数据库(ANNA),深入分析NLR基因的演化规律,发现了不同演化分支的被子植物在适应特殊环境过程中NLR抗病基因显著减少的现象。
背景介绍
为了能够在植物与病原体的战争中生存,植物进化出了两层的免疫系统:模式触发免疫(PTI)和效应因子触发免疫(ETI)。
PTI模式触发免疫是通过细胞表面的模式识别受体(PRRs)触发的,包括受体激酶(RKs)或受体类激酶和受体类蛋白,它们赋予对病原体的广泛抵抗力。
一些适应性强的病原体通过向宿主细胞输送效应因子来干扰PTI,成功地逃避了植物防御反应。
细胞内核苷酸结合的富含亮氨酸的重复受体**(NLRs)** 直接或间接地感知效应因子并触发植物的ETI,通常导致比PTI更强的防御反应和局部细胞死亡的超敏反应,以下是关于PTI和ETI的机制示意图。
植物应对环境中复杂多变的病原环境而形成了一类具有特殊功能的基因——植物抗病基因,NLR(核苷酸结合位点富含亮氨酸重复序列受体)基因是其中数量最多、功能最重要的一个基因家族,包括RNL、TNL和CNL三个不同的功能亚类。
NLR基因拷贝数和亚支组成在不同植物物种的基因组中变异很大,但是由于缺少足够代表性的植物基因组,因此基因组NLR含量和生态适应性或者NLR含量和信号转导之间的演化关联还不清楚。
ANNA 数据库
研究人员建立了被子植物37个目85个科305个物种基因组、包含90000多条NLR基因的被子植物NLR基因数据库ANNA(https://biobigdata.nju.edu.cn/ANNA/),该数据库提供了在线交互式数据检索查询功能,主要包括不同基因组之间的NLR基因对比、NLR基因序列查询、在线blast比对等功能。
数据库中包括包括18707个TNL基因、70737个CNL基因和1847个RNL基因。大部分基因组的NLR基因从5个到2000多个不等,以下是不同物种统计到的NLR基因数量:
所有鉴定出的NLR基因构建了ANNA数据库,这是一个公开的免费网站,允许用户浏览、下载并对感兴趣的NLR数据集进行初步
比较分析。数据库提供了快捷查询不同物种基因组中NLR基因详情的功能,通过选择科属种等信息,即可获得结果。
另外还提供了查询序列详情的页面,访问者选择物种和NLR类别后能够快速查询到对应的序列信息。
ANNA植物抗病基因数据库为研究人员从NLR基因的结构、功能、演化等角度研究和利用植物抗病基因提供了一个公共服务平台和数据资源,通过该数据库能够方便快捷的获得不同植物基因组中NLR基因的概况和对应信息。
不同基因组NLR数量差异
根据系统发育关系构建如下进化树,蓝色条形图表示不同基因组中NLR数量的多少,可以发现即使在同一进化枝内,NLR 数量在基因组之间也存在巨大差异。
为了检验NLR基因数量在近缘物种之间的差异程度,研究人员计算了85个科中NLR基因数量最多的物种与NLR基因数量最少的物种之间NLR基因数量的倍差。
各个基因组中NLR基因的拷贝数也有较大差异,下图展示了NLR基因拷贝数最大倍差,其中实心紫色圆点表示差异倍数超多5倍,共有17个物种基因组中NLR基因拷贝数超过5倍。
说明NLR基因的扩增和收缩可以在物种形成过程中发生变化,并可能促进植物对多变的致病环境作出快速反应。
但是,NLR基因数量在5个主要被子植物分支中没有显著差异(wilcoxon 检验),表明种间 NLR 含量变异在主要被子植物进化枝中普遍存在。
在所有被研究的基因组中,水生植物、寄生植物和食肉植物的 NLR 基因平均比其他被子植物基因组少得多,这是一个很有意思的现象。可能是由于水生环境下病原菌较少,NLR基因在长期演化过程中呈现收缩趋势。
在12个水生植物基因组中,有7个基因组的NLR基因少于100个,另外有4个基因组的NLR基因数量不超过200个。这表明NLR基因在植物适应水生环境过程中逐渐减少,这个过程受到基因组大小和环境等多方面因素的影响。
研究人员还发现寄生类植物中NLR数量也明显减少,不同基因组中NLR基因趋同性减少与寄主的生活环境有关,表明特定的生活环境塑造了植物多样性的NLR图谱。
NLR 不同亚类进化关系
被子植物共有三个NLR亚类,数据显示在305个基因组中的291个基因组中,TNL和CNL亚类加起来占所有NLR基因的90%以上。
CNL基因是268个被子植物基因组中最常见的NLR基因,而TNL基因是仅36个基因组中最常见的NLR基因。
上图右下角相关性图展示了NLR总基因数量与CNL基因数量之间存在显著的相关性,这可能是由于大多数被子植物基因组中CNL基因的相对丰度较高。同时还发现TNL和CNL基因数量之间的相关性很弱,这表明这两个NLR亚类可能在某些物种中独立进化。
TNL缺失与信号转导有关
数据显示TNL亚类丢失现象频繁发生于双子叶植物中,在230个双子叶植物基因组中有23个出现TNL完全缺失。下图是三个NLR亚类在各基因组中数量差异情况,可以看出TNL丢失现象在进化过程中频繁发生,在调查的13种唇形科植物中,有9种缺乏TNL基因,剩下的四个物种没有形成单一的基础单系分支,而是分散在拉米亚目中。
这一结果表明,在整个唇形目进化过程中,至少有5个独立的TNL丢失,类似的情况也在其他物种基因组中检测出现,研究人员一共发现了至少22个独立的TNL丢失事件,说明一直以来持续发生的全基因组水平TNL清除现象。
作者在305个植物基因组中鉴定发现NRG1和SAG101是最常丢失的基因,这些基因在104个基因组中均缺失,另外还发现在缺乏TNL的93个基因组中,有89个同时丢失了NRG1或SAG101,其中63个同时丢失了两个基因。这些基因的缺失很有可能是在漫长演化过程中发生,TNL缺失与信号转导基因NRG1和SAG101缺失之间具有很强相关性,说明TNL亚类与信号转导之间具有很强的关联。
除了89个基因组缺少TNL以及NRG1和SAG101外,还有20个基因组携带TNL但缺少NRG1和SAG101。只有4个基因组携带NRG1和SAG101但是缺少TNL,这表明在被子植物基因组中,NRG1和SAG101的丢失通常先于TNL的丢失,NRG1和SAG101的缺失可能会导致被子植物基因组中TNL基因减少。
TNL亚类趋同保留现象
有两种不同的机制可能导致这些NRG1/SAG101缺失的物种中TNL基因保留,一是这两个基因的缺失发生的时间比较接近,那么TNL基因还没来得及反应导致保留下来,二是TNL基因可能还存在一个独立于NRG1/SAG101的通路。
拟南芥(A. thaliana)、番茄(Solanum lycopersicum)和毛蕨(Amborella trichopoda)的TNL序列进行系统发育关系分析。在被检测的27个基因组中,有23个保存了一个TNL谱系,反映了一种保守的进化模式。
为了证实保守的TNL基因是同源关系,研究人员对4个物种的TNL谱系进行综合分析,发现TNL在这四个物种形成了排列良好的染色体块,证明了这些TNL基因之间的同源关系。这些基因广泛分布,并且具有保守的染色体背景,表明这可能是被子植物中比较保守的TNL基因谱系。
鉴定TNL信号转导信号
在89个物种中,TNL与NRG1和SAG101同步丢失,暗示可能存在其他TNL蛋白的关键信号成分。为了验证这一假设,研究人员首先在携带TNL、NRG1和SAG101的5个物种中发现了23个同源类群(简称OGs),而在缺乏这3个基因的5个物种中进行同源检测,进一步研究这23个OGs在物种中的丢失情况,发现在63个基因缺失TNL和NRG1、SAG101的基因组中,超过50%基因组也丢失了5个OGs,这5个OGs通过GO注释发现主要与信号转导、转录调控、跨膜转运活性等有关。
为了探究这些基因在触发免疫调控中的作用,作者进行表达模式分析,感染丁香假单胞菌DC3000后,拟南芥OG 4、6和8中的AT2G33720、AT2G04795和AT2G47270基因表达上调,被TNL蛋白RPS4识别。
NLR基因的扩张和收缩
NLR基因数量在物种间的变化已被广泛研究,不同物种中NLR基因数量变化倍数比较大,例如在小麦中NLR基因的数量明显较多,这种极端的差异表明NLR基因在进化过程中发生扩张或收缩现象。
外部环境影响
陆地和水里具有不同的环境特征,植物在这两种环境下的生活方式也具有明显差异,研究发现水生植物中NLR基因数量明显少于陆生植物,具有趋同性收缩规律。此外,在肉食性和寄生性植物中NLR基因的数量均呈现减少趋势,这些结果生态适应可能导致NLR数量降低。
水生植物、肉食性植物、寄生性植物三种具有特殊生活环境,它们有一个共同的特征,根系比较小,并且与其他植物相比,它们根系与周围微生物的物理接触明显较少,导致潜在的病原体直接相互作用减弱,选择压力降低,从而导致这些物种的NLR基因数量趋同减少。
内部信号通路影响
几乎所有的CNL和TNL蛋白都参与植物免疫,要么通过与效应蛋白的直接相互作用,要么通过使用诱饵机制的间接识别,长期的演化推动了NLR基因的扩张。研究表明,大多数TNL蛋白依赖于RNL来获得完全抗性,效应识别后,TNL蛋白的二聚化或四聚化激活了TIR结构域的NADase,随后将防御信号传递给下游的EDS1–SAG101
或EDS1–PAD4
复 合 物,在305个被子植物基因组中,TNL拷贝数与NRG1拷贝数高度相关。此外,在几十个物种中观察到NRG1/SAG101和TNL的共同缺失。
综上所述,研究人员建立了一个包含300多个被子植物基因组的NLR基因的数据库ANNA,涵盖了大多数被子植物的主要分支。这个大型数据集可以作为探索NLR基因进化各个方面的重要资源。
利用该数据集,研究人员揭示了近亲物种之间NLR拷贝数的变化,并发现适应水生、寄生或食肉物种基因组的NLR数量显著减少。TNL与RNL基因数量之间具有高度相关性,以及TNL与NRG1共同缺失的规律,表明NRG1-SAG101通路缺失可能导致TNL减少。
参考链接
https://doi.org/10.1016/j.molp.2021.08.001
https://www.cnblogs.com/erosmin-er/articles/16817790.html
https://blog.sciencenet.cn/blog-3158122-1298569.html
https://mp.weixin.qq.com/s/CNFm9IYzqDN1qNw3ccgdIg