创新背景
泛基因组(Pan-genome)是一个物种内所有基因组信息的总和,它比单一参考基因组涵盖了更多的遗传多样性。
近年来,科学家已经获得了多个作物的泛基因组。如何利用这些更为全面的基因组信息培育下一代良种,成为科学家们关心的课题。
该论文通讯作者黄三文认为:在一个物种内,有些基因是某些个体所特有的。比如任意两个番茄所含有的基因是不完全相同的,基因不同可能导致口感不同。番茄有很多品种,如大果番茄、樱桃番茄和醋栗番茄等,如果只是用大果番茄的参考基因组进行研究,那其中不会包含樱桃番茄和醋栗番茄特有的基因组信息。把一个物种所有的基因都找到,并按照顺序排列,就形成了泛基因组。而图泛基因组 (graph pangenome)是借助数学和计算机中被称为图(graph)的数据结构来展示一个物种所有的基因排列和结构。
基因组所副研究员周姚表示,由于泛基因组比单一参考基因组更加准确和详尽地代表了整个物种的遗传多样性,而详尽和准确的变异对下游的遗传学分析提供了完美的基础,所以借助泛基因组做研究不容易漏掉重要的基因和信息。
法国农业科学研究院研究员Mathilde Causse认为,图泛基因组资源对番茄遗传和基因组研究非常重要,促进了后续的基因定位。这篇文章将成为番茄研究领域里的基石。
创新过程
《自然》在线发表了中国农业科学院深圳农业基因组研究所(以下称“基因组所”)黄三文团队有关泛基因组的两项研究成果。
研究人员首次获得了番茄的图泛基因组,并借此找回了番茄育种中“丢失的遗传力”,为解析生物复杂性状的遗传机制提供了新思路。
此前有很多作物都获得了泛基因组图谱,如水稻、玉米、小麦、大麦、棉花、番茄、油菜等。这次研究人员首次获得了番茄的图泛基因组,并第一次完成了二倍体马铃薯的泛基因组。
在关于番茄图泛基因组的研究中应用了“图”这个概念。图是数学和计算机科学中一种常见的数据结构。已有研究发现,利用该数据结构整合泛基因组,可以减少单一基因组带来的参考基因组偏差问题。为了构建一个准确的图泛基因组,研究人员首先利用高准确率的三代测序技术重新组装了骨架基因组,其组装质量在完整性、连续性和准确性等指标上均优于之前的版本。
随后,他们选取了31份具有代表性的番茄材料进行了组装,并鉴定出相关的遗传变异;在整合已公布的结构变异和短片段测序信息后,最终构建了来自838个番茄基因组的图泛基因组。
好吃的番茄:找回“丢失的遗传力”
作物的性状由遗传因素和环境因素的共同作用而决定。科学家用“遗传力”这个概念表示一种作物的性状受遗传调控的比例。遗传力越高,说明性状的决定过程中遗传因素占比越大,环境因素占比越小。
在未来的作物育种中,基因组选择技术将被广泛应用。当番茄还是幼苗的时候,就对它的基因组进行测序,以此来预测它是否抗病、产量如何、好吃不好吃等。
然而,现在的预测还不是很准。这是因为调控上述复杂性状的基因有很多,有些基因的作用明显,其遗传力容易被检测到;而另一些基因的作用比较微弱,这些基因难于检测到的遗传力被称为“丢失的遗传力”。“遗传力丢失”是一个经典的数量遗传学问题,即通过遗传标记估计的遗传力以及通过全基因组关联分析(GWAS)发现的所有相关基因所贡献的遗传力总和均低于实际的遗传力。
找回这些丢失的遗传力,将有助于理解复杂性状的遗传机制。遗传力是研究基因型与表型相关性的基础,如何更准确和系统地找到更多的决定表型的遗传变异是作物育种中的基础问题。无论是分子标记辅助育种还是分子设计精准育种,都需要大量的已知功能的遗传变异来指导品种选择或改良。
目前认为遗传力丢失的主要原因有以下几个:遗传标记与真实影响表型的基因之间存在着不完全连锁,导致模型估计产生偏差;稀有等位基因的贡献不易被察觉;某个基因的不同突变表现出相同的表型使得遗传分析遗漏;基因与基因的互作和基因与环境的互作增加了分析的复杂性。传统短片段测序可对长度较小的变异进行鉴定,但对复杂结构变异的检测能力较差,无法全面评估复杂结构变异对遗传力的具体影响。
此前,在人类中遗传力丢失问题研究最为丰富。但受限于技术,这些研究主要关注单核苷酸变异与表型之间的联系,而忽视了更多的隐藏的大结构变异对表型的影响。
由于番茄的遗传资源丰富,其驯化历史、表达调控以及风味代谢方面都已有了相关的研究基础,为进一步研究遗传力丢失奠定了基础。
通过构建番茄图泛基因组,该研究准确鉴定了番茄基因组中的结构变异,并发现大的结构变异是遗传力丢失的关键原因之一,为遗传力丢失问题提供了新的解决思路。
进一步研究发现,与利用单一参考基因组相比,基于图泛基因组的遗传变异可将估计的遗传力提高24%,展现了图泛基因组在找回“丢失的遗传力”上的重要作用。
以影响番茄产量和糖度的重要代谢物可溶性固形物为例,采用上述分析方法,该团队共鉴定出2个潜在的与可溶性固形物含量高度相关的结构变异,可以用于未来的分子标记辅助选择。通过对影响番茄风味的33种代谢物进行分析发现,利用全部的结构变异作为分子标记进行基因组选择的效果最佳。
因此,他们进一步精心构建了一个包含近2.1万个结构变异的数据集。如果利用该数据集设计育种芯片,评估基因组选择的准确率可能超过利用全部的单核苷酸多态性。
智能推荐
遗传学创新思维 | 遗传负荷的新划分有助于保护物种多样性
2022-11-18涉及学科涉及领域研究方向农学创新思维 | 野生和栽培马铃薯的基因组进化和多样性
2022-07-02研究人员首次解析了二倍体马铃薯的泛基因组,研究了茄科茄属(Genus Solanum)的物种进化,破解了马铃薯如何结薯的分子机制,并为杂交马铃薯育种改良提供了丰富的遗传变异信息。这项研究展示了泛基因组学的力量,能为其他作物泛基因组研究提供参考方法。
涉及学科涉及领域研究方向生物科学创新思维 | 一种隔离血红素的植物肽促进共生细菌的铁摄取
2022-08-14麻省理工的一项研究发现了豆科植物细胞中具有一种会吸收所有可用的血红素的多肽——NCR247。这种多肽被豆科植物用来控制固氮细菌,同时它也可能对治疗血液中血红素过多的患者有益处。清除血液中的游离血红素有助于治疗由需要血红素生存的细菌或寄生虫引起的疾病,如牙龈杆菌(牙周病)或弓形虫病,或向血液中释放过多血红素的镰状细胞病或败血症等疾病。此外,这项研究也表明了,植物和微生物相互作用的基础研究也有可能转化为治疗应用。
涉及学科涉及领域研究方向饲料工程创新思维 | 瑞典研究芦苇营养变化以完善芦苇使用链
2022-08-02在不同时间段收集芦苇研究其营养价值变化,最大限度地将其用作动物饲料。
涉及学科涉及领域研究方向