基因组图谱的改进

所属分类:繁育管理

基因组图谱的改进

Chad Dechow

宾夕法尼亚州立大学动物科学系

早期的欧洲探险家绘制出第一幅地图之后,每次新的探险都会对地图有所改进,同样的情况也适用于DNA研究。

去年12月,美国奶牛育种委员会(CDCB)对其基因组评估系统进行了微妙的改革。其中一个变化是增加了基因组中标记的密度,从约6万个DNA标记增加至近8万个,这些DNA标记(或SNPs)现在已被应用到新的牛基因组参考图谱中。

参考基因组基本上是一个物种的DNA序列地图,遗传学家用以评估和共享基因组信息。新的牛参考基因组被称为ARS-UCD,这个缩写表示参与创造新基因组序列的组织,分别是美国农业部农业研究局(ARS)和加州大学戴维斯分校(UCD)。

为什么需要新的基因组参考图谱?

你可能想知道为什么我们需要一个新的基因组参考图谱,毕竟2004年才发布了第一套基因组序列。

其实对于任何物种而言,基因组序列的组装完成在某种程度上都是一个相对的概念。第一套人类基因组序列发布于2000年,“完成”于2003年,但在其“完成”15年后,我们仍然有相当大量的未检测出或未确定位置的序列。

基因组序列的组装面临许多挑战,我们无法像阅读一本书那样,从一端到另一端提取和解读动物的DNA序列。相反,我们提取了很多基因组的副本,随机将其打碎为更短的片段,然后对每个片段分别进行测序。由于我们使用了基因组的多个副本,因此在不同的片段上每个位点将会被多次测序。在大多数情况下,一个片段的部分序列会与另一个片段的部分序列重叠,这使得我们可以像拼一个巨大的拼图一样,把所有的片段拼在一起。

大量重复序列

这种策略对于大部分基因组都很有效,但也存在一些问题。科学家们尽最大的努力来确保DNA序列中的每个片段都被多次测序,但仍有些部分可能会被意外遗漏。

一个更大的问题是,包括人类和牛的大多数物种的基因组中,都含有重复的片段,其中我们的基因组约有一半是由重复数千次的DNA序列组成。尽管我们不完全了解为什么会出现这么大量的重复序列,也不了解这些重复序列的相关功能,但这些重复的片段肯定是重要的。

这些重复的片段可能是基因之间的间隔,有可能还会影响细胞核内一个基因的空间定位。这两种因素都会影响基因何时开启、何时表达、何时处于休眠状态,其中一些重复片段在胚胎发育过程中是活跃的。

在大多数情况下,重复片段在不同个体中所处的位置是相同的,但也有例外。这些差异肯定会导致表型的变异,但要理解其中的原因还需要更多的研究。

重复序列通常在整个基因组中都有分布,其大小从几个核苷酸到数千个核苷酸都有。例如BovB就是一个较长的重复片段,据报道其约占牛基因组大小的20%。每个BovB片段大约含有3200核苷酸,整个牛的基因组中很可能存在超过15万个BovB片段。

基因组组装的难题

想象一下,如何将一堆几乎完全相同的碎片和一些很可能丢失的碎片正确地组装成一个完整的拼图?这一直是基因组序列组装过程中所面临的挑战!新的技术使我们可以进行更长片段的测序,为克服该挑战提供了帮助,因此我们采用该技术进行了测序并组装了新的基因组参考图谱。

自2009年以来,我们所采用的基因组参考图谱一直是由马里兰大学开发的UMD3.1版本,该版本大概有7.2万个“空缺”,而新的版本中仅有393个。此外,新的基因组参考图谱的长度约为27.4亿个核苷酸,比上个版本增加了6700万个。

ARS-UCD和UMD在装配基因组时都依赖于同一个动物——一头名叫Dominette的海福特牛,因其高度近交而被选中。采用近交的动物可以简化基因组的组装过程,因为其从父亲和母亲获得的遗传物质之间的差异更小。

海福特牛与奶牛品种的基因组之间存在差异,硕腾(Zoetis)最近发布了荷斯坦牛专门的基因组图谱。特定品种专门的基因组图谱是否能提高基因组预测的准确性还有待观察,需要科学家继续探索。

更准确的预测

虽然新的基因组参考图谱的发展十分有趣,但对于如何帮助提高基因组预测的准确性来说可能并不明确。不过,至少在两个方面新的图谱可能会发挥作用。

改善基因型的填充。奶牛育种委员会在基因组评估中采用了80K的基因型数据。然而,大多数奶农会采用一种成本更低、密度更低的芯片来评估牛群,其测试范围为20K-45K之间。这意味着我们必须对其进行“填充”至80k,才能用于确定奶牛的估计传递力(PTA),在基因组测试的术语中,“填充”是“高质量猜测”的简洁说法。

如果一头奶牛的父亲和母亲的祖父均使用高密度芯片进行基因分型,那么在大多数情况下,对其进行填充的准确率将高于99%。基因型填充过程的准确性部分是由染色体上的两个SNPs之间的距离决定的,因此,若我们能更确切地知道两个SNPs之间的距离,其准确率就会更高。

定位隐性单倍型。通过改进基因组图谱,我们还将能够更准确地识别影响繁殖力的隐性单倍型,因为其检测依赖于精确的基因组图谱。另外,根据新的基因组图谱,我们能更容易地定位已知的隐性单倍型,并能更快地找到确切的突变。

美国农业部和奶牛育种委员会的科学家们的测试表明,将基因组评估的基因组参考图谱从60K增加至80K,其评估结果的可靠性会提高1-2个百分点。对于荷斯坦牛来说,已发布的可靠性可能并不会提高,因为验证研究表明之前的估计略有偏大,但其真实可靠性会提高。

需要更进一步的研究

在基因组时代,最重要的一点是,当涉及到我们的基因组时,我们从来没有像我们认为的那样了解那么多。

这个新的基因组图谱,只是我们在探索牛基因组秘密道路上迈出的一小步,在未来,它还将帮助我们进一步提高基因组预测的准确性。

翻译:王封霞

  • 我的微信
  • 这是我的微信扫一扫
  • weinxin
  • 我的今日头条账号
  • Dairyman养牛
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: