本文内容主要摘自下面 3 篇文章:第一篇介绍了 NAM 群体的 构建 及玉米基因组的 重组特征;第二篇介绍了 计算机模拟 下 NAM 群体挖掘 QTL 的 效力;第三篇介绍了 NAM 群体的 应用,使用 NAM 群体挖掘与 花期 相关的 QTL 及特征;
Genetic Properties of the Maize Nested Association Mapping Population,Michael D. Edward S. Buckler,Science,7 Aug 2009,doi: 10.1126/science.1174320
Genetic Design and Statistical Power of Nested Association Mapping in Maize,Yu J, Holland JB, McMullen MD, Buckler ES,Genetics,2008 Jan,doi:10.1534/genetics.107.074245
The genetic architecture of maize flowering time. Buckler ES, Holland JB, Bradbury PJ, et al,Science,7 Aug 2009,doi:10.1126/science.1174276
Lee, M., Sharopova, N., Beavis, W.D. et al. Expanding the genetic map of maize with the intermated B73 × Mo17 (IBM) population . Plant Mol Biol 48, 453–461 (2002). https://doi.org/10.1023/A:1014893521186
Hallauer, A. R., W. A. Russell and K. R. Lamkey, 1988. Corn breeding, pp. 463–564 in Corn and Corn Improvement, edited by G. F. Sprague and J. W. Dudley. American Society of Agronomy, Madison, WI.
NAM(Nested Association Mapping)由 B73 和 25 个株系(25 diverse lines,25 DL)杂交得到的 5000 个重组自交系(RILs)构成。其中 25 个亲本株系包括 13 个热带品系、9 个温带品系、2 个甜玉米品系、1 个爆裂玉米品系(pop corn),选自 302 个从全世界范围内收集的自交系。每个亲本与 B73 杂交,得到 25 个 家系(family), F 1 − F 5 F_1-F_5 F1−F5 使用 单粒传法(single seed descent,SSD,概念参见 附录)自交,在 F 5 F_5 F5 代每个家系中收获 200 个种子( S 5 S_5 S5),总共收获 5000 个种子(下图)。
在测定 SNP 后,66 个 RILs 因其 F 1 F_1 F1 中基因型与预期不符而移除,63 个 RILs 因基因型中出现了非亲本基因型而移除,82 个 RILs 因杂合率过高(>8%)而移除,90 个 RILs 因 SNP 检测中信号强度过低而移除,最终留下 4699 个 RIL 来绘制 NAM 群体的遗传图谱。
PS:因为 Mo17 与 B73 杂交的群体 IBM 已经十分成熟,所以 25 个亲本中没有 Mo17。
为保证 B73 与 25 DL 间遗传较大,选择在 B73 中为 次等位基因型 的 SNP。根据已有玉米数据库(Maize Diversity Project database)中的 cDNA 数据,本研究选择了 1536 个 SNP,其中 974 个选自 随机基因,329 个选自与农艺性状可能相关的 候选基因,233 个由杜邦先锋公司(Pioneer Hi-bred International)提供。经过质量控制,325 个 SNP 被淘汰,1211 个 SNP 用于绘制 NAM 群体的遗传图谱。注意,SNP 来源是 cDNA,所以 NAM 群体 1211 个 SNP 标记标定了 1211 个基因。
对大量子代进行高密度的 SNP 基因分型是十分昂贵的,但 NAM 由于亲本株系的 纯合背景 与群体构建过程中 有限的重组,使 RIL 基因组的每个片段都 可溯源。如果 RIL 中一定范围内两个 SNP 的基因型都与 B73 相同,则可以推断此片段遗传自 B73,此时两个 SNP 之间的 SNP 基因型可以直接根据 B73 的基因型预测出来。如果相邻的 CPS 标记来自不同的亲本,则根据其遗传距离在该区域内模拟重组事件,并相应地进行等位基因分配。所以,作者先测定了高密度的亲本 SNP 基因型,然后再 映射 到子代上,大幅降低了子代基因分型的费用,得到了大量高密度的 RILs,提高了全基因组关联分析的准确性与挖掘低效应 QTL 的效力。
下图摘自 Genetic Design and Statistical Power of Nested Association Mapping in Maize,此文中选用了 1331 个 SNP。图 a 显示测定亲本和子代 678 个 SNP,估算 RIL 基因组中各片段的来源;图 b 显示测定了亲本全部 1331 个 SNP 的基因型,通过图 a 中的关系预测 RIL 基因组中所有 SNP 的基因型。
因为 NAM 群体不涉及对照,作者通过 计算机模拟 来评估 NAM 群体挖掘 QTL 的效力。
为了确定不同 映射 SNP 密度 下 RIL 中预测基因型的准确率,验证预测基因型的可信度,作者进行了模拟实验。结果显示,当亲本和子代中 映射 SNP 密度 > 2.5 cM 时,映射的准确度会出现略微降低。因此,作者确定了 678 个映射 SNP,实现了平均密度 2.5 cM 。此外,作者还模拟了不同 QTL 数量(20 / 50)、遗传力(0.4 / 0.7)、SNP 数量(678 / 1331)、RIL 数量(625 / 1250 / 2500 / 5000) 、显著性阈值( 1 0 − 5 10^{-5} 10−5 / 1 0 − 7 10^{-7} 10−7 / 1 0 − 9 10^{-9} 10−9)、QTL 加性效应 条件下,测定挖掘 QTL 的效力。
表型值 y = b 0 + ∑ b i x i + e y=b_0+\sum b_ix_i+e y=b0+∑bixi+e,其中 b i b_i bi 表示第 i i i 个标记位点的加性效应大小, x i x_i xi 表示第 i i i 个标记位点的基因型。模拟部分结果如下图所示(其他模拟结果参见原文),其中 CPS markers only for RILs 表示仅测量 RILs 的 678 个映射 SNP 的基因型,剩余 SNP 的基因型预测得到。可以发现,映射方法对挖掘 QTL 效力的影响可以接受。
最终,在 NAM 的复合图谱(composite map)中包含了 1106 个 SNP,平均标记密度为 1.3 cM(centimorgans,厘摩)。其中每个家系内具有多态性的 SNP 位点(polymorphic SNP)的比例范围为 63% - 74%。在 RIL 中,48.7% 的标记基因型遗传自 B73,47.6% 遗传自 25 DL,3.6% 是杂合子。NAM 群体捕获了约 13.6w 个交叉事件。NAM 群体同染色体内 SNP 之间的 LD 极低,平均 r 2 = 0.04 r^2=0.04 r2=0.04 。
Science 文章主要介绍了作者在 NAM 群体遗传资源谱图绘制完成后对重组问题的研究,讨论了 NAM 群体理论与实际的偏离情况。
图中红色表示热带株系,灰色水平线表示 1 到 10 号染色体边界位置。
DS,days to silking,female flowering,发育至雌蕊开花(吐丝)所需天数
DA,days to anthesis,male flowering,发育至雄蕊开花(开花)所需天数
ASI,anthesis-silking interval,开花与吐丝之间的间隔天数
作者通过对开花时间表型的相关研究,说明玉米中开花时间表型 QTL 的特征,并证明 NAM 群体挖掘 QTL 的能力。
开花时间表型 QTL 特征
NAM 挖掘 QTL 效力评估
作者研究了已知与开花时间相关 QTL,vgt1(vegetative to generative transition 1)。vgt1 位于 rap2.7 基因(开花相关)上游 70kb 处的增强子序列上,当 vgt1 包含 MITE 结构时,开花时间会提前。本研究中作者首选确定了 vgt1 QTL 在 NAM 群体中依然对开花时间有影响(DA: P = 4 × 1 0 – 44 P=4×10^{–44} P=4×10–44,DS: P = 7 × 1 0 – 40 P=7×10^{–40} P=7×10–40)。然后克隆了此区间,发现当 vgt1 包含 MITE 结构时(下图蓝色系),开花时间会提前,与前人研究一致,但无法解释 non-MITE 区为何会延迟开花时间。为此,作者克隆了 rap2.7 基因,发现了两种基因型,当品系包含突变型时(下图红色系),开花时间会延迟。
育种应用
开花期 QTL 具有以下特征:
所以对于育种而言,研究大效应 QTL 的生物学功能即可,探究小效应 QTL 的功能是非必要的。利用已有遗传信息与表型预测未知表型是育种的重点,而非研究生物学功能。
Tian J, Wang C, Xia J, et al. Teosinte ligule allele narrows plant architecture and enhances high-density maize yields. Science. 2019;365(6454):658-664. doi:10.1126/science.aax5482
每株只取一两粒种子混合组成下一代群体,先加速纯合化进程后进行个体选择的杂种后代处理方法。
使杂种群体控制在数百株以内,每株结实不多,不进行选择或只进行微弱选择,成熟时每株随机取一或二粒种子混合组成下代群体。如此进行数代,直到纯合化达到要求时( F 5 F_5 F5 或 F 6 F_6 F6 代)再按株(穗)收获,下年种成株(穗)行,从中选择优良株(穗)系。