平码五不中公式规律
  • / 15
  • 下载费用:30 金币  

一种基于SNP芯片的综合基因组育种值估计方法及应用.pdf

关 键 ?#21097;?/dt>
一种 基于 SNP 芯片 综合 基因组 育种 估计 方法 应用
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
摘要
申请专利号:

CN201410067189.6

申请日:

2014.02.26

公开号:

CN103914631A

公开日:

2014.07.09

当前法律状态:

驳回

有效性:

无权

法?#19978;?#24773;: 发明专利申请公布后的驳回IPC(主分类):G06F 19/24申请公布日:20140709|||实质审查的生效IPC(主分类):G06F 19/24申请日:20140226|||公开
IPC分类号: G06F19/24(2011.01)I 主分类号: G06F19/24
申请人: 中国农业大学
发明人: 丁向东; 张勤; 李秀金; 王胜; 张哲; 王重龙; 黄菊; 李乐义
地址: 100193 北京市海淀区圆明园西路2号
优?#28909;ǎ?/td>
专利代理机构: 北京路浩知识产权代理有限公司 11002 代理人: 王文君
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

CN201410067189.6

授权公告号:

||||||

法律状态公告日:

2018.01.02|||2014.08.06|||2014.07.09

法律状态类型:

发明专利申请公布后的驳回|||实质审查的生效|||公开

摘要

本发明属于生物信息学技术领域,提供了一种基于SNP芯片的综合基因组育种值估计方法,步骤S1,获取数据文件,并对数据文件进行预处理,获得可靠的预处理数据;步骤S2,?#22278;?#39588;S1获得的预处理数据进行基因组育种值估计,利用GBLUP方法估计基因组育种值,或者利用贝?#31471;?#26041;法估计基因组育种值,获得单个性状的个体基因组育种值;步骤S3,综合基因组育种值估计,重复步骤S2,获得多个性状的个体基因组育种值,计算综合基因组育种值。本方法整合了SNP芯片信息、系谱信息、表型信息,可对动物的育种选留做出判断,可推进基因组选择在国内动物育种领域的应用,可更好地发挥基因组选择在动物育种领域的优势。

权利要求书

权利要求书
1.  一种基于SNP芯片的综合基因组育种值估计方法,其特征在于,所述方法包括:
步骤S1,获取数据文件,并?#36816;?#36848;数据文件进行预处理,获得可靠的预处理数据;
步骤S2,?#22278;?#39588;S1获得的预处理数据进行基因组育种值估计,利用GBLUP方法估计基因组育种值,或者利用贝?#31471;?#26041;法估计基因组育种值,获得单个性状的个体基因组育种值;
步骤S3,综合基因组育种值估计,重复步骤S2,获得多个性状的个体基因组育种值,计算综合基因组育种值。

2.  根据权利要求1所述的方法,其特征在于,所述步骤S1包括:
步骤S11,获取SNP芯片数据及预处理,包括SNP芯片数据读取、缺失基因型填充;
步骤S12,获取系谱文件及预处理,向上追溯父母系谱5-10代;
步骤S13,获取表型数据及预处理,筛选步骤S12中所述系谱文件中个体表型值。

3.  根据权利要求2所述的方法,其特征在于,所述步骤S1具体包括:
步骤S11,获取SNP芯片数据,并采用压缩格式存储文件以节省硬盘空间;所述缺失基因型填充利用Beagle程序将芯片基因型中存在缺失的SNP标记或个体进行填充,提高芯片基因型检测质量;
步骤S12,根据所述步骤S11中SNP芯片数据个体,从系谱文件中筛选具有SNP芯片信息的个体,向上追溯父母系谱信息5-10代,根据SNP信息对系谱文件父母及后代亲缘关系进行亲子鉴定并根据亲子鉴定结果调整原始系谱文件,当原始系谱文件亲子关系与亲子鉴定结果不一致时,系谱文件按亲子鉴定结果重新编排,其中,系谱文件包含个体、母号、父号三个字段信息。

4.  根据权利要求2或3所述的方法,其特征在于,步骤S11中,所述缺失基因型填充之后还包括基因型质?#38752;?#21046;。

5.  根据权利要求4所述的方法,其特征在于,所述基因型质?#38752;?#21046;的质?#38752;?#21046;参数为每个SNP标记检出率和最小等位基因频?#30465;?#21704;代-温伯格平衡检验、个体检出?#30465;?BR>
6.  根据权利要求1所述的方法,其特征在于,步骤S2中,
所述利用GBLUP方法估计基因组育种值,数据的选择分为仅选择基因组信息、或者选择基因组信息和仅具有SNP基因?#36879;?#20307;的系谱信息、或者选择基因组信息和系谱信息;
所述利用贝?#31471;?#26041;法估计基因组育种值,数据选择仅基因组信息,通过马尔?#21697;?#38142;蒙特卡洛算法估计SNP芯片中每个SNP标记的效应。

7.  根据权利要求6所述的方法,其特征在于,数据仅选择基因组信息利用GBLUP方法估计基因组育种值,根据SNP芯片数据文件和表型数据文件,建立参考群体和候选群体间基于分?#26377;?#24687;的个体亲缘关系矩阵—G阵,并求逆,通过混合模型方程组求解候选群体的基因组育种值;
数据选择基因组信息和剩余多基因信息利用GBLUP方法估计基因组育种值,建立参考群体和候选群体间基于分?#26377;?#24687;的个体亲缘关系矩阵—G阵,并建立参考群体和候选群体个体间基于系谱信息的血缘关系矩阵—A阵,并对G阵和A阵求逆,通过混合模型方程组求解候选群体的基因组育种值;
数据选择基因组信息和系谱信息利用GBLUP方法估计基因组育种值,根据参考群体和候选群体信息,增加有表型数据信息但无基因型信息的个体进入参考群体,扩大参考群体规模,建立参考群体和候选群体关系的亲缘关系矩阵—H阵,并求逆,通过混合模型方程组求解候选群体的基因组育种值。

8.  根据权利要求1所述的方法,其特征在于,步骤S3中,所述综合基因组育种值估计有两种方法:
(1)不考虑系谱指数,将每个性状的经济加权值作为权重,加权生成综合基因组育种值,用于个体选择;
或者,(2)考虑系谱指数,首先对单个性状,将个体系谱指数与其基因组育种值加权合并为一个新值作为该性状最终的基因组育种值,合并权重分别是该个体系谱指数和基因组育种值的可靠性,获得所有性状新的基因组育种值后,根据(1)所述计算综合基因组育种值。

9.  根据权利要求1-8任一所述的方法在动物育种方面的应用。

说明书

说明书一种基于SNP芯片的综合基因组育种值估计方法及应用
技术领域
本发明属于生物信息学技术领域,具体涉及一种基于SNP芯片的综合基因组育种值估计方法及应用。 
背景技术
遗传学理论和计算机广泛应用于动物育种是现代动物育种的基本特征。自20世纪80年代以来,基于育种值进行的畜禽选种选配成为畜禽育种的主要方法,育种值估计成为动物遗传育种的核心内容。育种值估计方法的实质就是利用个体本身和(或)?#36164;?#30340;性状记录,进行适当加权来提高选择的准确性。 
随着分子生物学及计算机技术的发展,大量分子标记信息被发现,育种学家开始探索将基因组信息添加到畜禽的遗传评定中,从而实现个体的早期选择及?#26723;?#19990;代间隔和育种成本,同时还可以实现对低遗传力性状和?#34892;?#29366;较好的选择效果。当前,应用基因组信息的模型主要包括两种,一种是标记辅助选择方法(MAS);另一种是基因组选择方法(GS)。标记辅助选择方法是应用了部分基因组信息作为多基因信息的辅助信息,而基因组选择是标记辅助选择的扩展,它试图应用整个基因组信息对动物个体进行遗传评定,从而实现对真实育种值的剖分。 
基因组选择方法的提出解决了标记辅助选择所面临的问题。基因组选择方法的原理是应用整个基因组高密度标记?#35745;?#20449;息和表型信息估计每个标记或染色体片段的效应值,通过所有效应值的加和从而得到基因组估计育种值。基因组选择的一个基本假设是,影响数量性状的每一个QTL?#21152;?#39640;密度全基因组标记?#35745;?#20013;的至少一个标记处于连锁?#40644;?#34913;(linkage disequilibrium,LD)状态。因此,基因组选择能 够追溯到所有影响QTL,从而克服传统标记辅助选择中标记解释遗传方差较少的缺点,实现对育种值的准确预测。 
目前,基因组选择?#21387;?#27867;应用于各国畜禽分子育种中,尤其在奶牛、猪和鸡育种方面,我国也在此领域进行了初步?#33455;?#21644;应用。与常规的仅基于系谱信息的动物遗传评定不同,基因组选择涉及到芯片数据的处理、动物个体基因组育种值估计和包含多个性状的综合育种值计算等多方面,其利用信息更多、计算量更大,因此需要一个高效的平台进行分子数据、表型数据、系谱信息、基因组育种值计算等信息的整合,以实?#20013;?#31165;分子育种的自动化和系统化。 
发明内容
育种值:种畜的种用价值,在数量遗传学中把决定某一数量性状的基因?#26377;?#25928;应总和称为某一性状的个体育种值。 
基因组育种值:个体全基因组的SNP效应累加得到的育种值。 
综合育种值:根据不同性状育种上和经济上的重要?#22278;?#24322;,将多个不同性状的育种值加权合并,可表示为ai为某个体性状i的育种值,wi为性状i的权重。 
参考群体:群体内个体具有SNP芯片基因型信息和表型数据信息,根据此参考群体可以估计整个基因组SNP标记效应,进而预测候选群体个体的基因组育种值。 
候选群体:由仅具有SNP芯片基因型信息的个体组成。 
针对现有技术不足,本发明的目的是提供一种基于SNP芯片的综合基因组育种值估计方法及应用。 
为实现上述目的,本发明提供了一种基于SNP芯片的综合基因组育种值估计方法,包括以下步骤: 
步骤S1,获取数据文件,并?#36816;?#36848;数据文件进行预处理,获得可靠的预处理数据; 
步骤S2,?#22278;?#39588;S1获得的预处理数据进行基因组育种值估计,利 用GBLUP方法估计基因组育种值,或者利用贝?#31471;?#26041;法估计基因组育种值,获得单个性状的个体基因组育种值; 
步骤S3,综合基因组育种值估计,重复步骤S2,获得多个性状的个体基因组育种值,计算综合基因组育种值。 
优选的,所述步骤S1包括: 
步骤S11,获取SNP芯片数据及预处理,包括SNP芯片数据读取、缺失基因型填充; 
步骤S12,获取系谱文件及预处理,向上追溯父母系谱5-10代; 
步骤S13,获取表型数据及预处理,筛选步骤S12中所述系谱文件中个体表型值。 
更优选的,所述步骤S1具体包括: 
步骤S11,获取SNP芯片数据,并采用压缩格式存储文件以节省硬盘空间;所述缺失基因型填充利用Beagle程序将芯片基因型中存在缺失的SNP标记或个体进行填充,提高芯片基因型检测质量; 
步骤S12,根据所述步骤S11中SNP芯片数据个体,从系谱文件中筛选具有SNP芯片信息的个体,向上追溯父母系谱信息5-10代,根据SNP信息对系谱文件父母及后代亲缘关系进行亲子鉴定并根据亲子鉴定结果调整原始系谱文件,当原始系谱文件亲子关系与亲子鉴定结果不一致时,系谱文件按亲子鉴定结果重新编排,其中,系谱文件包含个体、母号、父号三个字段信息。 
优选的,步骤S11中,所述缺失基因型填充之后还包括基因型质?#38752;?#21046;。 
优选的,所述基因型质?#38752;?#21046;的质?#38752;?#21046;参数为每个SNP标记检出率和最小等位基因频?#30465;?#21704;代-温伯格平衡检验、个体检出?#30465;?nbsp;
优选的,步骤S2中, 
所述利用GBLUP方法估计基因组育种值,数据的选择分为仅选择基因组信息、或者选择基因组信息和仅具有SNP基因?#36879;?#20307;的系 谱信息、或者选择基因组信息和系谱信息; 
所述利用贝?#31471;?#26041;法估计基因组育种值,数据选择仅基因组信息,通过马尔?#21697;?#38142;蒙特卡洛算法估计SNP芯片中每个SNP标记的效应。 
优选的,数据仅选择基因组信息利用GBLUP方法估计基因组育种值,根据SNP芯片数据文件和表型数据文件,建立参考群体和候选群体间基于分?#26377;?#24687;的个体亲缘关系矩阵—G阵,并求逆,通过混合模型方程组求解候选群体的基因组育种值; 
数据选择基因组信息和剩余多基因信息利用GBLUP方法估计基因组育种值,建立参考群体和候选群体间基于分?#26377;?#24687;的个体亲缘关系矩阵—G阵,并建立参考群体和候选群体个体间基于系谱信息的血缘关系矩阵—A阵,并对G阵和A阵求逆,通过混合模型方程组求解候选群体的基因组育种值; 
数据选择基因组信息和系谱信息利用GBLUP方法估计基因组育种值,根据参考群体和候选群体信息,增加有表型数据信息但无基因型信息的个体进入参考群体,扩大参考群体规模,建立参考群体和候选群体关系的亲缘关系矩阵—H阵,并求逆,通过混合模型方程组求解候选群体的基因组育种值。 
优选的,步骤S3中,所述综合基因组育种值估计有两种方法: 
(1)不考虑系谱指数(父母亲育种值平均值),将每个性状的经济加权值作为权重,加权生成综合基因组育种值,用于个体选择; 
或者,(2)考虑系谱指数,首先对单个性状,将个体系谱指数与其基因组育种值加权合并为一个新值作为该性状最终的基因组育种值,合并权重分别是该个体系谱指数和基因组育种值的可靠性,获得所有性状新的基因组育种值后,根据(1)所述计算综合基因组育种值。 
本发明的另一目的是,提供了一种基于SNP芯片的综合基因组 育种值估计方法在动物育种方面的应用。 
本发明的有益效果: 
1、本方法整合了SNP芯片信息、系谱信息、表型信息,根据动物的SNP信息即可对动物的育种选留做出判断,做到了动物分子育种的自动化和系统化; 
2、本方法运用科学语言Fortran编写而成,可?#22278;?#29992;多线程计算,可加快计算,缩短计算时间,适合在Linux和Windows系统下进行运算; 
3、本方法可推进基因组选择在国内动物育种领域的应用,可更好地发挥基因组选择在动物育种领域的优势。 
附图说明
图1实施例1中本发明方法的流程图; 
图2实施例1中GBLUP类方法构建关系矩阵流程图; 
图3实施例3中本发明方法的流程图。 
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的?#27573;А?nbsp;
实施例1 
实验数据是5439头中国荷?#22266;?#29275;母牛,出生于2004-2012年间,所有母牛进行了Illunima50K SNP芯片(含54001SNP标记)基因型测定,并对5个产奶性状产奶量、乳蛋白量、乳蛋白?#30465;?#20083;脂量、乳脂率进行了传统育种值估计,参见图1,包括以下步骤: 
步骤S1,获取数据文件,并?#36816;?#36848;数据文件进行编辑预处理,获得可靠的预处理数据; 
步骤S11,读取SNP芯片数据文件,首先用Beagle程序进行缺失基因型填充,然后选取SNP最小等位基因频率(MAF)0.01作为质?#38752;?#21046;标准,剔除最小等位基因频率(MAF)低于0.01和染色体位置未知的SNP,最终47160SNP用于分析; 
步骤S12,根据5439?#32442;?#29275;系谱信息,向上追溯10代资料,包含 130852个体,用于A阵构建; 
步骤S13,选取步骤S12中130852头个体5个产奶性状育种值作为表型,生成最终表型数据文件。 
步骤S2,?#22278;?#39588;S1获得的预处理数据进行基因组育种值估计,利用GBLUP方法估计基因组育种值,获得单个性状的个体基因组育种值。 
选定参考群体和候选群体:将5439?#32442;?#29275;分为两部分,4455头2008年前出生的母牛作为参考群体,984头2008年和2008后出生的母牛作为候选群体。 
选择利用基因组信息和系谱信息的GBLUP方法,如图2所示,具体包括以下步骤: 
①根据5439头有基因型信息的母牛构建G阵并求逆。 
其中,根据标记文件中SNP信息构建G阵。 
G=zz2Σpi(1-pi)]]>
每个SNP位点两个等位基因用1、2进行编码,pi代表第i个SNP第2个等位基因的频率(通过样本算得),-z阵的行数代表个体数,列数代表所用的SNP位点数,对于每个元素,若纯合子11,为0-2pi;纯合子22,为2-2pi;杂合子12或21,为1-2pi。 
②根据步骤S12中系谱追溯的130852个个体构建A阵,并求逆。选取其中的22106头未进行基因型测定的母牛加入参考群体。 
其中,根据系谱信息构建血缘关系矩阵A阵的方法,构建A阵中的每一个元素采用以下的递推公式来计算: 


其中,si(sj)和di(dj)为个体i(j)的父亲和母亲。 
系谱文件的特点:所有个体按个体号、父亲号和母亲号列成一个三列表,数据文件应注意, 
a:在个体一列中应包括所有在父和母列出现过的个体; 
b:在个体一列中应保证后代绝不会出现在其父母之前,一般可按出生日期?#21028;潁?#20808;出生的在前; 
c:个体用自然数从1开始连续编号; 
d:根据A-1和G-1,计算包含无基因?#36879;?#20307;和基因?#36879;?#20307;的H阵并求逆。 
即On-step Blending,同时考虑无基因型信息的个体,综合利用系谱信息和基因组信息,新的矩阵被称为H矩阵,即: 
H=H11H12H21H22=A11+A12A22-1(G-A22)A22-1A21A12A22-1GGA22-1A21G]]>
混合模型方程组求解需要用到H阵的逆矩阵,若直接先求H阵时计算比较繁琐。可跳过求H阵的繁琐过程,直接按下式求逆,即: 
H-1=A-1+000G-1-A22-1]]>
构建H-1公式中G-1有两个方法,一个方法利用G阵,另一个方法利用Ga。 
④建立混合模型方程,估计候选群体5个产奶性状基因组育种值,混合模型方程组可以表示为以下形式: 
(1)若e~N(0,Iσe2)时, 
111ZZ1ZZ+A-1kμα=1yZy]]>
(2)若e~N(0,Rσe2)时, 
1R-111R-1ZZR-11ZR-1Z+A-1kμα=1R-1yZR-1y]]>
其中,可通过迭代求解个体基因组育种值。 
步骤S3,综合基因组育种值估计。 
考虑到乳脂量、乳蛋白量主要受产奶量、乳脂率和乳蛋白率影响,因此衡量产奶性状的综合育种值主要考虑产奶量、乳脂率和乳蛋白率三个性状,产奶量?#20174;?#20102;奶牛的泌乳能力,乳脂率和乳蛋白率则?#20174;?#29275;奶质量,三个性状一起能?#40644;?#20215;奶牛在产奶性状方面的价值。例如某?#32442;?#29275;产奶量、乳脂率和乳蛋白率的基因组育种值(GEBV)分别为114.7737、0.06257和0.09157。不考虑该母牛的系谱指数,三个性状的权重(根据其经济重要性)分别为0.09、93.75、312.50,则产奶性状的综合基因组育种值为114.7737*0.09+0.06257*93.75+0.09157*312.50=44.81。同理,其他个体的综合育种值可以?#26469;?#33719;得,并可用于个体选择。 
实施例2基因组育种值估计准确性 
为检验本发明方法的实施效率,将实施例1中984头候选群体母牛5个产奶性状基因组育种值准确性(个体传统育种值与基因组育种值相关)作为检验标准,准确性越高说明本发明的计算效果越好。 
表1.基因组育种值估计准确性对比结果 


参见表1,与传统依赖父母信息的系谱指数(父母亲育种值平均值)相比,基因组育种值准确性提高幅度在13%-30%,说明用基因组育种值进行个体选种准确性大大提高。同时由于候选群体中个体基因组育种值仅依赖SNP芯片基因型信息即可获得,而SNP芯片基因型信息仅根据个体从任何组织中提取DNA,通过高通量基因型测定技术在动物早期可以实现,因此基因组选择可用于动物个体早期选择且准确性比仅根据父母信息选择更高。 
实施例3仿真数据计算基因组育种值准确性 
仿真数据是由2011年QTL-MAS Workshop利用LDSO软件模拟的一个远交群体,通过模拟历史群1000代,每代1000个体,当代群30代,每代150个体而构建的。分析所使用的数据?#20146;?#21518;一代数据,共20个公畜家系,每个公畜与100个母畜交配,每个母畜产生15个后代。9990个SNP标记均匀分布在5条染色体上,每条染色体长度为1摩尔根(Morgen),均匀分布着1998个SNP标记。 
仿真数据提供的具体数据信息为?#21512;?#35889;文件,SNP标记文件,以及表型文件,其中表型文件是每个15个全同胞后代中,随机模拟其中10个个体的表型值,而其他的5个个体为验证个体。同时提供3000后代的真实育种值。 
?#28304;?#20223;真数据,运用本方法,实验步骤同实施例1,其中,步骤S2,?#22278;?#39588;S1获得的预处理数据进行基因组育种值估计,除利用GBLUP方法估计基因组育种值,?#20272;?#29992;贝?#31471;?#26041;法估计基因组育种值,获得单个性状的个体基因组育种值。贝?#31471;?#26041;法?#22336;?#20026;以下3种方法: 
1、利用BayesA方法估计基因组育种值 
BayesA方法的先验分布假设: 
①即每个SNP的效应gk有各?#22278;?#21516;的效应方差
②即SNP的效应方差服从自由度为v,尺度参数为S的逆卡方分布; 
③即残差的效应方差服从自由度为-2,尺度参数为0的逆卡方分布; 
④P(b)∝常量,即固定效应和群体均值均服从均匀分布。 
似然函数P(y|g,b,σe2)∝(σe2)-n2exp(-12σe2Σi=1n(yi-Σj=1fxijbj-Σk=1qzikgk)2),]]>
于是由联合分布 
P(g,b,σg2,σe2|y)=P(y|g,b,σe2)P(g,b,σg2,σe2)=P(y|g,b,σe2)P(g|σg2)P(σg2)P(b)P(σe2)]]>
获得各个变量的完全条件后验分布,然后通过各个变量的完全条件后 
验分布进行Gibbs抽样,获得各个变量的估计值。 
Gibbs抽样的过程: 
第1步,初始化 
给所有未知参数赋初值θ(0)=[b1(0),...,bf(0),g1(0),...,gq0,σg12(0),...,σgq2(0),σe2(0)].]]>
第2步,更新
从的完全条件后验分布χ-2(n-2,(y-Xb-Zg)'(y-Xb-Zg)/(n-2))抽样。 
第3步,更新bj
从bj的完全条件后验分布 
N((XjXj)-1(Xjy-XjX-jb-j-XjZg),(XjXj)-1σe2)]]>抽样。 
第4步,更新
从的完全条件后验分布χ-2(v+1,(vS+g'kgk)/(v+1))抽样。 
第5步,更新gk
从gk的完全条件后验分布 
N((zkzk+σe2/σg2)-1(zky-zkXb-zkz-kg-k),(zkzk+σe2/σg2)-1σe2)]]>抽样。 
第6步,重复2-5步 
直到收敛达平稳分布,并获得足够的样本。 
2、利用BayesB方法估计基因组育种值 
BayesB和BayesA的重要区别在于SNP效应的假设不同,BayesA假设所有的SNP都有效应,并且SNP的效应方差各不相同;而BayesB的假设是,大多数的SNP没有效应值,仅有少数SNP有效应且有各自的效应方差。对的先验假设为:在π的概率下,在1-π的概率下,并且π为人为设定,表示效应为0或没有效应的SNP标记比例,通常设定为0.95。应用BayesB的MCMC抽样,除了?#22278;?#29992;Metropolis-Hasting(MH)抽样,而不是简单的从逆卡方分布中抽样得到以外,其他部分与BayesA的Gibbs抽样相同。 
3、利用BayesCpi方法估计基因组育种值 
BayesCpi是针对BayesA和BayesB的不足提出的。与BayesB相比较,BayesCpi有两点明显的不同,首先,BayesB是人为设定π值,而BayesCpi将π值当作未知参数,通过数据信息和先验信息进行推断得到。其次,在SNP效应方差先验假设方面,在1-π的概率下,BayesB假设SNP有效应且效应方差各?#22278;?#21516;,而BayesCpi假设SNP有效应,且具有相同的效应方差。理论上而言,BayesCpi更优,但在不同情况下,BayesB和BayesA效果与其接近。 
选取GBLUP方法和贝?#31471;估?#26041;法预测1000个后代的基因组育种值,并用基因组育种值与其真实育种值的相关系数作为准确性,相关系数越高,说明基因组育种值估计越准确。同时将基因组育种值对真实育种值回归,回归系数衡量基因组育种值估计的无偏性,回归系数越接近1.0,说明基因组育种值估计越无偏。 
表21000个后代基因组育种值估计准确性和无偏性 


表2为本发明的利用三种贝?#31471;?#26041;法(BayesA、BayesB、BayesCpi)和GBLUP方法估计基因组育种值准确性和无偏性,三种贝?#31471;?#26041;法的准确性都在0.91以上,三种方法都适合该数据的分析,准确性和无偏性几乎接近。表2同?#21271;?#26126;三种贝?#31471;?#26041;法估计的基因组育种值基本为真实育种值,高于传统育种值估计准确性0.65,虽然GBLUP?#32536;停?#22240;其仅利用了基因组信息,当把系谱信息考虑一同考虑后,其准确性提高至0.956,表现最好。同?#22791;?#31181;方法的无偏性都接近1.0,说明与真实基因组相比,本方法几乎没有高估或低估基因组育种值。证明了本方法的可靠性。 
实施例4应用 
中国荷?#22266;?#26159;我国主要的奶牛品种,广泛饲养于全国各地,我们日常喝的牛奶和奶粉主要?#31579;?#21697;种提供,因此选育优质高产奶牛成为我国奶牛育种核心。但传统的育种体系成本很高,导致奶牛育种效益不高。随着以SNP芯片为基础的基因组选择成为国际奶牛育种领域的一个?#33455;?#28909;点,我国从2008年起,开始对中国荷?#22266;?#29275;进行基因组选择。截止2013年,中国荷?#22266;?#29275;基因组选择参考群体由6000?#32442;?#29275;和400头公牛组成。自2012年起,已对全国28个公牛站的1224头青年公牛进行了高密度全基因组芯片检测,并利用本发明方法对这些青年公牛进行了基因组遗传评估,分别估计了产奶量、乳蛋白?#30465;?#20083;脂率等3个产奶性状,体型、泌乳系统、肢蹄、体细胞数等性状的基因组育种值,并根据以下公式, 
GPI1=20×30×Milk459+15×Fatpct0.16+25×Propct0.08+5Type5+10×MS5+5×PL5-10×SCS-30.16]]>
其中,Milk为产奶量GEBV(基因组育种值),30/459为该性状的权重(根据其经济重要性计算获得,其他性状同理),Fatpct为乳脂率GEBV,Propct为乳蛋白率GEBV,Type表示体型GEBV,MS表示泌乳系统GEBV,FL表?#23616;?#36420;GEBV,SCS表示体细胞数GEBV。计算了中国荷?#22266;?#38738;牛公牛综合基因组育种值,即基因组性能指数(CPI),作为挑选优秀青牛公牛的最终标准。2012和2013年两年,根据1224头青年公牛的基因组性能指数,已选出491头青年公牛参与良种?#22266;?#20351;优秀牛的冷冻精液可全国?#27573;?#20869;销售,从而促进优秀基因的快速传递,提升我国奶业整体水平,推动其健康有序发展。 
虽然,上文中已经用一?#38408;运?#26126;、具体实施方式及试验,对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而?#20934;?#30340;。因此,在?#40644;?#31163;本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的?#27573;А?nbsp;

关于本文
本文标题:一种基于SNP芯片的综合基因组育种值估计方法及应用.pdf
链接地址:http://www.pqiex.tw/p-6115796.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

[email protected] 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
平码五不中公式规律 十三水棋牌游戏大全 意甲直播360 科创板业务股票涨跌幅限制为 河北十一选五遗漏任五 盈胜国际娱乐城 东阳彩票大奖得主 安徽十一选五开下载 2014264期福彩开奖号码 开元棋牌官网正版网址 2011排列三走势图