为了充分挖掘野生大豆种质资源中的高蛋白基因及其连锁标记,以来自中国、韩国和日本,涵盖第4,5,6,7,8熟期组的508份野生大豆种质资源为材料,通过全基因组关联分析挖掘与野生大豆中高蛋白基因相关的SNP.参试材料蛋白含量数据从美国农业部种质资源信息网下载,为2a利用凯氏定氮法测定蛋白含量数据平均值,基因型数据从Soybase网站下载,利用Illumina公司大豆50K芯片(SoySNP50K BeadChip含有52041个SNP标记)检测获得.结果表明,参试材料蛋白含量呈正态分布,介于38.1% ~56.9%,平均48.1%,标准差2.71%.遗传结构分析将参试材料划分为3组,分别包含271,111,126份材料.基于混合线性模型的关联分析,共检测到与蛋白含量相关的SNP位点74个,散布在19条染色体的60个单倍型区段内.显著性SNP位点LOD平均值为3.47,SNP位点BARC_1.01_Gm_01_54656209_A_G的LOD值最大,为5.18.根据显著性SNP位点富集程度,确定第11号染色体常染色质区15128832~15253199 bp、第12号染色体异染色质区26842687~27818244 bp的单倍型区段为本研究中的2个蛋白含量显著性相关区段,命名为HAP_11_1和HAP_12_1.HAP_11_1中,SNP位点BARC_1.01_Gm_11_15167305_G_A的LOD值最大,为3.80,可解释遗传变异为2.88%.HAP_12_1中,SNP位点BARC_1.01_Gm_12_27563620_C_T的LOD值最大,为4.12,可解释遗传变异为3.23%.为野生大豆高蛋白基因育种利用提供了检测标记,为野生大豆高蛋白基因克隆提供了线索.