본 연구의 목적은 독립적인 동집단 자료에 기초한 납의 벤치마크 용량 하한 (BMDL)을 도출함으로써 Kim 등 (2014)의 결과를 재현하는 것이다. 우리나라 환경부에서는 지난 2010년 환경이 아동 건강에 미치는 영향을 평가하기 위해 경시적 자료인 CHEER (Children's Health and Environmental Research) 자료를 구축하였다. CHEER 자료는 두 개의 독립적인 동집단인 2005년 동집단과 2006년 동집단으로 구성되어 있으며, 각 동집단은 2010년까지 2년 간격으로 세 번에 걸쳐 추적 조사되었다. Kim 등 (2014)에서는 CHEER 자료의 2006년 동집단을 이용하여 주의력 결핍 과잉행동 장애 (ADHD)와 혈중 납 농도의 상관을 규명하고, ADHD를 종점으로 한 혈중 납 농도의 BMDL을 도출한 바 있다. CHEER 자료의 또 다른 동집단인 2005년 동집단은 서로 다른 두 가지 ADHD 평가 척도를 사용하여 연도 간에 ADHD 평가 척도가 일치하지 않는 문제가 있다. 본 연구에서는 벌점화 선형 스플라인을 이용하여 두 ADHD 평가 척도 간의 변환공식을 유도하고, 2005년 동집단의 ADHD 평가 척도를 통일하였다. 이후 2005년 동집단에 대해 경시적 자료의 특성을 반영한 선형혼합모형으로 임의 절편항과 임의 기울기항을 포함한 모형, 오차항의 1계 자기회귀 구조를 상정한 모형 등을 구성하고, 이를 이용하여 혈중 납 농도의 BMDL을 도출하였다. 이 과정에서 Kim 등 (2014)에서 발견한 ADHD 점수의 평균으로의 회귀 현상이 재확인되었고, 2005년 동집단과 2006년 동집단의 분포 상의 특징적 차이가 발견되었다. 결과적으로 이 차이를 감안했을 때, Kim 등 (2014)과 일치적인 결과를 얻을 수 있었다.
The primary objective of this thesis is to reproduce the result of Kim et al. (2014) by deriving a benchmark dose lower bound (BMDL) of lead based on an independent cohort data. The Ministry of Environment of South Korea recruited a longitudinal data set referred to as CHEER (Children's Health and Environmental Research) data set in 2010 to investigate the effect of environment on children's health. The CHEER data set consists of two independent cohorts: 2005 cohort and 2006 cohort. Each of the cohorts was followed three times biannually until 2010. Kim et al. (2014) confirmed the correlation of attention deficit/hyperactivity disorder (ADHD) with the blood lead level and derived a few BMDLs of lead with ADHD being the end point using the 2006 cohort of the CHEER data set. The ADHD rating scales in the 2005 cohort were not consistent along the three follow-ups since two different ADHD rating scales were used in the cohort. We first derived the conversion formula for the two ADHD rating scales using a penalized linear spline and unified the ADHD rating scales in the 2005 cohort. We then constructed two linear mixed models for the 2005 cohort which reflected the longitudinal characteristics of the data set. The first model introduced the random intercept and the random slope terms and the second model assumed the first order autoregressive structure of the error term. Using these models, we derived the BMDLs of lead and reconfirmed the “regression to the mean” nature of the ADHD score discovered by Kim et al. (2014). We also noticed that there was a definite difference between the sampling distributions of the two cohorts. As a result, taking this difference into account, we were able to obtain the consistent result with Kim et al. (2014).