재발 사건 분석을 위한 일반적인 통계 방법에는 Anderson-Gill 모델, 마진율 기반 모델, 그리고 프레일티 모델과 같은 준모수 모델들이 있습니다. 저희는 완전히 비모수적인 임의 생존 숲(Random Survival Forest, RSF)을 재발 사건에 제안합니다. 이 방법은 앙상블 평균 함수, 예상 사건 수의 요약 척도, 그리고 변수의 중요도를 제공합니다. 유한 표본 성능을 평가하기 위한 시뮬레이션 연구가 수행되었습니다. 제안된 방법은 만성 육아종성 질환(Chronic Granulomatous Disease, CGD) 데이터셋을 사용하여 CGD 환자에서 감염의 재발과 관련된 유전자를 식별하는 연구에 적용되었습니다. 이 연구는 무작위 시험 데이터를 활용하여 CGD 환자의 감염 빈도와 심각성에 영향을 줄 수 있는 유전적 요인을 탐색합니다.
Common statistical methods for recurrent event analysis include the Anderson-Gill model, marginal rate-based model, and frailty models, which are semiparametric models. We propose a random survival forest for recurrent events that is fully non-parametric. The proposed approach provides ensemble mean functions, a summary measure of the expected number of events, and variable importance. Simulation studies are conducted to evaluate finite sample performances of our method. The proposed method is applied to a study aimed at identifying genes associated with the recurrence of infections in the Chronic Granulomatous Disease (CGD) dataset. This research utilizes data from a randomized trial to explore the genetic factors that may influence the frequency and severity of infections in patients with CGD.