Latent transition analysis is one of the longitudinally expanded models of the mixed model and is used to estimate the change in type over time. An extended model that adds random intercepts to existing latent transition analysis has recently been introduced. If the perspective of the multilevel model is applied to the latent transition analysis, the time can be viewed at the level-1 and the individual at the level-2. Random intercept latent transition analysis (RI-LTA) aims to estimate pure transition probabilities over time by separating variance at the individual level, which is 2-level. To add a random intercept to the model, it is necessary to determine the type of random intercept and restrict the factor loading of the indicator variable. The types of random intercepts include continuous random intercepts and binary random intercepts, and random intercepts should be added in a way that constrains the factor loading of each indicator variable from the random intercept to be the same.This study aims to determine which random intercept type estimates the transition probability more stably and how much sample size and number of time points must be secured to estimate a stable transition probability when the sample collection environment is limited. In addition, this study aims to check whether the required sample size and number of time points vary depending on the conditions of the model. Therefore, it was confirmed through Monte Carlo simulation studies. The following simulation model was defined to conduct the study. Considering previous studies, the number of latent classes at all points in time was set to 2. The ratio at the first point in time was set at the same (50:50). The average of random intercepts was set to 0, and the variance was set to 1. The transition probability from class 1 to class 1 was set to 0.622, and the transition probability from class 2 to class 1 was set to 0.500. Simulation conditions are sample size (100, 300, 500), the number of indicator variables (5, 8), the number of time points (2, 3, 4, 5), and the type of random intercept (continuous, binary). Twenty-four thousand datasets were created to analyze this model and generated by 500 replications. As the evaluation criteria, bias, the standard deviation and average standard error across replications and the 95% coverage probability were used. As a result of the study, the bias was problematic only when the sample size was 100 at the second point, and five indicator variables with continuous random intercepts were used. The standard deviation and average standard error across replication were effectively reduced when continuous random intercepts with eight indicators were used. Standard deviation and average standard error increased as the number of time points increased with binary random intercept. The 95% coverage probability was found to have no problem with convergence when using continuous random intercepts, except that the sample size was 100 at two points with five indicators were used. However, when the binary random intercept was used, it was found that there was no problem with convergence only when the sample size was 500. Therefore, continuous latent intercepts are recommended to utilize random intercept latent transition analysis in a limited sample collection environment, and at least 300 sample sizes and at least 3 points should be collected.This study is meaningful in providing guidelines for collecting adequate sample sizes in a limited sample collection environment by exploring the sample size and the number of time points required for random intercept latent transition analysis. In addition, it is expected to contribute to the use of various mixed models by providing guidelines for more stable transition probability estimation by adjusting the types of random intercepts and the number of indicator variables in the area of modeling.
잠재전이분석은 혼합모형을 종단적으로 확장한 모형 중 하나로 시간에 따른 유형의 변화를 확인하고자 할 때 활용한다. 최근 기존 잠재전이분석에 랜덤 절편을 추가한 확장된 모형이 소개되었다. 잠재전이분석에 다층모형의 관점을 적용하면, 시간을 1-수준으로 개인을 2-수준으로 볼 수 있다. 랜덤 절편 잠재전이분석(RI-LTA)는 2-수준인 개인 수준의 분산을 분리하여 시간에 따른 순수한 전이확률을 추정하는 것에 목적이 있다. 랜덤 절편을 모형에 추가하기 위해서는 랜덤 절편의 종류를 결정하고 지표변수의 요인부하량을 제약해주어야 한다. 랜덤 절편의 종류로는 연속형 랜덤 절편과 이분형 랜덤 절편이 있으며, 랜덤 절편으로부터의 각 지표변수의 요인부하량은 동일한 문항끼리 같도록 제약하는 방식으로 랜덤 절편을 추가할 수 있다.본 연구의 목적은 랜덤 절편 잠재전이분석에서 어떤 랜덤 절편 유형이 전이확률을 더 안정적으로 추정하는지 알아보고, 또한 제한된 표본수집 환경에서 최소한 어느 정도의 표본크기와 시점 수가 확보되어야 안정적인 전이확률을 추정하는 지 알아보는 것이다. 따라서, 몬테카를로 시뮬레이션 연구를 통해 확인하였다. 연구 수행을 위해 다음의 시뮬레이션 모형을 정의하였다. 선행연구를 고려하여 모든 시점의 잠재집단의 수는 2개로 하였으며, 첫 시점의 비율은 동일한 비율(50:50)로 설정하였다. 랜덤 절편의 평균은 0, 분산은 1로 설정하였으며, 전이확률은 집단 1에서 집단 1을 유지할 확률은 0.622, 집단2에서 집단1로 전이할 확률은 0.500으로 설정하였다. 시뮬레이션 조건으로는 표본크기 (100, 300, 500), 지표변수의 수 (5, 8), 시점 수 (2, 3, 4, 5), 랜덤 절편의 종류 (연속형, 이분형)으로 총 48개의 조건을 500번 반복하여 24,000개의 데이터 셋을 생성하였다. 준거 기준으로는 편향, 반복을 통해 나타난 표준편차와 표준오차의 평균, 95% 수렴 확률을 사용하였다.연구결과, 편향은 2시점에 표본크기가 100개이면서 5개의 지표변수와 연속형 랜덤 절편을 사용한 경우에만 문제가 발생하였다. 반복을 통해 나타난 표준편차와 표준오차의 평균 연속형 랜덤 절편을 사용하였 때는 표본 크기의 증가가 표준편차 및 표준오차를 줄이는데 효과가 있었으며, 이분형 랜덤 절편을 사용하였을 때는 8개의 지표변수를 함께 사용한다면 시점 수가 증가함에 따라 표준편차 및 표준오차가 증가하였다. 95% 수렴확률은 연속형 랜덤 절편을 사용하였을 때는 2개 시점에 표본 크기가 100이면서 5개의 지표변수를 활용한 경우를 제외하면 수렴에 문제가 없었으나, 이분형 랜덤 절편을 활용하였을 때는 표본 크기가 500은 되어야 수렴에 문제가 없는 것으로 나타났다. 따라서 분석결과를 종합하면, 제한된 표본 수집 환경에서 랜덤 절편 잠재전이분석을 활용하기 위해서는 연속형 잠재 절편을 활용할 것을 권장하며 최소 300이상의 표본크기와 3 시점 이상의 반복 측정된 자료를 활용할 것을 권장한다.본 연구는 랜덤 절편 잠재전이 분석에 필요한 표본 크기와 시점 수를 탐색하여, 제한된 표본 수집 환경에서 적절한 표본 크기를 수집하는 데 가이드라인은 제시하였다는 의의가 있다. 또한, 모델링의 영역에서 랜덤 절편의 종류와 지표변수의 수를 조정하여 보다 안정적인 전이확률 추정을 위한 가이드라인을 제공하여 다양한 혼합모형의 활용에 기여할 수 있을 것으로 기대한다.