Latent class model(잠재 클래스 모형)은 주로 사회과학 분야에서 설문조사 분석 시 자료에 잠재된 요인 도출 및 분석에 널리 이용되고 있다. 설문조사 데이터에 주어진 변수가 너무 많을 경우, 일부 변수는 그룹 간의 특성을 잘 설명하지 못하는 경우가 있다. 이때, 모든 변수를 이용하기보다는 정보가 손실되지 않는 범위 내에서 유의미한 변수를 선택하여 분석의 효율성과 모형의 성능을 높일 수 있다. 이를 위해 본 연구에서는 로그선형모형의 로그우도함수에 L₁-norm 패널티를 적용한 latent class model의 변수선택방법을 제안하고 추정을 위한 알고리즘을 제안한다. 제안 알고리즘은 그룹화 과정에 변수 선택 과정을 포함하고 L₁-norm 패널티를 사용함으로써 유의미하지 않은 변수를 정확히 제거해주기 때문에 모형의 성능을 높이고 그룹 결과의 해석을 용이하게 한다. 본 연구에서는 이를 바탕으로 시뮬레이션과 실증자료분석을 통해 모형의 응용 가능성을 연구하였다.
The Latent Class Model is widely used in the field of social sciences for analyzing survey data and extracting latent factors. When there are too many variables in the survey data, some variables may not effectively explain the characteristics between groups. In such cases, rather than using all variables, selecting meaningful variables within a range where information loss is minimized can enhance the efficiency of analysis and the performance of the model.This study proposes a penalized loglikelihood method for the Latent Class Model using the L₁-norm penalty and suggests an algorithm for estimation. The proposed algorithm includes a variable selection process in the grouping stage and effectively removes insignificant variables by using the L₁-norm penalty, thereby improving the performance of the model and facilitating the interpretation of group results. Based on this, we investigate the potential application of the model through simulations and empirical data analysis.