Microcredit extends small loans (microloans) to impoverished borrowers who typically lack collateral, a steady job, or verifiable credit history. Microfinance firms have based their energies on developing rural communities and assisting individuals with financial difficulties. Since their conception, states, researchers, and other institutions have paid close attention to them. On the other hand, microfinance is a vulnerable market, and microcredit carries a high risk of default. These have raised the business risk for microfinance institutions. As a result, credit risk analysis of microfinance has become a pressing concern. Despite the urgency, few studies use large data sets and sophisticated methods to assess microcredit’s credit danger. Data mining techniques are a new discipline for extracting useful information from vast quantities of data. We can use them to conduct inductive reasoning and automatically classify customers’ credit risks. As a result, developing a credit risk assessment model will help microfinance companies increase personal credit risk evaluation efficiency and accuracy, service quality, and risk management capabilities. This study compares various data mining techniques and recommends the best one for analyzing microcredit credit risk. To that end, we obtained 46471 loan records from a Chinese microfinance company. We used IBM SPSS Modeler 18 and IBM SPSS Statistics 24 for the study. The results show that the logistic regression model has the advantages of less restrictive assumptions, less necessary parameters, no strict dependent variable constraints, and clear conclusions.
소액대출은 일반적으로 담보, 안정적인 직업 또는 확인 가능한 신용기록이 부족한 빈곤한 차용인에게 소액대출을 제공하는 것이다. 소액금융 회사는 농촌 지역사회를 개발하고 재정적 어려움을 겪는 개인을 지원하는 데 집중해 왔으며, 최근에는 국가, 연구원 및 기타 기관에서 많은 관심을 갖고 연구하고 있는 분야이다. 한편, 소액금융은 신용위험에 취약한 시장이며, 채무불이행 위험이 높기 때문에 소액금융 기관의 비즈니스 위험 또한 높아지고 있다. 따라서 소액금융의 신용위험분석은 시급하게 다루어야 할 중요한 주제라고 할 수 있다. 그럼에도 불구하고 소액대출의 신용위험을 평가하기 위한 빅데이터 및 데이터 분석기법을 활용한 계량적인 연구는 지금까지 많이 수행되지 않았다. 데이터마이닝은 방대한 양의 데이터에서 유용한 정보를 추출하는 분야로서, 이를 활용하여 귀납적 추론을 수행하고 고객의 신용 위험을 자동으로 분류할 수 있다. 따라서 소액대출 빅데이터와 데이터마이닝 기법을 활용한 신용위험평가 모형 개발은 소액금융 회사로 하여금 개인 신용위험평가의 효율성 및 정확성 제고, 서비스 품질 및 위험관리 능력을 향상시키는 데 도움이 될 것이다. 본 연구에서는 다양한 데이터마이닝 기법을 비교하여 소액대출 신용위험분석에 가장 적합한 기법을 제시하고자 한다. 이를 위해 중국 소액금융 회사인 NEO INCLUSIVE로부터 46471건의 대출 빅데이터를 수집하였고, 분석을 위해 IBM SPSS Modeler 18 및 IBM SPSS Statistics 24를 사용하였다. 분석결과 인공신경망과 의사결정나무 모형 등이 예측 정확도에서는 약간 우수한 것으로 나타났으나, 로지스틱 회귀분석은 매개변수 및 종속변수에 대한 제약 완하와 분석 결과를 명확하게 해석할 수 있다는 점에서 장점을 가지는 것으로 나타났다.