본 연구는 국내 경제 전망에 대한 실시간 예측 모형을 개발하는 것을 목적으로 한다. 또한 예측의 적시성과 예측의 정확성을 제고시키기 위해 비정형 데이터인 경제 뉴스를 활용하는 텍스트 마이닝과 기계학습 방법론을 활용한다. 특히, 신경망분석 중 하나인 장단기기억(LSTM: Long Short Term Memory) 알고리즘과 게이트순환유닛(GRU: Gated Recurrent Unit) 알고리즘을 활용했으며 예측의 요인별 구조를 파악하기 위해 자기회귀 혼합데이터샘플링모형(AR-MIDAS: AutoRegressive Mixed Data Sampling Model)을 분석 방법에 추가했고, 비정형 데이터인 경제 뉴스를 정량화하기 위해 TF 가중 방법인 TF-IDF 방법론을 활용했다. 분석 결과, LSTM은 예측력 측면에서 우월한 것으로 나타났지만 신경망 분석의 단점인 요인 분석이 블랙박스로 처리되는 단점이 있는 것으로 나타났다. 반면, AR-MIDAS 방법으로 추정한 결과, t기 전산업 생산지수가 상승하고 t-1기 실업률이 하락할수록 국내 경기는 양호해지는 것으로 나타났다. 또한 첫 번째 달의 경제 뉴스는 경제에 부정적인 영향을 미치는 반면 두 번째 달의 경제 뉴스는 경제에 긍정적인 영향을 미치는 것으로 나타났다. 이와 같이 본 연구는 GDP 예측의 적시성을 제고시키기 위해 GDP nowcasting 모형보다 예측 주기를 단축시켰으며 갑작스런 이벤트 발생 시 이를 GDP 예측에 즉각적으로 반영하기 위해 온라인 상의 경제 뉴스 데이터를 활용했다.
This paper is trying to develop a real-time forecast model for the gross domestic product. And text mining and machine learning that utilize economic news, which is unstructured data are used to enhance the timeliness of predictions and the accuracy of predictions. In particular, the long short term memory(LSTM) algorithm and the gated recurrent unit(GRU) algorithm, which are one of the neural network analyses, are used and an autoregressive mixed data sampling model is added to explain the structure of each factor. And the TF-IDF methodology is used to quantify economics news which is unstructured data. As a result of the analysis, LSTM is superior in terms of predictive power, but it has a disadvantage that it is difficult to understand the factors because they are treated as a black box. By the way, as a result of estimating by the AR-MIDAS method, it is found that as the industrial production index at t increases and the unemployment rate decreases at t-1, the gross domestic product at t improves. It is also found that economic news in the first month of the quarter had a negative impact on the economy, while economic news in the second month had a positive impact on quarterly GDP. As such, this study shortened the prediction cycle compared to the GDP nowcasting model to improve the timeliness of GDP prediction, and used online economic news data to immediately reflect it in GDP prediction in the event of a sudden event.