이 연구는 웰빙과 관련된 포털사이트 텍스트 자료를 대상으로 연관규칙과 미래신호 분석을 적용하여 키워드 연관규칙과 미래 이슈에 대한 정보를 제공함으로써 웰빙에 대한 언론과 대중의 트렌드를 탐색하는데 목적이 있다. 이를 위해 텍스트 전처리를 거친 81,076건의 뉴스기사와 2,672,692건의 블로그 및 지식인 자료를 연구에 활용하였다. 웰빙과 관련된 키워드 연관규칙은 Python3을 활용하여 지지도, 신뢰도, 향상도 값을 산출하여 도출하였다. 또한, 미래신호 분석은 웰빙 트렌드를 확인하기 위해 2구간으로 나누어 시계열적(Phase1: 2004년∼2010년, Phase2: 2011년∼2019년) 분석을 실시하였다. 분석결과는 다음과 같다. 첫째, Phase1에 나타난 웰빙 관련 언론 키워드 연관규칙은 {상품, 트렌드}, {소비, 트렌드} 등이 도출되었으며, 대중에게는 {건강}, {건강, 행복} 등으로 나타났다. Phase2에 새롭게 나타난 웰빙 관련 연관규칙은 {마케팅}, {페이스북} 등이 나타났으며, 대중들의 자료에서는 {생각, 음식}, {운동}, {요리} 등의 키워드 연관규칙이 생성되었다. 둘째, 웰빙과 관련된 키워드들의 미래신호를 분석한 결과 Phase1 언론에서 잠재신호로 인식되었던 ‘다이어트’, ‘디자인’ 키워드가 Phase2에서는 미래 이슈가능성이 높은 약신호로 나타났다. Phase1 대중에서 나타난 약신호는 ‘여행’, ‘캠핑’, ‘카드’로 나타났으며, Phase2에는 해당 단어들이 강신호로 나타나면서 미래신호 분석의 가능성을 확인하였다.
This research aims to explore the well-being trend of the media and the public by providing information on keyword association rules and future issues. The research was conducted by applying association rules and future signal analysis, focusing on the portal site text data related to well-being. A total of 81,076 news articles and 2,672,692 blogs and intellectual data that have been preprocessed were utilized for the study. Keyword association rules related to well-being were derived by calculating support, confidence, and lift values using Python3. In addition, the collected data was divided into two phases to confirm the well-being trend, and then, future signal analysis was performed with time series data (Phase1: 2004-2010, Phase2: 2011-2019). The results of the analysis are as follows. First, as for media keyword association rules related to well-being in Phase 1, {product, trend}, {consumption, trend}, etc. were derived, and, to the public, {health}, {health, happiness} were found. {Marketing}, {Facebook}, etc. appeared, and keywords rules such as {Think, Food}, {Exercise}, {Cooking} were created in the public data. Second, as a result of the future signal analysis with keywords related to well-being, the keywords ‘diet’ and ‘design’, which were recognized as potential signals in the media in Phase 1, were found as weak signals with high potential for future issues in Phase 2. The weak signals that appeared to the public in Phase 1 were ‘travel’, ‘camping’, and ‘card’, and in Phase 2, the corresponding words appeared as strong signals, confirming the possibility of the future signal analysis.