사회의 진보와 생산성이 지속적으로 향상됨에 따라 컴퓨터 기술도 지속적으로 혁신되고 대중화되었으며 기업의 정보 수집 능력도 크게 향상되었으며 데이터의 규모는 전례 없는 규모에 도달했다. 이러한 방대한 데이터 정보에 대해 기업의 원래 기술과 도구는 더 이상 요구를 충족시킬 수 없으므로 이러한 데이터를 처리하기 위한 새로운 기술을 연구하고 개발해야 한다. 이제 컴퓨터 기술과 수학 이론을 바탕으로 방대한 양의 데이터를 자동으로 처리하고 가치 있는 정보와 지식을 마이닝 및 분석하여 실제 의사결정에 도움을 주는 풍부하고 강력한 데이터 마이닝 기술이 개발되었다. 이런 배경에서 탄생한 데이터 마이닝 기술은 실제 업무와 떼려야 뗄 수 없는 관계다. 현재 데이터 마이닝 기술은 기업 운영의 효율성과 수익을 향상시키기 위해 다양한 산업에서 널리 사용되었다. 또한 다양한 비즈니스 요구를 충족시키기 위해 데이터 마이닝 기술은 클러스터링, 분류, 연관 분석 및 시계열 분석과 같은 다양한 방향으로 개발되었다. 상관 규칙 분석은 데이터 마이닝 기술에서 더 중요한 연구 방향이다. 이 논문에서는 관련 규칙 알고리즘 분석에 중점을 둔 데이터 마이닝 기술을 자세히 소개하고 실험적 연구와 고전적인 Apriori 알고리즘을 개선한다. Apriori 알고리즘의 경우 가장 핵심적인 문제는 빈번한 아이템 셋을 생성하는 것이다. 이에 데이터베이스 압축, 후보 아이템 셋 축소, 규칙에 맞지 않는 아이템 셋 사전 선별 등의 방향으로 개선해 클래식한 Apriori 알고리즘을 기반으로 알고리즘의 효율성을 더욱 향상시킨다. 이론적 분석이 완료된 후 파이썬을 통해 개선된 알고리즘의 유효성을 검증하기 위한 실험을 수행할 것이다.
With the progress of society and the continuous improvement of productivity, computer technology is constantly innovating and popularizing, the information collection ability of enterprises has also been greatly improved, and the scale of data has reached an unprecedented scale. For such a huge amount of data information, the original technology and tools of the enterprise can no longer meet the needs, so it is necessary to research and develop new technologies for processing these data. Now, based on computer technology and mathematical theory, rich and powerful data mining technology has been developed, which can automatically process massive data, mine and analyze valuable information and knowledge, and provide help for practical decision-making. The data mining technology born in this context is bound to be inseparable from the actual business. At present, data mining technology has been widely used in all walks of life to improve the operational efficiency and revenue of enterprises. In addition, in order to adapt to different business needs, data mining technology has developed in different directions, such as clustering, classification, association analysis and time series analysis and so on. Association rule analysis is an important research direction in data mining technology. This paper will introduce the data mining technology in detail, focus on the analysis of the association rule algorithm, and combine the experimental research and improvement of the classic Apriori algorithm. For the Apriori algorithm, the core problem is to generate frequent itemsets. In this regard, it can be improved by compressing the database, reducing the candidate item set, and pre-screening the itemsets that do not meet the rules, so as to further improve the efficiency of the algorithm on the basis of the classic Apriori algorithm. After completing the theoretical analysis, experiments will be conducted through python to verify the effectiveness of the improved algorithm.