인터넷 기술의 발달로 멀티미디어 플랫폼들이 빠르게 성장함과 동시에 스토리지에 저장되는 멀티미디어 콘텐츠도 폭발적으로 증가하고 있다. 이에 따라 멀티미디어 콘텐츠를 효율적으로 관리하기 위한 연구가 활발하게 진행되고 있으며 이러한 기술 중 하나로 콘텐츠의 고유 특성인 핑거프린트를 이용하여 콘텐츠를 식별하는 핑거프린팅 기술이 있다. 비즈니스에서 사용되는 핑거프린트를 이용한 콘텐츠 식별 기술은 검색 속도와 정확도 등 여러 요구 사항들로 인해 데이터베이스에 저장된 핑거프린트를 검색하거나 메모리에 핑거프린트를 저장하여 검색하는 경우가 대부분이다. 이러한 운영 방식은 콘텐츠가 증가하면 할수록 메모리를 증가시키고, 속도를 개선해야하는 한계가 있기 때문에 빅데이터 기술과 같은 민첩성과 확장성을 확보하는 연구가 필요하다. 따라서 본 논문에서는 빅데이터 환경에서 효율적으로 핑거프린트를 추출하고 검색하여 콘텐츠를 식별할 수 있도록 Elasticsearch를 이용한 오디오 핑거프린트 기반의 콘텐츠 식별 시스템을 제안한다. 핑거프린트 추출/검색 알고리즘이 동일한 경우, 콘텐츠 식별 결과에 큰 차이가 없어 기존 메모리 기반의 핑거프린트 검색 시스템을 대체할 수 있음을 확인하였고 이를 통해 메모리 기반의 핑거프린트 검색 시스템의 한계점을 극복할 수 있을 것으로 기대된다.
Multimedia platforms have experienced rapid growth due to the development of Internet technology. At the same time, multimedia content stored in storage has gone through an explosive growth. Accordingly, researchers have been actively conducting studies on ways to efficiently manage multimedia content. One such method is a fingerprinting technique that identifies content using a fingerprint as a unique characteristic of the content.Content identification technology using fingerprints used in business often searches for fingerprints stored in a database or in memory due to various requirements such as search speed and accuracy.This operation method has a limitation in that as content increases, memory and speed also increase. Therefore, research to secure agility and scalability, such as big data technology, is needed.In this paper, the researcher proposed an audio fingerprint-based content identification system using Elasticsearch to efficiently identify and retrieve fingerprints in big data environments.When the fingerprint extraction/search algorithms are the same, it is confirmed that there is no significant difference in the content identification results. This means that existing fingerprint-based search systems can be replaced as this is expected to overcome the limitations of the memory-based fingerprint search system.