멀티미디어 플랫폼의 대중화로 인하여 유통되고 있는 수많은 동영상들의 불법성 분석을 지원할 포렌식 방법이 필요하며, 최근 동영상 분류에 인공지능 기술을 도입하는 연구가 활발히 진행되고 있다. 본 논문에서는 입력된 동영상에서 프레임 차이값 히스토그램을 추출하여 비주얼 리듬을 생성하고 변형된 DenseNet-201 모델을 활용하여 장면 전환을 검출함으로써 편집 및 무편집 동영상으로 분류하여 불법성 분석 대상을 선별하는 포렌식 알고리즘을 제안한다. 편집 동영상은 급격한 장면 전환과 앵글 변화가 포함되었고, 무편집 동영상은 그렇지 않은 동영상으로 정의했다. 무작위 길이의 동영상을 3분 단위의 세그먼트로 분할하고, 프레임 차이값 히스토그램으로 비주얼 리듬 이미지를 생성하였다. 이를 변형된 DenseNet-201 모델에 적용하여 편집 및 무편집 세그먼트로 구분하였고, 비율에 대한 임계값 필터링을 통하여 최종적으로 편집 및 무편집 동영상 분류를 수행했다. 실험을 통하여 제안하는 동영상 분류 포렌식 알고리즘이 세그먼트 단위로 95.91%, 전체 동영상에 대해 94.50% 분류 정확도를 갖고 있음을 보였다.
Due to the recent popularization of multimedia platforms, there is a need for a forensic method to support the illegality analysis of the numerous distributed videos. Recently, research on introducing artificial intelligence technology to image analysis is being actively conducted. This paper proposes a forensic algorithm to select videos for the illegality analysis, which extracts the histogram of frame difference value from an input video to create a visual rhythm and detect shot change using modified DenseNet-201 model to classify the video into edited or unedited video. Edited videos included sudden shot changes and angle changes, and non-edited videos were defined as videos that did not. A video of random length was divided into 3-minute segments, and a visual rhythm image was created with a histogram of frame difference values. This image was applied to the modified DenseNet-201 model to classify into edited and unedited segments, and finally classified edited and unedited videos through threshold filtering for the ratio. Through experiments, it was shown that the proposed video classification forensic algorithm has 95.91% classification accuracy for each segment and 94.50% classification accuracy for the entire video.