고도화되는 디지털 범죄를 해결하기 위해 다양한 디지털 포렌식 기술이 연구되고 있다. 특히, 동영상을 이용한 범죄가 증가하고 있지만 방대한 데이터 규모로 인해 인력 및 자원 측면에서 제약이 있어서 동영상 포렌식에 인공지능을 도입하는 연구도 진행되고 있다. 본 논문에서는 Conv3DNet 모델을 이용하여 다양한 동영상에서 상대 동의를 구하고 촬영한 동영상(동의) 및 상대 동의를 구하지 않고 촬영한 동영상(비동의)으로 분류하는 알고리즘을 제안한다. 먼저 동의 및 비동의 동영상의 기준을 정의하고, 장시간의 동영상을 세그먼트 단위로 분할하여 동의 및 비동의 동영상 데이터셋을 구축하였다. 그 후에 세그먼트 단위의 동영상에 대해 프레임 특징을 추출하는 전처리를 수행하였고, 연속적인 프레임들에서 인접한 프레임 내 객체의 외관과 행동을 추적하여 학습하는 Conv3DNet 모델에 적용하였다. 특히, Conv3DNet 모델은 동의 및 비동의 동영상 분류를 위하여 변형과 파라미터 최적화를 수행하였다. 제안한 알고리즘의 성능 검증은 세 종류의 옵티마이저(SGD, Adam, Nadam)를 이용하여 수행하였고, 최종적으로 Nadam 옵티마이저를 이용한 동의 및 비동의 동영상 분류 알고리즘을 통해 94.18% 정확도를 달성하였다.
Various digital forensic technologies are being studied to solve increasingly sophisticated digital crimes. In particular, crimes using video are increasing, but, there are limits in terms of manpower and resources due to the massive amount of data. Therefore, research on applying artificial intelligence to video forensics is also being conducted. In this paper, we propose an algorithm for classifying various video files into videos taken after obtaining consent (agreed) and videos filmed without consent (non-agreed) using the Conv3DNet model. First, the criteria of agreed and non-agreed video is defined, and video datasets are constructed by segmenting long-time videos into segments. After that, pre-processing is performed to extract frame features in segment units and applied to the Conv3DNet model, which learns by tracking the appearance and behavior of objects in adjacent frames of successive frames. In particular, the Conv3DNet model is modified and optimized its parameters to classify agreed and non-agreed videos. The performance of the proposed algorithm was verified using three types of optimizers(SGD, Adam, and Nadam), and finally achieved 94.18% accuracy in the agreed and non-agreed video classification using the Nadam optimizer.