본 연구는 클라우드 환경에서 주성분 분석과 KNN을 이용하여 수천장의 이미지를 인식 및 분류한 내용이다. 인간의 얼굴을 컴퓨터에서 인식하기에 계산과정이 복잡하기 때문에 정확하게 인식하려면 컴퓨팅 성능이 강력한 컴퓨터가 있어야 한다. 인간-컴퓨터 상호작용 및 객체인식분야의 연구 이미 오래 전 부터 시작했다. 자세예측, 얼굴인식, 표정인식 등등. Twitter, Linkedin 그리고 패스북 등 서셜 네트웍 서비스발전에 따라 매일 수많은 이미지를 업로드 했다. 예를 들면 트위터는 하루당 거의 7TB데이터생산되고, 패이스북은10TB가까이 된다, 그리고 미디어데이터 용량이나 해상도도 계속 늘어나고 있고 파일 포맷도 다양하게 늘고 있다.그러나 아직까지 이미지데이터나 미디어 데이터를 분석 및 응용 시장이 매우 크지만 활용 할 수 있는 응용 프로그램이 매우 적다. 경쟁사간에 연구진도도 키 포인트 된다. 기존에 있었던 툴들이 소형 데이터 분석만 가능 할 뿐이다, 또한 얼굴 이미지의 복잡성으로 인해 분석 장비 또한 강력한 컴퓨팅 파워가 있어야 한다. 그래서 안정적이고 효율적인 이미지 분석 아키텍처에 관한 연구가 매우 긴박 한다. 다행이 구글이 이러한 무료 플랫폼을 제고했다, 하둡은 대용량데이터 분석 할 수 있는 효과적인 플랫폼이다. 이번 논문에서 우리는 클라우드 환경에서 대용량 이미지를 KNN 과 PCA 기술을 통해서 빠르게 인식 및 분류하는 일체화 솔루션을 제시했다. 실험결과를 보면 시스템 성능이 훨씬 현저 하게 향상됨을 나타난다. 따라서 분석 시간이 매우 절약 되었고 인식정확도도 조금 향샹되었다.
Complexities to the human face require tremendous computing power to recognize and distinguish faces correctly. Research in this field pertains to human-computer interaction and object recognition—including pose estimation and the recognition of faces, expressions, and gestures. With the advent of online social networks such as Twitter, LinkedIn and Facebook, the number of images being uploaded is rapidly increasing. For example, the amount of data generated by Twitter every day reaches up to 7TB. Facebook also produces around 10TB because media files have recently changed from low capacity, low definition to high capacity and high definition formats. However, there is a severe lack of applications that can make use of this data. The proliferation of image data has led to a demand for research into large image set analysis. Such research will become the key basis for competition, because standard tools and procedures are not designed to handle massive datasets. Moreover, images are complex multidimensional structures and require solid computing techniques for recognition. It is extremely urgent to develop a new robust and efficient platform. Fortunately, the Hadoop platform provides a powerful framework for computationally intensive distributed processing under a free license. In this paper, we provide a full solution to facial image tagging and classification in a cloud environment using Hadoop and KNN. Experimental results confirm that this system makes significant improvements in performance. Furthermore, the effectiveness of the system is evaluated by comparing recognition rates and processing times.