Fingerprint identification is a technology which has been widely accepted for personal identification in many areas such as criminal investigation, access control, and Internet authentication due to its uniqueness. Most available systems for fingerprint identification use the minutiae matching for identification. The performance of minutiae extraction algorithms relies heavily on the quality of the fingerprint image because the minutiae-based approach is very sensitive to noise or image-quality degradation. Poor-quality images result in spurious and missing features which degrades the performance of the identification system. So if the quality of the image can be examined first, the image with very poor quality can be rejected. The useful information can be combined into the procedure of post-processing and matching scheme to improve the identification process. Therefore it is desirable to design a classification scheme which is able to examine the quality of a fingerprint image before it is processed by the fingerprint identification systems. Decision-tree is one of the well-known data mining methods that are used in classification problems because of its fast and effective features. In this paper a new classifier based on decision tree theory for classification of fingerprint image quality is proposed. This new classifier has many advantages in solving the fingerprint quality classification problem. It can generate the rules with almost all of the original information from the classifier even after all of the original fingerprint images are lost. It means it will be not necessary to save all the original fingerprint images because the classifier can combine the rules with the new coming data to build a more precise classifier with more information to classify the fingerprint image quality. And the new classifier can give weight to different fingerprint images if they come from the sensors with different importance. The advantages of the new classifier make the fingerprint image classification system very powerful and feasible. The proposed method has a very good performance which is proved by the experiments.
어떤 값들이 특정한 값 벡터들로부터 분실되는 불완전한 데이터들이 컴퓨터 비젼, 생명학적 시스템들, 분류 시스템들, 리모트 센싱 등등 군집형태를 포함해서 필드들이 넓게 분포되어 있는 곳에 존재한다. 분류는 기계학습에서 매우 중요한 연구주제이다.숫자 데이터의 분류를 위한 많은 알고리즘들이 있다. 그러나 불완전한 데이터의 존재는 분류 모델들의 학습 질을 떨어뜨린다. 그리고 그 불완전한 데이터는 실 세계에서는 아주 흔하다. 보통, 분류 문제는 두 단계로 나누어질 수 있다: 학습 단계와 분류 단계. 분류 문제에서 불완전한 데이터를 다루는 많은 방법들이 제시되고 있지만 그들 대부분은 단지 학습단계에서 불완전한 데이터를 다루는 프로세싱에 초점이 맞춰져 있다. 분류 단계들에서 나타나는 불완전한 값에 대해 거의 모든 현재의 접근들이 효과가 있을 수 없다. 그래서 학습 단계와 분류 단계 양쪽에서 불완전한 데이터를 다루는 것이 중요하고 현실 세계 문제들을 풀기 위해 적용되는 것이 필요하다. 그리고나서 새로운 방법이 불완전한 데이터를 분류하기 위해서 제시되었고, 그것은 놀라운 성능을 보여준다. 그와 동시에, 이 새로운 방법은 두 가지 다른 중요한 문제들을 풀 수 있다: 규칙 정제 문제 (rule refinement problem) 와 중요성 우선권 문제 (importance preference problem) .중요하게도, 이것은 매우 강력하고도 중요한 분류기이다. 이것은 이런 모든 문제들을 풀 수 있는 것과 동시에 매우 잘 해결할 수 있다.