유전자의 진화는 생명체의 진화의 기초이다. 인간의 유전체는 약 21,000 개의 단백질을 암호화하는 유전자를 포함하고 있다. 그러나, 그 중 수백여 개는 관련된 기능이 밝혀져 있지 않고, 단지 미규명 단백질로 알려져 있다. 이들 미규명 단백질들의 분자 기능 연구를 통하여 새로운 분자적 기능을 밝혀낼 수 있다. 본 연구에서는, 인간의 미규명 단백질들에 대한 진화학적 분석을 통하여, 동물의 진화 상에서 언제 해당 단백질들이 기원하였는지를 밝혔다. 인간의 미규명 단백질의 기원을 다섯 가지 진화 단계에서 결정하였다: 즉 (1) 비동물 생명체; (2) 비좌우대칭 동물; (3) 비후생 좌우대칭동물; (4) 비척삭 후생동물; (5) 비척추 척삭동물 단계이다. 또한, 다섯 개의 선택된 단백질에 대하여 상동성 단백질 분석을 통하여, 해당 단백질의 생물계 내의 분포 양상과 보존된 아미노산 서열 등을 결정하였다. 본 연구에서 축적된 분석 결과는 인간의 미규명 단백질의 진화 연구에 중요한 단서를 제공 할 것이다.
Gene evolution is the foundation of the organismal evolution. The human genome contains around 21,000 protein-coding genes. However, several hundreds of them are still not directly associated with specific functions and remained as uncharacterized proteins. Molecular functional study of the uncharacterized proteins may reveal novel functions. In this study, evolutionary analyses of human uncharacterized proteins were performed to identify when they first appeared during animal evolution. The origins of human uncharacterized proteins were determined at the five major evolutionary steps: (1) non-animal organisms; (2) non-bilaterian animals; (3) non-deuterostome bilaterians; (4) non-chordate deuterostomes; and (5) non-vertebrate chordates. For selected five proteins, additional evolutionary analyses were also carried out to identify organismal distributions and conserved amino acid residues. The information collected in this study may provide important clues for elucidating evolution of human uncharacterized proteins.