효과적인 신약 후보물질 발굴을 위한 다양한 인공지능 기술들이 여럿 제안되고 있다. 많은 기술들이 약물의 분자구조를 문자열 및 그래프 데이터로 나타내고, 이를 생성형 인공지능 모델을 통해 학습하여 새로운 분자구조를 생성하는 기능을 수행한다. 하지만 종래의 기술들은 정보기술 전문가에게 친숙한 분자구조 표현법에 기반하여 개발되었으며, 이로 인해 정보기술에 친숙하지 않은 신약개발 실무자들이 이해하고 활용하기 어렵다는 문제가 있다. 이러한 문제를 해결하기 위해 본 논문에서는 분자구조 이미지 표현법 기반의 분자구조 생성 기법을 제안하며, DDPM 및 Repainting 알고리즘을 활용한 분자구조 생성 방법을 설명한다. 제안하는 기술은 벤치마크 데이터집합들을 통해 기존 기술 대비 분자구조 생성에 관한 우수성을 확인하였으며, 나아가 사용자의 요구사항에 부합하는 분자구조들을 생성할 수 있음을 확인하였다.
Various artificial intelligence techniques are being suggested to unearth novel drug candidates. These techniques use the molecular structure data of drugs with string-based and graph-based representation methods, leveraging generative AI models to glean knowledge from them, thereby enabling the creation of novel molecular structures. However, these methods were developed based on molecular structure representations familiar to IT professionals, which make their comprehension and application by drug development researchers who lack familiarity with information technology challenging. To address these challenges, this paper introduces a molecular structure generation technique founded on the representation of molecular structures as images. We elucidate the process of crafting molecular structures using the Denoising Diffusion Probabilistic Model (DDPM) and Repainting algorithms. The proposed technique demonstrated its superiority in generating molecular structures compared to existing methods, as evidenced by benchmark datasets. Moreover, we also confirmed its capability to generate molecular structures meeting user requirements.