다자대화는 여러 명의 사람 간의 대화를 지칭하며, 두 명 사이에서 이루어지는 대화와 대비된다. 일상적으로 여러명과 상호작용하는 환경에서 쉽게 일어나며, 인터넷 게시판과 같은 온라인 상황에서도 발생한다. 여러명이 참여하기 때문에, 각 발화마다 직접적으로 연관이있는 현재 발화자와 발화 대상자 뿐만이 아니라 간접적으로 듣는 간접적 참여자들도 존재하게 된다. 기존 대화시스템에 대한 연구들은 대부분 화자가 여러명인 상황을 고려하지 않기 때문에 관련된 연구가 필요한 실정이다. 다자대화 환경을 고려한 과거 연구의 경우 직접적인 참여관계만 반영하여 그래프로 모델링하는 연구가 주를 이루었다. 하지만 직접적인 참여관계만 반영하게 되면 간접적인 참여관계가 중요하게 작용하는 대화 양상에서는 대화 히스토리에 대한 적절한 응답 생성에 어려움이 있다. 본 연구에서는 직접적인 참여관계 뿐만 아니라 간접적인 참여관계 효과적으로 반영할 수 있도록 하는 두 개의 모듈로 기존 트랜스포머를 개선하는 SoPI 모델을 제안한다. 두 개의 모듈은 각각 초점 토큰 합산기와 발화자-발의 부분 임베딩으로 트랜스포머에 다자대화 해석에 필요한 정보들을 전달한다. 또한, 대화 히스토리의 핵심이라 볼 수 있는 발의 개념을 도입해서, 대화의 초점을 찾음으로써 더욱 알맞는 응답을 생성할 수 있는 기법을 제시한다. SoPI 모델은 다자대화 응답 생성 태스크인 Ubuntu IRC 벤치마크에서 실험 한 결과, 모든 지표에서 이전 최고 성능 모델 및 다양한 기준 모델들을 뛰어넘는 우수한 성능을 기록하였다. 추가적으로 본 연구에서는 대화 내 참여자 수의 변화가 각 모델에 미치는 영향 등 여러 분석을 통해서 다각도로 제안하는 SoPI 모델의 우수성을 입증한다.
Multi-party conversations commonly take place on online discussion platforms as well as in various off-line situations. For dialogue systems to effectively comprehend multi-party conversations, it is important to understand the dynamic nature of engagement between speakers and the unique characteristics of each speaker. However, recent approaches only emphasize the direct engagement of a speaker and addressee, leaving out other indirectly participating interlocutors. In this work, we present a simple yet effective method, SoPI, which introduces two novel modules to capture the subtle variations in engagement level. We also introduce the concept of pseudo initiatives that are extracted from the dialogue context as a key element in multi-party dialogue generation. Extensive experiments are conducted on the UbuntuIRC benchmark and SoPI achieves the best performance in all metrics including human evaluation, compared to the previous state-of-the-art model and various baselines. Analysis on the effect of the varying number of interlocutors further show the effectiveness of SoPI in Multi-party conversations.