최근 딥러닝 기반 종단형 음성인식 모델 구조의 발전에 따라 큰 성능 향상이 있었으나, 훈련-테스트 불일치가 큰 경우 테스트 시에 성능 저하가 크다는 문제는 해결되지 않았다. 예측하지 훈련-테스트 불일치에도 강인한 모델을 만들기 위해서 훈련된 모델의 여러 epoch 별 weight 각각을 평균 내는 기법이 최근 제안되었으며, 이는 음성인식 분야에서도 좋은 성능을 보임이 선행연구를 통해 검증되었다. 본 논문에서는 weight 평균 기법의 적용 시 특정한 epoch 들을 선택하는 방법론에 따라 음성인식 글자오류율의 추이를 측정하였다. 한국어 음성 데이터에 대한 실험결과, 훈련-테스트 불일치가 큰 실시간 디코딩의 경우 최고선택법이, 불일치가 작은 비실시간 디코딩 시에는 최후선택법이 상대적으로 좋은 성능을 보임을 확인하였다.