This study tried to establish a new speaking practice system using deep learning for non-native speakers of preschool or lower-grade elementary school children. While the basic speaking system assumes that the user can converse with the AI chatbot to some extent, the speaking practice system suggested in this study aims to reduce the child's burden by giving the child texts to read in advance and answer to the system’s questions according to the given text material.In order to use the new speaking practice system in reality, mainly two models in the speaking practice system need improvement. First, the performance of the Automatic Speech Recognition (ASR) model for non-native children's speech must be improved. Second, the Natural Language Processing (NLP) model for child response evaluation must be generalizable.Firstly, in order to improve the performance of the ASR model for non-native children's speech, spontaneous speech data of native adults was additionally used. The original data consists of read speeches of native adults, native children, non-native adults, and non-native children. It was confirmed in this study that the performance of speech recognition for non-native children improved with additional spontaneous speech data of native adults.Secondly, by introducing a deep learning method to the response evaluation system, it was possible to create a natural language processing model that can evaluate children's responses with over 90% accuracy even for new reading comprehension questions and answers that the NLP model have never been seen before. For the experiments, the ALBERT v3 model provided by Google was used. As a result of comparing 4 different trained models, it can be concluded that adding general paraphrase or non-paraphrase data to the model was helpful for generalizing the evaluation of the children’s responses to the reading comprehension questions. Also the result showed that question conditions prepended to the model inputs can give the NLP model better context on which to evaluate the users’ response.
이 연구의 목적은 미취학 및 초등학교 저학년 비원어민 아동을 위한 쉬운 말하기 연습 시스템을 만드는 것이다. 이를 위하여 본고는 독해 평가 기반의 말하기 연습 시스템을 제시하였다.독해 평가 기반의 말하기 연습 시스템을 실제 서비스에 적용하기 위해서는 음성 인식 모델의 성능이 미취학 및 초등학교 저학년 비원어민 아동에 대하여 높아야 하고, 사용자 응답 평가 시스템이 새로운 질문과 답변에 대해서도 잘 대응할 수 있어야 한다. 이 연구는 독해 평가 기반의 말하기 연습 시스템이 실제 상용 서비스에서 사용될 수 있도록 음성인식 모델 개선 실험 및 사용자 응답 평가 시스템 일반화 실험을 진행하였다.첫번째로 음성 인식 모델 실험에서는 기존의 원어민 성인, 원어민 아동, 비원어민 성인, 비원어민 아동의 낭독 발화 데이터를 모두 넣어 음향 모델을 학습한 결과와 추가적으로 원어민 성인의 자유 발화 데이터를 넣어 학습한 결과를 비교하였다. 결과적으로 자유 발화 데이터를 음성 인식 모델 훈련에 포함시켜서 비원어민 아동 음성 인식에 대한 모델 성능이 높아지는 것을 확인할 수 있었다.두번째로 사용자 응답 평가 모델을 일반화하기 위하여 딥러닝 모델인 영어 알버트 모델을 훈련하였고, 훈련 시에 본 적 없는 새로운 독해 질문과 정답에 대해서도 사용자 응답의 정오 판단을 90% 이상의 정확도로 대응할 수 있는 일반화된 사용자 응답 평가 모델을 구축할 수 있었다.