딥러닝 기반 기술도면 내 테이블 정보 추출연구
- Resource Type
- Dissertation/ Thesis
- Authors
- 김민태
- Source
- Subject
- Language
- Korean
본 논문은 딥러닝 기반의 기술도면 내 테이블 정보 추출 시스템을 제안한다. 테이블 정보를 추출하기 위해서는 먼저 테이블 영역 추출이 필요하며 테이블 영역을 추출하기 위해 VGG19 네트워크를 백본으로 하여 인코딩-디코딩 구조를 가진 테이블 영역 추출 오픈소스인 TableNet을 이용한다. 기술도면은 일반적으로 PDF 형식으로 저장되어 있어 원본 그대로를 TableNet에 입력할 수 없어 이미지로 변환하였으며 이때 데이터 손실을 최소화하기 위해 BMP 형식으로 변환하였다. 변환된 이미지의 크기가 TableNet 입력으로 사용되기에 너무 컸기 때문에 이미지 축소가 필요하며 이 과정에서 발생할 수 있는 선 정보 손실을 막기 위해 선 추출 및 선 확장을 위한 전처리를 진행하였다. 전처리된 이미지는 TableNet의 입력으로 사용되어 각 픽셀에 대해 테이블에 속할 확률을 예측하며 이 예측값을 이용해 테이블 마스크 이미지를 생성하였다. 생성된 마스크는 테이블 영역을 대략적으로 나타내기 때문에 테이블 영역을 더 정밀하게 예측하기 위해 테이블 영역 확장 및 선 검출과 윤곽선 검출을 이용해 테이블 영역을 정밀 추출 할 수 있었다. 테이블 영역 추출 성능에 대해서는 160장의 기술도면을 대상으로 테스트 되었으며 그 결과 96%의 Recall 성능을 보였다. 마스크 이미지에선 테이블 영역에 대한 좌표를 획득하고, 이 좌표를 PDF 좌표로 변환하여 PDF 내의 테이블데이터 추출 오픈소스인 Camelot에 전달된다. Camelot은 전달받은 PDF 원본과 테이블 좌표를 이용해 좌표 범위 내의 텍스트 정보들을 추출하고, 좌표 범위 내의 선 정보들을 이용해 원래 테이블과 가능한 유사한 형태로 텍스트들을 정렬하여 csv 형태로 추출 가능하였다. 본 논문에서 제안한 시스템은 기존의 일반 문서뿐만 아니라 기술도면에 대해서도 높은 수준의 테이블 영역 추출이 가능하였으며 테이블 영역에 해당하는 테이블데이터 추출이 가능함을 보여주고, 이를 이용하면 사람이 직접 하던 테이블 추출 문제를 자동화하여 더 효율적인 기술도면 버전 관리가 가능할 것으로 보인다.