특허
딥러닝 기반 문서 이해 방법및 그 장치(deep learning-based document understanding method andapparatus)
- 날짜 : 2026.01.16 11:08
[발명의 명칭]
딥러닝 기반 문서 이해 방법및 그 장치(deep learning-based document understanding method andapparatus)
[출원번호/일자)]
2023-0192039 (2023.12.27)
[등록번호/일자)]
2707962 (2024.09.12)
[요약]
딥러닝 기반 문서 이해 방법 및 그 장치가 개시된다. 딥러닝 기반 문서 이해 방법은, (a) 비정형 데이터를 포함하는 타겟 문서를 학습된 딥러닝 기반 문서 분류 모델에 적용하여 페이지별 문서 유형을 분류하는 단계; (b) 상기 타겟 문서의 페이지별 구조를 분석하여 각 페이지내 구성 요소를 각각 탐지하는 단계; 및 (c) 상기 분류된 문서 유형과 상기 탐지된 구성 요소에 따라 서로 상이한 방식을 적용하여 상기 각 탐지된 구성 요소에서 필요한 정보를 추출하여 데이터베이스 적재 가능한 구조화된 데이터 포맷으로 변환하는 단계를 포함한다.
[대표도면]
