RAG시스템 구축시 비정형문서를 AI-OCR를 이용해서 파싱하고 청킹처리하게 된다. 특히 금융권 문서는 대용량이기도 하고 다양한 문서처리 노하우가 필요하단걸 절실히 느끼고 있다.
문서 파싱시 중요한것은 테이블을 처리하는것인데 테이블에 테이블 처리는 현존하는 어떤 AI-OCR도 복합 테이블 파싱은 어렵다.
또한 테이블 안에 셀정보가 좌측하고 동일하다는 의미로 "좌동", 위에 셀정보가 동일하다는 의미로 "상동"등의 용어가 심심찮게 나오는데 이것들을 시스템 프롬프트로 읽어 낼수 있을까
라는 의문을 가지고 테스트한 결과를 남기고자 한다.
AI-OCR에서는 파싱결과를 마크다운 또는 HTML로 전환할수 있기에 두가지 경우 테스트를 진행했다.
일관성을 포함한 정확성에서 3개의 모델이 준수한 결과를 보여준다.
anthropic의 Claude 3.5 Sonnet, openAI의 o1, DeepSeek R1 1
그외 sLLM을 포함한 모델들은 정확한 답변을 하지 못한다.
잘된예)
아쉬운예)
'관심분야 > 생성형AI' 카테고리의 다른 글
AI 새로운 전환점 : Titans 아키텍처 ( 발표: 2025.01.15 ) (0) | 2025.02.05 |
---|---|
Dense벡터 유사도검색 + Sparse 벡터 유사도검색 (0) | 2025.02.05 |
AI 기반의 지능형 PII 탐지 파이프라인 소개 (0) | 2025.01.23 |
RAG 검색 히팅율 올리기 (0) | 2025.01.21 |
RAG 평가 분석 후 개선방안 (0) | 2025.01.21 |