솔루션 목록으로
Solution 02
2025
Python
OCR API
Upstage
Image to Excel 데이터 수집 자동화
이미지 형태로 보관된 검사보고서를 OCR로 추출해 엑셀 데이터로 자동 변환
검사보고서 to Excel (2025)
많은 협력업체들의 부품을 이용하여 현장에서 완성체로 조립하는데 하자가 있는 부품을 관리하는데 어려움이 있음. 공장 출하 단계에서는 양품으로 판정되었지만 현장 조립 과정에서 불량이 발견되는 경우도 있음.
HD-E 입장에서는 품질 관리와 예지 보전을 위해 AX를 도모하지만, 오래된 검사 자료 대부분은 한글 문서로 작성되었고, 이마저도 대부분 이미지 파일 형태로 보관되어 있어 데이터 수집 과정에서 치명적인 문제가 있음.
인공지능을 활용한 데이터 분석이나 모델링을 진행하기 위해서는 이미지 형태의 검사보고서 내용을 엑셀 데이터로 변환하는 작업이 필요함.
업무자동화 시스템 프로세스
- 1Python + OCR API를 이용한 이미지 내 텍스트 추출
- 2Upstage OCR API를 이용하여 이미지 상의 텍스트를 추출하고 엑셀 파일로 저장
- 3생성형 AI의 OCR 기능도 활용 가능하나, 일관성 문제로 인해 OCR API 방식을 채택
- 4파이썬 + OCR API 방식으로 프로세스를 고정화한 다음, LangChain/LangGraph으로 고도화 추진 예정
개발 과정 및 결과물

검사보고서 to Excel 샘플 이미지

Application Python Code (ChatGPT 활용) — Upstage API Key 발급 필요

검사보고서 이미지 to Excel 파일 — 내용 추출 결과 1

검사보고서 이미지 to Excel 파일 — 내용 추출 결과 2
