OCR 2

[미니 과제] 금융 문서 특화 OCR 파이프라인 구축기 — 4일간의 팀 과제

0. 프롤로그 4일동안 5명이 팀이 되어 OCR 엔진을 비교하고 개선하는 실험을 했다. 결과보다 재미있었던 건 과정속에서 나온 수많은 시행착오와 질문이었다. 1. 과제 개요금융권에 재직당시 "고객이 쓴 서류를 스캔 한 번으로 다 읽어주고 전산에 반영까지 된다면 얼마나 편할까?" 라는 생각을 해본 적이 있었다. 그래서 이 과제를 통해 글자들이 어떻게 인식되고 인식률과 속도를 높일 수 있는 방법은 뭐가 있을 지 탐구해볼 수 있겠다라는 기대가 컸다. 2. 데이터셋 선정 과정 후보 데이터셋으로는 한국 식당의 메뉴판, 차량 번호판 데이터, 항만 컨테이너 데이터 등이 있었다. 나는 "금융 서류" 의견을 냈다. 아래와 같은 이유를 바탕으로 팀원들에게 내 의견을 피력했다. 1. 주어진 리소스 안에서 데드라인까지..

CNN을 활용한 손글씨 이미지 인식

1. 목적과 역할 분석 - MNIST 데이터셋을 이용해 CNN(합성곱 신경망) 모델을 학습- 저장된 모델을 불러와 사용자가 입력한 이미지에서 숫자를 인식- 입력 이미지 전처리 → 모델 예측 → 결과 시각화까지 일련의 AI 파이프라인을 실습- 이는 OCR 시스템에서 매우 중요한 딥러닝 기반 이미지 분류의 기초 2. 기초 라이브러리 분석 tensorflow : 딥러닝 모델 생성, 학습, 평가, 저장 numpy : 이미지 데이터를 배열로 처리, 수치 연산matplotlib.pyplot : 예측결과 시각화 PIL.Image : 이미지를 열고 변환하기 위해 사용 cv2 : OpenCV (비전 관련 고급 전처리에 활용 가능)os : 모델 저장 파일 유무 확인, 조건 분기 처리 3. 주요 기능 분석 Sequentia..

Data Analysis Study 2025.07.29