OCR 영수증 스캔 작동 방식: 완벽한 가이드

OCR 스캔이 종이 영수증을 디지털 데이터로 변환하는 방법을 알아보세요 — 이미지 캡처부터 개별 항목 추출까지. 영수증 처리 기술을 이해하세요.

Yulia Lit

Yulia Lit

소비자 심리학 및 행동경제학 연구원

13 min read
기술개인 재정금융 팁#ocr 영수증 스캔 작동 방식#ocr 영수증 처리#ocr 영수증 스캔#ocr 영수증 데이터 추출#ocr 영수증 형식#ocr 영수증 항목#영수증 스캐너 ocr
OCR 영수증 스캔 작동 방식: 완벽한 가이드

OCR 영수증 스캔 작동 방식: 완벽한 가이드

미국에서만 매년 약 600억 장의 종이 영수증이 인쇄됩니다 — 대부분은 구매 데이터를 담고 있지만 몇 시간 내에 주머니, 지갑, 쓰레기통으로 사라집니다. OCR 영수증 스캔은 인쇄된 영수증 이미지를 구조화된 검색 가능한 디지털 레코드로 변환하여 이 데이터를 복구하는 기술입니다.

하지만 "OCR"은 단일 단계가 아닙니다 — 각 단계가 잠재적 오류를 도입하고 이 오류가 전체 프로세스에 걸쳐 누적되는 다단계 파이프라인입니다. 각 단계의 작동 방식을 이해하면 어떤 영수증 스캔 도구가 정확도 약속을 실제로 지키는지, 어떤 것이 단순한 마케팅인지 평가하는 데 도움이 됩니다.

이 가이드는 카메라 센서에 닿는 광자부터 상점명, 개별 항목, 총액이 담긴 구조화된 JSON까지 전체 OCR 영수증 스캔 파이프라인을 안내합니다.

핵심 요점

  • OCR 영수증 스캔은 6가지 단계로 이루어집니다: 이미지 캡처, 전처리, 텍스트 감지, 문자 인식, 필드 추출, 검증
  • 전처리 (대비 개선, 기울기 보정, 노이즈 제거)는 최종 정확도의 20–30%를 담당합니다 — 대부분의 사용자가 생각하는 것보다 훨씬 많습니다
  • 현대 영수증 OCR은 딥러닝(LSTM 및 트랜스포머 네트워크)을 사용하며 템플릿 매칭이 아닙니다
  • 필드 추출 — 원시 텍스트를 구조화된 데이터에 매핑 — 이 가장 어려운 단계이며 대부분의 도구가 품질에서 차이를 보이는 곳입니다
  • 개별 항목 추출은 영수증 레이아웃의 복잡성으로 인해 합계/상점명 추출보다 3–5배 더 어렵습니다
  • 고급 검증 기술(다중 패스 처리, 수학적 교차 검증)은 오류율을 30–40% 줄입니다

OCR 영수증 스캔의 6단계

영수증 스캔은 "카메라를 대면 데이터가 나온다"는 것이 아닙니다. 파이프라인의 각 단계는 입력을 변환하고 다음 단계가 작업할 내용을 결정합니다. 한 단계의 오류는 모든 다운스트림 처리에 전파됩니다.

Interactive Guide

The 6-Stage OCR Receipt Scanning Pipeline

Click each stage to explore how receipts are transformed from paper to structured data.

📷

Stage 1

Image Capture

The receipt is photographed via smartphone camera, imported as a file, or scanned on a flatbed scanner. Auto-focus, exposure compensation, and edge detection optimize the raw image. Resolution of 300–600 DPI equivalent is sufficient; higher resolution rarely improves accuracy. The key factor is even lighting and a flat receipt surface.

Impact on final accuracy: Sets the ceiling for all downstream stages. A poor capture (motion blur, shadows, partial framing) caps maximum accuracy at 70–80% regardless of engine quality.

📷 Paper receipt

📊 Structured data


1단계: 이미지 캡처

첫 번째 단계는 겉보기에 단순합니다: 영수증 이미지를 시스템에 가져오는 것입니다. 하지만 그 이미지의 품질이 이후 모든 작업의 상한선을 결정합니다.

카메라 기반 캡처 (모바일 앱)

Yomio나 Expensify 같은 모바일 앱으로 영수증을 촬영할 때, 앱의 카메라 모듈은 여러 자동 조정을 수행합니다:

  • 자동 초점이 영수증 텍스트에 잠깁니다 (일부 앱은 텍스트 감지를 사용해 초점을 안내합니다)
  • 노출 보정이 주변 조명에 맞게 조정됩니다
  • 엣지 감지가 배경 표면과 영수증 경계를 식별합니다
  • 원근 보정이 여기서 시작됩니다 — 앱은 영수증을 직사각형 문서로 식별하고 정렬을 안내합니다

현대 스마트폰은 12–50 메가픽셀을 캡처하여 OCR이 실제로 필요한 것보다 훨씬 더 많은 해상도를 제공합니다. 여분의 해상도는 크리티컬한 세부 정보를 잃지 않고 크롭과 전처리를 견딜 수 있어 유용합니다.

스캐너 기반 캡처 (데스크톱)

평판 스캐너는 휴대폰 카메라보다 더 높은 품질의 이미지를 생성합니다: 균일한 조명, 원근 왜곡 없음, 정밀한 DPI 제어. 300 DPI에서 표준 영수증 너비(80mm)는 약 945픽셀의 수평 해상도를 생성합니다 — OCR에 충분하고도 남습니다.

트레이드오프는 편의성입니다. 데스크톱 스캔은 영수증을 수집하고 나중에 일괄 처리해야 하므로 대부분의 영수증 추적 습관을 실패하게 만드는 지연이 발생합니다.

파일 가져오기 (PDF, 이미지)

많은 OCR 시스템은 기존 이미지나 PDF 파일을 허용합니다. 이는 디지털 영수증(이메일 첨부 파일, PDF 청구서)과 더 나은 OCR 엔진을 통해 이전에 스캔된 문서를 재처리하는 데 관련이 있습니다.

Information

OCR 엔진은 처리 전에 일반적으로 이미지를 300–600 DPI 등가로 다운스케일합니다. 일반 스캔 거리에서 찍은 12MP 스마트폰 사진은 영수증 텍스트에서 약 400–600 유효 DPI를 제공합니다 — 최적 범위 내입니다. 더 높은 해상도는 정확도를 거의 향상시키지 않습니다; 더 나은 조명과 평탄한 표면이 더 도움이 됩니다.


2단계: 이미지 전처리

전처리는 카메라의 원시 이미지를 OCR 엔진을 위한 깨끗하고 표준화된 입력으로 변환합니다. 이 단계는 **최종 정확도의 20–30%**를 담당하며 대부분의 무료 또는 기본 OCR 도구가 충분히 투자하지 않는 영역입니다.

기울기 보정 (Deskewing)

각도로 촬영된 영수증은 기울어진 텍스트 줄을 만듭니다. 기울기 보정 알고리즘은 주요 텍스트 줄 각도를 감지하고 (허프 변환 또는 유사한 엣지 감지 방법으로) 이미지를 회전하여 텍스트를 수평으로 정렬합니다. 3–5°의 기울기만으로도 문자 인식 정확도가 5–10% 감소할 수 있습니다.

원근 보정

영수증이 완벽하게 수직이 아닌 각도에서 위에서 촬영될 때, 결과 이미지는 원근 왜곡을 보여줍니다: 상단 텍스트가 하단 텍스트보다 좁게 보입니다. 4포인트 원근 변환은 왜곡된 직사각형을 진짜 직사각형으로 매핑합니다.

이진화

OCR 엔진은 고대비 흑백 이미지에서 가장 잘 작동합니다. 이진화는 그레이스케일 또는 컬러 이미지를 순수 검정(텍스트)과 흰색(배경)으로 변환합니다. 간단해 보이지만 영수증은 이를 어렵게 만듭니다:

  • 감열지는 새것일 때도 자연적으로 낮은 대비를 가집니다
  • 바랜 영수증은 2:1 미만의 대비 비율을 가질 수 있습니다
  • 배경 패턴 (일부 영수증은 텍스트 뒤에 로고나 워터마크를 인쇄합니다)이 노이즈를 생성합니다

적응형 임계값 처리 — 이미지의 다른 영역에서 흑/백 전환점을 국소적으로 조정 — 은 단일 전역 임계값보다 이러한 문제를 더 잘 처리합니다.

노이즈 제거

이진화 후에도 작은 아티팩트가 남습니다: 먼지 입자, 종이 질감, 인접 텍스트의 잉크 얼룩. 형태학적 연산(침식 후 팽창)은 텍스트 구조를 파괴하지 않고 고립된 노이즈 픽셀을 제거합니다. 커널 크기는 신중하게 조정해야 합니다 — 너무 공격적이면 마침표와 쉼표 같은 얇은 문자가 사라집니다.

대비 개선

바랜 감열지의 경우, 히스토그램 균등화 또는 CLAHE(대비 제한적 적응형 히스토그램 균등화)는 인간의 눈에 거의 비어 보이는 이미지에서 읽을 수 있는 텍스트를 복구할 수 있습니다. 이것이 영수증이 읽을 수 없어 보이는 3–6개월 된 바랜 영수증을 일부 앱이 읽을 수 있는 이유입니다.

Warning

감열지 화학은 영수증이 인쇄되는 순간부터 점진적으로 바래게 합니다. 6개월 후, 많은 영수증은 인쇄 대비의 40–60%를 잃었습니다. 12개월 후, 일부는 많은 조건에서 완전히 판독 불가능해집니다 — 어떤 전처리도 화학적으로 사라진 텍스트를 복구할 수 없습니다. 최대 정확도를 위해 24시간 내에 영수증을 스캔하세요.


3단계: 텍스트 감지

텍스트 감지는 전처리된 이미지에서 어디에 텍스트가 있는지 식별합니다 — 텍스트가 무엇을 말하는지가 아니라, 어떤 픽셀 영역이 배경, 로고, 바코드 또는 빈 공간이 아닌 텍스트를 포함하는지입니다.

연결 성분 분석

전통적인 방법은 연결된 검정 픽셀을 성분으로 그룹화한 다음 크기, 종횡비, 공간적 관계를 기반으로 성분을 텍스트 문자 후보로 분류합니다. 수평으로 가깝고 수직으로 정렬된 문자들은 텍스트 줄로 그룹화됩니다.

딥러닝 감지

현대 OCR 엔진은 CNN(합성곱 신경망)을 사용하여 텍스트 영역을 직접 감지합니다. EAST(Efficient and Accurate Scene Text Detector)나 CRAFT(Character Region Awareness for Text Detection) 같은 아키텍처는 휴리스틱 연결 성분에 의존하지 않고 텍스트 영역을 식별하여 다음과 같은 까다로운 시나리오를 처리합니다:

  • 그래픽 요소와 겹치는 텍스트
  • 매우 작은 텍스트 (각주 주석, 가게 전화번호)
  • 회전되거나 곡선인 텍스트 (텍스트가 주위에 있는 원형 로고)

영수증 특정 과제

영수증은 독특한 텍스트 감지 과제를 제시합니다:

  • 밀집된 레이아웃: 영수증의 텍스트 줄은 표준 문서보다 더 촘촘하게 패킹되는 경우가 많습니다
  • 혼합 콘텐츠: 바코드, QR 코드, 로고, 텍스트가 가까운 거리에 공존합니다
  • 컬럼 구조: 오른쪽 정렬된 가격, 왼쪽 정렬된 설명, 그 사이에 가변적인 간격
  • 구분자: 시각적 구분자로 사용되는 대시, 등호 부호, 별표는 텍스트 내용과 혼동되지 않아야 합니다

4단계: 문자 인식

이것이 대부분의 사람들이 "OCR"을 말할 때 생각하는 단계입니다. 감지된 텍스트 영역들이 주어지면, 엔진은 각 개별 문자를 식별합니다.

현대 OCR이 문자를 인식하는 방법

오래된 방법 (템플릿 매칭): 각 문자 이미지를 알려진 문자 템플릿 라이브러리와 비교합니다. 빠르지만 취약합니다 — 알 수 없는 폰트, 손상된 문자, 비정상적인 간격에서 실패합니다.

현재 방법 (딥러닝): LSTM(Long Short-Term Memory) 네트워크는 텍스트 줄 이미지를 순차적으로 처리하여 컨텍스트에서 문자 패턴을 인식하는 법을 배웁니다. "0" 대 "O"의 모호성은 주변 문자와 필드 내 문자 위치로 해결됩니다.

최신 기술 (트랜스포머 모델): Vision Transformer 아키텍처 (Microsoft의 TrOCR 같은)는 전체 텍스트 영역을 시퀀스로 처리하여 더 넓은 컨텍스트를 활용해 저하되거나 비정상적인 텍스트에서 더 높은 정확도를 달성합니다.

CTC 손실 함수

대부분의 현대 OCR 엔진은 훈련 중에 CTC (Connectionist Temporal Classification)를 사용하여 네트워크가 문자 수준의 정밀한 분할 없이 문자 시퀀스를 학습할 수 있게 합니다. 이는 문자 간격이 불규칙하고 문자가 때때로 닿거나 겹치는 영수증에 중요합니다.

문자 수준 대 단어 수준 정확도

  • 문자 수준 정확도는 개별 문자의 정확성을 측정합니다: "치킨"이 "치킧"으로 읽히면 2/3 = 67% 문자 수준 정확도입니다
  • 단어 수준 정확도는 완전한 단어를 측정합니다: "치킧"은 단어 수준 오류입니다 (그 단어에서 0%)
  • 영수증 OCR 주장은 일반적으로 숫자가 더 높기 때문에 문자 수준 정확도를 인용합니다

실용적인 사용을 위해서는 단어 수준 정확도가 더 중요합니다 — 구매를 범주화하고 싶을 때 잘못 철자된 제품 이름은 누락된 이름만큼 쓸모없습니다.

Tip

숫자 "1"과 문자 "l" (소문자 L)은 많은 영수증 폰트에서 시각적으로 동일합니다. OCR 엔진은 컨텍스트를 사용하여 이 모호성을 해결합니다: 가격 필드에서는 "1"이 압도적으로 올바릅니다; 제품 이름 필드에서는 "l"이 더 가능성이 높습니다. 이것이 영수증 필드 구조를 이해하는 영수증 특정 OCR 엔진이 영수증 데이터에서 일반적인 텍스트 인식보다 뛰어난 이유입니다.


5단계: 필드 추출 (어려운 부분)

4단계의 원시 OCR 출력은 인식된 문자들의 평면 텍스트 스트림입니다. 필드 추출은 이 텍스트를 구조화된 데이터에 매핑합니다: 어떤 텍스트가 상점명인지, 어떤 것이 개별 항목인지, 어떤 것이 합계인지.

이것이 영수증 특정 훈련이 전문 도구와 기본 OCR을 구분하는 곳입니다. 영수증을 읽는 일반 OCR 엔진은 다음과 비슷한 것을 생성합니다:

이마트
서울시 강남구 테헤란로 152
사업자번호: 123-45-67890

바나나(유기농)       1,980
우유 1L             1,500
체다 치즈           3,800
통밀빵              2,200
식기세척기 세제     4,500

소계               13,980
부가세              0
합계               13,980
카드 ****5678

영수증에 훈련된 필드 추출 엔진은 이것을 다음으로 변환합니다:

{
  "상점명": "이마트",
  "주소": "서울시 강남구 테헤란로 152",
  "날짜": "2026-03-22",
  "항목": [
    {"이름": "바나나(유기농)", "가격": 1980},
    {"이름": "우유 1L", "가격": 1500},
    {"이름": "체다 치즈", "가격": 3800},
    {"이름": "통밀빵", "가격": 2200},
    {"이름": "식기세척기 세제", "가격": 4500}
  ],
  "소계": 13980,
  "세금": 0,
  "합계": 13980,
  "결제수단": "카드 끝 5678"
}

개별 항목 추출이 왜 그렇게 어려운가

합계 금액 추출은 비교적 간단합니다: 보통 영수증 하단에서 가장 큰 숫자이며 "합계" 또는 동등한 것이 앞에 옵니다.

개별 항목은 다음과 같은 이유로 어렵습니다:

  1. 보편적인 형식 없음: 각 상점은 영수증을 다르게 형식화합니다 — 열 너비, 약어 스타일, 가격 위치, 구분자가 수천 개의 POS 시스템에서 다양합니다
  2. 약칭 이름: "닭가슴/무뼈" 는 "무뼈 닭가슴살"로 해석하기 위한 도메인 지식이 필요합니다
  3. 여러 줄 항목: 일부 항목은 두 줄에 걸쳐 있습니다 (한 줄에 설명, 다음 줄에 가격; 또는 항목 아래에 할인 줄)
  4. 가격 수정자: 1+1, 무게 기반 가격 책정 ("2,340g × ₩4,500/100g"), 멤버십 할인, 쿠폰 조정이 복잡한 가격 구조를 만듭니다
  5. 비항목 줄: 헤더, 푸터, 마케팅 메시지, 가게 정책이 구매 데이터 사이에 섞여 있습니다

현대 엔진이 추출할 수 있는 데이터 포인트에 대한 심층적인 내용은 OCR 영수증 데이터 추출 가이드를 읽어보세요.


6단계: 검증 및 사후 처리

마지막 단계는 추출된 데이터의 내부 일관성을 확인합니다:

  • 수학적 검증: 개별 항목 가격의 합이 소계가 되는가? 소계 + 세금 = 합계인가?
  • 형식 검증: 날짜가 유효한 형식인가? 합계가 양수인가?
  • 신뢰도 점수: 엔진은 각 추출된 필드에 신뢰도 점수(0–100%)를 할당하여 앱이 낮은 신뢰도 추출을 사용자 검토를 위해 플래그를 표시할 수 있게 합니다
  • 상점 데이터베이스 조회: 일부 엔진은 추출된 상점 이름을 알려진 상점 데이터베이스와 매칭하여 철자를 수정하고 명명을 표준화합니다

다중 패스 검증

Yomio와 같은 고급 시스템은 영수증에 훈련된 맞춤형 모델과 함께 다중 패스 처리를 사용하여 결과를 확인합니다. 엔진은 여러 추출 패스를 실행하고 결과를 병합합니다. 패스들이 동의하는 경우, 신뢰도가 높습니다. 동의하지 않는 경우, 시스템은:

  • 더 높은 신뢰도의 결과를 선택할 수 있습니다
  • 사용자 검토를 위해 필드를 플래그로 표시할 수 있습니다
  • 규칙 기반 휴리스틱을 적용할 수 있습니다 (예: 한 엔진이 "₩13,980"을 읽고 다른 엔진이 "₩13,985"를 읽는데, 항목들이 ₩13,980으로 합산되면 첫 번째 결과가 이깁니다)

이 다중 패스 방식은 단일 패스 처리 대비 전체 오류율을 30–40% 줄입니다, 이것이 Yomio가 기본 OCR 앱이 일반적으로 75–85%를 달성하는 곳에서 92% 개별 항목 정확도를 달성하는 이유입니다.

Success

영수증에 대한 최종 OCR 정확도는 6단계 모두의 곱입니다. 각 단계가 독립적으로 97% 정확하다면, 결합 정확도는 0.97⁶ = 83.3%입니다. 이것이 단일 단계를 개선하는 것 — 몇 퍼센트 포인트라도 — 이 종단 간 정확도에 측정 가능한 영향을 미치는 이유입니다. 그리고 전처리(2단계)에 투자하는 것이 불균형적인 배당을 주는 이유입니다.


OCR 영수증 스캔: 일반적인 형식과 과제

감열지 영수증 (가장 일반적)

상점 영수증의 ~90%는 잉크가 아닌 열 감응성 코팅이 있는 감열지에 인쇄됩니다. 열 인쇄는 다음을 생성합니다:

  • 새것일 때 일관된 문자 품질
  • 열, 햇빛, 화학 물질 노출에 대한 취약성
  • 인쇄 직후부터 시작되는 점진적인 바램
  • 많은 조건에서 12–24개월 후 완전한 판독 불가능성

잉크 인쇄 영수증

도트 매트릭스 및 잉크젯 영수증 (구형 POS 시스템 및 수동 청구서 프린터에서 일반적)은 화학적으로 바래지 않는 실제 잉크를 사용합니다. 그러나 불균일한 문자 무게, 잉크 얼룩, 낮은 해상도 등 종종 낮은 인쇄 품질을 가집니다. 도트 매트릭스 출력의 OCR 정확도는 일반적으로 신선한 열 인쇄보다 5–10% 낮습니다.

디지털 영수증 (이메일/PDF)

디지털 영수증은 이미지 캡처 및 전처리 단계를 완전히 건너뜁니다. OCR 없이 PDF 또는 이메일 HTML에서 직접 텍스트를 추출할 수 있어 텍스트 추출 정확도가 거의 100%에 달합니다. 그러나 필드 추출은 데이터를 올바르게 구조화하기 위해 영수증 형식 이해가 여전히 필요합니다.

국제 영수증 형식

영수증 형식은 국가별로 크게 다릅니다:

  • 미국/영국: 왼쪽 정렬 항목, 오른쪽 정렬 가격, 소수점 구분자로 점
  • 유럽 대륙: 소수점 구분자로 쉼표 (€13,63), 때때로 오른쪽에서 왼쪽으로의 합계
  • 아랍어 사용 국가: 오른쪽에서 왼쪽 텍스트 방향, 아랍어 또는 서양 숫자, 혼합 언어 콘텐츠
  • 동아시아: 문자 기반 제품 이름, 세로 또는 가로 텍스트, 가변 너비 문자

이러한 형식을 지원하려면 문자 인식만이 아니라 언어별 OCR 모델과 문화적 형식 이해가 필요합니다.


OCR 영수증 스캔의 미래

필드 추출을 위한 대형 언어 모델 (LLM)

영수증 OCR의 최신 발전은 필드 추출 단계에 LLM을 사용하는 것입니다. 규칙 기반 또는 CNN 기반 필드 추출 대신, 원시 OCR 텍스트가 영수증 구조를 맥락적으로 이해하는 언어 모델에 공급됩니다. 초기 결과는 특히 다음에 대해 복잡한 영수증에서 5–10% 정확도 향상을 보여줍니다:

  • 약칭 제품 이름 해결
  • 훈련 데이터에서 보지 못한 비정상적인 영수증 레이아웃 처리
  • 혼합 스크립트가 있는 다국어 영수증

기기 내 처리

Apple과 Google의 온디바이스 ML 프레임워크 (Core ML, ML Kit)는 영수증 OCR을 엣지 디바이스로 가져와 지연 시간을 줄이고 오프라인 스캔을 가능하게 합니다. 현재 온디바이스 정확도는 클라우드 처리보다 10–15% 낮지만, 각 하드웨어 세대마다 간격이 좁혀지고 있습니다.

구조화된 디지털 영수증

영수증 OCR 과제에 대한 장기 솔루션은 OCR의 필요성을 완전히 제거하는 것입니다. DRIS (Digital Receipt Interchange Standard)와 같은 표준은 계산대에서 디지털로 전송되는 기계 판독 가능한 영수증 형식을 제안합니다. 채택은 느립니다 — 수백만 소매업체에서 POS 시스템 업그레이드가 필요합니다 — 하지만 EU와 영국에서 모멘텀이 증가하고 있습니다.


자주 묻는 질문

2026년 OCR 영수증 스캔은 얼마나 정확한가요? 최상위 클라우드 엔진은 표준 영수증에서 90–95%의 필드 수준 정확도와 85–92%의 개별 항목 정확도를 달성합니다. Yomio의 맞춤형 엔진은 92%+ 개별 항목 정확도를 달성합니다. 정확도는 바랜 감열지, 비정상적인 레이아웃, 손글씨 텍스트에서 감소합니다.

OCR이 구겨지거나 손상된 영수증을 처리할 수 있나요? 현대 전처리는 기울기 보정과 로컬 대비 향상을 통해 적당히 구겨진 영수증에서 텍스트를 복구할 수 있습니다. 심하게 손상된 영수증 (찢어진, 물에 젖은, 또는 텍스트 줄에 심하게 접힌)은 불완전한 결과를 낼 수 있습니다. 스캔 전에 영수증을 평평하게 펴면 결과가 크게 향상됩니다.

왜 같은 OCR 엔진이 다른 영수증에서 다른 결과를 주나요? 영수증 레이아웃 가변성이 주요 요인입니다. 표준화된 POS 시스템을 가진 전국 체인의 영수증은 일관되고 매우 정확한 결과를 낼 것입니다. 구형 프린터를 가진 작은 지역 상점의 영수증은 비정상적인 형식, 폰트 선택, 인쇄 품질로 인해 더 낮은 정확도를 가질 수 있습니다.

OCR 영수증 스캔은 일반 OCR과 어떻게 다른가요? 일반 OCR은 이미지를 텍스트로 변환합니다. 영수증 OCR은 필드 추출을 추가합니다: 어떤 텍스트가 상점명인지, 어떤 것이 날짜인지, 어떤 것이 개별 항목인지, 어떤 것이 합계인지 이해합니다. 이 영수증 특정 지능은 수백만 개의 영수증 예제로 훈련하고 영수증 레이아웃 패턴을 이해하는 것이 필요합니다.

OCR과 ICR의 차이점은 무엇인가요? OCR (광학 문자 인식)은 기계로 인쇄된 텍스트에 최적화되어 있습니다. ICR (지능형 문자 인식)은 손글씨 텍스트를 처리합니다. 대부분의 영수증 스캔 앱은 영수증이 기계로 인쇄되기 때문에 OCR만 사용합니다. ICR은 손글씨 청구서나 경비 메모에 관련이 있습니다.


OCR 영수증 스캔을 직접 체험해보세요

Yomio의 맞춤형 OCR 엔진은 몇 초 안에 영수증의 모든 개별 항목을 추출합니다. 다음 장보기 영수증을 스캔해보세요 — 항목 수준 데이터의 차이를 경험하세요.

Yomio 무료 다운로드