koscom cloud

CLOVA OCR

인쇄물 상의 글자와 이미지를 디지털 데이터로 자동으로 추출하는 기술입니다.

문서를 인식하고, 사용자가 지정한 영역의 텍스트와 데이터를 정확하게 추출

문서인식 후에는 연결되는 워크플로우를 지정하여 효과적인 업무 처리가 가능합니다.

정확한 데이터 추출

OCR(Optical character recognition, 광학 문자 인식)은 이미지(사진) 속 글자 위치를 찾고 어떤 글자인지 자동으로 알아내는 기술입니다. OCR은 다양한 형태의 글자를 이해하기 위해 독자적인 글자 영역 검출 및 인식 기술을 보유하고 있습니다. 또한 손쉽게 템플릿을 만들고 원하는 영역을 지정한 뒤, 필요한 글자만 빠르게 추출하는 기능을 제공합니다.


차별화된 모델

CLOVA OCR 서비스는 네이버의 AI 기술을 활용하여 주요 비즈니스 활용에 최적화된 고성능 OCR 인식 모델을 적용하였습니다. 문자 인식이 제공되는 언어는 한국어, 영어, 일본어이며, 필기체 인식은 한국어와 일본어가 지원됩니다.

세계 최고 수준의 인식 정확도

CLOVA OCR은 문서 레이아웃 분석 및 글자를 읽는 순서 방향을 추정하여 둥글게 곡선으로 배열되거나 기울어진 문자, 필기체 인식 등 고성능 AI 모델바탕으로 높은 수준의 정확도를 제공합니다. OCR분야 가장 권위있는 글로벌 챌린지ICDAR2019 4개 분야에서 1위, CVPR 및 ICCV 국제학회 논문 선정 등 독보적기술력이 집약된 CLOVA OCR을 네이버 클라우드 플랫폼을 통해 손쉽게 이용할 수 있습니다


문서처리 자동화와 액션 연동

등록된 템플릿과의 유사도를 통해 사용자의 개입없이 문서의 자동 분류가 가능하므로 효과적인 업무 워크플로우를 설계할 수 있습니다. CLOVA OCR 서비스는 인식된 텍스트의 값을 검증할 수 있어 반복 검증 업무를 줄이고 신뢰도를 높일 수 있습니다. 또한 Papago 서비스 등 다른 서비스와 연계하여 고객에게 차별화된 서비스를 제공할 수 있습니다.

상세기능

OCR Process

단순한 OCR(광학 문자 인식)을 넘어 문서의 종류를 분류하고, 구조화된 형태로 정확히 문자 정보를 추출합니다.
고객이 이미지 데이터(사진)를 RESTful API 방식으로 전달하면, 해당 이미지를 분석하여 텍스트 추출 결과를 JSON 형태로 제공합니다.

제공 서비스

고객이 이미지 데이터(사진)를 RESTful API 방식으로 전달하면, 해당 이미지를 분석하여 텍스트 추출 결과를 JSON 형태로 제공합니다.

Init-Script
항목내용
이미지 내의 Text 탐지이미지 파일 형식은 현재 JPG, PNG, PDF, TIFF 형식을 지원하며, 지원 포맷은 계속 확대될 예정입니다.
인식 템플릿 서식 문서 에서 인식을 원하는 영역을 설정 하면, 구조화된 값으로 추출하여 정형화된 인식 결과를 전송합니다. OCR 빌더에서 다양한 인식 템플릿을 설정하고, 서비스에 배포가 가능합니다.
인식값 검증 검증이 필요한 이미지의 판독 값에 대해서 외부 검증 서버와 연동될 수 있도록 검증 연동 End-point를 제공합니다.
멀티 박스 여러 개의 글자 입력 박스들을 조합하여 인식하는 멀티 박스(예: 우편번호) 기능을 제공합니다.
체크 박스 체크 표시를 인식할 수 있는 체크 박스 기능을 제공합니다.
도메인 복사 도메인을 설정값을 복사하여 기존 템플릿을 그대로 유지한 새로운 도메인 생성 및 플랜 변경이 가능합니다.

※ 이미지 파일 사이즈는 20MB 이하로 제한됩니다.

Template OCR 인식 모델별 기능 제공

Init-Script
인식 모델베이직프리미엄설명
모델 인식률활자체 및 필기체 인식활자체 및 필기체 인식주요 비즈니스 활용에 최적화된 고성능 OCR
인식 모델을 제공
적합 문서증명서, 고정 폼 양식수기 신청서
가입 양식,
금융 문서 등
인식 템플릿
레이아웃
제공제공인식 영역을 설정
멀티박스제공 안함제공싱글 박스 템플릿을 조합하여
번호 인식영역 등을 제어
체크박스제공 안함제공체크 박스 형태의 인식 제공
필드 유형제공 안함제공인식 값을 숫자로만 인식되도록 유형을 설정

Document OCR

많은 학습데이터를 기반으로 CLOVA AI 기술을 적용하여 문서의 주요 Feature를 추출합니다.
영수증/신용카드/사업자등록증/명함/신분증이 제공되며, 계속적으로 Document OCR 모델이 확장될 예정입니다.

영수증

영수증의 유형과 패턴을 자동 분석하여 매장 정보, 결제 내역, 지불 방식 등 영수증의 기재된 정보를 추출합니다.

신용카드

다양한 카드 형태를 인식하며 카드번호와 유효기간을 추출합니다.

사업자 등록증

사업자 등록증 문서를 자동 분석하여 등록번호, 법인명, 대표자 등 사업자 등록증의 기재된 정보를 추출합니다.

명함

명함 내 정보를 추출하며, 한국어/일본어/영어 명함 인식을 지원합니다.

신분증

신분증 OCR은 다양한 형태의 신분증 - 주민등록증(구형,신형)/운전면허증(구형,신형)/여권(국내), 외국인 등록증 항목들을 추출하여 정보를 제공합니다.

의료비 영수증

의료비 영수증의 진료 정보들을 추출합니다.
의료비영수증은 표 형태의 의료비영수증에서 진료과목, 질병군 번호, 영수증 번호, 납부 금액, 사업자등록번호 등 주요 정보를 추출합니다.

CLOVA OCR 모델 안내

  • 정보를 추출하고 싶은 영역을 템플릿으로 직접 지정하여, 동일한 유형의 문서 관리에 유용한 Template OCR 모델을 제공합니다.
  • 특정 템플릿의 인식률 향상, CLOVA OCR 성능 개선 상담, 템플릿 작성에 도움이 필요한 경우 기술지원으로 문의해 주세요.
  • Document OCR 특화 모델은 계속적으로 추가될 예정입니다. 사용하시는 특화 모델에 따라 제공하는 Feature가 각기 다릅니다. 특화 모델에서 제공하는 대한 상세한 내용은 [CLOVA 특화모델 API 참조서]를 참고해 주세요.

활용 사례

다양한 서비스에 응용되어 적용될 수 있습니다.

  • 사용자에게 전달받은 다양한 전표들을 해당하는 템플릿에 맞게 분류하고, 분류된 문서 내 검출/인식된 정보들을 사내 시스템과 연계하여 활용이 가능합니다.
  • 사용자에게 전달받은 다양한 청구 서류들을 수작업으로 분류하지 않고, 자동으로 분류하는 작업에 활용할 수 있습니다.
  • 다양한 형태로 정형화된 폼 인식 등의 서비스로 활용이 가능합니다.

요금 안내

Document OCR

(VAT 별도)
Init-Script
인식 모델서비스 플랜플랜월이용요금포함내역포함 내역 외 추가 API 이용안내
영수증/신용카드/명함/사업자등록증/신분증Basic 18,000원 300건 제공100원/건 Document OCR은 개인정보/민감 정보가 포함되어 있을 수 있어 사전 신청/승인 절차 진행 후 제공합니다
신청방법안내
Standard180,000원3,000건 제공80원/건
Advanced580,000원15,000건 제공50원/건
의료비 영수증Basic48,000원300건 제공200원/건
Standard428,000원3,000건 제공180원/건
Advanced1,180,000원15,000건 제공100원/건

General OCR

(VAT 별도)
General OCR
인식 모델서비스 플랜단위이용 요금 (월)비고
프리미엄General 이용 횟수 글자 추출 3원 / 건 무료 제공 횟수(글자): 100회 / 월
표 추출 22원 / 건 무료 제공 횟수(표): 100회 / 월
  • 표 추출 이용시 글자 추출이 동시에 호출되며 1건당 25원이 청구됩니다.
  • 최대 100만 건까지 호출 가능하며, 대용량 사용을 원하시는 경우 고객지원으로 문의해 주시기 바랍니다.

Template OCR

(VAT 별도)
Init-Script
인식 모델서비스 플랜 플랜
월 이용 요금
포함 내역포함 내역 외
추가 API 이용
베이직Free 무료 최대 300건 -
Basic35,000원 1,000건 제공 60원 / 건
Standard350,000원 10,000건 제공 35원 / 건
Advanced950,000원 30,000건 제공 33원 / 건
프리미엄Basic450,000 원 7,500건 제공 75원 / 건
Advanced1,100,000원 30,000건 제공 43원 / 건
  • Template OCR의 1회 호출 기준은 빌더에서 설정한 템플릿의 인식 영역의 수(Max 50개)입니다. 이를 초과하는 경우 추가 과금됩니다.
    (예시, Template의 Box영역의 수가 130개인 경우, 3회 API호출로 과금)
  • CLOVA OCR 서비스는 서비스 배포 후 API Gateway를 통해 호출되며 API Gateway 사용량에 따라 별도 과금 됩니다.

고객 지원

  • CLOVA OCR 서비스를 대량으로 호출하기 위해 서비스 유량 변경이 필요한 경우, 고객 지원을 통해 문의바랍니다.