OCR

참고

네이버 클라우드 플랫폼의 상품 사용 방법을 보다 상세하게 제공하고, 다양한 API의 활용을 돕기 위해 [설명서][API 참조서]를 구분하여 제공하고 있습니다.

OCR 설명서 바로가기 >>

개요

OCR(Optical character recognition, 광학 문자 인식)은 이미지(사진) 속 글자 위치를 찾고 어떤 글자인지 자동으로 알아내는 기술입니다. OCR은 다양한 형태의 글자를 이해하기 위해 독자적인 글자 영역 검출 및 인식 기술을 보유하고 있습니다. 또한 손쉽게 템플릿을 만들고 원하는 영역을 지정한 뒤, 필요한 글자만 빠르게 추출하는 기능을 제공합니다. OCR API는 OCR 빌더에서 설정한 Template을 기반으로 문자 인식을 제공하는 API로, 인식에 사용할 언어와 이미지 데이터를 입력받고, 그에 맞는 인식 결과를 텍스트로 반환합니다.

공통 설정

API URL

Method Request URI
POST OCR 빌더에서 생성된 API Gateway의 InvokeURL로 호출합니다.
각 도메인마다 고유의 호출 URL이 생성됩니다.

TEXT OCR 인식과 Template OCR 인식 요청

구분 설명 Path Request Response
TEXT OCR 템플릿 정의없이 이미지의 모든 텍스트를 인식합니다. /general 이미지 인식 요청 형식을 따릅니다.
설정 가능한 언어값은 ‘ko’/‘ja’ 이며, lang 필드가 설정되지 않은 경우, ‘ko’가 default로 설정됩니다.
이미지 인식 결과 형식을 따릅니다.
matchedTemplate, title and validationResult 값은 전달되지 않습니다.
Template OCR 도메인에 배포된 템플릿이 포함 된 이미지를 인식합니다. /infer 이미지 인식 요청 형식을 따릅니다.
lang 필드가 설정되지 않은 경우, 도메인의 언어 설정값이 default로 설정됩니다.
이미지 인식 결과 형식을 따릅니다.

요청 헤더

헤더명 설명
x-ncp-apigw-timestamp 1970년 1월 1일 00:00:00 협정 세계시(UTC)부터의 경과 시간을 밀리초(Millisecond)로 나타내며 API Gateway 서버와 시간 차가 5분 이상 나는 경우 유효하지 않은 요청으로 간주
x-ncp-apigw-timestamp:{Timestamp}
x-ncp-iam-access-key 네이버 클라우드 플랫폼 포털에서 발급받은 Access Key ID 값
x-ncp-iam-access-key:{Sub Account Access Key}
x-ncp-apigw-signature-v2 Access Key ID 값과 Secret Key로 암호화한 서명
x-ncp-apigw-signature-v2:{API Gateway Signature}

오퍼레이션