Clova Speech Recognition(CSR)

참고

네이버 클라우드 플랫폼의 상품 사용 방법을 보다 상세하게 제공하고, 다양한 API의 활용을 돕기 위해 [설명서][API 참조서]를 구분하여 제공하고 있습니다.

Clova Speech Recognition API 참조서 바로가기 >>
Clova Speech Recognition 설명서 바로가기 >>

개요

사람의 목소리를 인식하여 작동하는 비서 애플리케이션, 챗봇, 음성 메모 등의 서비스를 만들 때 활용할 수 있는 음성 인식 API 서비스입니다. 음성 데이터는 API를 통해 Clova Speech Recognition(CSR) 엔진으로 전송되며, 해당 음성 데이터를 인식해서 텍스트로 변환하여 전달해줍니다.

공통 설정

클라이언트 아이디는 네이버 클라우드 플랫폼 콘솔에서 애플리케이션을 등록해 발급받습니다.

  1. 콘솔의 AI·Application Service > AI·NAVER API > Application에서 애플리케이션을 등록합니다. 자세한 방법 보기 >

  2. AI·Application Service > AI·NAVER API > Application에서 등록한 애플리케이션을 선택해 Client ID와 Client Secret값을 확인합니다.

  3. AI·Application Service > AI·NAVER API > Application변경 화면에서 Clova Speech Recognition가 선택되어 있는지 확인합니다. 선택되어 있지 않으면 429 (Quota Exceed)가 발생하니 주의하시기 바랍니다.

STT API 사용하기

STT API는 REST API이며, 음성인식할 음성 데이터를 HTTP 통신으로 음성인식 서버에 전달하면 됩니다. 음성인식 서버가 제공하는 REST API의 URI는 다음과 같으며 POST 방식으로 연결을 시도해야 합니다.

API URL

Method Request URI
POST https://naveropenapi.apigw.ntruss.com/recog/v1/stt

요청 헤더

헤더 명 설명
X-NCP-APIGW-API-KEY-ID 앱 등록 시 발급받은 Client ID
X-NCP-APIGW-API-KEY-ID:{Client ID}
X-NCP-APIGW-API-KEY 앱 등록 시 발급 받은 Client Secret
X-NCP-APIGW-API-KEY:{Client Secret}
Content-Type application/octet-stream 로 고정
Content-Type: application/octet-stream

에러 코드

{
  "error": {
    "errorCode": "300",
    "message": "Not Found Exception"
  }
}

공통 에러

HttpStatusCode ErrorCode ErrorMessage Description
400 100 Bad Request Exception protocol(https), endocing(UTF-8) 등 request 에러
401 200 Authentication Failed 인증실패
401 210 Permission Denied 권한없음
404 300 Not Found Exception 권한없음
429 400 Quota Exceeded Quota 초과
429 410 Throttle Limited Rate 초과
429 420 Rate Limited Rate 초과
413 430 Request Entity Too Large conent-length 초과 (10MB)
503 500 Endpoint Error 엔드포인트 연결에러
504 510 Endpoint Timeout 엔드포인트 연결시간 초과
500 900 Unexpected Error 예외처리가 안된 에러

API 에러

HttpStatusCode ErrorCode ErrorMessage Description
413 STT000 Request Entity Too Large 허용 음성데이터 용량을 초과하였습니다 ( 최대 3MB )
413 STT001 Exceed Sound Data length 허용 음성데이터 길이를 초과하였습니다 ( 60초 )
400 STT002 Invalid Content Type application/octet-stream 이외의 content-type인 경우 발생합니다.
400 STT003 Empty Sound Data 음성 데이터가 입력되지 않았습니다.
400 STT004 Empty Language 언어 파라미터가 입력되지 않았습니다.
400 STT005 Invalid Language 정해진 언어 이외의 언어 값이 입력되었습니다.
500 STT006 Failed to pre-processing 음성인식 전처리 중 오류가 발생하였습니다. 음성 데이터가 정상적인 wav, mp3, flac 인지 확인이 필요합니다.
500 STT998 Failed to STT 음성인식 중 오류가 발생하였습니다. 고객지원을 통해 문의하시면 신속히 조치하겠습니다.
500 STT999 Internal Server Error 알 수 없는 오류 발생하였습니다. 고객지원을 통해 문의하시면 신속히 조치하겠습니다.

오퍼레이션

아쉬운 점이 있다면 이야기해 주세요.
0/5000
내용을 입력해 주세요
의견 보내기