koscom cloud

CLOVA Voice

고품질 음성 합성 기술로 다양하고 자연스러운 목소리 제공

언제 어디서나, 자연스러운 억양과 감정표현 CLOVA Voice

고품질 음성 합성 기술
CLOVA는 복잡한 전사 작업 없이 40분 정도의 음성과 텍스트만으로 새로운 화자, 스타일의 음성합성기를 만들 수 있는 기술을 보유하고 있습니다. 이 기술을 통해 실제 사람의 음성에 가까운 자연스럽고 깨끗한 합성음을 제공합니다.
자연스러운 억양과 감정표현
CLOVA 의 기술로 같은 텍스트에도 기쁘거나 슬픈 감성이 반영된 합성음을 사용할 수 있습니다. 엄격한 뉴스 앵커 스타일, 부드러운 친구 스타일, 담백한 일반인 스타일 등 앞으로 더 다양한 감정과 스타일의 목소리가 제공될 예정입니다.
다양한 콘텐츠 표현에 최적화
고도화된 음성합성 기술로 섬세한 감정 표현은 물론 한국어·영어·중국어·일본어·스페인어를 지원합니다. 이를 통해 음성합성을 통한 다양한 콘텐츠 부가가치 창출에 도움을 줍니다.

CLOVA Voice 서비스는 총 61가지 자연스러운 음성합성음을 제공합니다.

프리미엄 합성음 - 성인
프리미엄 합성음 - 아이
일반 합성음 - 성인

상세기능

네이버의 풍부한 데이터를 기반으로 학습된 다양한 인공지능 서비스를 제공합니다.

제공 서비스

입력된 텍스트를 RESTful API 방식으로 전달하면 서버에서 인식해 mp3, wav 포맷의 파일로 리턴해주는 API입니다.

항목내용
리턴 형태mp3 포맷의 파일
지원 언어한국어/영어/일본어/중국어/스페인어/대만어

API 이용

1회 호출 시 요청 가능한 최대 글자는 1,000글자입니다. Volume, Speed, Pitch, Emotion 등의 감정 파라미터를 제공합니다.

요금 안내

CLOVA Voice 서비스는 서비스 플랜에 따라 자유롭게 목소리를 선택하여 사용할 수 있습니다.

CLOVA Voice - Premium

(VAT 별도)
서비스 플랜기본 요금Voice Font 구성포함 내역포함 내역 외 이용 시
Premium90,000원/월일반 합성음 9종
프리미엄 합성음 35종
1,000,000자/월1,000 글자당 100원
  • 이용 글자는 1,000글자 단위로 올림됩니다.
  • 이용 글자는 월 단위로 누적되어 계산됩니다.
요금 예시

Premium 서비스 플랜 사용하여 월 2,000,000 자의 음성을 합성 한 경우, 기본료와 초과한 음성 합성 글자 수에 대한 요금이 청구 됩니다.

  • 기본료 = 90,000원 / 1,000,000 글자 포함
  • 초과 글자수에 따른 이용 요금 = {(음성 합성 글자 수 – 기본 제공 문자 수) / 1,000} * 글자 당 요금 = {(2,000,000 – 1,000,000)/1,000}*100 = 100,000
  • 월 이용 요금 = 기본료 + 초과 글자수에 따른 이용 요금 =90,000 + 100,000 = 190,000