대화형 AI 모델을 훈련하기 위한 고품질 오디오/음성/음성 데이터 세트 

자동 음성 인식(ASR) 모델을 바로 시작할 수 있는 다국어의 기성품 음성/음성/오디오 데이터 세트

음성 데이터 세트

오늘 누락된 오디오 데이터 카탈로그 플러그인

세부 정보언어 데이터세트샘플 속도데이터 세트 유형총 오디오 시간총 연설 시간데이터세트 설명오디오 채널녹음 플랫폼WER(%)오디오 형식전사 형식적용 사례CTA
연설아프리카 계 미국인아프리카계 미국인 모국어8 kHz콜센터214211"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설아프리카 계 미국인아프리카계 미국인 모국어16 kHz미디어 오디오159149인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설아프리카 어아프리카 어8 kHz일반회화368404두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 아프리카에서 사용되는 아프리칸스어이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설아프리카 어아프리카 어16 kHz미디어 오디오658615인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설ArabicArabic8 kHz일반회화293297두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 걸프만 국가의 아랍어이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설보스턴보스턴8 kHz콜센터177175"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설보스턴보스턴8 kHz일반회화3232두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설보스턴보스턴16 kHz미디어 오디오9393인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설중국어 영어중국어 영어8 kHz콜센터169130"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설중국어 영어중국어 영어16 kHz미디어 오디오249236인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설덴마크 말덴마크 말8 kHz일반회화372395두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설덴마크 말덴마크 말16 kHz미디어 오디오664603인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설영어영어16 kHz미디어 오디오109인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설영어 딥 사우스영어 딥 사우스8 kHz콜센터151149"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설영어 딥 사우스영어 딥 사우스8 kHz일반회화5656두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설영어 딥 사우스영어 딥 사우스16 kHz미디어 오디오266248인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설히브리어히브리어8 kHz일반회화399397두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 이스라엘 히브리어이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설히브리어히브리어16 kHz미디어 오디오427400인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설힝글 리쉬힝글 리쉬8 kHz콜센터208185"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설힝글 리쉬힝글 리쉬16 kHz미디어 오디오216219인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설히스패닉 영어히스패닉 영어8 kHz콜센터212209"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설히스패닉 영어히스패닉 영어16 kHz미디어 오디오155150인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설인도 영어인도 영어16 kHz미디어 오디오13787인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설IndonesianIndonesian8 kHz일반회화496598두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 인도네시아어 바하사이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설IndonesianIndonesian16 kHz미디어 오디오643610인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설아일랜드아일랜드8 kHz일반회화192180두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설한국어한국어8 kHz콜센터107103"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설한국어한국어16 kHz미디어 오디오204197인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설MalayMalay8 kHz일반회화266302두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 말레이시아의 말레이어이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설MalayMalay16 kHz미디어 오디오344305인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설뉴질랜드 영어 뉴질랜드 영어 8 kHz일반회화148142두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설뉴질랜드 영어 뉴질랜드 영어 16 kHz미디어 오디오400400인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설뉴욕 영어뉴욕 영어8 kHz콜센터103103"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설뉴욕 영어뉴욕 영어8 kHz일반회화107106두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설뉴욕 영어뉴욕 영어16 kHz미디어 오디오140140인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설광택광택16 kHz미디어 오디오269255인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설스코틀랜드 사람스코틀랜드 사람8 kHz일반회화292267두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설싱가포르 영어싱가포르 영어8 kHz콜센터218194"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설싱가포르 영어싱가포르 영어16 kHz미디어 오디오247240인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설남아프리카 영어남아프리카 영어8 kHz콜센터261204"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설남아프리카 영어남아프리카 영어16 kHz미디어 오디오251245인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설SpanishSpanish16 kHz미디어 오디오32인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설스와힐리어스와힐리어8 kHz콜센터184165"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설스와힐리어스와힐리어8 kHz콜센터4644"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설스와힐리어스와힐리어16 kHz미디어 오디오203191인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설스와힐리어스와힐리어16 kHz미디어 오디오6258인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설SwedishSwedish8 kHz콜센터250224"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설SwedishSwedish16 kHz미디어 오디오278255인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설텔루구어텔루구어8 kHz일반회화553582두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설텔루구어텔루구어16 kHz미디어 오디오648599인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설ThaiThai8 kHz일반회화183201두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 친구 간에 사용되는 비공식 기록이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설ThaiThai16 kHz미디어 오디오173167인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설베트남어베트남어8 kHz일반회화295293"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, 북부(예: 하노이), 중부 및 남부(예: 호치민시).이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설베트남어베트남어16 kHz미디어 오디오257248인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설웨일스 말웨일스 말8 kHz일반회화278299"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설인도 영어인도 영어8 kHz콜센터200200"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설텔루구어 텔루구어 NA콜센터3030"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설타밀 사람 타밀 사람 NA콜센터6060"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설칸나다어 칸나다어 NA콜센터6060"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설말라얄람어 말라얄람어 NA콜센터6060"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설벵골어 벵골어 NA콜센터6060"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설구자라트어 구자라트어 NA콜센터6060"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설마라타어 마라타어 NA콜센터6060"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설아삼어 아삼어 NA콜센터6060"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설오리 야 오리 야 NA콜센터6060"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설펀 자브 펀 자브 NA콜센터6060"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설텔루구어 텔루구어 NA일반회화5050"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설타밀 사람 타밀 사람 NA일반회화100100"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설칸나다어 칸나다어 NA일반회화100100"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설말라얄람어 말라얄람어 NA일반회화100100"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설벵골어 벵골어 NA일반회화100100"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설구자라트어 구자라트어 NA일반회화100100"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설마라타어 마라타어 NA일반회화100100"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설아삼어 아삼어 NA일반회화100100"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설오리 야 오리 야 NA일반회화100100"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설펀 자브 펀 자브 NA일반회화100100"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설텔루구어 텔루구어 NA미디어 오디오2020인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설타밀 사람 타밀 사람 NA미디어 오디오4040인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설칸나다어 칸나다어 NA미디어 오디오4040인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설말라얄람어 말라얄람어 NA미디어 오디오4040인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설벵골어 벵골어 NA미디어 오디오4040인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설구자라트어 구자라트어 NA미디어 오디오4040인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설마라타어 마라타어 NA미디어 오디오4040인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설아삼어 아삼어 NA미디어 오디오4040인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설오리 야 오리 야 NA미디어 오디오4040인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설펀 자브펀 자브NA미디어 오디오4040인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분NA바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설영어 미국영어 미국48 kHz스크립트 독백545~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설스페인 스페인스페인 스페인48 kHz스크립트 독백1085~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설멕시코의멕시코의48 kHz스크립트 독백1,4921,2285~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설캐나다의캐나다의48 kHz스크립트 독백1,2221,0495~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설NederlandNederland48 kHz스크립트 독백1,2051,0215~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설폴란드 폴란드폴란드 폴란드48 kHz스크립트 독백1,4821,2665~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설터키어 터키터키어 터키48 kHz스크립트 독백2,0271,7355~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설중국어 번체중국어 번체48 kHz스크립트 독백1,0288915~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설ArabicArabic48 kHz스크립트 독백1,9471,5945~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설덴마크 말덴마크 말48 kHz스크립트 독백2,5792,0415~30초 범위에 속하는 경향이 있는 단일 발화 녹음, 덴마크의 덴마크어모노모바일 애플 리케이션5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설힌디 어힌디 어8 kHz콜센터122131"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설힌디 어힌디 어16 kHz미디어 오디오219202인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노바탕 화면5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설힌디 어힌디 어48 kHz스크립트 독백2,8672,1055~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설일본어일본어48 kHz스크립트 독백2,3352,0295~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설한국어한국어48 kHz스크립트 독백1,9551,5485~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설RussianRussian48 kHz스크립트 독백2,3982,0465~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설중국어 간체중국어 간체48 kHz스크립트 독백2,7622,1815~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
연설GermanGerman8 kHz콜센터640"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링

대화형 AI 개발을 가속화하는 Ground Truth 오디오 및 음성 데이터

40시간이 넘는 오디오 데이터 세트/음성 데이터 세트가 있는 Shaip은 고품질 음성 데이터 세트로 대화형 AI 모델을 확장하는 데 도움을 줄 수 있습니다. 표준 음성 데이터 세트는 여러 언어 및 방언, 인구 통계, 화자 특성, 대화 유형, 환경 및 시나리오로 수집됩니다. 찾고 있는 것을 찾을 수 없다면? – Shaip은 성별, 연령, 언어 또는 설정에 관계없이 모든 음성 데이터 세트에 대해 도움을 드릴 수 있습니다.

우리가 지원하는 언어 데이터 세트 중 일부: 모든 주요 언어 및 방언에 대한 데이터 세트가 있습니다. 가장 인기 있는 언어는 다음과 같습니다.

아프리칸 음성 데이터세트

아랍어 음성 데이터 세트

캐나다 음성 데이터 세트

중국어 음성 데이터 세트

덴마크어 음성 데이터 세트

영어 음성 데이터 세트

독일어 음성 데이터 세트

히브리어 음성 데이터 세트

인도네시아어 음성 데이터 세트

아일랜드 음성 데이터 세트

일본어 음성 데이터 세트

한국어 음성 데이터 세트

멕시코 음성 데이터 세트

폴란드어 음성 데이터 세트

러시아어 음성 데이터 세트

스코틀랜드 음성 데이터세트

스페인어 음성 데이터 세트

스웨덴어 음성 데이터 세트

태국어 음성 데이터 세트

터키어 음성 데이터 세트

베트남어 음성 데이터 세트

데이터 세트 설명

콜센터 대화 8khz: 스크립트가 없는 합성 전화 대화: "에이전트" 및 "고객"

일반 대화 8khz: 두 사람 간의 대본 없는 전화 대화

미디어 및 팟캐스트 16khz: 퍼블릭 도메인 오디오/비디오 인터뷰, 팟캐스트 등 1-5명

발화/스크립트 독백 16khz: 프롬프트 기반 녹화 

샤이프 문의

찾고 있는 것을 찾을 수 없습니까?

모든 데이터 유형에서 새로운 기성 오디오 및 음성 데이터 세트가 수집되고 있습니다. 

오디오/스피치 트레이닝 데이터 수집 걱정은 지금 바로 연락주세요.

  • 등록함으로써 Shaip에 동의합니다. 개인정보 보호정책서비스약관 그리고 Shaip의 B2B 마케팅 커뮤니케이션 수신에 동의합니다.