AI를 위한 가장 신뢰할 수 있는 음성 데이터 수집 서비스

당사의 오디오 및 음성 데이터 수집 서비스를 통해 고품질 대화 데이터로 NLP 모델, VA, TTS 프로토타입 등을 교육하십시오.

병목 현상 없이 오디오 데이터 파이프라인을 발견하세요

주요 클라이언트

이전 보기

다음 보기

전문 오디오/음성 데이터 수집 서비스

모든 주제. 모든 시나리오.

Shaip의 전문 지식은 다양한 AI/ML 요구 사항에 맞게 설계된 고품질 음성 데이터 세트를 만드는 데 있습니다. 우리는 광범위한 언어와 다양한 설정의 기록을 제공하여 데이터 세트를 포괄적이고 적응 가능하게 만듭니다. 영형우리의 초점은 가능한 가장 짧은 시간에 가장 많은 양의 사용자 정의 음성 데이터를 모델에 제공하는 것입니다. 우리와 함께라면 다음과 같은 혜택을 누릴 수 있습니다.

정확성을 높이기 위해 선별된 고품질 다국어 오디오/음성 데이터
t에 대한 가능한 최고 수준의 도메인 특이성다양한 시나리오 확보 설치

다양한 인구 통계 및 업종에 맞게 ML 모델 확장
녹음 환경: 스튜디오 품질, 배경 소음을 최소화한 선명한 오디오를 제공합니다. 자연환경, 녹음에는 주변 소리가 포함되어 실제 상황을 모방합니다.

100+

나라

55K +

음성 데이터 시간

250+

프로젝트

60+

언어(100개 이상의 방언)

8 / 16 / 44 / 48kHz

샘플링 속도

우리의 전문성

더 스마트한 NLP 모델을 위해 오디오 데이터 정렬

Shaip은 음성 지원 기술이 전 세계의 다양한 청중을 수용할 수 있도록 100개 이상의 언어로 종단 간 음성/오디오 데이터 수집 서비스를 제공합니다. 우리는 모든 범위와 규모의 프로젝트에서 작업할 수 있습니다. 기존 기성 오디오 데이터 세트 라이선스부터 맞춤형 오디오 데이터 수집 관리, 오디오 전사 및 주석에 이르기까지. 음성 데이터 수집 프로젝트의 규모에 상관없이 방언, 어조 및 언어를 대상으로 하는 고품질 NLP 데이터 세트를 구축하기 위해 필요에 맞게 오디오 수집 서비스를 사용자 정의할 수 있습니다. 음성 지원 지능형 설정을 위해 광범위한 음성 데이터 세트 및 오디오 데이터 수집 리소스 중에서 선택하십시오.

성공 사례

3개 언어에 걸쳐 8시간 이상의 데이터가 포함된 대화형 AI 데이터 세트

인도어를 위한 다국어 플랫폼을 구축하려는 고객은 Shaip과 제휴하여 여러 인도어로 된 대규모 데이터 세트를 수집, 분할 및 복사했습니다. 이는 고객의 혁신적인 새 플랫폼을 강화할 수 있는 효과적인 음성 모델을 개발하는 데 도움이 될 것입니다.

문제 : 3,000개 인도 언어로 수집된 8시간 이상의 오디오 데이터를 분할하고 전사하여 자동 음성 인식을 개발했습니다.

해결 방법 : 우리는 데이터 수집, 세분화, 전사를 제공하고 메타데이터가 포함된 JSON 파일을 전달했습니다. 우리는 고객의 음성 기술 프로젝트를 위해 3000개 인도 언어로 된 8시간의 오디오 데이터를 대규모로 수집했습니다.

Shaip을 신뢰할 수 있는 음성 데이터 수집 파트너로 선택한 이유

사람들

전담 및 훈련된 팀:

데이터 생성, 라벨링 및 QA를 위한 30,000명 이상의 공동 작업자
자격을 갖춘 프로젝트 관리 팀
경험이 풍부한 제품 개발 팀
인재 풀 소싱 및 온보딩 팀

방법

최고의 공정 효율성은 다음을 통해 보장됩니다.

강력한 6시그마 스테이지 게이트 프로세스
6시그마 블랙벨트로 구성된 전담 팀 – 핵심 프로세스 소유자 및 품질 준수
지속적인 개선 및 피드백 루프

플랫폼

특허 받은 플랫폼은 다음과 같은 이점을 제공합니다.

웹 기반 엔드 투 엔드 플랫폼
완벽한 품질
더 빠른 TAT
원활한 전달

사람들

전담 및 훈련된 팀:

데이터 생성, 라벨링 및 QA를 위한 30,000명 이상의 공동 작업자
자격을 갖춘 프로젝트 관리 팀
경험이 풍부한 제품 개발 팀
인재 풀 소싱 및 온보딩 팀

방법

최고의 공정 효율성은 다음을 통해 보장됩니다.

강력한 6시그마 스테이지 게이트 프로세스
6시그마 블랙벨트로 구성된 전담 팀 – 핵심 프로세스 소유자 및 품질 준수
지속적인 개선 및 피드백 루프

플랫폼

특허 받은 플랫폼은 다음과 같은 이점을 제공합니다.

웹 기반 엔드 투 엔드 플랫폼
완벽한 품질
더 빠른 TAT
원활한 전달

기성품 음성/오디오 데이터세트

코퍼스 ID(고유)	키워드	언어 데이터세트	언어 코드	샘플 속도	데이터 세트 유형	총 오디오 시간	간단한 설명	데이터 세트 설명	오디오 채널	녹음 플랫폼	WER(%)	오디오 형식	전사 형식	적용 사례	스피커의 수	CTA
ko_US_CC_8	아프리카계 미국인 모국어	아프리카계 미국인 모국어	ko 페이지	8 kHz	콜센터	211	아프리카계 미국인 버내큘러 콜 센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성: 612, 남성: 1242, 불명: 12	Contact
ko_US_MA_16	아프리카계 미국인 모국어	아프리카계 미국인 모국어	ko 페이지	16 kHz	미디어 오디오	154	아프리카계 미국인 버내큘러 미디어 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성: 151, 남성: 150, 불명: 10	Contact
아프리카어_GC_8	아프리카 어	아프리카 어	af_ZA	8 kHz	일반회화	368	아프리칸스 일반 회화 데이터	두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 아프리카에서 사용되는 아프리칸스어	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성: 502, 남성: 390, 불명: 2	Contact
아프리카어_MA_16	아프리카 어	아프리카 어	af_ZA	16 kHz	미디어 오디오	658	아프리칸스어 미디어 파일	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성: 750, 남성: 1278, 불명: 52	Contact
아랍어_GC_8	아랍어	아랍어	ar_AE	8 kHz	일반회화	292	아랍어 일반 회화 데이터	두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 걸프만 국가의 아랍어	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성: 171, 남성: 534, 불명: 1	Contact
아랍어_SM_48	아랍어	아랍어	ar-SA	48 kHz	스크립트 독백	1,947	아랍어 스크립트 독백	5~30초 범위에 속하는 경향이 있는 단일 발화 녹음	모노	모바일 애플 리케이션	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 838 남성 1209 불명 78	Contact
아쌈어_CC_8	아삼어	아쌈어(파이프라인 내)	as_IN		콜센터	60	Assamese(파이프라인 내) Call-Center 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,		데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
아쌈어_GC	아삼어	아쌈어(파이프라인 내)	as_IN		일반회화	100	아삼어(파이프라인 내) 일반 대화 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,		데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
아쌈어_MA	아삼어	아쌈어(파이프라인 내)	as_IN		미디어 오디오	40	Assamese(파이프라인 내) 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분		웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
벵골어_CC_8	벵골어	벵골어(파이프라인 내)	bn_IN		콜센터	60	벵골어(파이프라인 내) 콜 센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,		데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
벵골어_GC	벵골어	벵골어(파이프라인 내)	bn_IN		일반회화	100	벵골어(파이프라인 내) 일반 대화 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,		데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
벵골어_MA	벵골어	벵골어(파이프라인 내)	bn_IN		미디어 오디오	40	벵골어(파이프라인 내) 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분		웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
보스턴_CC_8	보스턴 영어	보스턴 영어	ko 페이지	8 kHz	콜센터	177	보스턴 콜 센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성: 605, 남성: 711, 불명: 0	Contact
보스턴_GC_8	보스턴 영어	보스턴 영어	ko 페이지	8 kHz	일반회화	32	보스턴 일반 대화 데이터	두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성: 53, 남성: 83, 불명: 0	Contact
보스턴_MA_16	보스턴 영어	보스턴 영어	ko 페이지	16 kHz	미디어 오디오	93	보스턴 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성: 43, 남성: 181, 불명: 2	Contact
캐나다_SM_48	캐나다 불어	캐나다 불어	FR-CA	48 kHz	스크립트 독백	1,222	캐나다 불어	5~30초 범위에 속하는 경향이 있는 단일 발화 녹음	모노	모바일 애플 리케이션	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 974 남성 631 불명 1	Contact
중국어_CC_8	중국어 영어	중국어 영어	ko 페이지	8 kHz	콜센터	169	중국 콜센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성: 1790년, 남성: 523명, 불명: 13명	Contact
중국어_MA_16	중국어 영어	중국어 영어	ko 페이지	16 kHz	미디어 오디오	249	중국 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성: 126년, 남성: 346명, 불명: 6명	Contact
중국어 간체_SM_48	중국어 간체	중국어 간체	에서 zh-CN	48 kHz	스크립트 독백	2,762	중국어 간체	5~30초 범위에 속하는 경향이 있는 단일 발화 녹음	모노	모바일 애플 리케이션	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 1920 남성 1535 불명 270	Contact
중국어 번체_SM_48	중국어 번체	중국어 번체	zh-TW	48 kHz	스크립트 독백	1,028	중국어 번체	5~30초 범위에 속하는 경향이 있는 단일 발화 녹음	모노	모바일 애플 리케이션	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 1069 남성 262 불명 3	Contact
덴마크어_GC_8	덴마크 말	덴마크 말	다_DK	8 kHz	일반회화	372	덴마크 일반 회화 데이터	두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성: 311, 남성: 417, 불명: 0	Contact
덴마크어_MA_16	덴마크 말	덴마크 말	다_DK	16 kHz	미디어 오디오	664	덴마크 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성: 369, 남성: 864, 불명: 27	Contact
덴마크어_SM_48	덴마크 말	덴마크 말	다-DK	48 kHz	스크립트 독백	2,579	덴마크 스크립트 독백	5~30초 범위에 속하는 경향이 있는 단일 발화 녹음, 덴마크의 덴마크어	모노	모바일 애플 리케이션	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 1551 남성 1233 불명 42	Contact
영어 Deep South_CC_8	영어 딥 사우스	영어 딥 사우스	ko 페이지	8 kHz	콜센터	151	Deep South 콜센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 221명, 남성 1004명, 불명 7명	Contact
영어 Deep South_GC_8	영어 딥 사우스	영어 딥 사우스	ko 페이지	8 kHz	일반회화	56	영어 Deep South 일반 회화 데이터	두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 99, 남성 31, 알 수 없음 0	Contact
영어 Deep South_MA_16	영어 딥 사우스	영어 딥 사우스	ko 페이지	16 kHz	미디어 오디오	266	영어 Deep South Media 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 204, 남성 356, 알 수 없음 21	Contact
독일어_CC_8	독일 사람	독일 사람	드-데	8 kHz	콜센터	64	독일 콜센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,	모노	데스크탑		. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 478 남성 1440 알 수 없음 0	Contact
German_IVR_8	독일 사람	독일 사람	드-데	8 kHz	IVR	200	독일 IVR 데이터	인간 대 기계. TTS 프롬프트(예: "어떻게 도와드릴까요?")와 자발적인 사람의 응답이 있는 IVR 유형의 흐름	모노	데스크탑		. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 10115 남성 8750 알 수 없음 0	Contact
구자라트어_CC_8	구자라트어	구자라트어(파이프라인 내)	gu_IN		콜센터	60	구자라트어(파이프라인 내) 콜 센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,		데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
구자라트어_GC	구자라트어	구자라트어(파이프라인 내)	gu_IN		일반회화	100	구자라트어(파이프라인 내) 일반 대화 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,		데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
구자라트어_MA	구자라트어	구자라트어(파이프라인 내)	gu_IN		미디어 오디오	40	구자라트어(In Pipeline) 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분		웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
히브리어_일반회화_8	히브리어	히브리어	he_IL	8 kHz	일반회화	399	히브리어 일반 회화 데이터	두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 이스라엘 히브리어	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 414명, 남성 399명, 불명 1명	Contact
히브리어_MA_16	히브리어	히브리어	he_IL	16 kHz	미디어 오디오	427	히브리어 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 361명, 남성 513명, 불명 13명	Contact
힌디어_MA_16	힌디 어	힌디 어	안녕하세요_IN	16 kHz	미디어 오디오	219	힌디어 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 83명, 남성 309명, 불명 0명	Contact
Hindi_SM_48	힌디 어	힌디 어	하이 인	48 kHz	스크립트 독백	2,867	힌디어 스크립트 독백	5~30초 범위에 속하는 경향이 있는 단일 발화 녹음	모노	모바일 애플 리케이션	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 1977 남성 1864 불명 147	Contact
HINGLISH_CC_8	힝글 리쉬	힝글 리쉬	hg_IN	8 kHz	콜센터	208	HINGLISH 콜 센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 822, 남성 1262, 알 수 없음 0	Contact
HINGLISH_MA_16	힝글 리쉬	힝글 리쉬	hg_IN	16 kHz	미디어 오디오	216	HINGLISH 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 75, 남성 380, 알 수 없음 0	Contact
히스패닉_CC_8	히스패닉 영어	히스패닉 영어	ko 페이지	8 kHz	콜센터	212	히스패닉 콜 센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 822, 남성 1262, 알 수 없음 0	Contact
히스패닉_MA_16	히스패닉 영어	히스패닉 영어	ko 페이지	16 kHz	미디어 오디오	155	히스패닉 콜 미디어 오디오	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 140, 남성 219, 알 수 없음 5	Contact
인도네시아어_GC_8	인도네시아 인	인도네시아 인	아이디_아이디	8 kHz	일반회화	496	인도네시아어 일반 회화 데이터	두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 인도네시아어 바하사	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 524, 남성 454, 알 수 없음 2	Contact
인도네시아어_MA_16	인도네시아 인	인도네시아 인	아이디_아이디	16 kHz	미디어 오디오	643	인도네시아 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 746, 남성 1507, 알 수 없음 129	Contact
아일랜드어_GC_8	아일랜드	아일랜드	ko_IE	8 kHz	일반회화	192	아일랜드 일반 회화 데이터	두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 213명, 남성 153명, 불명 0명	Contact
일본어_SM_48	일본제	일본제	JA-JP	48 kHz	스크립트 독백	2,335	일본 스크립트 독백	5~30초 범위에 속하는 경향이 있는 단일 발화 녹음	모노	모바일 애플 리케이션	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 1460 남성 1221 불명 194	Contact
칸나다어_CC_8	칸나다어	칸나다어(파이프라인 내)	kn_IN		콜센터	60	칸나다어(파이프라인 내) 콜 센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,		데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
칸나다어_GC	칸나다어	칸나다어(파이프라인 내)	kn_IN		일반회화	100	칸나다어(파이프라인 내) 일반 대화 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,		데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
칸나다어_MA	칸나다어	칸나다어(파이프라인 내)	kn_IN		미디어 오디오	40	칸나다어(파이프라인 내) 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분		웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
한국어_CC_8	한국어	한국어	ko_KR	8 kHz	콜센터	107	한국 콜센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 1086, 남성 210, 불명 4	Contact
한국어_MA_16	한국어	한국어	ko_KR	16 kHz	미디어 오디오	204	한국 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 70 남성 303, 불명 25	Contact
한국어_SM_48	한국어	한국어	ko-KR	48 kHz	스크립트 독백	1,955	한국어 대본 독백	5~30초 범위에 속하는 경향이 있는 단일 발화 녹음	모노	모바일 애플 리케이션	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 1195 남성 1134 불명 122	Contact
말레이어_GC_8	Malay	Malay	ms_MY	8 kHz	일반회화	266	말레이 일반 회화 데이터	두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 말레이시아의 말레이어	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 316, 남성 176, 알 수 없음 0	Contact
말레이어_MA_16	Malay	Malay	ms_MY	16 kHz	미디어 오디오	344	말레이 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 236, 남성 626, 알 수 없음 47	Contact
말라얄람어_CC_8	말라얄람어	말라얄람어(파이프라인 중)	ml_IN		콜센터	60	말라얄람어(파이프라인 내) 콜 센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,		데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
말라얄람어_GC	말라얄람어	말라얄람어(파이프라인 중)	ml_IN		일반회화	100	말라얄람어(파이프라인 내) 일반 대화 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,		데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
말라얄람어_MA	말라얄람어	말라얄람어(파이프라인 중)	ml_IN		미디어 오디오	40	말라얄람어(파이프라인 내) 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분		웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
마라티어_CC_8	마라타어	마라티어(파이프라인 내)	미스터인		콜센터	60	마라티어(파이프라인 내) 콜센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,		데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
마라티_GC	마라타어	마라티어(파이프라인 내)	미스터인		일반회화	100	마라티어(파이프라인 내) 일반 대화 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,		데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
마라티어_MA	마라타어	마라티어(파이프라인 내)	미스터인		미디어 오디오	40	마라티어(파이프라인 내) 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분		웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
멕시코인_SM_48	스페인어 (멕시코)	스페인어 (멕시코)	ES-MX	48 kHz	스크립트 독백	1,492	멕시코 스페인어 스크립트 독백	5~30초 범위에 속하는 경향이 있는 단일 발화 녹음	모노	모바일 애플 리케이션	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 1016 남성 1069 불명 95	Contact
네덜란드_SM_48	Dutch	Dutch	NL-NL	48 kHz	스크립트 독백	1,205	네덜란드 스크립트 독백	5~30초 범위에 속하는 경향이 있는 단일 발화 녹음	모노	모바일 애플 리케이션	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 1285 남성 531 불명 3	Contact
뉴욕 English_CC_8	뉴욕 영어	뉴욕 영어	ko 페이지	8 kHz	콜센터	103	New York English 콜센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 610, 남성 532, 알 수 없음 0	Contact
뉴욕 영어_GC_8	뉴욕 영어	뉴욕 영어	ko 페이지	8 kHz	일반회화	107	뉴욕 영어 일반 회화 데이터	두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 118, 남성 114, 알 수 없음 0	Contact
뉴욕 English_MA_16	뉴욕 영어	뉴욕 영어	ko 페이지	16 kHz	미디어 오디오	140	New York English Media 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 66, 남성 230, 알 수 없음 11	Contact
뉴질랜드_GC_8	뉴질랜드 영어	뉴질랜드 영어	ko_NZ	8 kHz	일반회화	148	뉴질랜드 영어 일반 회화 데이터	두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 167, 남성 121, 불명 4	Contact
뉴질랜드_MA_16	뉴질랜드 영어	뉴질랜드 영어	ko_NZ	16 kHz	미디어 오디오	400	뉴질랜드 영어 미디어 오디오	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 367, 남성 678, 불명 26	Contact
오리야_CC_8	오리 야	오리야(파이프라인 내)	or_IN		콜센터	60	오리야(파이프라인 내) 콜 센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,		데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
오리야_GC	오리 야	오리야(파이프라인 내)	or_IN		일반회화	100	Oriya(파이프라인 내) 일반 대화 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,		데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
오리야_MA	오리 야	오리야(파이프라인 내)	or_IN		미디어 오디오	40	Oriya(In Pipeline) 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분		웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
폴란드어_MA_16	광택	광택	pl_PL	16 kHz	미디어 오디오	269	폴란드어 미디어 오디오	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 173 남성 354 알 수 없음 6	Contact
폴란드 폴란드_SM_48	폴란드어 (폴란드)	폴란드어 (폴란드)	PL-PL	48 kHz	스크립트 독백	1,482	폴란드 폴란드 - 스크립트 독백	5~30초 범위에 속하는 경향이 있는 단일 발화 녹음	모노	모바일 애플 리케이션	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 1324 남성 701 불명 24	Contact
펀자브어_CC_8	펀 자브	펀자브어(파이프라인 내)	펀 자브		콜센터	60	펀자브어(파이프라인 내) 콜센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,		데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
펀자브어_GC	펀 자브	펀자브어(파이프라인 내)	펀 자브		일반회화	100	펀자브어(파이프라인 내) 일반 대화 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,		데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
펀잡어_MA	펀 자브	펀자브어(파이프라인 내)	펀 자브		미디어 오디오	40	펀자브어(In Pipeline) 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분		웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
러시아어_SM_48	러시아인	러시아인	RU-RU	48 kHz	스크립트 독백	2,398	러시아 스크립트 독백	5~30초 범위에 속하는 경향이 있는 단일 발화 녹음	모노	모바일 애플 리케이션	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 1689 남성 1937 불명 214	Contact
스코틀랜드_GC_8	스코틀랜드(영어 악센트)	스코틀랜드(영어 악센트)	ko_AB	8 kHz	일반회화	292	스코틀랜드 일반 회화 데이터	두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 285명, 남성 260명, 불명 3명	Contact
싱가포르_CC_8	싱가포르 영어	싱가포르 영어	ko_SG	8 kHz	콜센터	218	싱가포르 콜 센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 2139, 남성 884, 불명 21	Contact
싱가포르_MA_16	싱가포르 영어	싱가포르 영어	ko_SG	16 kHz	미디어 오디오	247	싱가포르 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 160, 남성 455, 알 수 없음 37	Contact
남아프리카 영어_CC_8	남아프리카 영어	남아프리카 영어	en_ZA	8 kHz	콜센터	261	남아프리카 영어 콜 센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 1274명, 남성 935명, 불명 1명	Contact
남아프리카 영어_MA_16	남아프리카 영어	남아프리카 영어	en_ZA	16 kHz	미디어 오디오	251	남아프리카 영어 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 235, 남성 432, 알 수 없음 36	Contact
스와힐리어_CC_8	스와힐리어	스와힐리어	sw_KE	8 kHz	콜센터	230	스와힐리어 콜 센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 611, 남성 833, 알 수 없음 0	Contact
스와힐리어_MA_16	스와힐리어	스와힐리어	sw_KE	16 kHz	미디어 오디오	265	Swahili 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 118, 남성 493, 알 수 없음 25	Contact
스웨덴어_CC_8	스웨덴어	스웨덴어	SV_SE	8 kHz	콜센터	250	스웨덴 콜센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 1581, 남성 727, 불명 2	Contact
스웨덴어_MA_16	스웨덴어	스웨덴어	SV_SE	16 kHz	미디어 오디오	278	스웨덴 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 195, 남성 500, 불명 21	Contact
타밀어_CC_8	타밀 사람	타밀어(파이프라인 내)	엷은 주석판		콜센터	60	타밀어(파이프라인 내) 콜 센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,		데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
타밀어_GC	타밀 사람	타밀어(파이프라인 내)	엷은 주석판		일반회화	100	타밀어(파이프라인 내) 일반 대화 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,		데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
타밀어_MA	타밀 사람	타밀어(파이프라인 내)	엷은 주석판		미디어 오디오	40	타밀어(파이프라인 내) 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분		웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
텔루구어_GC_8	텔루구어	텔루구어	te_IN	8 kHz	일반회화	553	텔루구어 일반 대화 데이터	두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 574, 남성 564, 불명 0	Contact
Telugu_MA_16	텔루구어	텔루구어	te_IN	16 kHz	미디어 오디오	648	텔루구어 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 207, 남성 963, 알 수 없음 2	Contact
Telugu_CC_8	텔루구어	텔루구어(파이프라인 내)	te_IN		콜센터	30	텔루구어(파이프라인 내) 콜 센터 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,		데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
Telugu_GC	텔루구어	텔루구어(파이프라인 내)	te_IN		일반회화	50	텔루구어(파이프라인 내) 일반 대화 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,		데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
Telugu_MA	텔루구어	텔루구어(파이프라인 내)	te_IN		미디어 오디오	20	텔루구어(파이프라인 내) 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분		웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링		Contact
태국어_GC_8	태국어	태국어	일_TH	8 kHz	일반회화	183	태국 일반 회화	두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 친구 간에 사용되는 비공식 기록	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 338, 남성 96, 알 수 없음 8	Contact
태국어_MA_8	태국어	태국어	일_TH	16 kHz	미디어 오디오	173	태국 미디어 오디오	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 143, 남성 502, 알 수 없음 26	Contact
터키어 Turkey_SM_48	터키어 터키	터키어 터키	TR-TR	48 kHz	스크립트 독백	2,027	터키어 터키	5~30초 범위에 속하는 경향이 있는 단일 발화 녹음	모노	모바일 애플 리케이션	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 1561 남성 1241 불명 31	Contact
베트남어_GC_8	베트남어	베트남어	vi_VN	8 kHz	일반회화	295	베트남어 일반 회화 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, 북부(예: 하노이), 중부 및 남부(예: 호치민시).	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 400, 남성 380, 불명 2	Contact
베트남어_MA_16	베트남어	베트남어	vi_VN	16 kHz	미디어 오디오	257	베트남 미디어 오디오 데이터	인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분	모노	웹소싱	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 249, 남성 200, 불명 45	Contact
웨일스어_GC_8	웨일스어(영어 악센트)	웨일스어(영어 악센트)	ko_WL	8 kHz	일반회화	278	웨일스 일반 회화 데이터	"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,	이중의	데스크탑	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	여성 270, 남성 324, 알 수 없음 0	Contact
영국 English_WW_16	영국 영어	영국 영어	en_uk	16 kHz	웨이크 워드	200연설자	Wake Word 영국 영어	keyphrases 데이터 수집 200 스피커 화자당 4개의 고유한 키프레이즈 고유한 키프레이즈당 25-30개의 반복된 키프레이즈 녹음 고유한 키프레이즈당 25-30개의 오디오 파일 화자당 총 120개의 녹음된 발화	1 채널	모바일 애플 리케이션	5.0	. WAV	.json	ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링	성별: 남성 50%, 여성 50%, +/- 10%.	Contact

서비스 제공

전문적인 오디오 데이터 수집은 포괄적인 AI 설정을 위한 모든 준비가 아닙니다. Shaip에서는 모델을 평소보다 더 널리 보급하기 위해 다음 서비스를 고려할 수도 있습니다.

나만의 오디오 데이터세트를 만들고 싶으신가요?

사내 음성 데이터 수집 전문가와 연결하여 요구 사항에 가장 적합한 오디오 리포지토리를 설정하십시오.

이름*
성*
이메일*
연락처 *
기업 정보*
국가*
국가
코멘트*
등록함으로써 Shaip에 동의합니다. 개인 정보 보호 정책 과 서비스약관 그리고 Shaip의 B2B 마케팅 커뮤니케이션 수신에 동의합니다.
보안문자

자주 묻는 질문 (FAQ)

1. 음성 데이터 수집이란 무엇입니까?

ML 모델의 음성 데이터 수집은 음성 언어 오디오 녹음을 수집하는 프로세스를 의미합니다. 이 컬렉션은 기계 학습 알고리즘, 특히 사람의 목소리를 이해하고 처리하는 데 중점을 둔 알고리즘을 훈련하고 개선하는 데 도움이 됩니다.

2. ASR(자동 음성 인식)을 위한 오디오 데이터를 수집하는 방법은 무엇입니까?

ASR(자동 음성 인식)을 위한 오디오 데이터 수집을 목표로 하는 경우 원하는 언어, 억양 및 음성 유형을 포함하여 프로젝트의 특정 요구 사항을 정의하는 것부터 시작해야 합니다. 이러한 매개변수를 설정한 후에는 사용자 개인정보 보호를 존중하는 데 필요한 모든 권한을 얻었는지 확인하세요. 그런 다음 적절한 녹음 장치나 소프트웨어를 사용하여 선명한 오디오 샘플을 캡처합니다. 각 녹음에는 필사본이나 기타 관련 메타데이터를 꼼꼼하게 주석 처리하고 체계적으로 저장하여 쉽게 액세스할 수 있어야 합니다.

3. 기계 학습을 위한 음성 데이터 세트의 활용

기계 학습의 음성 데이터 세트는 음성 언어를 인식, 전사 또는 해석하도록 맞춤화된 모델을 훈련, 테스트 및 검증하는 데 중추적인 역할을 합니다. 이러한 데이터 세트는 음성 도우미 및 녹음 서비스부터 음성 생체 인식에 이르기까지 수많은 애플리케이션을 위한 길을 열어줍니다.

4. 다양한 언어와 억양에서 정확한 데이터를 수집하는 방법

다양한 언어와 억양에서 정확한 데이터를 수집하려면 원하는 언어 배경을 가진 원어민과의 협업이 필수적입니다. 광범위한 인구통계적 차이를 포괄하는 다양하고 대표적인 샘플을 목표로 합니다. 오디오 일관성을 보장하기 위해 균일한 환경에서 표준화된 녹음 장비를 사용합니다. 그리고 중요한 것은 특정 언어와 억양을 나타내는 자세한 기록과 메타데이터로 각 데이터 조각에 주석을 다는 것입니다.

AI를 위한 가장 신뢰할 수 있는 음성 데이터 수집 서비스

병목 현상 없이 오디오 데이터 파이프라인을 발견하세요

주요 클라이언트

전문 오디오/음성 데이터 수집 서비스

모든 주제. 모든 시나리오.

100+

55K +

250+

60+

8 / 16 / 44 / 48kHz

우리의 전문성

더 스마트한 NLP 모델을 위해 오디오 데이터 정렬

독백 스피치 컬렉션

대화 연설 수집

그룹 / 다자간 대화

자연어 발화 모음

음향 데이터 수집

자동 음성 인식(ASR)

다국어 음성/음성 훈련 데이터

텍스트 음성 변환 (TTS)

센터에 문의 녹음

성공 사례

Shaip을 신뢰할 수 있는 음성 데이터 수집 파트너로 선택한 이유

사람들

방법

플랫폼

사람들

방법

플랫폼

기성품 음성/오디오 데이터세트

서비스 제공

텍스트 데이터 수집 서비스

이미지 데이터 수집 서비스

비디오 데이터 수집 서비스

추천 자료

제공

지능형 AI를 위한 오디오 주석

구매자 가이드

구매자 가이드: 대화형 AI에 대한 완전한 가이드

데이터 카탈로그

기성품 음성 데이터 카탈로그 및 라이선스

나만의 오디오 데이터세트를 만들고 싶으신가요?

자주 묻는 질문 (FAQ)

AI 데이터 서비스

전문

산업별

제품

기업 정보

자료

문의하기

대화 연설
수집

그룹 / 다자간
대화

음향 데이터
수집

텍스트 음성 변환
(TTS)

센터에 문의
녹음

텍스트 데이터 수집
서비스