제목(언어)
뉴욕 영어 언어 데이터 세트
데이터 세트 유형
콜센터, 일반 대화, 미디어(팟캐스트)
국가
United States
기술설명
이 데이터 세트는 스크립트가 없는 합성 에이전트-고객 대화(5~15분), 사람 간 전화 대화(15~60분), 필사본이 포함된 노래 오디오, 인터뷰, 팟캐스트, 스크립트가 있는 독백 등 다양한 음성 및 미디어 콘텐츠를 제공하여 음성 및 언어 기술의 훈련과 평가를 지원합니다.
적용 사례
ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
| 데이터 세트 유형 | 샘플링 속도 | 스피커 | 채널 | 전체 시간 | 총 연사 수 |
|---|---|---|---|---|---|
| 센터에 문의 | 8 kHz | 2연설자 | 이중의 | 117:40:09 | 1,388 |
| 일반회화 | 8 kHz | 2연설자 | 이중의 | 156:42:48 | 510 |
| 음악 | 16 kHz | 단일 스피커 | 모노 | 135:14:18 | 288 |
팀이 세계 최고의 AI 제품을 구축할 수 있도록 지원합니다.
오디오/스피치 트레이닝 데이터 수집 걱정은 지금 바로 연락주세요.