중국어 데이터 세트
简體中文数据集
AI 및 음성 모델을 위한 고품질 중국어 데이터 세트
회사 개요
제목(언어)
중국어 언어 데이터 세트
데이터 세트 유형
콜센터, 음악, 대본 독백, 미디어 데이터(팟캐스트 데이터)
국가
China
기술설명
이 데이터 세트에는 대본이 없는 합성 에이전트-고객 전화 대화(5~15분), 자연스러운 인간 대 인간 전화 대화(15~60분), 필사본이 포함된 노래 오디오가 포함되어 있으며, 음성 및 언어 기술을 훈련하고 평가하기 위한 다양한 음성 데이터를 제공합니다.
적용 사례
ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
데이터 세트 세부정보
| Language | 데이터 세트 유형 | 샘플링 속도 | 스피커 | 채널 | 전체 시간 | 총 연사 수 |
|---|---|---|---|---|---|---|
| 중국어 노래 | 음악 | 48 kHz | 단일 스피커 | 모노 | 06:11:32 | 10 |
| 중국 (번체) | 스크립트 독백 | 48 kHz | 단일 스피커 | 모노 | 1,499:00:00 | 1,805 |
| 중국어 악센트 영어 | 미디어 데이터 | 16 kHz | 여러 스피커 | 모노 | 306:04:58 | 2,130 |
| 중국어 간체 | 스크립트 독백 | 48 kHz | 단일 스피커 | 모노 | 2,761:00:00 | 3,725 |
| 중국 미국식 영어 악센트 | 센터에 문의 | 8 kHz | 2연설자 | 이중의 | 152:18:33 | 2,058 |
| 중국 미국식 영어 악센트 | 미디어 데이터 | 16 kHz | 여러 스피커 | 모노 | 245:55:15 | 468 |
주요 클라이언트
팀이 세계 최고의 AI 제품을 구축할 수 있도록 지원합니다.
찾고 있는 것을 찾을 수 없습니까?
모든 데이터 유형에 걸쳐 새로운 기성 데이터 세트가 수집되고 있습니다.
오디오/스피치 트레이닝 데이터 수집 걱정은 지금 바로 연락주세요.