중국어 데이터 세트

简體中文数据集

AI 및 음성 모델을 위한 고품질 중국어 데이터 세트

회사 개요

제목(언어)

중국어 언어 데이터 세트

데이터 세트 유형

콜센터, 음악, 대본 독백, 미디어 데이터(팟캐스트 데이터)

국가

China

기술설명

이 데이터 세트에는 대본이 없는 합성 에이전트-고객 전화 대화(5~15분), 자연스러운 인간 대 인간 전화 대화(15~60분), 필사본이 포함된 노래 오디오가 포함되어 있으며, 음성 및 언어 기술을 훈련하고 평가하기 위한 다양한 음성 데이터를 제공합니다.

적용 사례

ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링

데이터 세트 세부정보

Language 데이터 세트 유형 샘플링 속도 스피커 채널 전체 시간 총 연사 수
중국어 노래 음악 48 kHz 단일 스피커 모노 06:11:32 10
중국 (번체) 스크립트 독백 48 kHz 단일 스피커 모노 1,499:00:00 1,805
중국어 악센트 영어 미디어 데이터 16 kHz 여러 스피커 모노 306:04:58 2,130
중국어 간체 스크립트 독백 48 kHz 단일 스피커 모노 2,761:00:00 3,725
중국 미국식 영어 악센트 센터에 문의 8 kHz 2연설자 이중의 152:18:33 2,058
중국 미국식 영어 악센트 미디어 데이터 16 kHz 여러 스피커 모노 245:55:15 468

주요 클라이언트

팀이 세계 최고의 AI 제품을 구축할 수 있도록 지원합니다.

샤이프 연락처

찾고 있는 것을 찾을 수 없습니까?

모든 데이터 유형에 걸쳐 새로운 기성 데이터 세트가 수집되고 있습니다.

오디오/스피치 트레이닝 데이터 수집 걱정은 지금 바로 연락주세요.

  • 이 필드는 검증 목적이며 변하지 남아 있어야합니다.
  • 등록함으로써 Shaip에 동의합니다. 개인정보 처리방침 서비스약관 그리고 Shaip의 B2B 마케팅 커뮤니케이션 수신에 동의합니다.