힌디어 데이터세트

힌디어 데이터 세트

AI 및 ASR 모델을 위한 고품질 힌디어 콜센터, 일반 대화 및 팟캐스트 데이터 세트

회사 개요

제목(언어)

힌디어 언어 데이터 세트

데이터 세트 유형

콜센터, 일반 대화, 미디어(팟캐스트), 대본 독백

국가

India

기술설명

두 사람 간의 대본 없는 전화 대화는 15분에서 60분까지 가능하며, 1명에서 5명까지 참여자가 참여하는 인터뷰나 팟캐스트 등 라이선스가 부여된 퍼블릭 도메인 오디오 또는 비디오 파일도 제공됩니다. 또한, 단일 발화 녹음은 일반적으로 5초에서 30초까지 지속되며, 대본이 있는 독백 데이터도 제공됩니다.

적용 사례

ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링

데이터 세트 세부정보

데이터 세트 유형 샘플링 속도 스피커 채널 전체 시간 총 연사 수
센터에 문의 8 kHz 2연설자 이중의 70:45:51 (요청시)
센터에 문의 8 kHz 2연설자 모노 20,000:00:00 (요청시)
센터에 문의 16 kHz 2연설자 모노 29:17:20 261
센터에 문의 16 kHz 2연설자 이중의 400:27:10 1200
일반회화 8 kHz 2연설자 이중의 47:48:40 224
미디어 데이터 16 kHz 여러 스피커 모노 227:57:43 438
스크립트 독백 48 kHz 단일 스피커 모노 2,866:00:00 3,988
스크립트 독백 24 kHz 단일 스피커 모노 29,000:00:00 (요청시)

주요 클라이언트

팀이 세계 최고의 AI 제품을 구축할 수 있도록 지원합니다.

아마존
구글
Microsoft
샤이프 연락처

찾고 있는 것을 찾을 수 없습니까?

모든 데이터 유형에 걸쳐 새로운 기성 데이터 세트가 수집되고 있습니다.

오디오/스피치 트레이닝 데이터 수집 걱정은 지금 바로 연락주세요.

  • 이 필드는 검증 목적이며 변하지 남아 있어야합니다.
  • 등록함으로써 Shaip에 동의합니다. 개인정보 처리방침 서비스약관 그리고 Shaip의 B2B 마케팅 커뮤니케이션 수신에 동의합니다.