타밀어 데이터 세트

தமிழ் தரவுத்தொகுப்பு

ASR, TTS 및 대화형 AI를 위한 타밀어 음성 데이터 세트의 잠재력을 활용하세요. Shaip은 더욱 스마트한 언어 모델을 학습하는 데 필요한 프리미엄 타밀어 오디오 데이터 세트를 제공합니다.

회사 개요

제목(언어)

타밀어 데이터 세트

데이터 세트 유형

콜센터, 일반 대화, 미디어 데이터, 스크립트 독백

국가

India

기술설명

이 데이터 세트에는 대본이 없는 합성 에이전트-고객 대화(5~15분), 자연스러운 인간 대 인간 전화 대화(15~60분), 그리고 필사본이 포함된 미디어 데이터가 포함되어 있으며, 음성 및 언어 기술을 훈련하고 평가하기 위한 다양한 음성 데이터를 제공합니다.

적용 사례

ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링

데이터 세트 세부정보

데이터 세트 유형 샘플링 속도 스피커 채널 전체 시간 총 연사 수
센터에 문의 8 kHz 2연설자 이중의 124:23:52 484
센터에 문의 16 kHz 2연설자 모노 199:44:21 1,986
일반회화 8 kHz 2연설자 이중의 101:42:05 440
일반회화 48 kHz 2연설자 모노 80:21:16 141
미디어 데이터 16 kHz 여러 스피커 모노 43:07:01 32
스크립트 독백 24 kHz 단일 스피커 모노 500:00:00 (요청시)

주요 클라이언트

팀이 세계 최고의 AI 제품을 구축할 수 있도록 지원합니다.

아마존
구글
Microsoft
샤이프 문의하기

찾고 있는 것을 찾을 수 없습니까?

모든 데이터 유형에 걸쳐 새로운 기성 데이터 세트가 수집되고 있습니다.

오디오/스피치 트레이닝 데이터 수집 걱정은 지금 바로 연락주세요.

  • 이 필드는 검증 목적이며 변하지 남아 있어야합니다.
  • 등록함으로써 Shaip에 동의합니다. 개인정보 처리방침서비스약관 그리고 Shaip의 B2B 마케팅 커뮤니케이션 수신에 동의합니다.