타밀어 데이터 세트
தமிழ் தரவுத்தொகுப்பு
ASR, TTS 및 대화형 AI를 위한 타밀어 음성 데이터 세트의 잠재력을 활용하세요. Shaip은 더욱 스마트한 언어 모델을 학습하는 데 필요한 프리미엄 타밀어 오디오 데이터 세트를 제공합니다.
회사 개요
제목(언어)
타밀어 데이터 세트
데이터 세트 유형
콜센터, 일반 대화, 미디어 데이터, 스크립트 독백
국가
India
기술설명
이 데이터 세트에는 대본이 없는 합성 에이전트-고객 대화(5~15분), 자연스러운 인간 대 인간 전화 대화(15~60분), 그리고 필사본이 포함된 미디어 데이터가 포함되어 있으며, 음성 및 언어 기술을 훈련하고 평가하기 위한 다양한 음성 데이터를 제공합니다.
적용 사례
ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
데이터 세트 세부정보
| 데이터 세트 유형 | 샘플링 속도 | 스피커 | 채널 | 전체 시간 | 총 연사 수 |
|---|---|---|---|---|---|
| 센터에 문의 | 8 kHz | 2연설자 | 이중의 | 124:23:52 | 484 |
| 센터에 문의 | 16 kHz | 2연설자 | 모노 | 199:44:21 | 1,986 |
| 일반회화 | 8 kHz | 2연설자 | 이중의 | 101:42:05 | 440 |
| 일반회화 | 48 kHz | 2연설자 | 모노 | 80:21:16 | 141 |
| 미디어 데이터 | 16 kHz | 여러 스피커 | 모노 | 43:07:01 | 32 |
| 스크립트 독백 | 24 kHz | 단일 스피커 | 모노 | 500:00:00 | (요청시) |
주요 클라이언트
팀이 세계 최고의 AI 제품을 구축할 수 있도록 지원합니다.
찾고 있는 것을 찾을 수 없습니까?
모든 데이터 유형에 걸쳐 새로운 기성 데이터 세트가 수집되고 있습니다.
오디오/스피치 트레이닝 데이터 수집 걱정은 지금 바로 연락주세요.