힌디어 데이터세트
힌디어 데이터 세트
AI 및 ASR 모델을 위한 고품질 힌디어 콜센터, 일반 대화 및 팟캐스트 데이터 세트
회사 개요
제목(언어)
힌디어 언어 데이터 세트
데이터 세트 유형
콜센터, 일반 대화, 미디어(팟캐스트), 대본 독백
국가
India
기술설명
두 사람 간의 대본 없는 전화 대화는 15분에서 60분까지 가능하며, 1명에서 5명까지 참여자가 참여하는 인터뷰나 팟캐스트 등 라이선스가 부여된 퍼블릭 도메인 오디오 또는 비디오 파일도 제공됩니다. 또한, 단일 발화 녹음은 일반적으로 5초에서 30초까지 지속되며, 대본이 있는 독백 데이터도 제공됩니다.
적용 사례
ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
데이터 세트 세부정보
| 데이터 세트 유형 | 샘플링 속도 | 스피커 | 채널 | 전체 시간 | 총 연사 수 |
|---|---|---|---|---|---|
| 센터에 문의 | 8 kHz | 2연설자 | 이중의 | 70:45:51 | (요청시) |
| 센터에 문의 | 8 kHz | 2연설자 | 모노 | 20,000:00:00 | (요청시) |
| 센터에 문의 | 16 kHz | 2연설자 | 모노 | 29:17:20 | 261 |
| 센터에 문의 | 16 kHz | 2연설자 | 이중의 | 400:27:10 | 1200 |
| 일반회화 | 8 kHz | 2연설자 | 이중의 | 47:48:40 | 224 |
| 미디어 데이터 | 16 kHz | 여러 스피커 | 모노 | 227:57:43 | 438 |
| 스크립트 독백 | 48 kHz | 단일 스피커 | 모노 | 2,866:00:00 | 3,988 |
| 스크립트 독백 | 24 kHz | 단일 스피커 | 모노 | 29,000:00:00 | (요청시) |
주요 클라이언트
팀이 세계 최고의 AI 제품을 구축할 수 있도록 지원합니다.
찾고 있는 것을 찾을 수 없습니까?
모든 데이터 유형에 걸쳐 새로운 기성 데이터 세트가 수집되고 있습니다.
오디오/스피치 트레이닝 데이터 수집 걱정은 지금 바로 연락주세요.