히브리어 데이터 세트
ערכת נתונים 아랍어
AI 및 음성 모델을 위한 고품질 히브리어 일반 대화 및 팟캐스트 데이터 세트
회사 개요
제목(언어)
히브리어 언어 데이터 세트
데이터 세트 유형
일반 대화, 미디어 데이터
국가
Israel
기술설명
이스라엘의 두 사람 사이에서 이루어지는 히브리어로 진행되는 각본 없는 전화 대화는 15분에서 60분까지 이용 가능하며, 1~5명이 참여하는 인터뷰나 팟캐스트와 같은 라이선스가 가능한 퍼블릭 도메인 오디오 또는 비디오 파일도 15분에서 60분까지 이용 가능합니다.
적용 사례
ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
데이터 세트 세부정보
| 데이터 세트 유형 | 샘플링 속도 | 스피커 | 채널 | 전체 시간 | 총 연사 수 |
|---|---|---|---|---|---|
| 일반회화 | 8 kHz | 2연설자 | 이중의 | 398:47:10 | 814 |
| 미디어 데이터 | 16 kHz | 여러 스피커 | 모노 | 426:14:16 | 885 |
주요 클라이언트
팀이 세계 최고의 AI 제품을 구축할 수 있도록 지원합니다.
찾고 있는 것을 찾을 수 없습니까?
모든 데이터 유형에 걸쳐 새로운 기성 데이터 세트가 수집되고 있습니다.
오디오/스피치 트레이닝 데이터 수집 걱정은 지금 바로 연락주세요.
회사 개요
Title
히브리어 언어 데이터세트
데이터 세트 유형
일반회화
기술설명
두 사람의 대본 없는 전화 통화. 약. 오디오 길이(범위) – 15-60분, 이스라엘의 히브리어.
적용 사례
ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
데이터 세트 세부정보
전체 시간
399
샘플 속도
8 kHz
오디오 채널
이중의
녹음 플랫폼
데스크탑
오디오 형식
. WAV
전사 형식
.json
WER(%)
5
데이터 세트 인구통계
국가
Israel
Language
히브리어
성별
여성 414, 남성 399, 알 수 없음 1
스피커의 수
814
연령
18-50
회사 개요
Title
히브리어 언어 데이터세트
데이터 세트 유형
팟캐스트
기술설명
인터뷰, 팟캐스트 등과 같은 라이선스 가능한 공개 도메인 오디오/비디오 파일 – 1~5명. 약. 오디오 길이(범위) 15-60분.
적용 사례
ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
데이터 세트 세부정보
전체 시간
427
샘플 속도
16 kHz
오디오 채널
모노
녹음 플랫폼
웹소싱
오디오 형식
. WAV
전사 형식
.json
WER(%)
5
데이터 세트 인구통계
국가
Israel
Language
히브리어
성별
여성 361, 남성 513, 알 수 없음 13
스피커의 수
887
연령
18-50