한국어 데이터셋
한국어 데이터셋
개요
Title
한국어
데이터 세트
데이터 세트 유형
콜센터
상품 설명
"상담원"과 "고객" 간의 대본 없는 합성 전화 대화, 약. 오디오 길이(범위) 5-15분.
적용 사례
ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
데이터 세트 세부정보
전체 시간
107
샘플 속도
8 kHz
오디오 채널
이중의
녹음 플랫폼
데스크탑
오디오 형식
. WAV
전사 형식
.json
WER(%)
5
데이터 세트 인구통계
국가
한국어
지원하는 언어
한국어
성별
여성 1086, 남성 210, 알 수 없음 4
스피커의 수
1,300
연령
18-50
개요
Title
한국어 언어 데이터세트
데이터 세트 유형
미디어 오디오
상품 설명
인터뷰, 팟캐스트 등과 같은 라이선스 가능한 공개 도메인 오디오/비디오 파일 – 1~5명. 약. 오디오 길이(범위) 15-60분.
적용 사례
ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
데이터 세트 세부정보
전체 시간
204
샘플 속도
16 kHz
오디오 채널
모노
녹음 플랫폼
웹소싱
오디오 형식
. WAV
전사 형식
.json
WER(%)
5
데이터 세트 인구통계
국가
한국어
지원하는 언어
한국어
성별
여성 70, 남성 303, 알 수 없음 25
스피커의 수
398
연령
18-50
개요
Title
한국어 언어 데이터세트
데이터 세트 유형
TTS
상품 설명
5~30초 범위에 속하는 경향이 있는 단일 음성 녹음.
적용 사례
ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
데이터 세트 세부정보
전체 시간
1,955
샘플 속도
48 kHz
오디오 채널
모노
녹음 플랫폼
모바일 애플 리케이션
오디오 형식
. WAV
전사 형식
.json
WER(%)
5
데이터 세트 인구통계
국가
한국어
지원하는 언어
한국어
성별
여성 1195, 남성 1134, 알 수 없음 122
스피커의 수
2,351
연령
18-50
주요 클라이언트
팀이 세계 최고의 AI 제품을 구축할 수 있도록 지원합니다.
찾고 있는 것을 찾을 수 없습니까?
모든 데이터 유형에 걸쳐 새로운 기성 데이터 세트가 수집되고 있습니다.
오디오/스피치 트레이닝 데이터 수집 걱정은 지금 바로 연락주세요.