AI를 위한 가장 신뢰할 수 있는 음성 데이터 수집 서비스
당사의 오디오 및 음성 데이터 수집 서비스를 통해 고품질 대화 데이터로 NLP 모델, VA, TTS 프로토타입 등을 교육하십시오.
병목 현상 없이 오디오 데이터 파이프라인을 발견하세요
주요 클라이언트
전문 오디오/음성 데이터 수집 서비스
모든 주제. 모든 시나리오.
Shaip의 전문 지식은 다양한 AI/ML 요구 사항에 맞게 설계된 고품질 음성 데이터 세트를 만드는 데 있습니다. 우리는 광범위한 언어와 다양한 설정의 기록을 제공하여 데이터 세트를 포괄적이고 적응 가능하게 만듭니다. 영형우리의 초점은 가능한 가장 짧은 시간에 가장 많은 양의 사용자 정의 음성 데이터를 모델에 제공하는 것입니다. 우리와 함께라면 다음과 같은 혜택을 누릴 수 있습니다.
- 정확성을 높이기 위해 선별된 고품질 다국어 오디오/음성 데이터
- t에 대한 가능한 최고 수준의 도메인 특이성다양한 시나리오 확보 설치
- 다양한 인구 통계 및 업종에 맞게 ML 모델 확장
- 녹음 환경: 스튜디오 품질, 배경 소음을 최소화한 선명한 오디오를 제공합니다. 자연환경, 녹음에는 주변 소리가 포함되어 실제 상황을 모방합니다.
100+
55K +
음성 데이터 시간
250+
프로젝트
60+
언어(100개 이상의 방언)
8 / 16 / 44 / 48kHz
샘플링 속도
우리의 전문성
더 스마트한 NLP 모델을 위해 오디오 데이터 정렬
Shaip은 음성 지원 기술이 전 세계의 다양한 청중을 수용할 수 있도록 100개 이상의 언어로 종단 간 음성/오디오 데이터 수집 서비스를 제공합니다. 우리는 모든 범위와 규모의 프로젝트에서 작업할 수 있습니다. 기존 기성 오디오 데이터 세트 라이선스부터 맞춤형 오디오 데이터 수집 관리, 오디오 전사 및 주석에 이르기까지. 음성 데이터 수집 프로젝트의 규모에 상관없이 방언, 어조 및 언어를 대상으로 하는 고품질 NLP 데이터 세트를 구축하기 위해 필요에 맞게 오디오 수집 서비스를 사용자 정의할 수 있습니다. 음성 지원 지능형 설정을 위해 광범위한 음성 데이터 세트 및 오디오 데이터 수집 리소스 중에서 선택하십시오.
독백 대본 및 자발적인 연설
단일 화자의 음성을 처리하는 데 중점을 둡니다. 스크립트 프롬프트를 활용하여 단일 채널 오디오 파일에 피드함으로써 해당 개인에 특정한 고유한 음성 패턴, 톤 및 뉘앙스를 캡처할 수 있습니다.
대화 대본 및 자발적인 연설
이중 채널 파일 및 기록된 리소스를 통해 다국어 노출을 통해 실제 대화와 대화를 복제하는 2인 상호 작용.
그룹 / 다자간
대화
다중 사용자 토론, 그룹 역학, 중복 및 다양한 어조를 캡처하여 음성 모델을 정확하게 훈련합니다.
깨우침/핵심문구/발화 모음
고급 자연어 처리 및 이해를 위해 다양하고 풍부하며 실제적인 발화를 사용하여 유사한 의미를 가진 핵심 문구를 식별하거나 깨우는 단어 또는 발화를 AI가 훈련하도록 합니다.
음향 데이터
수집
우리는 레스토랑, 사무실, 집 등 다양한 환경과 언어에서 스튜디오 수준의 오디오 데이터를 전문적으로 녹음하면서 더 넓은 음향 범위(종합 사운드 데이터 세트)를 포괄할 수 있습니다.
자동 음성 인식(ASR)
다양한 인구 통계에서 최신의 다양한 음성/오디오 데이터 세트에 액세스하여 자동 음성 인식(ASR) 시스템의 정확도를 향상시킵니다.
다국어 음성/음성 훈련 데이터
전 세계에 걸쳐 있는 우리의 숙련된 언어 전문가들은 다양한 언어와 방언으로 된 다국어 오디오/음성 데이터를 제공합니다. 이러한 노력은 글로벌 커뮤니케이션을 촉진하고 언어 장벽을 해소하여 보다 포괄적이고 효과적인 AI 솔루션에 기여합니다.
텍스트 음성 변환
(TTS)
150개 이상의 언어 및 방언으로 음성 데이터를 수집하여 차량 내 제어부터 챗봇, 학습 솔루션까지 AI 모델을 향상하는 데 도움을 주는 글로벌 인력의 도움으로 텍스트 음성 변환(TTS) 다국어 모델을 구축하세요. 고품질 오디오 데이터.
센터에 문의
대화
스페인어, 독일어, 미국 영어, 벵골어, 일본어, 중국어, 힌디어 등 다양한 언어를 지원하는 에이전트와 고객 간의 진정한 교환.
성공 사례
3개 언어에 걸쳐 8시간 이상의 데이터가 포함된 대화형 AI 데이터 세트
인도어를 위한 다국어 플랫폼을 구축하려는 고객은 Shaip과 제휴하여 여러 인도어로 된 대규모 데이터 세트를 수집, 분할 및 복사했습니다. 이는 고객의 혁신적인 새 플랫폼을 강화할 수 있는 효과적인 음성 모델을 개발하는 데 도움이 될 것입니다.
문제 : 3,000개 인도 언어로 수집된 8시간 이상의 오디오 데이터를 분할하고 전사하여 자동 음성 인식을 개발했습니다.
해결 방법 : 우리는 데이터 수집, 세분화, 전사를 제공하고 메타데이터가 포함된 JSON 파일을 전달했습니다. 우리는 고객의 음성 기술 프로젝트를 위해 3000개 인도 언어로 된 8시간의 오디오 데이터를 대규모로 수집했습니다.
Shaip을 신뢰할 수 있는 음성 데이터 수집 파트너로 선택한 이유
사람들
전담 및 훈련된 팀:
- 데이터 생성, 라벨링 및 QA를 위한 30,000명 이상의 공동 작업자
- 자격을 갖춘 프로젝트 관리 팀
- 경험이 풍부한 제품 개발 팀
- 인재 풀 소싱 및 온보딩 팀
방법
최고의 공정 효율성은 다음을 통해 보장됩니다.
- 강력한 6시그마 스테이지 게이트 프로세스
- 6시그마 블랙벨트로 구성된 전담 팀 – 핵심 프로세스 소유자 및 품질 준수
- 지속적인 개선 및 피드백 루프
플랫폼
특허 받은 플랫폼은 다음과 같은 이점을 제공합니다.
- 웹 기반 엔드 투 엔드 플랫폼
- 완벽한 품질
- 더 빠른 TAT
- 원활한 전달
사람들
전담 및 훈련된 팀:
- 데이터 생성, 라벨링 및 QA를 위한 30,000명 이상의 공동 작업자
- 자격을 갖춘 프로젝트 관리 팀
- 경험이 풍부한 제품 개발 팀
- 인재 풀 소싱 및 온보딩 팀
방법
최고의 공정 효율성은 다음을 통해 보장됩니다.
- 강력한 6시그마 스테이지 게이트 프로세스
- 6시그마 블랙벨트로 구성된 전담 팀 – 핵심 프로세스 소유자 및 품질 준수
- 지속적인 개선 및 피드백 루프
플랫폼
특허 받은 플랫폼은 다음과 같은 이점을 제공합니다.
- 웹 기반 엔드 투 엔드 플랫폼
- 완벽한 품질
- 더 빠른 TAT
- 원활한 전달
기성품 음성/오디오 데이터세트
세부 정보 | 코퍼스 ID(고유) | 키워드 | 언어 데이터세트 | 언어 코드 | 샘플 속도 | 데이터 세트 유형 | 총 오디오 시간 | 간단한 설명 | 데이터 세트 설명 | 오디오 채널 | 녹음 플랫폼 | WER(%) | 오디오 형식 | 전사 형식 | 적용 사례 | 스피커의 수 | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
뉴욕 영어_GC_8 | 뉴욕 영어 | 뉴욕 영어 | ko 페이지 | 8 kHz | 일반회화 | 107 | 뉴욕 영어 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 118, 남성 114, 알 수 없음 0 | 고객문의 | |
러시아어_SM_48 | 러시아인 | 러시아인 | RU-RU | 48 kHz | 스크립트 독백 | 2,398 | 러시아 스크립트 독백 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1689 남성 1937 불명 214 | 고객문의 | |
펀잡어_MA | 펀 자브 | 펀자브어(파이프라인 내) | 펀 자브 | 미디어 오디오 | 40 | 펀자브어(In Pipeline) 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
펀자브어_GC | 펀 자브 | 펀자브어(파이프라인 내) | 펀 자브 | 일반회화 | 100 | 펀자브어(파이프라인 내) 일반 대화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
펀자브어_CC_8 | 펀 자브 | 펀자브어(파이프라인 내) | 펀 자브 | 콜센터 | 60 | 펀자브어(파이프라인 내) 콜센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
폴란드 폴란드_SM_48 | 폴란드어 (폴란드) | 폴란드어 (폴란드) | PL-PL | 48 kHz | 스크립트 독백 | 1,482 | 폴란드 폴란드 - 스크립트 독백 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1324 남성 701 불명 24 | 고객문의 | |
폴란드어_MA_16 | 광택 | 광택 | pl_PL | 16 kHz | 미디어 오디오 | 269 | 폴란드어 미디어 오디오 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 173 남성 354 알 수 없음 6 | 고객문의 | |
오리야_MA | 오리 야 | 오리야(파이프라인 내) | or_IN | 미디어 오디오 | 40 | Oriya(In Pipeline) 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
오리야_GC | 오리 야 | 오리야(파이프라인 내) | or_IN | 일반회화 | 100 | Oriya(파이프라인 내) 일반 대화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
오리야_CC_8 | 오리 야 | 오리야(파이프라인 내) | or_IN | 콜센터 | 60 | 오리야(파이프라인 내) 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
뉴질랜드_MA_16 | 뉴질랜드 영어 | 뉴질랜드 영어 | ko_NZ | 16 kHz | 미디어 오디오 | 400 | 뉴질랜드 영어 미디어 오디오 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 367, 남성 678, 불명 26 | 고객문의 | |
뉴질랜드_GC_8 | 뉴질랜드 영어 | 뉴질랜드 영어 | ko_NZ | 8 kHz | 일반회화 | 148 | 뉴질랜드 영어 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 167, 남성 121, 불명 4 | 고객문의 | |
뉴욕 English_MA_16 | 뉴욕 영어 | 뉴욕 영어 | ko 페이지 | 16 kHz | 미디어 오디오 | 140 | New York English Media 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 66, 남성 230, 알 수 없음 11 | 고객문의 | |
스코틀랜드_GC_8 | 스코틀랜드(영어 악센트) | 스코틀랜드(영어 악센트) | ko_AB | 8 kHz | 일반회화 | 292 | 스코틀랜드 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 285명, 남성 260명, 불명 3명 | 고객문의 | |
뉴욕 English_CC_8 | 뉴욕 영어 | 뉴욕 영어 | ko 페이지 | 8 kHz | 콜센터 | 103 | New York English 콜센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 610, 남성 532, 알 수 없음 0 | 고객문의 | |
네덜란드_SM_48 | Dutch | Dutch | NL-NL | 48 kHz | 스크립트 독백 | 1,205 | 네덜란드 스크립트 독백 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1285 남성 531 불명 3 | 고객문의 | |
멕시코인_SM_48 | 스페인어 (멕시코) | 스페인어 (멕시코) | ES-MX | 48 kHz | 스크립트 독백 | 1,492 | 멕시코 스페인어 스크립트 독백 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1016 남성 1069 불명 95 | 고객문의 | |
마라티어_MA | 마라타어 | 마라티어(파이프라인 내) | 미스터인 | 미디어 오디오 | 40 | 마라티어(파이프라인 내) 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
마라티_GC | 마라타어 | 마라티어(파이프라인 내) | 미스터인 | 일반회화 | 100 | 마라티어(파이프라인 내) 일반 대화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
마라티어_CC_8 | 마라타어 | 마라티어(파이프라인 내) | 미스터인 | 콜센터 | 60 | 마라티어(파이프라인 내) 콜센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
말라얄람어_MA | 말라얄람어 | 말라얄람어(파이프라인 중) | ml_IN | 미디어 오디오 | 40 | 말라얄람어(파이프라인 내) 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
말라얄람어_GC | 말라얄람어 | 말라얄람어(파이프라인 중) | ml_IN | 일반회화 | 100 | 말라얄람어(파이프라인 내) 일반 대화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
말라얄람어_CC_8 | 말라얄람어 | 말라얄람어(파이프라인 중) | ml_IN | 콜센터 | 60 | 말라얄람어(파이프라인 내) 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
말레이어_MA_16 | Malay | Malay | ms_MY | 16 kHz | 미디어 오디오 | 344 | 말레이 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 236, 남성 626, 알 수 없음 47 | 고객문의 | |
말레이어_GC_8 | Malay | Malay | ms_MY | 8 kHz | 일반회화 | 266 | 말레이 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 말레이시아의 말레이어 | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 316, 남성 176, 알 수 없음 0 | 고객문의 | |
텔루구어_GC_8 | 텔루구어 | 텔루구어 | te_IN | 8 kHz | 일반회화 | 553 | 텔루구어 일반 대화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 574, 남성 564, 불명 0 | 고객문의 | |
영국 English_WW_16 | 영국 영어 | 영국 영어 | en_uk | 16 kHz | 웨이크 워드 | 200연설자 | Wake Word 영국 영어 | keyphrases 데이터 수집
| 1 채널 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 성별: 남성 50%, 여성 50%, +/- 10%. | 고객문의 | |
웨일스어_GC_8 | 웨일스어(영어 악센트) | 웨일스어(영어 악센트) | ko_WL | 8 kHz | 일반회화 | 278 | 웨일스 일반 회화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 270, 남성 324, 알 수 없음 0 | 고객문의 | |
베트남어_MA_16 | 베트남어 | 베트남어 | vi_VN | 16 kHz | 미디어 오디오 | 257 | 베트남 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 249, 남성 200, 불명 45 | 고객문의 | |
베트남어_GC_8 | 베트남어 | 베트남어 | vi_VN | 8 kHz | 일반회화 | 295 | 베트남어 일반 회화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, 북부(예: 하노이), 중부 및 남부(예: 호치민시). | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 400, 남성 380, 불명 2 | 고객문의 | |
터키어 Turkey_SM_48 | 터키어 터키 | 터키어 터키 | TR-TR | 48 kHz | 스크립트 독백 | 2,027 | 터키어 터키 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1561 남성 1241 불명 31 | 고객문의 | |
태국어_MA_8 | 태국어 | 태국어 | 일_TH | 16 kHz | 미디어 오디오 | 173 | 태국 미디어 오디오 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 143, 남성 502, 알 수 없음 26 | 고객문의 | |
태국어_GC_8 | 태국어 | 태국어 | 일_TH | 8 kHz | 일반회화 | 183 | 태국 일반 회화 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 친구 간에 사용되는 비공식 기록 | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 338, 남성 96, 알 수 없음 8 | 고객문의 | |
Telugu_MA | 텔루구어 | 텔루구어(파이프라인 내) | te_IN | 미디어 오디오 | 20 | 텔루구어(파이프라인 내) 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
Telugu_GC | 텔루구어 | 텔루구어(파이프라인 내) | te_IN | 일반회화 | 50 | 텔루구어(파이프라인 내) 일반 대화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
Telugu_CC_8 | 텔루구어 | 텔루구어(파이프라인 내) | te_IN | 콜센터 | 30 | 텔루구어(파이프라인 내) 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
Telugu_MA_16 | 텔루구어 | 텔루구어 | te_IN | 16 kHz | 미디어 오디오 | 648 | 텔루구어 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 207, 남성 963, 알 수 없음 2 | 고객문의 | |
한국어_SM_48 | 한국어 | 한국어 | ko-KR | 48 kHz | 스크립트 독백 | 1,955 | 한국어 대본 독백 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1195 남성 1134 불명 122 | 고객문의 | |
타밀어_MA | 타밀 사람 | 타밀어(파이프라인 내) | 엷은 주석판 | 미디어 오디오 | 40 | 타밀어(파이프라인 내) 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
타밀어_GC | 타밀 사람 | 타밀어(파이프라인 내) | 엷은 주석판 | 일반회화 | 100 | 타밀어(파이프라인 내) 일반 대화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
타밀어_CC_8 | 타밀 사람 | 타밀어(파이프라인 내) | 엷은 주석판 | 콜센터 | 60 | 타밀어(파이프라인 내) 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
스웨덴어_MA_16 | 스웨덴어 | 스웨덴어 | SV_SE | 16 kHz | 미디어 오디오 | 278 | 스웨덴 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 195, 남성 500, 불명 21 | 고객문의 | |
스웨덴어_CC_8 | 스웨덴어 | 스웨덴어 | SV_SE | 8 kHz | 콜센터 | 250 | 스웨덴 콜센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1581, 남성 727, 불명 2 | 고객문의 | |
스와힐리어_MA_16 | 스와힐리어 | 스와힐리어 | sw_KE | 16 kHz | 미디어 오디오 | 265 | Swahili 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 118, 남성 493, 알 수 없음 25 | 고객문의 | |
스와힐리어_CC_8 | 스와힐리어 | 스와힐리어 | sw_KE | 8 kHz | 콜센터 | 230 | 스와힐리어 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 611, 남성 833, 알 수 없음 0 | 고객문의 | |
남아프리카 영어_MA_16 | 남아프리카 영어 | 남아프리카 영어 | en_ZA | 16 kHz | 미디어 오디오 | 251 | 남아프리카 영어 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 235, 남성 432, 알 수 없음 36 | 고객문의 | |
남아프리카 영어_CC_8 | 남아프리카 영어 | 남아프리카 영어 | en_ZA | 8 kHz | 콜센터 | 261 | 남아프리카 영어 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1274명, 남성 935명, 불명 1명 | 고객문의 | |
싱가포르_MA_16 | 싱가포르 영어 | 싱가포르 영어 | ko_SG | 16 kHz | 미디어 오디오 | 247 | 싱가포르 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 160, 남성 455, 알 수 없음 37 | 고객문의 | |
싱가포르_CC_8 | 싱가포르 영어 | 싱가포르 영어 | ko_SG | 8 kHz | 콜센터 | 218 | 싱가포르 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 2139, 남성 884, 불명 21 | 고객문의 | |
보스턴_CC_8 | 보스턴 영어 | 보스턴 영어 | ko 페이지 | 8 kHz | 콜센터 | 177 | 보스턴 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 605, 남성: 711, 불명: 0 | 고객문의 | |
영어 Deep South_CC_8 | 영어 딥 사우스 | 영어 딥 사우스 | ko 페이지 | 8 kHz | 콜센터 | 151 | Deep South 콜센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 221명, 남성 1004명, 불명 7명 | 고객문의 | |
덴마크어_SM_48 | 덴마크 말 | 덴마크 말 | 다-DK | 48 kHz | 스크립트 독백 | 2,579 | 덴마크 스크립트 독백 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음, 덴마크의 덴마크어 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1551 남성 1233 불명 42 | 고객문의 | |
덴마크어_MA_16 | 덴마크 말 | 덴마크 말 | 다_DK | 16 kHz | 미디어 오디오 | 664 | 덴마크 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 369, 남성: 864, 불명: 27 | 고객문의 | |
덴마크어_GC_8 | 덴마크 말 | 덴마크 말 | 다_DK | 8 kHz | 일반회화 | 372 | 덴마크 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 311, 남성: 417, 불명: 0 | 고객문의 | |
중국어 번체_SM_48 | 중국어 번체 | 중국어 번체 | zh-TW | 48 kHz | 스크립트 독백 | 1,028 | 중국어 번체 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1069 남성 262 불명 3 | 고객문의 | |
중국어 간체_SM_48 | 중국어 간체 | 중국어 간체 | 에서 zh-CN | 48 kHz | 스크립트 독백 | 2,762 | 중국어 간체 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1920 남성 1535 불명 270 | 고객문의 | |
중국어_MA_16 | 중국어 영어 | 중국어 영어 | ko 페이지 | 16 kHz | 미디어 오디오 | 249 | 중국 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 126년, 남성: 346명, 불명: 6명 | 고객문의 | |
중국어_CC_8 | 중국어 영어 | 중국어 영어 | ko 페이지 | 8 kHz | 콜센터 | 169 | 중국 콜센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 1790년, 남성: 523명, 불명: 13명 | 고객문의 | |
캐나다_SM_48 | 캐나다 불어 | 캐나다 불어 | FR-CA | 48 kHz | 스크립트 독백 | 1,222 | 캐나다 불어 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 974 남성 631 불명 1 | 고객문의 | |
보스턴_MA_16 | 보스턴 영어 | 보스턴 영어 | ko 페이지 | 16 kHz | 미디어 오디오 | 93 | 보스턴 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 43, 남성: 181, 불명: 2 | 고객문의 | |
보스턴_GC_8 | 보스턴 영어 | 보스턴 영어 | ko 페이지 | 8 kHz | 일반회화 | 32 | 보스턴 일반 대화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 53, 남성: 83, 불명: 0 | 고객문의 | |
영어 Deep South_GC_8 | 영어 딥 사우스 | 영어 딥 사우스 | ko 페이지 | 8 kHz | 일반회화 | 56 | 영어 Deep South 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 99, 남성 31, 알 수 없음 0 | 고객문의 | |
벵골어_MA | 벵골어 | 벵골어(파이프라인 내) | bn_IN | 미디어 오디오 | 40 | 벵골어(파이프라인 내) 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
벵골어_GC | 벵골어 | 벵골어(파이프라인 내) | bn_IN | 일반회화 | 100 | 벵골어(파이프라인 내) 일반 대화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
벵골어_CC_8 | 벵골어 | 벵골어(파이프라인 내) | bn_IN | 콜센터 | 60 | 벵골어(파이프라인 내) 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
아쌈어_MA | 아삼어 | 아쌈어(파이프라인 내) | as_IN | 미디어 오디오 | 40 | Assamese(파이프라인 내) 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
아쌈어_GC | 아삼어 | 아쌈어(파이프라인 내) | as_IN | 일반회화 | 100 | 아삼어(파이프라인 내) 일반 대화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
아쌈어_CC_8 | 아삼어 | 아쌈어(파이프라인 내) | as_IN | 콜센터 | 60 | Assamese(파이프라인 내) Call-Center 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
아랍어_SM_48 | 아랍어 | 아랍어 | ar-SA | 48 kHz | 스크립트 독백 | 1,947 | 아랍어 스크립트 독백 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 838 남성 1209 불명 78 | 고객문의 | |
아랍어_GC_8 | 아랍어 | 아랍어 | ar_AE | 8 kHz | 일반회화 | 292 | 아랍어 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 걸프만 국가의 아랍어 | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 171, 남성: 534, 불명: 1 | 고객문의 | |
아프리카어_MA_16 | 아프리카 어 | 아프리카 어 | af_ZA | 16 kHz | 미디어 오디오 | 658 | 아프리칸스어 미디어 파일 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 750, 남성: 1278, 불명: 52 | 고객문의 | |
아프리카어_GC_8 | 아프리카 어 | 아프리카 어 | af_ZA | 8 kHz | 일반회화 | 368 | 아프리칸스 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 아프리카에서 사용되는 아프리칸스어 | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 502, 남성: 390, 불명: 2 | 고객문의 | |
ko_US_MA_16 | 아프리카계 미국인 모국어 | 아프리카계 미국인 모국어 | ko 페이지 | 16 kHz | 미디어 오디오 | 154 | 아프리카계 미국인 버내큘러 미디어 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 151, 남성: 150, 불명: 10 | 고객문의 | |
HINGLISH_MA_16 | 힝글 리쉬 | 힝글 리쉬 | hg_IN | 16 kHz | 미디어 오디오 | 216 | HINGLISH 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 75, 남성 380, 알 수 없음 0 | 고객문의 | |
한국어_MA_16 | 한국어 | 한국어 | ko_KR | 16 kHz | 미디어 오디오 | 204 | 한국 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 70 남성 303, 불명 25 | 고객문의 | |
한국어_CC_8 | 한국어 | 한국어 | ko_KR | 8 kHz | 콜센터 | 107 | 한국 콜센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1086, 남성 210, 불명 4 | 고객문의 | |
칸나다어_MA | 칸나다어 | 칸나다어(파이프라인 내) | kn_IN | 미디어 오디오 | 40 | 칸나다어(파이프라인 내) 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
칸나다어_GC | 칸나다어 | 칸나다어(파이프라인 내) | kn_IN | 일반회화 | 100 | 칸나다어(파이프라인 내) 일반 대화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
칸나다어_CC_8 | 칸나다어 | 칸나다어(파이프라인 내) | kn_IN | 콜센터 | 60 | 칸나다어(파이프라인 내) 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
일본어_SM_48 | 일본제 | 일본제 | JA-JP | 48 kHz | 스크립트 독백 | 2,335 | 일본 스크립트 독백 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1460 남성 1221 불명 194 | 고객문의 | |
아일랜드어_GC_8 | 아일랜드 | 아일랜드 | ko_IE | 8 kHz | 일반회화 | 192 | 아일랜드 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 213명, 남성 153명, 불명 0명 | 고객문의 | |
인도네시아어_MA_16 | 인도네시아 인 | 인도네시아 인 | 아이디_아이디 | 16 kHz | 미디어 오디오 | 643 | 인도네시아 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 746, 남성 1507, 알 수 없음 129 | 고객문의 | |
인도네시아어_GC_8 | 인도네시아 인 | 인도네시아 인 | 아이디_아이디 | 8 kHz | 일반회화 | 496 | 인도네시아어 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 인도네시아어 바하사 | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 524, 남성 454, 알 수 없음 2 | 고객문의 | |
히스패닉_MA_16 | 히스패닉 영어 | 히스패닉 영어 | ko 페이지 | 16 kHz | 미디어 오디오 | 155 | 히스패닉 콜 미디어 오디오 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 140, 남성 219, 알 수 없음 5 | 고객문의 | |
히스패닉_CC_8 | 히스패닉 영어 | 히스패닉 영어 | ko 페이지 | 8 kHz | 콜센터 | 212 | 히스패닉 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 822, 남성 1262, 알 수 없음 0 | 고객문의 | |
ko_US_CC_8 | 아프리카계 미국인 모국어 | 아프리카계 미국인 모국어 | ko 페이지 | 8 kHz | 콜센터 | 211 | 아프리카계 미국인 버내큘러 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 612, 남성: 1242, 불명: 12 | 고객문의 | |
HINGLISH_CC_8 | 힝글 리쉬 | 힝글 리쉬 | hg_IN | 8 kHz | 콜센터 | 208 | HINGLISH 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 822, 남성 1262, 알 수 없음 0 | 고객문의 | |
Hindi_SM_48 | 힌디 어 | 힌디 어 | 하이 인 | 48 kHz | 스크립트 독백 | 2,867 | 힌디어 스크립트 독백 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1977 남성 1864 불명 147 | 고객문의 | |
힌디어_MA_16 | 힌디 어 | 힌디 어 | 안녕하세요_IN | 16 kHz | 미디어 오디오 | 219 | 힌디어 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 83명, 남성 309명, 불명 0명 | 고객문의 | |
히브리어_MA_16 | 히브리어 | 히브리어 | he_IL | 16 kHz | 미디어 오디오 | 427 | 히브리어 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 361명, 남성 513명, 불명 13명 | 고객문의 | |
히브리어_일반회화_8 | 히브리어 | 히브리어 | he_IL | 8 kHz | 일반회화 | 399 | 히브리어 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 이스라엘 히브리어 | 이중의 | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 414명, 남성 399명, 불명 1명 | 고객문의 | |
구자라트어_MA | 구자라트어 | 구자라트어(파이프라인 내) | gu_IN | 미디어 오디오 | 40 | 구자라트어(In Pipeline) 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
구자라트어_GC | 구자라트어 | 구자라트어(파이프라인 내) | gu_IN | 일반회화 | 100 | 구자라트어(파이프라인 내) 일반 대화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
구자라트어_CC_8 | 구자라트어 | 구자라트어(파이프라인 내) | gu_IN | 콜센터 | 60 | 구자라트어(파이프라인 내) 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 데스크탑 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 고객문의 | ||||
German_IVR_8 | 독일 사람 | 독일 사람 | 드-데 | 8 kHz | IVR | 200 | 독일 IVR 데이터 | 인간 대 기계. TTS 프롬프트(예: "어떻게 도와드릴까요?")와 자발적인 사람의 응답이 있는 IVR 유형의 흐름 | 모노 | 데스크탑 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 10115 남성 8750 알 수 없음 0 | 고객문의 | ||
독일어_CC_8 | 독일 사람 | 독일 사람 | 드-데 | 8 kHz | 콜센터 | 64 | 독일 콜센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 모노 | 데스크탑 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 478 남성 1440 알 수 없음 0 | 고객문의 | ||
영어 Deep South_MA_16 | 영어 딥 사우스 | 영어 딥 사우스 | ko 페이지 | 16 kHz | 미디어 오디오 | 266 | 영어 Deep South Media 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 204, 남성 356, 알 수 없음 21 | 고객문의 |
서비스 제공
전문적인 오디오 데이터 수집은 포괄적인 AI 설정을 위한 모든 준비가 아닙니다. Shaip에서는 모델을 평소보다 더 널리 보급하기 위해 다음 서비스를 고려할 수도 있습니다.
추천 자료
제공
지능형 AI를 위한 오디오 주석
오디오 주석 서비스는 처음부터 Shaip의 강점이었습니다. 당사의 최첨단 오디오 주석 서비스로 대화형 AI, 챗봇 및 음성 인식 엔진을 개발, 훈련 및 개선하십시오.
구매자 가이드
구매자 가이드: 대화형 AI에 대한 완전한 가이드
대화를 나눈 챗봇은 수많은 음성 인식 데이터 세트를 사용하여 훈련, 테스트 및 구축된 고급 대화형 AI 시스템에서 실행됩니다.
데이터 카탈로그
기성품 음성 데이터 카탈로그 및 라이선스
AI 프로젝트의 음성 데이터에 대한 다양한 공통 응용 프로그램이 있습니다. 음성 인식을 위해 준비된 방대한 양의 고품질 데이터를 제공합니다.
나만의 오디오 데이터세트를 만들고 싶으신가요?
사내 음성 데이터 수집 전문가와 연결하여 요구 사항에 가장 적합한 오디오 리포지토리를 설정하십시오.
자주 묻는 질문 (FAQ)
ML 모델의 음성 데이터 수집은 음성 언어 오디오 녹음을 수집하는 프로세스를 의미합니다. 이 컬렉션은 기계 학습 알고리즘, 특히 사람의 목소리를 이해하고 처리하는 데 중점을 둔 알고리즘을 훈련하고 개선하는 데 도움이 됩니다.
ASR(자동 음성 인식)을 위한 오디오 데이터 수집을 목표로 하는 경우 원하는 언어, 억양 및 음성 유형을 포함하여 프로젝트의 특정 요구 사항을 정의하는 것부터 시작해야 합니다. 이러한 매개변수를 설정한 후에는 사용자 개인정보 보호를 존중하는 데 필요한 모든 권한을 얻었는지 확인하세요. 그런 다음 적절한 녹음 장치나 소프트웨어를 사용하여 선명한 오디오 샘플을 캡처합니다. 각 녹음에는 필사본이나 기타 관련 메타데이터를 꼼꼼하게 주석 처리하고 체계적으로 저장하여 쉽게 액세스할 수 있어야 합니다.
기계 학습의 음성 데이터 세트는 음성 언어를 인식, 전사 또는 해석하도록 맞춤화된 모델을 훈련, 테스트 및 검증하는 데 중추적인 역할을 합니다. 이러한 데이터 세트는 음성 도우미 및 녹음 서비스부터 음성 생체 인식에 이르기까지 수많은 애플리케이션을 위한 길을 열어줍니다.
다양한 언어와 억양에서 정확한 데이터를 수집하려면 원하는 언어 배경을 가진 원어민과의 협업이 필수적입니다. 광범위한 인구통계적 차이를 포괄하는 다양하고 대표적인 샘플을 목표로 합니다. 오디오 일관성을 보장하기 위해 균일한 환경에서 표준화된 녹음 장비를 사용합니다. 그리고 중요한 것은 특정 언어와 억양을 나타내는 자세한 기록과 메타데이터로 각 데이터 조각에 주석을 다는 것입니다.