AI를 위한 가장 신뢰할 수 있는 음성 데이터 수집 서비스
당사의 오디오 및 음성 데이터 수집 서비스를 통해 고품질 대화 데이터로 NLP 모델, VA, TTS 프로토타입 등을 교육하십시오.
병목 현상이 없는 오디오 데이터 파이프라인을 발견하십시오.
주요 클라이언트
자연어 처리에 음성 훈련 데이터 세트가 필요한 이유는 무엇입니까?
스마트폰 VA(예: Siri, Bixby 또는 기타)가 상호 작용하는 것을 본 적이 있습니까? 그들이 모든 질문에 답하고 귀하의 요구 사항에 따라 결과를 분석하고 제시하는 방식!
글쎄, 이러한 VA가 우리를 흥미롭게 하는 만큼, 이러한 지능형 자원과 프로그램은 정확하게 응답할 수 있도록 점진적으로 훈련되어야 합니다. 이것이 음성/오디오 및 음성 데이터 수집을 전문적인 전문성을 검증하고 전문 데이터 수집 회사에 아웃소싱하는 것을 고려해야 하는 이유입니다.
오디오 데이터 수집에 투자하면 다국어 청중을 수용할 수 있는 NLP가 준비됩니다. 그뿐만 아니라 NLP용 음성 데이터 수집은 전문가가 처리할 때 현장 수집, 의미 분석 및 오디오 전사도 고려합니다. 전문 음성 데이터 수집 솔루션으로 다음을 수행할 수 있습니다.
- 정확도 향상을 위해 고품질 오디오 데이터 세트 조달
- 타겟 다양한 시나리오 설정
- 다국어 AI 교육 데이터 수집
- 다양한 인구 통계 및 업종에 맞게 ML 모델 확장
NLP를 위한 전문 오디오/음성 데이터 수집 서비스
모든 주제. 모든 시나리오.
지능형 NLP 시스템은 일반적이지 않습니다. 프로그램의 기능에 따라 평판이 좋은 음성/오디오 데이터 수집 회사에서만 제공할 수 있는 공간 및 다국어 오디오 데이터 서비스에 집중해야 할 수도 있습니다. 이것이 Shaip이 지능적인 AI를 위해 무거운 일을 하는 것을 자랑스럽게 생각하는 매우 안정적인 데이터 연결 서비스 제공업체로서 사물의 계획에 등장하는 곳입니다.
Shaip에서 우리의 주요 초점은 가능한 가장 많은 양의 맞춤형 음성 샘플을 가능한 한 가장 짧은 시간에 모델에 공급하는 것입니다. 우리와 함께라면 다음을 기대할 수 있습니다.
- NLP를 위한 선별된 오디오/음성 데이터 수집
- 특정 사용 사례에 따라 대응하는 맞춤형 프로그램
- 오디오 데이터 세트 마이닝 준비
- 패턴별 및 자동화된 데이터 처리
- 가능한 가장 높은 수준의 도메인 특이성
- 가속화된 AI 모델로 시장 출시 시간 단축
우리의 전문성
스마트 NLP 모델을 준비하기 위해 오디오 데이터 정렬
Shaip은 음성 지원 기술이 전 세계의 다양한 청중을 수용할 수 있도록 100개 이상의 언어로 종단 간 음성/오디오 데이터 수집 서비스를 제공합니다. 우리는 모든 범위와 규모의 프로젝트에서 작업할 수 있습니다. 기존 기성 오디오 데이터 세트 라이선스부터 맞춤형 오디오 데이터 수집 관리, 오디오 전사 및 주석에 이르기까지. 음성 데이터 수집 프로젝트의 규모에 상관없이 방언, 어조 및 언어를 대상으로 하는 고품질 NLP 데이터 세트를 구축하기 위해 필요에 맞게 오디오 수집 서비스를 사용자 정의할 수 있습니다. 음성 지원 지능형 설정을 위해 광범위한 음성 데이터 세트 및 오디오 데이터 수집 리소스 중에서 선택하십시오.
독백 스피치 컬렉션
단일 채널 파일을 통해 스크립트로 작성된 프롬프트 공급으로 Text-to-Speed 프로토타입 및 트랜스크립션 관련 요구 사항에 대한 독립형 스피커와 관련된 음성 기반 요구 사항을 처리합니다.
대화 연설
수집
이중 채널 파일 및 전사된 리소스를 통해 다국어 노출을 통해 지능형 가상 도우미, 속도별 챗봇 및 자동 음성 인식 모델을 설정합니다.
음향 데이터
수집
레스토랑, 사무실, 가정 또는 다양한 환경과 언어에서 스튜디오 품질의 오디오 데이터를 전문적으로 녹음할 수 있습니다.
자연어 발화 모음
AI를 제시간에 보다 자율적으로 만들기 위해 유사한 의미로 다르게 발화되는 고객 문구를 식별하도록 스마트 상업 설정을 교육합니다.
디지털 / 가상
조수
사람의 말, 다국어 노출, 상황 분석 및 NLU에 대한 경고로 모델을 교육하여 곧 출시될 가상 어시스턴트를 구축하는 데 집중하십시오.
자동 음성 인식(ASR)
다양한 인구 통계에서 최신의 다양한 음성/오디오 데이터 세트에 액세스하여 자동 음성 인식(ASR) 시스템의 정확도를 향상시킵니다.
다국어 음성/음성 훈련 데이터
전 세계의 고도로 숙련된 언어 전문가가 아랍어, 덴마크어, 중국어, 아프리칸스어, 싱가포르, 뉴질랜드, 히브리어, 인도네시아어, 아일랜드어, 한국어, 말레이어, 폴란드어, 스코틀랜드어, 스웨덴어를 포함한 여러 언어 및 방언으로 다국어 오디오/음성 교육 데이터를 제공합니다. , 프랑스어, 독일어, 베트남어, 태국어, 이탈리아어, 스페인어 등.
텍스트 음성 변환
(TTS)
TTS로 더 나은 사용자 경험을 제공하려면 자연스럽게 들리는 시스템을 개발하는 것이 중요합니다. 150개 이상의 언어 및 방언으로 음성 데이터를 수집하는 데 도움을 주는 글로벌 인력의 도움을 받아 TTS(텍스트 음성 변환) 다국어 모델을 구축하여 차량 내 제어에서 챗봇 및 높은 수준의 학습 솔루션에 이르기까지 AI 모델을 향상시킵니다. 고품질 오디오 데이터.
Shaip을 신뢰할 수 있는 음성 데이터 수집 파트너로 선택한 이유
사람들
전담 및 훈련된 팀:
- 데이터 생성, 라벨링 및 QA를 위한 30,000명 이상의 공동 작업자
- 자격을 갖춘 프로젝트 관리 팀
- 경험이 풍부한 제품 개발 팀
- 인재 풀 소싱 및 온보딩 팀
방법
최고의 공정 효율성은 다음을 통해 보장됩니다.
- 강력한 6시그마 스테이지 게이트 프로세스
- 6시그마 블랙벨트로 구성된 전담 팀 – 핵심 프로세스 소유자 및 품질 준수
- 지속적인 개선 및 피드백 루프
Platform
특허 받은 플랫폼은 다음과 같은 이점을 제공합니다.
- 웹 기반 엔드 투 엔드 플랫폼
- 완벽한 품질
- 더 빠른 TAT
- 원활한 전달
사람들
전담 및 훈련된 팀:
- 데이터 생성, 라벨링 및 QA를 위한 30,000명 이상의 공동 작업자
- 자격을 갖춘 프로젝트 관리 팀
- 경험이 풍부한 제품 개발 팀
- 인재 풀 소싱 및 온보딩 팀
방법
최고의 공정 효율성은 다음을 통해 보장됩니다.
- 강력한 6시그마 스테이지 게이트 프로세스
- 6시그마 블랙벨트로 구성된 전담 팀 – 핵심 프로세스 소유자 및 품질 준수
- 지속적인 개선 및 피드백 루프
Platform
특허 받은 플랫폼은 다음과 같은 이점을 제공합니다.
- 웹 기반 엔드 투 엔드 플랫폼
- 완벽한 품질
- 더 빠른 TAT
- 원활한 전달
언어: 수집된 오디오 데이터 세트
기성품 음성/오디오 데이터세트
세부 정보 | 코퍼스 ID(고유) | 키워드 | 언어 데이터세트 | 언어 코드 | 샘플 속도 | 데이터 세트 유형 | 총 오디오 시간 | 간단한 설명 | 데이터 세트 설명 | 오디오 채널 | 녹음 플랫폼 | WER(%) | 오디오 형식 | 전사 형식 | 적용 사례 | 스피커의 수 | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ko_US_CC_8 | 아프리카계 미국인 모국어 | 아프리카계 미국인 모국어 | ko 페이지 | 8 kHz | 콜센터 | 211 | 아프리카계 미국인 버내큘러 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 612, 남성: 1242, 불명: 12 | UTD 연락처 | |
ko_US_MA_16 | 아프리카계 미국인 모국어 | 아프리카계 미국인 모국어 | ko 페이지 | 16 kHz | 미디어 오디오 | 154 | 아프리카계 미국인 버내큘러 미디어 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 151, 남성: 150, 불명: 10 | UTD 연락처 | |
아프리카어_GC_8 | 아프리카 어 | 아프리카 어 | af_ZA | 8 kHz | 일반회화 | 368 | 아프리칸스 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 아프리카에서 사용되는 아프리칸스어 | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 502, 남성: 390, 불명: 2 | UTD 연락처 | |
아프리카어_MA_16 | 아프리카 어 | 아프리카 어 | af_ZA | 16 kHz | 미디어 오디오 | 658 | 아프리칸스어 미디어 파일 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 750, 남성: 1278, 불명: 52 | UTD 연락처 | |
아랍어_GC_8 | 아랍어 | 아랍어 | ar_AE | 8 kHz | 일반회화 | 292 | 아랍어 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 걸프만 국가의 아랍어 | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 171, 남성: 534, 불명: 1 | UTD 연락처 | |
아랍어_SM_48 | 아랍어 | 아랍어 | ar-SA | 48 kHz | 스크립트 독백 | 1,947 | 아랍어 스크립트 독백 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 838 남성 1209 불명 78 | UTD 연락처 | |
아쌈어_CC_8 | 아삼어 | 아쌈어(파이프라인 내) | as_IN | 콜센터 | 60 | Assamese(파이프라인 내) Call-Center 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
아쌈어_GC | 아삼어 | 아쌈어(파이프라인 내) | as_IN | 일반회화 | 100 | 아삼어(파이프라인 내) 일반 대화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
아쌈어_MA | 아삼어 | 아쌈어(파이프라인 내) | as_IN | 미디어 오디오 | 40 | Assamese(파이프라인 내) 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
벵골어_CC_8 | 벵골어 | 벵골어(파이프라인 내) | bn_IN | 콜센터 | 60 | 벵골어(파이프라인 내) 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
벵골어_GC | 벵골어 | 벵골어(파이프라인 내) | bn_IN | 일반회화 | 100 | 벵골어(파이프라인 내) 일반 대화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
Bengali_MA | 벵골어 | 벵골어(파이프라인 내) | bn_IN | 미디어 오디오 | 40 | 벵골어(파이프라인 내) 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
보스턴_CC_8 | 보스턴 영어 | 보스턴 영어 | ko 페이지 | 8 kHz | 콜센터 | 177 | 보스턴 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 605, 남성: 711, 불명: 0 | UTD 연락처 | |
보스턴_GC_8 | 보스턴 영어 | 보스턴 영어 | ko 페이지 | 8 kHz | 일반회화 | 32 | 보스턴 일반 대화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 53, 남성: 83, 불명: 0 | UTD 연락처 | |
Boston_MA_16 | 보스턴 영어 | 보스턴 영어 | ko 페이지 | 16 kHz | 미디어 오디오 | 93 | 보스턴 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 43, 남성: 181, 불명: 2 | UTD 연락처 | |
Canadian_SM_48 | 캐나다 불어 | 캐나다 불어 | FR-CA | 48 kHz | 스크립트 독백 | 1,222 | 캐나다 불어 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 974 남성 631 불명 1 | UTD 연락처 | |
Chinese_CC_8 | 중국어 영어 | 중국어 영어 | ko 페이지 | 8 kHz | 콜센터 | 169 | 중국 콜센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 1790년, 남성: 523명, 불명: 13명 | UTD 연락처 | |
Chinese_MA_16 | 중국어 영어 | 중국어 영어 | ko 페이지 | 16 kHz | 미디어 오디오 | 249 | 중국 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 126년, 남성: 346명, 불명: 6명 | UTD 연락처 | |
중국어 간체_SM_48 | 중국어 간체 | 중국어 간체 | 에서 zh-CN | 48 kHz | 스크립트 독백 | 2,762 | 중국어 간체 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1920 남성 1535 불명 270 | UTD 연락처 | |
중국어 번체_SM_48 | 중국어 번체 | 중국어 번체 | zh-TW | 48 kHz | 스크립트 독백 | 1,028 | 중국어 번체 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1069 남성 262 불명 3 | UTD 연락처 | |
덴마크어_GC_8 | 덴마크 말 | 덴마크 말 | 다_DK | 8 kHz | 일반회화 | 372 | 덴마크 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 311, 남성: 417, 불명: 0 | UTD 연락처 | |
덴마크어_MA_16 | 덴마크 말 | 덴마크 말 | 다_DK | 16 kHz | 미디어 오디오 | 664 | 덴마크 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성: 369, 남성: 864, 불명: 27 | UTD 연락처 | |
덴마크어_SM_48 | 덴마크 말 | 덴마크 말 | 다-DK | 48 kHz | 스크립트 독백 | 2,579 | 덴마크 스크립트 독백 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음, 덴마크의 덴마크어 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1551 남성 1233 불명 42 | UTD 연락처 | |
영어 Deep South_CC_8 | 영어 딥 사우스 | 영어 딥 사우스 | ko 페이지 | 8 kHz | 콜센터 | 151 | Deep South 콜센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 221명, 남성 1004명, 불명 7명 | UTD 연락처 | |
영어 Deep South_GC_8 | 영어 딥 사우스 | 영어 딥 사우스 | ko 페이지 | 8 kHz | 일반회화 | 56 | 영어 Deep South 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 99, 남성 31, 알 수 없음 0 | UTD 연락처 | |
영어 Deep South_MA_16 | 영어 딥 사우스 | 영어 딥 사우스 | ko 페이지 | 16 kHz | 미디어 오디오 | 266 | 영어 Deep South Media 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 204, 남성 356, 알 수 없음 21 | UTD 연락처 | |
German_CC_8 | German | German | 드-데 | 8 kHz | 콜센터 | 64 | 독일 콜센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 모노 | 바탕 화면 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 478 남성 1440 알 수 없음 0 | UTD 연락처 | ||
German_IVR_8 | German | German | 드-데 | 8 kHz | IVR | 200 | 독일 IVR 데이터 | 인간 대 기계. TTS 프롬프트(예: "어떻게 도와드릴까요?")와 자발적인 사람의 응답이 있는 IVR 유형의 흐름 | 모노 | 바탕 화면 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 10115 남성 8750 알 수 없음 0 | UTD 연락처 | ||
구자라트어_CC_8 | 구자라트어 | 구자라트어(파이프라인 내) | gu_IN | 콜센터 | 60 | 구자라트어(파이프라인 내) 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
구자라트어_GC | 구자라트어 | 구자라트어(파이프라인 내) | gu_IN | 일반회화 | 100 | 구자라트어(파이프라인 내) 일반 대화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
구자라트어_MA | 구자라트어 | 구자라트어(파이프라인 내) | gu_IN | 미디어 오디오 | 40 | 구자라트어(In Pipeline) 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
히브리어_일반회화_8 | 히브리어 | 히브리어 | he_IL | 8 kHz | 일반회화 | 399 | 히브리어 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 이스라엘 히브리어 | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 414명, 남성 399명, 불명 1명 | UTD 연락처 | |
히브리어_MA_16 | 히브리어 | 히브리어 | he_IL | 16 kHz | 미디어 오디오 | 427 | 히브리어 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 361명, 남성 513명, 불명 13명 | UTD 연락처 | |
힌디어_MA_16 | 힌디 어 | 힌디 어 | 안녕하세요_IN | 16 kHz | 미디어 오디오 | 219 | 힌디어 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 83명, 남성 309명, 불명 0명 | UTD 연락처 | |
Hindi_SM_48 | 힌디 어 | 힌디 어 | 하이 인 | 48 kHz | 스크립트 독백 | 2,867 | 힌디어 스크립트 독백 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1977 남성 1864 불명 147 | UTD 연락처 | |
HINGLISH_CC_8 | 힝글 리쉬 | 힝글 리쉬 | hg_IN | 8 kHz | 콜센터 | 208 | HINGLISH 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 822, 남성 1262, 알 수 없음 0 | UTD 연락처 | |
HINGLISH_MA_16 | 힝글 리쉬 | 힝글 리쉬 | hg_IN | 16 kHz | 미디어 오디오 | 216 | HINGLISH 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 75, 남성 380, 알 수 없음 0 | UTD 연락처 | |
Hispanic_CC_8 | 히스패닉 영어 | 히스패닉 영어 | ko 페이지 | 8 kHz | 콜센터 | 212 | 히스패닉 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 822, 남성 1262, 알 수 없음 0 | UTD 연락처 | |
Hispanic_MA_16 | 히스패닉 영어 | 히스패닉 영어 | ko 페이지 | 16 kHz | 미디어 오디오 | 155 | 히스패닉 콜 미디어 오디오 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 140, 남성 219, 알 수 없음 5 | UTD 연락처 | |
인도네시아어_GC_8 | Indonesian | Indonesian | 아이디_아이디 | 8 kHz | 일반회화 | 496 | 인도네시아어 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 인도네시아어 바하사 | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 524, 남성 454, 알 수 없음 2 | UTD 연락처 | |
인도네시아어_MA_16 | Indonesian | Indonesian | 아이디_아이디 | 16 kHz | 미디어 오디오 | 643 | 인도네시아 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 746, 남성 1507, 알 수 없음 129 | UTD 연락처 | |
아일랜드어_GC_8 | 아일랜드 | 아일랜드 | ko_IE | 8 kHz | 일반회화 | 192 | 아일랜드 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 213명, 남성 153명, 불명 0명 | UTD 연락처 | |
일본어_SM_48 | 일본어 | 일본어 | JA-JP | 48 kHz | 스크립트 독백 | 2,335 | 일본 스크립트 독백 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1460 남성 1221 불명 194 | UTD 연락처 | |
칸나다어_CC_8 | 칸나다어 | 칸나다어(파이프라인 내) | kn_IN | 콜센터 | 60 | 칸나다어(파이프라인 내) 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
칸나다어_GC | 칸나다어 | 칸나다어(파이프라인 내) | kn_IN | 일반회화 | 100 | 칸나다어(파이프라인 내) 일반 대화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
칸나다어_MA | 칸나다어 | 칸나다어(파이프라인 내) | kn_IN | 미디어 오디오 | 40 | 칸나다어(파이프라인 내) 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
Korean_CC_8 | 한국어 | 한국어 | ko_KR | 8 kHz | 콜센터 | 107 | 한국 콜센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1086, 남성 210, 불명 4 | UTD 연락처 | |
Korean_MA_16 | 한국어 | 한국어 | ko_KR | 16 kHz | 미디어 오디오 | 204 | 한국 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 70 남성 303, 불명 25 | UTD 연락처 | |
Korean_SM_48 | 한국어 | 한국어 | ko-KR | 48 kHz | 스크립트 독백 | 1,955 | 한국어 대본 독백 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1195 남성 1134 불명 122 | UTD 연락처 | |
말레이어_GC_8 | Malay | Malay | ms_MY | 8 kHz | 일반회화 | 266 | 말레이 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 말레이시아의 말레이어 | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 316, 남성 176, 알 수 없음 0 | UTD 연락처 | |
Malay_MA_16 | Malay | Malay | ms_MY | 16 kHz | 미디어 오디오 | 344 | 말레이 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 236, 남성 626, 알 수 없음 47 | UTD 연락처 | |
말라얄람어_CC_8 | 말라얄람어 | 말라얄람어(파이프라인 중) | ml_IN | 콜센터 | 60 | 말라얄람어(파이프라인 내) 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
말라얄람어_GC | 말라얄람어 | 말라얄람어(파이프라인 중) | ml_IN | 일반회화 | 100 | 말라얄람어(파이프라인 내) 일반 대화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
말라얄람어_MA | 말라얄람어 | 말라얄람어(파이프라인 중) | ml_IN | 미디어 오디오 | 40 | 말라얄람어(파이프라인 내) 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
마라티어_CC_8 | 마라타어 | 마라티어(파이프라인 내) | mr_IN | 콜센터 | 60 | 마라티어(파이프라인 내) 콜센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
Marathi_GC | 마라타어 | 마라티어(파이프라인 내) | mr_IN | 일반회화 | 100 | 마라티어(파이프라인 내) 일반 대화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
Marathi_MA | 마라타어 | 마라티어(파이프라인 내) | mr_IN | 미디어 오디오 | 40 | 마라티어(파이프라인 내) 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
멕시코인_SM_48 | 스페인어 (멕시코) | 스페인어 (멕시코) | ES-MX | 48 kHz | 스크립트 독백 | 1,492 | 멕시코 스페인어 스크립트 독백 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1016 남성 1069 불명 95 | UTD 연락처 | |
네덜란드_SM_48 | Dutch | Dutch | NL-NL | 48 kHz | 스크립트 독백 | 1,205 | 네덜란드 스크립트 독백 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1285 남성 531 불명 3 | UTD 연락처 | |
뉴욕 English_CC_8 | 뉴욕 영어 | 뉴욕 영어 | ko 페이지 | 8 kHz | 콜센터 | 103 | New York English 콜센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 610, 남성 532, 알 수 없음 0 | UTD 연락처 | |
뉴욕 영어_GC_8 | 뉴욕 영어 | 뉴욕 영어 | ko 페이지 | 8 kHz | 일반회화 | 107 | 뉴욕 영어 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 118, 남성 114, 알 수 없음 0 | UTD 연락처 | |
뉴욕 English_MA_16 | 뉴욕 영어 | 뉴욕 영어 | ko 페이지 | 16 kHz | 미디어 오디오 | 140 | New York English Media 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 66, 남성 230, 알 수 없음 11 | UTD 연락처 | |
뉴질랜드_GC_8 | 뉴질랜드 영어 | 뉴질랜드 영어 | ko_NZ | 8 kHz | 일반회화 | 148 | 뉴질랜드 영어 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 167, 남성 121, 불명 4 | UTD 연락처 | |
뉴질랜드_MA_16 | 뉴질랜드 영어 | 뉴질랜드 영어 | ko_NZ | 16 kHz | 미디어 오디오 | 400 | 뉴질랜드 영어 미디어 오디오 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 367, 남성 678, 불명 26 | UTD 연락처 | |
오리야_CC_8 | 오리 야 | 오리야(파이프라인 내) | or_IN | 콜센터 | 60 | 오리야(파이프라인 내) 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
오리야_GC | 오리 야 | 오리야(파이프라인 내) | or_IN | 일반회화 | 100 | Oriya(파이프라인 내) 일반 대화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
오리야_MA | 오리 야 | 오리야(파이프라인 내) | or_IN | 미디어 오디오 | 40 | Oriya(In Pipeline) 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
폴란드어_MA_16 | 광택 | 광택 | pl_PL | 16 kHz | 미디어 오디오 | 269 | 폴란드어 미디어 오디오 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 173 남성 354 알 수 없음 6 | UTD 연락처 | |
폴란드 폴란드_SM_48 | 폴란드어 (폴란드) | 폴란드어 (폴란드) | PL-PL | 48 kHz | 스크립트 독백 | 1,482 | 폴란드 폴란드 - 스크립트 독백 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1324 남성 701 불명 24 | UTD 연락처 | |
펀자브어_CC_8 | 펀 자브 | 펀자브어(파이프라인 내) | 펀 자브 | 콜센터 | 60 | 펀자브어(파이프라인 내) 콜센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
펀자브어_GC | 펀 자브 | 펀자브어(파이프라인 내) | 펀 자브 | 일반회화 | 100 | 펀자브어(파이프라인 내) 일반 대화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
Punjabi_MA | 펀 자브 | 펀자브어(파이프라인 내) | 펀 자브 | 미디어 오디오 | 40 | 펀자브어(In Pipeline) 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
러시아어_SM_48 | Russian | Russian | RU-RU | 48 kHz | 스크립트 독백 | 2,398 | 러시아 스크립트 독백 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1689 남성 1937 불명 214 | UTD 연락처 | |
스코틀랜드_GC_8 | 스코틀랜드(영어 악센트) | 스코틀랜드(영어 악센트) | ko_AB | 8 kHz | 일반회화 | 292 | 스코틀랜드 일반 회화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 285명, 남성 260명, 불명 3명 | UTD 연락처 | |
싱가포르_CC_8 | 싱가포르 영어 | 싱가포르 영어 | ko_SG | 8 kHz | 콜센터 | 218 | 싱가포르 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 2139, 남성 884, 불명 21 | UTD 연락처 | |
싱가포르_MA_16 | 싱가포르 영어 | 싱가포르 영어 | ko_SG | 16 kHz | 미디어 오디오 | 247 | 싱가포르 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 160, 남성 455, 알 수 없음 37 | UTD 연락처 | |
남아프리카 영어_CC_8 | 남아프리카 영어 | 남아프리카 영어 | ko_ZA | 8 kHz | 콜센터 | 261 | 남아프리카 영어 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1274명, 남성 935명, 불명 1명 | UTD 연락처 | |
남아프리카 영어_MA_16 | 남아프리카 영어 | 남아프리카 영어 | ko_ZA | 16 kHz | 미디어 오디오 | 251 | 남아프리카 영어 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 235, 남성 432, 알 수 없음 36 | UTD 연락처 | |
스와힐리어_CC_8 | 스와힐리어 | 스와힐리어 | sw_KE | 8 kHz | 콜센터 | 230 | 스와힐리어 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 611, 남성 833, 알 수 없음 0 | UTD 연락처 | |
스와힐리어_MA_16 | 스와힐리어 | 스와힐리어 | sw_KE | 16 kHz | 미디어 오디오 | 265 | Swahili 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 118, 남성 493, 알 수 없음 25 | UTD 연락처 | |
스웨덴어_CC_8 | Swedish | Swedish | SV_SE | 8 kHz | 콜센터 | 250 | 스웨덴 콜센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1581, 남성 727, 불명 2 | UTD 연락처 | |
스웨덴어_MA_16 | Swedish | Swedish | SV_SE | 16 kHz | 미디어 오디오 | 278 | 스웨덴 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 195, 남성 500, 불명 21 | UTD 연락처 | |
타밀어_CC_8 | 타밀 사람 | 타밀어(파이프라인 내) | 엷은 주석판 | 콜센터 | 60 | 타밀어(파이프라인 내) 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
Tamil_GC | 타밀 사람 | 타밀어(파이프라인 내) | 엷은 주석판 | 일반회화 | 100 | 타밀어(파이프라인 내) 일반 대화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
Tamil_MA | 타밀 사람 | 타밀어(파이프라인 내) | 엷은 주석판 | 미디어 오디오 | 40 | 타밀어(파이프라인 내) 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
텔루구어_GC_8 | 텔루구어 | 텔루구어 | te_IN | 8 kHz | 일반회화 | 553 | 텔루구어 일반 대화 데이터 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 574, 남성 564, 불명 0 | UTD 연락처 | |
Telugu_MA_16 | 텔루구어 | 텔루구어 | te_IN | 16 kHz | 미디어 오디오 | 648 | 텔루구어 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 207, 남성 963, 알 수 없음 2 | UTD 연락처 | |
Telugu_CC_8 | 텔루구어 | 텔루구어(파이프라인 내) | te_IN | 콜센터 | 30 | 텔루구어(파이프라인 내) 콜 센터 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
Telugu_GC | 텔루구어 | 텔루구어(파이프라인 내) | te_IN | 일반회화 | 50 | 텔루구어(파이프라인 내) 일반 대화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
Telugu_MA | 텔루구어 | 텔루구어(파이프라인 내) | te_IN | 미디어 오디오 | 20 | 텔루구어(파이프라인 내) 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | UTD 연락처 | ||||
Thai_GC_8 | Thai | Thai | th_TH | 8 kHz | 일반회화 | 183 | 태국 일반 회화 | 두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 친구 간에 사용되는 비공식 기록 | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 338, 남성 96, 알 수 없음 8 | UTD 연락처 | |
Thai_MA_8 | Thai | Thai | th_TH | 16 kHz | 미디어 오디오 | 173 | 태국 미디어 오디오 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 143, 남성 502, 알 수 없음 26 | UTD 연락처 | |
터키어 Turkey_SM_48 | 터키어 터키 | 터키어 터키 | TR-TR | 48 kHz | 스크립트 독백 | 2,027 | 터키어 터키 | 5~30초 범위에 속하는 경향이 있는 단일 발화 녹음 | 모노 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 1561 남성 1241 불명 31 | UTD 연락처 | |
베트남어_GC_8 | 베트남어 | 베트남어 | vi_VN | 8 kHz | 일반회화 | 295 | 베트남어 일반 회화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, 북부(예: 하노이), 중부 및 남부(예: 호치민시). | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 400, 남성 380, 불명 2 | UTD 연락처 | |
베트남어_MA_16 | 베트남어 | 베트남어 | vi_VN | 16 kHz | 미디어 오디오 | 257 | 베트남 미디어 오디오 데이터 | 인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분 | 모노 | 웹소싱 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 249, 남성 200, 불명 45 | UTD 연락처 | |
웨일스어_GC_8 | 웨일스어(영어 악센트) | 웨일스어(영어 악센트) | ko_WL | 8 kHz | 일반회화 | 278 | 웨일스 일반 회화 데이터 | "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, | 이중의 | 바탕 화면 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 여성 270, 남성 324, 알 수 없음 0 | UTD 연락처 | |
영국 English_WW_16 | 영국 영어 | 영국 영어 | en_uk | 16 kHz | 웨이크 워드 | 200연설자 | Wake Word 영국 영어 | keyphrases 데이터 수집
| 1 채널 | 모바일 애플 리케이션 | 5.0 | . WAV | .json | ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 | 성별: 남성 50%, 여성 50%, +/- 10%. | UTD 연락처 |
서비스 제공
전문적인 오디오 데이터 수집은 포괄적인 AI 설정을 위한 모든 준비가 아닙니다. Shaip에서는 모델을 평소보다 더 널리 보급하기 위해 다음 서비스를 고려할 수도 있습니다.
추천 자료
제공
지능형 AI를 위한 오디오 주석
오디오 주석 서비스는 처음부터 Shaip의 강점이었습니다. 당사의 최첨단 오디오 주석 서비스로 대화형 AI, 챗봇 및 음성 인식 엔진을 개발, 훈련 및 개선하십시오.
구매자 가이드
구매자 가이드: 대화형 AI에 대한 완전한 가이드
대화를 나눈 챗봇은 수많은 음성 인식 데이터 세트를 사용하여 훈련, 테스트 및 구축된 고급 대화형 AI 시스템에서 실행됩니다.
데이터 카탈로그
기성품 음성 데이터 카탈로그 및 라이선스
AI 프로젝트의 음성 데이터에 대한 다양한 공통 응용 프로그램이 있습니다. 음성 인식을 위해 준비된 방대한 양의 고품질 데이터를 제공합니다.
나만의 오디오 데이터세트를 만들고 싶으신가요?
사내 음성 데이터 수집 전문가와 연결하여 요구 사항에 가장 적합한 오디오 리포지토리를 설정하십시오.