AI를 위한 가장 신뢰할 수 있는 음성 데이터 수집 서비스

당사의 오디오 및 음성 데이터 수집 서비스를 통해 고품질 대화 데이터로 NLP 모델, VA, TTS 프로토타입 등을 교육하십시오.

오디오 데이터 수집

병목 현상이 없는 오디오 데이터 파이프라인을 발견하십시오.

주요 클라이언트

자연어 처리에 음성 훈련 데이터 세트가 필요한 이유는 무엇입니까?

스마트폰 VA(예: Siri, Bixby 또는 기타)가 상호 작용하는 것을 본 적이 있습니까? 그들이 모든 질문에 답하고 귀하의 요구 사항에 따라 결과를 분석하고 제시하는 방식!

글쎄, 이러한 VA가 우리를 흥미롭게 하는 만큼, 이러한 지능형 자원과 프로그램은 정확하게 응답할 수 있도록 점진적으로 훈련되어야 합니다. 이것이 음성/오디오 및 음성 데이터 수집을 전문적인 전문성을 검증하고 전문 데이터 수집 회사에 아웃소싱하는 것을 고려해야 하는 이유입니다.

오디오 데이터 수집에 투자하면 다국어 청중을 수용할 수 있는 NLP가 준비됩니다. 그뿐만 아니라 NLP용 음성 데이터 수집은 전문가가 처리할 때 현장 수집, 의미 분석 및 오디오 전사도 고려합니다. 전문 음성 데이터 수집 솔루션으로 다음을 수행할 수 있습니다.

  • 정확도 향상을 위해 고품질 오디오 데이터 세트 조달
  • 타겟 다양한 시나리오 설정
  • 다국어 AI 교육 데이터 수집
  • 다양한 인구 통계 및 업종에 맞게 ML 모델 확장

NLP를 위한 전문 오디오/음성 데이터 수집 서비스

모든 주제. 모든 시나리오.

지능형 NLP 시스템은 일반적이지 않습니다. 프로그램의 기능에 따라 평판이 좋은 음성/오디오 데이터 수집 회사에서만 제공할 수 있는 공간 및 다국어 오디오 데이터 서비스에 집중해야 할 수도 있습니다. 이것이 Shaip이 지능적인 AI를 위해 무거운 일을 하는 것을 자랑스럽게 생각하는 매우 안정적인 데이터 연결 서비스 제공업체로서 사물의 계획에 등장하는 곳입니다.

Shaip에서 우리의 주요 초점은 가능한 가장 많은 양의 맞춤형 음성 샘플을 가능한 한 가장 짧은 시간에 모델에 공급하는 것입니다. 우리와 함께라면 다음을 기대할 수 있습니다.

스피치 컬렉션
  • NLP를 위한 선별된 오디오/음성 데이터 수집
  • 특정 사용 사례에 따라 대응하는 맞춤형 프로그램
  • 오디오 데이터 세트 마이닝 준비
  • 패턴별 및 자동화된 데이터 처리
  • 가능한 가장 높은 수준의 도메인 특이성
  • 가속화된 AI 모델로 시장 출시 시간 단축

우리의 전문성

스마트 NLP 모델을 준비하기 위해 오디오 데이터 정렬

Shaip은 음성 지원 기술이 전 세계의 다양한 청중을 수용할 수 있도록 100개 이상의 언어로 종단 간 음성/오디오 데이터 수집 서비스를 제공합니다. 우리는 모든 범위와 규모의 프로젝트에서 작업할 수 있습니다. 기존 기성 오디오 데이터 세트 라이선스부터 맞춤형 오디오 데이터 수집 관리, 오디오 전사 및 주석에 이르기까지. 음성 데이터 수집 프로젝트의 규모에 상관없이 방언, 어조 및 언어를 대상으로 하는 고품질 NLP 데이터 세트를 구축하기 위해 필요에 맞게 오디오 수집 서비스를 사용자 정의할 수 있습니다. 음성 지원 지능형 설정을 위해 광범위한 음성 데이터 세트 및 오디오 데이터 수집 리소스 중에서 선택하십시오.

독백 연설

독백 스피치 컬렉션

단일 채널 파일을 통해 스크립트로 작성된 프롬프트 공급으로 Text-to-Speed ​​프로토타입 및 트랜스크립션 관련 요구 사항에 대한 독립형 스피커와 관련된 음성 기반 요구 사항을 처리합니다.

대화 연설

대화 연설
수집

이중 채널 파일 및 전사된 리소스를 통해 다국어 노출을 통해 지능형 가상 도우미, 속도별 챗봇 및 자동 음성 인식 모델을 설정합니다.

어쿠스틱 스피치

음향 데이터
수집

레스토랑, 사무실, 가정 또는 다양한 환경과 언어에서 스튜디오 품질의 오디오 데이터를 전문적으로 녹음할 수 있습니다.

자연어 발화

자연어 발화 모음

AI를 제시간에 보다 자율적으로 만들기 위해 유사한 의미로 다르게 발화되는 고객 문구를 식별하도록 스마트 상업 설정을 교육합니다.

디지털 가상 비서

디지털 / 가상
조수

사람의 말, 다국어 노출, 상황 분석 및 NLU에 대한 경고로 모델을 교육하여 곧 출시될 가상 어시스턴트를 구축하는 데 집중하십시오.

자동 음성 인식

자동 음성 인식(ASR)

다양한 인구 통계에서 최신의 다양한 음성/오디오 데이터 세트에 액세스하여 자동 음성 인식(ASR) 시스템의 정확도를 향상시킵니다.

자연어 발화

다국어 음성/음성 훈련 데이터

전 세계의 고도로 숙련된 언어 전문가가 아랍어, 덴마크어, 중국어, 아프리칸스어, 싱가포르, 뉴질랜드, 히브리어, 인도네시아어, 아일랜드어, 한국어, 말레이어, 폴란드어, 스코틀랜드어, 스웨덴어를 포함한 여러 언어 및 방언으로 다국어 오디오/음성 교육 데이터를 제공합니다. , 프랑스어, 독일어, 베트남어, 태국어, 이탈리아어, 스페인어 등.

디지털 가상 비서

텍스트 음성 변환
(TTS)

TTS로 더 나은 사용자 경험을 제공하려면 자연스럽게 들리는 시스템을 개발하는 것이 중요합니다. 150개 이상의 언어 및 방언으로 음성 데이터를 수집하는 데 도움을 주는 글로벌 인력의 도움을 받아 TTS(텍스트 음성 변환) 다국어 모델을 구축하여 차량 내 제어에서 챗봇 및 높은 수준의 학습 솔루션에 이르기까지 AI 모델을 향상시킵니다. 고품질 오디오 데이터.

Shaip을 신뢰할 수 있는 음성 데이터 수집 파트너로 선택한 이유

사람들

사람들

전담 및 훈련된 팀:

  • 데이터 생성, 라벨링 및 QA를 위한 30,000명 이상의 공동 작업자
  • 자격을 갖춘 프로젝트 관리 팀
  • 경험이 풍부한 제품 개발 팀
  • 인재 풀 소싱 및 온보딩 팀
방법

방법

최고의 공정 효율성은 다음을 통해 보장됩니다.

  • 강력한 6시그마 스테이지 게이트 프로세스
  • 6시그마 블랙벨트로 구성된 전담 팀 – 핵심 프로세스 소유자 및 품질 준수
  • 지속적인 개선 및 피드백 루프
Platform

Platform

특허 받은 플랫폼은 다음과 같은 이점을 제공합니다.

  • 웹 기반 엔드 투 엔드 플랫폼
  • 완벽한 품질
  • 더 빠른 TAT
  • 원활한 전달

언어: 수집된 오디오 데이터 세트

기성품 음성/오디오 데이터세트

세부 정보언어 데이터세트샘플 속도데이터 세트 유형총 오디오 시간간단한 설명데이터 세트 설명오디오 채널녹음 플랫폼WER(%)오디오 형식전사 형식적용 사례스피커의 수CTA
스피치 병리학자ko_US_CC_8아프리카계 미국인 모국어아프리카계 미국인 모국어ko 페이지8 kHz콜센터211아프리카계 미국인 버내큘러 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 612, 남성: 1242, 불명: 12
스피치 병리학자ko_US_MA_16아프리카계 미국인 모국어아프리카계 미국인 모국어ko 페이지16 kHz미디어 오디오154아프리카계 미국인 버내큘러 미디어 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 151, 남성: 150, 불명: 10
스피치 병리학자아프리카어_GC_8아프리카 어아프리카 어af_ZA8 kHz일반회화368아프리칸스 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 아프리카에서 사용되는 아프리칸스어이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 502, 남성: 390, 불명: 2
스피치 병리학자아프리카어_MA_16아프리카 어아프리카 어af_ZA16 kHz미디어 오디오658아프리칸스어 미디어 파일인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 750, 남성: 1278, 불명: 52
스피치 병리학자아랍어_GC_8아랍어아랍어ar_AE8 kHz일반회화292아랍어 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 걸프만 국가의 아랍어이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 171, 남성: 534, 불명: 1
스피치 병리학자아랍어_SM_48아랍어아랍어ar-SA48 kHz스크립트 독백1,947아랍어 스크립트 독백5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 838 남성 1209 불명 78
스피치 병리학자아쌈어_CC_8아삼어아쌈어(파이프라인 내) as_IN콜센터60Assamese(파이프라인 내) Call-Center 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자아쌈어_GC아삼어아쌈어(파이프라인 내) as_IN일반회화100아삼어(파이프라인 내) 일반 대화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자아쌈어_MA아삼어아쌈어(파이프라인 내) as_IN미디어 오디오40Assamese(파이프라인 내) 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자벵골어_CC_8벵골어벵골어(파이프라인 내) bn_IN콜센터60벵골어(파이프라인 내) 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자벵골어_GC벵골어벵골어(파이프라인 내) bn_IN일반회화100벵골어(파이프라인 내) 일반 대화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자Bengali_MA벵골어벵골어(파이프라인 내) bn_IN미디어 오디오40벵골어(파이프라인 내) 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자보스턴_CC_8보스턴 영어보스턴 영어ko 페이지8 kHz콜센터177보스턴 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 605, 남성: 711, 불명: 0
스피치 병리학자보스턴_GC_8보스턴 영어보스턴 영어ko 페이지8 kHz일반회화32보스턴 일반 대화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 53, 남성: 83, 불명: 0
스피치 병리학자Boston_MA_16보스턴 영어보스턴 영어ko 페이지16 kHz미디어 오디오93보스턴 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 43, 남성: 181, 불명: 2
스피치 병리학자Canadian_SM_48캐나다 불어캐나다 불어FR-CA48 kHz스크립트 독백1,222캐나다 불어5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 974 남성 631 불명 1
스피치 병리학자Chinese_CC_8중국어 영어중국어 영어ko 페이지8 kHz콜센터169중국 콜센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 1790년, 남성: 523명, 불명: 13명
스피치 병리학자Chinese_MA_16중국어 영어중국어 영어ko 페이지16 kHz미디어 오디오249중국 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 126년, 남성: 346명, 불명: 6명
스피치 병리학자중국어 간체_SM_48중국어 간체중국어 간체에서 zh-CN48 kHz스크립트 독백2,762중국어 간체5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1920 남성 1535 불명 270
스피치 병리학자중국어 번체_SM_48중국어 번체중국어 번체zh-TW48 kHz스크립트 독백1,028중국어 번체5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1069 남성 262 불명 3
스피치 병리학자덴마크어_GC_8덴마크 말덴마크 말다_DK8 kHz일반회화372덴마크 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 311, 남성: 417, 불명: 0
스피치 병리학자덴마크어_MA_16덴마크 말덴마크 말다_DK16 kHz미디어 오디오664덴마크 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 369, 남성: 864, 불명: 27
스피치 병리학자덴마크어_SM_48덴마크 말덴마크 말다-DK48 kHz스크립트 독백2,579덴마크 스크립트 독백5~30초 범위에 속하는 경향이 있는 단일 발화 녹음, 덴마크의 덴마크어모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1551 남성 1233 불명 42
스피치 병리학자영어 Deep South_CC_8영어 딥 사우스영어 딥 사우스ko 페이지8 kHz콜센터151Deep South 콜센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 221명, 남성 1004명, 불명 7명
스피치 병리학자영어 Deep South_GC_8영어 딥 사우스영어 딥 사우스ko 페이지8 kHz일반회화56영어 Deep South 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 99, 남성 31, 알 수 없음 0
스피치 병리학자영어 Deep South_MA_16영어 딥 사우스영어 딥 사우스ko 페이지16 kHz미디어 오디오266영어 Deep South Media 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 204, 남성 356, 알 수 없음 21
스피치 병리학자German_CC_8GermanGerman드-데8 kHz콜센터64독일 콜센터 데이터 "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,모노바탕 화면. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 478 남성 1440 알 수 없음 0
스피치 병리학자German_IVR_8GermanGerman드-데8 kHz IVR200독일 IVR 데이터인간 대 기계. TTS 프롬프트(예: "어떻게 도와드릴까요?")와 자발적인 사람의 응답이 있는 IVR 유형의 흐름모노바탕 화면. WAV .jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 여성 10115 남성 8750 알 수 없음 0
스피치 병리학자구자라트어_CC_8구자라트어구자라트어(파이프라인 내) gu_IN콜센터60구자라트어(파이프라인 내) 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자구자라트어_GC구자라트어구자라트어(파이프라인 내) gu_IN일반회화100구자라트어(파이프라인 내) 일반 대화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자구자라트어_MA구자라트어구자라트어(파이프라인 내) gu_IN미디어 오디오40구자라트어(In Pipeline) 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자히브리어_일반회화_8히브리어히브리어he_IL8 kHz일반회화399히브리어 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 이스라엘 히브리어이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 414명, 남성 399명, 불명 1명
스피치 병리학자히브리어_MA_16히브리어히브리어he_IL16 kHz미디어 오디오427히브리어 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 361명, 남성 513명, 불명 13명
스피치 병리학자힌디어_MA_16힌디 어힌디 어안녕하세요_IN16 kHz미디어 오디오219힌디어 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 83명, 남성 309명, 불명 0명
스피치 병리학자Hindi_SM_48힌디 어힌디 어하이 인48 kHz스크립트 독백2,867힌디어 스크립트 독백5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1977 남성 1864 불명 147
스피치 병리학자HINGLISH_CC_8힝글 리쉬힝글 리쉬hg_IN8 kHz콜센터208HINGLISH 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 822, 남성 1262, 알 수 없음 0
스피치 병리학자HINGLISH_MA_16힝글 리쉬힝글 리쉬hg_IN16 kHz미디어 오디오216HINGLISH 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 75, 남성 380, 알 수 없음 0
스피치 병리학자Hispanic_CC_8히스패닉 영어히스패닉 영어ko 페이지8 kHz콜센터212히스패닉 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 822, 남성 1262, 알 수 없음 0
스피치 병리학자Hispanic_MA_16히스패닉 영어히스패닉 영어ko 페이지16 kHz미디어 오디오155히스패닉 콜 미디어 오디오인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 140, 남성 219, 알 수 없음 5
스피치 병리학자인도네시아어_GC_8IndonesianIndonesian아이디_아이디8 kHz일반회화496인도네시아어 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 인도네시아어 바하사이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 524, 남성 454, 알 수 없음 2
스피치 병리학자인도네시아어_MA_16IndonesianIndonesian아이디_아이디16 kHz미디어 오디오643인도네시아 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 746, 남성 1507, 알 수 없음 129
스피치 병리학자아일랜드어_GC_8아일랜드아일랜드ko_IE8 kHz일반회화192아일랜드 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 213명, 남성 153명, 불명 0명
스피치 병리학자일본어_SM_48일본어일본어JA-JP48 kHz스크립트 독백2,335일본 스크립트 독백5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1460 남성 1221 불명 194
스피치 병리학자칸나다어_CC_8칸나다어칸나다어(파이프라인 내) kn_IN콜센터60칸나다어(파이프라인 내) 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자칸나다어_GC칸나다어칸나다어(파이프라인 내) kn_IN일반회화100칸나다어(파이프라인 내) 일반 대화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자칸나다어_MA칸나다어칸나다어(파이프라인 내) kn_IN미디어 오디오40칸나다어(파이프라인 내) 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자Korean_CC_8한국어한국어ko_KR8 kHz콜센터107한국 콜센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1086, 남성 210, 불명 4
스피치 병리학자Korean_MA_16한국어한국어ko_KR16 kHz미디어 오디오204한국 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 70 남성 303, 불명 25
스피치 병리학자Korean_SM_48한국어한국어ko-KR48 kHz스크립트 독백1,955한국어 대본 독백5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1195 남성 1134 불명 122
스피치 병리학자말레이어_GC_8MalayMalayms_MY8 kHz일반회화266말레이 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 말레이시아의 말레이어이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 316, 남성 176, 알 수 없음 0
스피치 병리학자Malay_MA_16MalayMalayms_MY16 kHz미디어 오디오344말레이 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 236, 남성 626, 알 수 없음 47
스피치 병리학자말라얄람어_CC_8말라얄람어말라얄람어(파이프라인 중) ml_IN콜센터60말라얄람어(파이프라인 내) 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자말라얄람어_GC말라얄람어말라얄람어(파이프라인 중) ml_IN일반회화100말라얄람어(파이프라인 내) 일반 대화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자말라얄람어_MA말라얄람어말라얄람어(파이프라인 중) ml_IN미디어 오디오40말라얄람어(파이프라인 내) 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자마라티어_CC_8마라타어마라티어(파이프라인 내) mr_IN콜센터60마라티어(파이프라인 내) 콜센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자Marathi_GC마라타어마라티어(파이프라인 내) mr_IN일반회화100마라티어(파이프라인 내) 일반 대화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자Marathi_MA마라타어마라티어(파이프라인 내) mr_IN미디어 오디오40마라티어(파이프라인 내) 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자멕시코인_SM_48스페인어 (멕시코)스페인어 (멕시코)ES-MX48 kHz스크립트 독백1,492멕시코 스페인어 스크립트 독백5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1016 남성 1069 불명 95
스피치 병리학자네덜란드_SM_48DutchDutchNL-NL48 kHz스크립트 독백1,205네덜란드 스크립트 독백5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1285 남성 531 불명 3
스피치 병리학자뉴욕 English_CC_8뉴욕 영어뉴욕 영어ko 페이지8 kHz콜센터103New York English 콜센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 610, 남성 532, 알 수 없음 0
스피치 병리학자뉴욕 영어_GC_8뉴욕 영어뉴욕 영어ko 페이지8 kHz일반회화107뉴욕 영어 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 118, 남성 114, 알 수 없음 0
스피치 병리학자뉴욕 English_MA_16뉴욕 영어뉴욕 영어ko 페이지16 kHz미디어 오디오140New York English Media 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 66, 남성 230, 알 수 없음 11
스피치 병리학자뉴질랜드_GC_8뉴질랜드 영어 뉴질랜드 영어 ko_NZ8 kHz일반회화148뉴질랜드 영어 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 167, 남성 121, 불명 4
스피치 병리학자뉴질랜드_MA_16뉴질랜드 영어 뉴질랜드 영어 ko_NZ16 kHz미디어 오디오400뉴질랜드 영어 미디어 오디오인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 367, 남성 678, 불명 26
스피치 병리학자오리야_CC_8오리 야오리야(파이프라인 내) or_IN콜센터60오리야(파이프라인 내) 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자오리야_GC오리 야오리야(파이프라인 내) or_IN일반회화100Oriya(파이프라인 내) 일반 대화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자오리야_MA오리 야오리야(파이프라인 내) or_IN미디어 오디오40Oriya(In Pipeline) 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자폴란드어_MA_16광택광택pl_PL16 kHz미디어 오디오269폴란드어 미디어 오디오인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 173 남성 354 알 수 없음 6
스피치 병리학자폴란드 폴란드_SM_48폴란드어 (폴란드)폴란드어 (폴란드)PL-PL48 kHz스크립트 독백1,482폴란드 폴란드 - 스크립트 독백5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1324 남성 701 불명 24
스피치 병리학자펀자브어_CC_8펀 자브펀자브어(파이프라인 내) 펀 자브콜센터60펀자브어(파이프라인 내) 콜센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자펀자브어_GC펀 자브펀자브어(파이프라인 내) 펀 자브일반회화100펀자브어(파이프라인 내) 일반 대화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자Punjabi_MA펀 자브펀자브어(파이프라인 내) 펀 자브 미디어 오디오40펀자브어(In Pipeline) 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자러시아어_SM_48RussianRussianRU-RU48 kHz스크립트 독백2,398러시아 스크립트 독백5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1689 남성 1937 불명 214
스피치 병리학자스코틀랜드_GC_8스코틀랜드(영어 악센트)스코틀랜드(영어 악센트)ko_AB8 kHz일반회화292스코틀랜드 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 285명, 남성 260명, 불명 3명
스피치 병리학자싱가포르_CC_8싱가포르 영어싱가포르 영어ko_SG8 kHz콜센터218싱가포르 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 2139, 남성 884, 불명 21
스피치 병리학자싱가포르_MA_16싱가포르 영어싱가포르 영어ko_SG16 kHz미디어 오디오247싱가포르 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 160, 남성 455, 알 수 없음 37
스피치 병리학자남아프리카 영어_CC_8남아프리카 영어남아프리카 영어ko_ZA8 kHz콜센터261남아프리카 영어 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1274명, 남성 935명, 불명 1명
스피치 병리학자남아프리카 영어_MA_16남아프리카 영어남아프리카 영어ko_ZA16 kHz미디어 오디오251남아프리카 영어 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 235, 남성 432, 알 수 없음 36
스피치 병리학자스와힐리어_CC_8스와힐리어스와힐리어sw_KE8 kHz콜센터230스와힐리어 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 611, 남성 833, 알 수 없음 0
스피치 병리학자스와힐리어_MA_16스와힐리어스와힐리어sw_KE16 kHz미디어 오디오265Swahili 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 118, 남성 493, 알 수 없음 25
스피치 병리학자스웨덴어_CC_8SwedishSwedishSV_SE8 kHz콜센터250스웨덴 콜센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1581, 남성 727, 불명 2
스피치 병리학자스웨덴어_MA_16SwedishSwedishSV_SE16 kHz미디어 오디오278스웨덴 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 195, 남성 500, 불명 21
스피치 병리학자타밀어_CC_8타밀 사람타밀어(파이프라인 내) 엷은 주석판콜센터60타밀어(파이프라인 내) 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자Tamil_GC타밀 사람타밀어(파이프라인 내) 엷은 주석판일반회화100타밀어(파이프라인 내) 일반 대화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자Tamil_MA타밀 사람 타밀어(파이프라인 내) 엷은 주석판미디어 오디오40타밀어(파이프라인 내) 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자텔루구어_GC_8텔루구어텔루구어te_IN8 kHz일반회화553텔루구어 일반 대화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 574, 남성 564, 불명 0
스피치 병리학자Telugu_MA_16텔루구어텔루구어te_IN16 kHz미디어 오디오648텔루구어 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 207, 남성 963, 알 수 없음 2
스피치 병리학자Telugu_CC_8텔루구어텔루구어(파이프라인 내) te_IN콜센터30텔루구어(파이프라인 내) 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자Telugu_GC텔루구어텔루구어(파이프라인 내) te_IN일반회화50텔루구어(파이프라인 내) 일반 대화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자Telugu_MA텔루구어텔루구어(파이프라인 내) te_IN미디어 오디오20텔루구어(파이프라인 내) 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자Thai_GC_8ThaiThaith_TH8 kHz일반회화183태국 일반 회화두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 친구 간에 사용되는 비공식 기록이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 338, 남성 96, 알 수 없음 8
스피치 병리학자Thai_MA_8ThaiThaith_TH16 kHz미디어 오디오173태국 미디어 오디오인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 143, 남성 502, 알 수 없음 26
스피치 병리학자터키어 Turkey_SM_48터키어 터키터키어 터키TR-TR48 kHz스크립트 독백2,027터키어 터키5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1561 남성 1241 불명 31
스피치 병리학자베트남어_GC_8베트남어베트남어vi_VN8 kHz일반회화295베트남어 일반 회화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, 북부(예: 하노이), 중부 및 남부(예: 호치민시).이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 400, 남성 380, 불명 2
스피치 병리학자베트남어_MA_16베트남어베트남어vi_VN16 kHz미디어 오디오257베트남 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 249, 남성 200, 불명 45
스피치 병리학자웨일스어_GC_8웨일스어(영어 악센트)웨일스어(영어 악센트)ko_WL8 kHz일반회화278웨일스 일반 회화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 270, 남성 324, 알 수 없음 0
스피치 병리학자영국 English_WW_16영국 영어영국 영어en_uk16 kHz웨이크 워드200연설자Wake Word 영국 영어keyphrases 데이터 수집
  • 200 스피커
  • 화자당 4개의 고유한 키프레이즈
  • 고유한 키프레이즈당 25-30개의 반복된 키프레이즈 녹음
  • 고유한 키프레이즈당 25-30개의 오디오 파일
  • 화자당 총 120개의 녹음된 발화
1 채널모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링성별: 남성 50%, 여성 50%, +/- 10%.

서비스 제공

전문적인 오디오 데이터 수집은 포괄적인 AI 설정을 위한 모든 준비가 아닙니다. Shaip에서는 모델을 평소보다 더 널리 보급하기 위해 다음 서비스를 고려할 수도 있습니다.

텍스트 데이터 수집

텍스트 데이터 수집
서비스

Shaip 인지 데이터 수집 서비스의 진정한 가치는 조직에 비정형 데이터에서 발견된 중요한 정보를 잠금 해제할 수 있는 키를 제공한다는 것입니다.

이미지 데이터 수집

이미지 데이터 수집 서비스

미래의 차세대 AI 모델을 원활하게 훈련하기 위해 컴퓨터 비전 모델이 모든 이미지를 정확하게 식별하는지 확인하십시오.

비디오 데이터 수집

비디오 데이터 수집 서비스

이제 객체, 개인, 억지력 및 기타 시각적 요소를 완벽하게 식별하도록 모델을 훈련하기 위해 NLP와 함께 컴퓨터 비전에 집중하십시오.

샤이프 문의

나만의 오디오 데이터세트를 만들고 싶으신가요?

사내 음성 데이터 수집 전문가와 연결하여 요구 사항에 가장 적합한 오디오 리포지토리를 설정하십시오.

  • 등록함으로써 Shaip에 동의합니다. 개인정보 보호정책서비스약관 그리고 Shaip의 B2B 마케팅 커뮤니케이션 수신에 동의합니다.