AI를 위한 가장 신뢰할 수 있는 음성 데이터 수집 서비스

당사의 오디오 및 음성 데이터 수집 서비스를 통해 고품질 대화 데이터로 NLP 모델, VA, TTS 프로토타입 등을 교육하십시오.

오디오 데이터 수집

병목 현상 없이 오디오 데이터 파이프라인을 발견하세요

주요 클라이언트

전문 오디오/음성 데이터 수집 서비스

모든 주제. 모든 시나리오.

Shaip의 전문 지식은 다양한 AI/ML 요구 사항에 맞게 설계된 고품질 음성 데이터 세트를 만드는 데 있습니다. 우리는 광범위한 언어와 다양한 설정의 기록을 제공하여 데이터 세트를 포괄적이고 적응 가능하게 만듭니다. 영형우리의 초점은 가능한 가장 짧은 시간에 가장 많은 양의 사용자 정의 음성 데이터를 모델에 제공하는 것입니다. 우리와 함께라면 다음과 같은 혜택을 누릴 수 있습니다. 

스피치 컬렉션
  • 정확성을 높이기 위해 선별된 고품질 다국어 오디오/음성 데이터
  • t에 대한 가능한 최고 수준의 도메인 특이성다양한 시나리오 확보 설치
  •  다양한 인구 통계 및 업종에 맞게 ML 모델 확장
  • 녹음 환경: 스튜디오 품질, 배경 소음을 최소화한 선명한 오디오를 제공합니다. 자연환경, 녹음에는 주변 소리가 포함되어 실제 상황을 모방합니다.

100+

나라

55K +

음성 데이터 시간

250+

프로젝트

60+

언어(100개 이상의 방언)

8 / 16 / 44 / 48kHz

샘플링 속도

우리의 전문성

더 스마트한 NLP 모델을 위해 오디오 데이터 정렬

Shaip은 음성 지원 기술이 전 세계의 다양한 청중을 수용할 수 있도록 100개 이상의 언어로 종단 간 음성/오디오 데이터 수집 서비스를 제공합니다. 우리는 모든 범위와 규모의 프로젝트에서 작업할 수 있습니다. 기존 기성 오디오 데이터 세트 라이선스부터 맞춤형 오디오 데이터 수집 관리, 오디오 전사 및 주석에 이르기까지. 음성 데이터 수집 프로젝트의 규모에 상관없이 방언, 어조 및 언어를 대상으로 하는 고품질 NLP 데이터 세트를 구축하기 위해 필요에 맞게 오디오 수집 서비스를 사용자 정의할 수 있습니다. 음성 지원 지능형 설정을 위해 광범위한 음성 데이터 세트 및 오디오 데이터 수집 리소스 중에서 선택하십시오.

독백 연설

독백 스피치 컬렉션

단일 화자의 음성을 처리하는 데 중점을 둡니다. 스크립트 프롬프트를 활용하여 단일 채널 오디오 파일에 피드함으로써 해당 개인에 특정한 고유한 음성 패턴, 톤 및 뉘앙스를 캡처할 수 있습니다.

대화 연설

대화 연설
수집

이중 채널 파일 및 기록된 리소스를 통해 다국어 노출을 통해 실제 대화와 대화를 복제하는 2인 상호 작용.

다자간 대화

그룹 / 다자간
대화

다중 사용자 토론, 그룹 역학, 중복 및 다양한 어조를 캡처하여 음성 모델을 정확하게 훈련합니다.

자연어 발화

자연어 발화 모음

고급 자연어 처리 및 이해를 위해 다양하고 풍부하며 실제적인 발화를 사용하여 유사한 의미를 가진 문구를 식별하거나 단어를 깨우도록 AI를 훈련시킵니다.

어쿠스틱 스피치

음향 데이터
수집

우리는 레스토랑, 사무실, 집 등 다양한 환경과 언어에서 스튜디오 수준의 오디오 데이터를 전문적으로 녹음하면서 더 넓은 음향 범위(종합 사운드 데이터 세트)를 포괄할 수 있습니다.

자동 음성 인식

자동 음성 인식(ASR)

다양한 인구 통계에서 최신의 다양한 음성/오디오 데이터 세트에 액세스하여 자동 음성 인식(ASR) 시스템의 정확도를 향상시킵니다.

자연어 발화

다국어 음성/음성 훈련 데이터

전 세계에 걸쳐 있는 우리의 숙련된 언어 전문가들은 다양한 언어와 방언으로 된 다국어 오디오/음성 데이터를 제공합니다. 이러한 노력은 글로벌 커뮤니케이션을 촉진하고 언어 장벽을 해소하여 보다 포괄적이고 효과적인 AI 솔루션에 기여합니다.

디지털 가상 비서

텍스트 음성 변환
(TTS)

150개 이상의 언어 및 방언으로 음성 데이터를 수집하여 차량 내 제어부터 챗봇, 학습 솔루션까지 AI 모델을 향상하는 데 도움을 주는 글로벌 인력의 도움으로 텍스트 음성 변환(TTS) 다국어 모델을 구축하세요. 고품질 오디오 데이터.

콜센터 녹음

센터에 문의
녹음

스페인어, 독일어, 미국 영어, 벵골어, 일본어, 중국어, 힌디어 등 다양한 언어를 지원하는 에이전트와 고객 간의 진정한 교환.

성공 사례

3개 언어에 걸쳐 8시간 이상의 데이터가 포함된 대화형 AI 데이터 세트

인도어를 위한 다국어 플랫폼을 구축하려는 고객은 Shaip과 제휴하여 여러 인도어로 된 대규모 데이터 세트를 수집, 분할 및 복사했습니다. 이는 고객의 혁신적인 새 플랫폼을 강화할 수 있는 효과적인 음성 모델을 개발하는 데 도움이 될 것입니다.

문제 : 3,000개 인도 언어로 수집된 8시간 이상의 오디오 데이터를 분할하고 전사하여 자동 음성 인식을 개발했습니다.

해결 방법 : 우리는 데이터 수집, 세분화, 전사를 제공하고 메타데이터가 포함된 JSON 파일을 전달했습니다. 우리는 고객의 음성 기술 프로젝트를 위해 3000개 인도 언어로 된 8시간의 오디오 데이터를 대규모로 수집했습니다.

음성 데이터 수집 사례 연구

Shaip을 신뢰할 수 있는 음성 데이터 수집 파트너로 선택한 이유

사람들

사람들

전담 및 훈련된 팀:

  • 데이터 생성, 라벨링 및 QA를 위한 30,000명 이상의 공동 작업자
  • 자격을 갖춘 프로젝트 관리 팀
  • 경험이 풍부한 제품 개발 팀
  • 인재 풀 소싱 및 온보딩 팀
방법

방법

최고의 공정 효율성은 다음을 통해 보장됩니다.

  • 강력한 6시그마 스테이지 게이트 프로세스
  • 6시그마 블랙벨트로 구성된 전담 팀 – 핵심 프로세스 소유자 및 품질 준수
  • 지속적인 개선 및 피드백 루프
플랫폼

플랫폼

특허 받은 플랫폼은 다음과 같은 이점을 제공합니다.

  • 웹 기반 엔드 투 엔드 플랫폼
  • 완벽한 품질
  • 더 빠른 TAT
  • 원활한 전달

기성품 음성/오디오 데이터세트

세부 정보언어 데이터세트샘플 속도데이터 세트 유형총 오디오 시간간단한 설명데이터 세트 설명오디오 채널녹음 플랫폼WER(%)오디오 형식전사 형식적용 사례스피커의 수CTA
스피치 병리학자ko_US_CC_8아프리카계 미국인 모국어아프리카계 미국인 모국어ko 페이지8 kHz콜센터211아프리카계 미국인 버내큘러 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 612, 남성: 1242, 불명: 12
스피치 병리학자ko_US_MA_16아프리카계 미국인 모국어아프리카계 미국인 모국어ko 페이지16 kHz미디어 오디오154아프리카계 미국인 버내큘러 미디어 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 151, 남성: 150, 불명: 10
스피치 병리학자아프리카어_GC_8아프리카 어아프리카 어af_ZA8 kHz일반회화368아프리칸스 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 아프리카에서 사용되는 아프리칸스어이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 502, 남성: 390, 불명: 2
스피치 병리학자아프리카어_MA_16아프리카 어아프리카 어af_ZA16 kHz미디어 오디오658아프리칸스어 미디어 파일인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 750, 남성: 1278, 불명: 52
스피치 병리학자아랍어_GC_8아랍어아랍어ar_AE8 kHz일반회화292아랍어 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 걸프만 국가의 아랍어이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 171, 남성: 534, 불명: 1
스피치 병리학자아랍어_SM_48아랍어아랍어ar-SA48 kHz스크립트 독백1,947아랍어 스크립트 독백5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 838 남성 1209 불명 78
스피치 병리학자아쌈어_CC_8아삼어아쌈어(파이프라인 내) as_IN콜센터60Assamese(파이프라인 내) Call-Center 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자아쌈어_GC아삼어아쌈어(파이프라인 내) as_IN일반회화100아삼어(파이프라인 내) 일반 대화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자아쌈어_MA아삼어아쌈어(파이프라인 내) as_IN미디어 오디오40Assamese(파이프라인 내) 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자벵골어_CC_8벵골어벵골어(파이프라인 내) bn_IN콜센터60벵골어(파이프라인 내) 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자벵골어_GC벵골어벵골어(파이프라인 내) bn_IN일반회화100벵골어(파이프라인 내) 일반 대화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자벵골어_MA벵골어벵골어(파이프라인 내) bn_IN미디어 오디오40벵골어(파이프라인 내) 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자보스턴_CC_8보스턴 영어보스턴 영어ko 페이지8 kHz콜센터177보스턴 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 605, 남성: 711, 불명: 0
스피치 병리학자보스턴_GC_8보스턴 영어보스턴 영어ko 페이지8 kHz일반회화32보스턴 일반 대화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 53, 남성: 83, 불명: 0
스피치 병리학자보스턴_MA_16보스턴 영어보스턴 영어ko 페이지16 kHz미디어 오디오93보스턴 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 43, 남성: 181, 불명: 2
스피치 병리학자캐나다_SM_48캐나다 불어캐나다 불어FR-CA48 kHz스크립트 독백1,222캐나다 불어5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 974 남성 631 불명 1
스피치 병리학자중국어_CC_8중국어 영어중국어 영어ko 페이지8 kHz콜센터169중국 콜센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 1790년, 남성: 523명, 불명: 13명
스피치 병리학자중국어_MA_16중국어 영어중국어 영어ko 페이지16 kHz미디어 오디오249중국 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 126년, 남성: 346명, 불명: 6명
스피치 병리학자중국어 간체_SM_48중국어 간체중국어 간체에서 zh-CN48 kHz스크립트 독백2,762중국어 간체5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1920 남성 1535 불명 270
스피치 병리학자중국어 번체_SM_48중국어 번체중국어 번체zh-TW48 kHz스크립트 독백1,028중국어 번체5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1069 남성 262 불명 3
스피치 병리학자덴마크어_GC_8덴마크 말덴마크 말다_DK8 kHz일반회화372덴마크 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 311, 남성: 417, 불명: 0
스피치 병리학자덴마크어_MA_16덴마크 말덴마크 말다_DK16 kHz미디어 오디오664덴마크 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성: 369, 남성: 864, 불명: 27
스피치 병리학자덴마크어_SM_48덴마크 말덴마크 말다-DK48 kHz스크립트 독백2,579덴마크 스크립트 독백5~30초 범위에 속하는 경향이 있는 단일 발화 녹음, 덴마크의 덴마크어모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1551 남성 1233 불명 42
스피치 병리학자영어 Deep South_CC_8영어 딥 사우스영어 딥 사우스ko 페이지8 kHz콜센터151Deep South 콜센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 221명, 남성 1004명, 불명 7명
스피치 병리학자영어 Deep South_GC_8영어 딥 사우스영어 딥 사우스ko 페이지8 kHz일반회화56영어 Deep South 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 99, 남성 31, 알 수 없음 0
스피치 병리학자영어 Deep South_MA_16영어 딥 사우스영어 딥 사우스ko 페이지16 kHz미디어 오디오266영어 Deep South Media 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 204, 남성 356, 알 수 없음 21
스피치 병리학자독일어_CC_8독일 사람독일 사람드-데8 kHz콜센터64독일 콜센터 데이터 "에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,모노바탕 화면. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 478 남성 1440 알 수 없음 0
스피치 병리학자German_IVR_8독일 사람독일 사람드-데8 kHz IVR200독일 IVR 데이터인간 대 기계. TTS 프롬프트(예: "어떻게 도와드릴까요?")와 자발적인 사람의 응답이 있는 IVR 유형의 흐름모노바탕 화면. WAV .jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링 여성 10115 남성 8750 알 수 없음 0
스피치 병리학자구자라트어_CC_8구자라트어구자라트어(파이프라인 내) gu_IN콜센터60구자라트어(파이프라인 내) 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자구자라트어_GC구자라트어구자라트어(파이프라인 내) gu_IN일반회화100구자라트어(파이프라인 내) 일반 대화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자구자라트어_MA구자라트어구자라트어(파이프라인 내) gu_IN미디어 오디오40구자라트어(In Pipeline) 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자히브리어_일반회화_8히브리어히브리어he_IL8 kHz일반회화399히브리어 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 이스라엘 히브리어이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 414명, 남성 399명, 불명 1명
스피치 병리학자히브리어_MA_16히브리어히브리어he_IL16 kHz미디어 오디오427히브리어 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 361명, 남성 513명, 불명 13명
스피치 병리학자힌디어_MA_16힌디 어힌디 어안녕하세요_IN16 kHz미디어 오디오219힌디어 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 83명, 남성 309명, 불명 0명
스피치 병리학자Hindi_SM_48힌디 어힌디 어하이 인48 kHz스크립트 독백2,867힌디어 스크립트 독백5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1977 남성 1864 불명 147
스피치 병리학자HINGLISH_CC_8힝글 리쉬힝글 리쉬hg_IN8 kHz콜센터208HINGLISH 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 822, 남성 1262, 알 수 없음 0
스피치 병리학자HINGLISH_MA_16힝글 리쉬힝글 리쉬hg_IN16 kHz미디어 오디오216HINGLISH 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 75, 남성 380, 알 수 없음 0
스피치 병리학자히스패닉_CC_8히스패닉 영어히스패닉 영어ko 페이지8 kHz콜센터212히스패닉 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 822, 남성 1262, 알 수 없음 0
스피치 병리학자히스패닉_MA_16히스패닉 영어히스패닉 영어ko 페이지16 kHz미디어 오디오155히스패닉 콜 미디어 오디오인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 140, 남성 219, 알 수 없음 5
스피치 병리학자인도네시아어_GC_8인도네시아 인인도네시아 인아이디_아이디8 kHz일반회화496인도네시아어 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 인도네시아어 바하사이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 524, 남성 454, 알 수 없음 2
스피치 병리학자인도네시아어_MA_16인도네시아 인인도네시아 인아이디_아이디16 kHz미디어 오디오643인도네시아 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 746, 남성 1507, 알 수 없음 129
스피치 병리학자아일랜드어_GC_8아일랜드아일랜드ko_IE8 kHz일반회화192아일랜드 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 213명, 남성 153명, 불명 0명
스피치 병리학자일본어_SM_48일본제일본제JA-JP48 kHz스크립트 독백2,335일본 스크립트 독백5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1460 남성 1221 불명 194
스피치 병리학자칸나다어_CC_8칸나다어칸나다어(파이프라인 내) kn_IN콜센터60칸나다어(파이프라인 내) 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자칸나다어_GC칸나다어칸나다어(파이프라인 내) kn_IN일반회화100칸나다어(파이프라인 내) 일반 대화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자칸나다어_MA칸나다어칸나다어(파이프라인 내) kn_IN미디어 오디오40칸나다어(파이프라인 내) 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자한국어_CC_8한국어한국어ko_KR8 kHz콜센터107한국 콜센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1086, 남성 210, 불명 4
스피치 병리학자한국어_MA_16한국어한국어ko_KR16 kHz미디어 오디오204한국 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 70 남성 303, 불명 25
스피치 병리학자한국어_SM_48한국어한국어ko-KR48 kHz스크립트 독백1,955한국어 대본 독백5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1195 남성 1134 불명 122
스피치 병리학자말레이어_GC_8MalayMalayms_MY8 kHz일반회화266말레이 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 시간(범위) - 15-60분, 말레이시아의 말레이어이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 316, 남성 176, 알 수 없음 0
스피치 병리학자말레이어_MA_16MalayMalayms_MY16 kHz미디어 오디오344말레이 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 236, 남성 626, 알 수 없음 47
스피치 병리학자말라얄람어_CC_8말라얄람어말라얄람어(파이프라인 중) ml_IN콜센터60말라얄람어(파이프라인 내) 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자말라얄람어_GC말라얄람어말라얄람어(파이프라인 중) ml_IN일반회화100말라얄람어(파이프라인 내) 일반 대화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자말라얄람어_MA말라얄람어말라얄람어(파이프라인 중) ml_IN미디어 오디오40말라얄람어(파이프라인 내) 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자마라티어_CC_8마라타어마라티어(파이프라인 내) 미스터인콜센터60마라티어(파이프라인 내) 콜센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자마라티_GC마라타어마라티어(파이프라인 내) 미스터인일반회화100마라티어(파이프라인 내) 일반 대화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자마라티어_MA마라타어마라티어(파이프라인 내) 미스터인미디어 오디오40마라티어(파이프라인 내) 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자멕시코인_SM_48스페인어 (멕시코)스페인어 (멕시코)ES-MX48 kHz스크립트 독백1,492멕시코 스페인어 스크립트 독백5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1016 남성 1069 불명 95
스피치 병리학자네덜란드_SM_48DutchDutchNL-NL48 kHz스크립트 독백1,205네덜란드 스크립트 독백5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1285 남성 531 불명 3
스피치 병리학자뉴욕 English_CC_8뉴욕 영어뉴욕 영어ko 페이지8 kHz콜센터103New York English 콜센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 610, 남성 532, 알 수 없음 0
스피치 병리학자뉴욕 영어_GC_8뉴욕 영어뉴욕 영어ko 페이지8 kHz일반회화107뉴욕 영어 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 118, 남성 114, 알 수 없음 0
스피치 병리학자뉴욕 English_MA_16뉴욕 영어뉴욕 영어ko 페이지16 kHz미디어 오디오140New York English Media 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 66, 남성 230, 알 수 없음 11
스피치 병리학자뉴질랜드_GC_8뉴질랜드 영어 뉴질랜드 영어 ko_NZ8 kHz일반회화148뉴질랜드 영어 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 167, 남성 121, 불명 4
스피치 병리학자뉴질랜드_MA_16뉴질랜드 영어 뉴질랜드 영어 ko_NZ16 kHz미디어 오디오400뉴질랜드 영어 미디어 오디오인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 367, 남성 678, 불명 26
스피치 병리학자오리야_CC_8오리 야오리야(파이프라인 내) or_IN콜센터60오리야(파이프라인 내) 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자오리야_GC오리 야오리야(파이프라인 내) or_IN일반회화100Oriya(파이프라인 내) 일반 대화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자오리야_MA오리 야오리야(파이프라인 내) or_IN미디어 오디오40Oriya(In Pipeline) 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자폴란드어_MA_16광택광택pl_PL16 kHz미디어 오디오269폴란드어 미디어 오디오인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 173 남성 354 알 수 없음 6
스피치 병리학자폴란드 폴란드_SM_48폴란드어 (폴란드)폴란드어 (폴란드)PL-PL48 kHz스크립트 독백1,482폴란드 폴란드 - 스크립트 독백5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1324 남성 701 불명 24
스피치 병리학자펀자브어_CC_8펀 자브펀자브어(파이프라인 내) 펀 자브콜센터60펀자브어(파이프라인 내) 콜센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자펀자브어_GC펀 자브펀자브어(파이프라인 내) 펀 자브일반회화100펀자브어(파이프라인 내) 일반 대화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자펀잡어_MA펀 자브펀자브어(파이프라인 내) 펀 자브 미디어 오디오40펀자브어(In Pipeline) 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자러시아어_SM_48러시아인러시아인RU-RU48 kHz스크립트 독백2,398러시아 스크립트 독백5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1689 남성 1937 불명 214
스피치 병리학자스코틀랜드_GC_8스코틀랜드(영어 악센트)스코틀랜드(영어 악센트)ko_AB8 kHz일반회화292스코틀랜드 일반 회화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 285명, 남성 260명, 불명 3명
스피치 병리학자싱가포르_CC_8싱가포르 영어싱가포르 영어ko_SG8 kHz콜센터218싱가포르 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 2139, 남성 884, 불명 21
스피치 병리학자싱가포르_MA_16싱가포르 영어싱가포르 영어ko_SG16 kHz미디어 오디오247싱가포르 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 160, 남성 455, 알 수 없음 37
스피치 병리학자남아프리카 영어_CC_8남아프리카 영어남아프리카 영어en_ZA8 kHz콜센터261남아프리카 영어 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1274명, 남성 935명, 불명 1명
스피치 병리학자남아프리카 영어_MA_16남아프리카 영어남아프리카 영어en_ZA16 kHz미디어 오디오251남아프리카 영어 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 235, 남성 432, 알 수 없음 36
스피치 병리학자스와힐리어_CC_8스와힐리어스와힐리어sw_KE8 kHz콜센터230스와힐리어 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 611, 남성 833, 알 수 없음 0
스피치 병리학자스와힐리어_MA_16스와힐리어스와힐리어sw_KE16 kHz미디어 오디오265Swahili 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 118, 남성 493, 알 수 없음 25
스피치 병리학자스웨덴어_CC_8스웨덴어스웨덴어SV_SE8 kHz콜센터250스웨덴 콜센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1581, 남성 727, 불명 2
스피치 병리학자스웨덴어_MA_16스웨덴어스웨덴어SV_SE16 kHz미디어 오디오278스웨덴 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 195, 남성 500, 불명 21
스피치 병리학자타밀어_CC_8타밀 사람타밀어(파이프라인 내) 엷은 주석판콜센터60타밀어(파이프라인 내) 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자타밀어_GC타밀 사람타밀어(파이프라인 내) 엷은 주석판일반회화100타밀어(파이프라인 내) 일반 대화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자타밀어_MA타밀 사람 타밀어(파이프라인 내) 엷은 주석판미디어 오디오40타밀어(파이프라인 내) 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자텔루구어_GC_8텔루구어텔루구어te_IN8 kHz일반회화553텔루구어 일반 대화 데이터두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 574, 남성 564, 불명 0
스피치 병리학자Telugu_MA_16텔루구어텔루구어te_IN16 kHz미디어 오디오648텔루구어 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 207, 남성 963, 알 수 없음 2
스피치 병리학자Telugu_CC_8텔루구어텔루구어(파이프라인 내) te_IN콜센터30텔루구어(파이프라인 내) 콜 센터 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자Telugu_GC텔루구어텔루구어(파이프라인 내) te_IN일반회화50텔루구어(파이프라인 내) 일반 대화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자Telugu_MA텔루구어텔루구어(파이프라인 내) te_IN미디어 오디오20텔루구어(파이프라인 내) 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
스피치 병리학자태국어_GC_8태국어태국어일_TH8 kHz일반회화183태국 일반 회화두 사람 사이의 대본 없는 전화 대화. 약 오디오 지속 시간(범위) - 15-60분, 친구 간에 사용되는 비공식 기록이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 338, 남성 96, 알 수 없음 8
스피치 병리학자태국어_MA_8태국어태국어일_TH16 kHz미디어 오디오173태국 미디어 오디오인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 143, 남성 502, 알 수 없음 26
스피치 병리학자터키어 Turkey_SM_48터키어 터키터키어 터키TR-TR48 kHz스크립트 독백2,027터키어 터키5~30초 범위에 속하는 경향이 있는 단일 발화 녹음모노모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 1561 남성 1241 불명 31
스피치 병리학자베트남어_GC_8베트남어베트남어vi_VN8 kHz일반회화295베트남어 일반 회화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분, 북부(예: 하노이), 중부 및 남부(예: 호치민시).이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 400, 남성 380, 불명 2
스피치 병리학자베트남어_MA_16베트남어베트남어vi_VN16 kHz미디어 오디오257베트남 미디어 오디오 데이터인터뷰, 팟캐스트 등과 같은 라이선스가 있는 공개 도메인 오디오/비디오 파일 - 1~5명. 약 오디오 지속 시간(범위) 15-60분모노웹소싱5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 249, 남성 200, 불명 45
스피치 병리학자웨일스어_GC_8웨일스어(영어 악센트)웨일스어(영어 악센트)ko_WL8 kHz일반회화278웨일스 일반 회화 데이터"에이전트"와 "고객" 사이의 스크립트되지 않은 합성 전화 대화, 약. 오디오 지속 시간(범위) 5-15분,이중의바탕 화면5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링여성 270, 남성 324, 알 수 없음 0
스피치 병리학자영국 English_WW_16영국 영어영국 영어en_uk16 kHz웨이크 워드200연설자Wake Word 영국 영어keyphrases 데이터 수집
  • 200 스피커
  • 화자당 4개의 고유한 키프레이즈
  • 고유한 키프레이즈당 25-30개의 반복된 키프레이즈 녹음
  • 고유한 키프레이즈당 25-30개의 오디오 파일
  • 화자당 총 120개의 녹음된 발화
1 채널모바일 애플 리케이션5.0. WAV.jsonASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링성별: 남성 50%, 여성 50%, +/- 10%.

서비스 제공

전문적인 오디오 데이터 수집은 포괄적인 AI 설정을 위한 모든 준비가 아닙니다. Shaip에서는 모델을 평소보다 더 널리 보급하기 위해 다음 서비스를 고려할 수도 있습니다.

텍스트 데이터 수집

텍스트 데이터 수집
서비스

Shaip 인지 데이터 수집 서비스의 진정한 가치는 조직에 비정형 데이터에서 발견된 중요한 정보를 잠금 해제할 수 있는 키를 제공한다는 것입니다.

이미지 데이터 수집

이미지 데이터 수집 서비스

미래의 차세대 AI 모델을 원활하게 훈련하기 위해 컴퓨터 비전 모델이 모든 이미지를 정확하게 식별하는지 확인하십시오.

비디오 데이터 수집

비디오 데이터 수집 서비스

이제 객체, 개인, 억지력 및 기타 시각적 요소를 완벽하게 식별하도록 모델을 훈련하기 위해 NLP와 함께 컴퓨터 비전에 집중하십시오.

샤이프 문의

나만의 오디오 데이터세트를 만들고 싶으신가요?

사내 음성 데이터 수집 전문가와 연결하여 요구 사항에 가장 적합한 오디오 리포지토리를 설정하십시오.

  • 등록함으로써 Shaip에 동의합니다. 개인 보호 정책서비스약관 그리고 Shaip의 B2B 마케팅 커뮤니케이션 수신에 동의합니다.

ML 모델의 음성 데이터 수집은 음성 언어 오디오 녹음을 수집하는 프로세스를 의미합니다. 이 컬렉션은 기계 학습 알고리즘, 특히 사람의 목소리를 이해하고 처리하는 데 중점을 둔 알고리즘을 훈련하고 개선하는 데 도움이 됩니다.

ASR(자동 음성 인식)을 위한 오디오 데이터 수집을 목표로 하는 경우 원하는 언어, 억양 및 음성 유형을 포함하여 프로젝트의 특정 요구 사항을 정의하는 것부터 시작해야 합니다. 이러한 매개변수를 설정한 후에는 사용자 개인정보 보호를 존중하는 데 필요한 모든 권한을 얻었는지 확인하세요. 그런 다음 적절한 녹음 장치나 소프트웨어를 사용하여 선명한 오디오 샘플을 캡처합니다. 각 녹음에는 필사본이나 기타 관련 메타데이터를 꼼꼼하게 주석 처리하고 체계적으로 저장하여 쉽게 액세스할 수 있어야 합니다.

기계 학습의 음성 데이터 세트는 음성 언어를 인식, 전사 또는 해석하도록 맞춤화된 모델을 훈련, 테스트 및 검증하는 데 중추적인 역할을 합니다. 이러한 데이터 세트는 음성 도우미 및 녹음 서비스부터 음성 생체 인식에 이르기까지 수많은 애플리케이션을 위한 길을 열어줍니다.

다양한 언어와 억양에서 정확한 데이터를 수집하려면 원하는 언어 배경을 가진 원어민과의 협업이 필수적입니다. 광범위한 인구통계적 차이를 포괄하는 다양하고 대표적인 샘플을 목표로 합니다. 오디오 일관성을 보장하기 위해 균일한 환경에서 표준화된 녹음 장비를 사용합니다. 그리고 중요한 것은 특정 언어와 억양을 나타내는 자세한 기록과 메타데이터로 각 데이터 조각에 주석을 다는 것입니다.