태국어 데이터세트

안녕하세요.

AI 및 음성 모델을 위한 고품질 태국어 일반 대화, 스크립트 독백 및 미디어(팟캐스트) 데이터 세트

회사 개요

제목(언어)

태국어 데이터 세트

데이터 세트 유형

일반 대화, 미디어(팟캐스트), 대본 독백

국가

Thailand

기술설명

이 데이터 세트에는 이스라엘의 히브리어 사용자 2명 간의 대본 없는 전화 대화(15~60분), 1~5명이 참여하는 라이선스가 있는 퍼블릭 도메인 오디오 또는 비디오 파일(15~60분), 단일 화자가 음성 및 언어 모델을 훈련하고 평가하기 위해 미리 정의된 콘텐츠를 전달하는 대본이 있는 독백이 포함됩니다.

적용 사례

ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링

데이터 세트 세부정보

데이터 세트 유형 샘플링 속도 스피커 채널 전체 시간 총 연사 수
일반회화 8 kHz 2연설자 이중의 211:48:42 170
미디어 데이터 16 kHz 단일 스피커 모노 249:14:31 670
스크립트 독백 24 kHz 단일 스피커 모노 500:00:00 (요청시)

주요 클라이언트

팀이 세계 최고의 AI 제품을 구축할 수 있도록 지원합니다.

아마존
구글
Microsoft
샤이프 문의하기

찾고 있는 것을 찾을 수 없습니까?

모든 데이터 유형에 걸쳐 새로운 기성 데이터 세트가 수집되고 있습니다.

오디오/스피치 트레이닝 데이터 수집 걱정은 지금 바로 연락주세요.

  • 이 필드는 검증 목적이며 변하지 남아 있어야합니다.
  • 등록함으로써 Shaip에 동의합니다. 개인정보 처리방침서비스약관 그리고 Shaip의 B2B 마케팅 커뮤니케이션 수신에 동의합니다.