AI 및 음성 모델을 위한 고품질 말레이 콜센터, 일반 대화 및 팟캐스트 데이터 세트
제목(언어)
말레이어 데이터 세트
데이터 세트 유형
콜센터, 일반 대화, 미디어 데이터(팟캐스트 데이터)
국가
말레이시아, 인도네시아, 브루나이, 싱가포르
기술설명
말레이시아 출신 말레이계 두 사람 간의 각본 없는 전화 대화는 15~60분 동안 제공되며, 1~5명이 참여하는 인터뷰나 팟캐스트와 같은 라이선스가 가능한 퍼블릭 도메인 오디오 또는 비디오 파일도 15~60분 동안 제공됩니다.
적용 사례
ASR, 가상 비서, 챗봇, 대화형 AI, 음성 분석, TTS, 언어 모델링
| 데이터 세트 유형 | 샘플링 속도 | 스피커 | 채널 | 전체 시간 | 총 연사 수 |
|---|---|---|---|---|---|
| 일반회화 | 8 kHz | 2연설자 | 이중의 | 239:49:43 | 432 |
| 일반회화 | 48 kHz | 2연설자 | 모노 | 90:19:23 | 140 |
| 미디어 데이터 | 16 kHz | 다중 화자 | 모노 | 343:57:16 | 907 |
| 센터에 문의 | 8 kHz | 2연설자 | 모노 | 2,000:00:00 | (요청시) |
팀이 세계 최고의 AI 제품을 구축할 수 있도록 지원합니다.
오디오/스피치 트레이닝 데이터 수집 걱정은 지금 바로 연락주세요.