핵심 문구/프롬프트 오디오 컬렉션

사례 연구: 차량 내 음성 인식 시스템을 위한 핵심 문구 수집

핵심 문구 모음

자동차 산업에서 차량 내 음성 활성화 시스템에 대한 수요가 증가하고 있으며 우리가 모빌리티 차량에 참여하는 방식을 재정의하고 있습니다.

자동차 산업은 Ford, Tesla 및 BMW와 같은 주요 업체가 차량에 고급 음성 인식을 통합하면서 음성 활성화 시스템을 빠르게 채택했습니다. 2022년까지 신차의 50% 이상이 음성 인식 기능을 탑재할 것으로 추정됩니다. 이러한 통합은 안전을 강화하여 운전자가 방해받지 않고 내비게이션, 엔터테인먼트 및 통신 기능을 작동할 수 있도록 하는 것을 목표로 합니다.

자동차의 음성 인식 시장 가치는 1년까지 2023억 달러를 넘어설 것으로 예상되며 이는 핸즈프리 지능형 차량 내 상호 작용에 대한 수요가 증가하고 있음을 나타냅니다.

자동차

연구에 따르면 2022년까지 운전자의 73%가 차량 내 음성 어시스턴트를 사용할 것이라고 합니다.

자동차 음성 인식 시스템 시장은 2.01년 2021억 3.51천만 달러에서 2027년까지 8.07억 XNUMX천만 달러에 달할 것으로 예상되며 CAGR은 약 XNUMX%입니다.

실제 세계 솔루션

음성 인식 시스템을 구동하는 데이터

자동차의 음성 인식 시스템은 안전과 편의성을 향상시킵니다. 이를 통해 운전자는 운전대에서 손을 떼거나 도로에서 눈을 떼지 않고도 내비게이션에 액세스하고, 전화를 걸고, 문자를 보내고, 음악을 제어할 수 있습니다. 이러한 시스템은 구두 명령에 응답함으로써 산만함을 줄이고 멀티태스킹을 촉진하며 운전에 지속적으로 집중할 수 있도록 합니다. 

클라이언트는 기업이 고객에게 놀라운 대화 경험을 제공할 수 있도록 하는 음성 AI 솔루션을 제공하는 대화 지능 분야의 글로벌 리더입니다. 그들은 주요 자동차 회사와 협력하여 브랜드 핵심 문구로 음성 활성화 시스템을 교육하고 있었고 오디오 데이터 수집에 대한 Shaip의 전문 지식이 필요했습니다.

실제 솔루션
도전

도전

  • 크라우드 소싱: 전 세계적으로 언어별로 2800명 이상의 원어민을 모집합니다.
  • 데이터 수집: 정해진 시간 내에 200개 언어로 12개 이상의 프롬프트를 확보하세요.
  • 컨텍스트 및 의도 인식: 사용자 요청을 올바르게 이해하려면 동일한 핵심 문구에 대한 다양한 변형에 대해 시스템을 교육해야 했습니다.
  • 배경 소음 처리: ML 모델 정확도를 위해 실제 배경 노이즈를 처리합니다.
  • 바이어스 감소: 포용성을 보장하기 위해 다양한 인구 통계에서 음성 샘플을 수집합니다..
  • 오디오 사양: 16khz 16비트 PCM, 모노, 단일 채널, WAV; 처리하지 않습니다.
  • 녹음 환경: 녹음에는 배경 잡음이나 방해 없이 깨끗한 오디오가 있어야 합니다. 일반 음성을 사용하여 녹음할 핵심 문구.
  • 품질 점검 :  모든 음성 녹음은 품질 평가 및 검증을 거치며 검증된 음성 녹음만 제공됩니다. Shaip이 합의된 품질 기준을 충족하지 않는 경우 Shaip은 추가 비용 없이 데이터를 재전송합니다.

해법

대화형 AI 공간에 대한 전문 지식을 갖춘 Shaip은 다음과 같은 클라이언트를 지원했습니다.

  • 데이터 수집: 규정된 기간 동안 208명의 화자로부터 12개 글로벌 언어로 수집된 2800k 핵심 문구/브랜드 메시지
  • 다양한 악센트 및 방언: 전 세계에서 원하는 억양과 방언에 능숙한 전문가를 모집했습니다.
  • 컨텍스트 및 의도 인식: 모든 화자는 핵심 문구를 20개의 고유한 변형으로 녹음하여 ML 모델이 컨텍스트 및 의도 측면에서 사용자 요청을 정확하게 파악할 수 있도록 했습니다.
  • 배경 소음 처리: 깨끗한 오디오 품질을 보장하기 위해 TV, 라디오, 음악, 음성 또는 거리 소리와 같은 배경 소음이 없는 소음 수준이 40dB 미만인 고요한 환경에서 핵심 문구가 캡처되었는지 확인했습니다.
  • 바이어스 감소: 편견을 최소화하기 위해 우리는 다양한 지역의 개인을 참여시키고 50세에서 50세까지의 연령대에 걸쳐 남성 18%, 여성 60%로 균형 잡힌 인구 통계학적 대표성을 유지했습니다.
  • 녹화 지침: 핵심 문구는 빠르거나 느린 페이싱과 같은 변형 없이 일관되고 정상적인 음성 패턴으로 캡처되었습니다. 음성의 어떤 부분도 실수로 잘리지 않도록 시작과 끝 모두에 2초 동안 침묵합니다.
  • 녹음 형식: 오디오는 단일 채널을 사용하여 16kHz, 16비트 PCM 모노로 녹음되었으며 WAV 파일 형식으로 저장되었습니다. 오디오는 처리되지 않은 상태로 남아 있습니다. 즉, 압축, 리버브 또는 EQ가 적용되지 않았습니다.
  • 품질 : 모든 음성 녹음은 엄격한 품질 검사 및 검증을 거쳤습니다. 이 평가를 통과한 녹음만 전달되었습니다. 합의된 품질 기준에 미치지 못하는 파일은 재녹음하여 추가 비용 없이 제공합니다.
해법
결과

결과

고품질 브랜드 핵심 문구 오디오 데이터 또는 음성 프롬프트는 자동차 회사와 고객에게 다음과 같은 이점을 제공합니다.

  1. 브랜딩 및 아이덴티티: 구체적인 브랜드 문구가 포함된 음성 프롬프트는 회사가 사용자와 브랜드 간의 직접적이고 기억에 남는 연결을 만들어 브랜드 회상을 향상시키는 데 도움이 됩니다.
  2. 사용의 용이성: 음성 명령을 통해 운전자는 운전대에서 손을 떼거나 도로에서 눈을 떼지 않고도 차량과 더 쉽게 상호 작용할 수 있으므로 도로 안전이 향상됩니다.
  3. 기능 : 음성 명령을 통해 자동차 기능에 보다 직관적으로 액세스하고 제어할 수 있습니다. 내비게이션, 미디어 재생 또는 기후 제어 여부.
  4. 다른 시스템과의 통합: 많은 음성 인식 시스템이 스마트폰, 스마트 홈 장치 및 기타 IoT 장치와 통합되어 있습니다. 예를 들어, 사용자는 집에 가까워지면 집에서 조명을 켜도록 자동차에 요청할 수 있습니다.
  5. 경쟁 우위: 고급 음성 인식 시스템을 제공하는 것은 판매 포인트이자 차별화 요소가 될 수 있습니다. 구매자는 새 차 구매를 고려할 때 최신 기술을 찾습니다.
  6. 미래 보장: 기술이 발전하고 IoT가 일상 생활에 더욱 통합됨에 따라 강력한 음성 인식 시스템을 갖춘 자동차 회사는 미래 기술에 더 잘 적응할 수 있습니다.
  7. 수익 기회: 추가 수익 창출 기회 즉, 음성 시스템은 제휴 수익을 제공할 수 있는 권장 사항 또는 통합 전자 상거래 경험(예: 음식 주문 또는 주변 서비스 찾기)을 제공합니다.
골든-5성급

자동차 부문을 위한 음성 안내를 소싱하기 시작했을 때 수많은 문제가 있었습니다. 말투, 억양 및 어조의 다양성을 포착하는 것은 고객의 글로벌 고객을 대표하는 데 매우 중요했습니다. Shaip은 단순한 벤더가 아니라 진정한 파트너로서 두각을 나타냈습니다. 다양한 지역의 다양한 목소리를 확보하려는 그들의 노력은 칭찬할 만했습니다. 그들은 단순히 목소리를 모으는 것을 넘어섰습니다. 그들은 우리 프로젝트 요구의 뉘앙스를 파악하여 최고 수준의 녹음을 보장했습니다. 오디오 수집 표준에 대한 완벽한 준수는 프로젝트에 대한 전문성과 헌신을 보여주었습니다.

대화형 AI 가속화
100% 애플리케이션 개발