음성 기반 UPI 결제 프롬프트: 향상된 AI 모델을 위한 다양성 포착
샤이프의 신속한 생성 및 다양한 오디오 녹음 분야의 전문성을 활용하여 고품질의 문화적 다양성이 있는 데이터를 제공하는 음성 기반 UPI 지불 시스템을 지원합니다.
사업 개요
Shaip은 선도적인 핀테크 회사와 협력하여 다양한 UPI 결제 프롬프트를 만들고 기록하여 음성 기반 결제 애플리케이션을 개발했습니다. 이 프로젝트에는 송금, 송금 요청, 잔액 조회, 청구서 지불과 같은 2,500가지 결제 관련 의도에 걸쳐 87,000개의 고유한 프롬프트와 13개의 다양한 프롬프트를 만드는 것이 포함되었습니다. 이러한 프롬프트는 다양한 지역, 배경 및 연령대의 200명의 화자가 45시간 이상 녹음하여 광범위한 언어적 및 환경적 다양성을 보장했습니다.
이 프로젝트의 목표는 실제 환경에서 UPI 결제와 관련된 음성 명령을 인식하고 응답할 수 있는 AI 모델을 위한 고품질 훈련 데이터를 개발하는 것이었습니다.
주요 통계
UPI 결제 안내의 오디오 시간 녹음
200
다양한 배경(연령, 학력, 지역)의 연사들
45
87,000개 이상의 다양한 프롬프트로 의도를 다루었습니다.
13
언어 : 영어, 다양한 모국어 배경을 가진 화자(쿠마오니어, 벵골어, 말라얄람어, 구자라트어, 힌디어, 마라티어 등)가 참여합니다.
프로젝트 범위
신속한 생성
범위에는 음성 기반 UPI 결제 시스템을 위한 고유한 프롬프트를 만드는 것이 포함되었습니다. 프롬프트는 여러 의도를 포괄하도록 설계되어 구조, 어휘 및 명명된 엔터티가 다양하도록 했습니다. 몇 가지 주요 측면은 다음과 같습니다.
다음을 포함한 13가지 주요 의도:
- 돈을 보내다: 65,653개의 독특하고 다양한 프롬프트
- 잔액 조회: 3,052개의 프롬프트
- 돈 요청: 26,972개의 프롬프트
- 거래 내역, 충전, 청구서 지불 등
오디오 녹음
진정성과 실제 적용성을 보장하기 위해, 프롬프트는 다양한 언어적 배경을 가진 45명의 화자에 의해 기록되었습니다. 다양한 모국어, 지역 방언 및 환경(실내 및 실외)을 통해 포착된 다양성은 훈련 데이터를 강화하는 데 도움이 되었습니다.
- 언어 다양성: 영어에 능통하지만 쿠마오니어, 구자라트어, 힌디어, 방글라어, 마라티어, 말라얄람어 등 다양한 모국어를 사용하는 사용자입니다.
- 나이, 성별, 교육 배경: 데이터는 광범위한 인구 통계를 포착했습니다.
- 도시와 시골의 스피커: 실제 사용을 반영하기 위해 도시 사용자와 농촌 사용자 모두가 포함되었습니다.
- 녹음 환경: 실내와 실외 모두에서 오디오 녹음을 진행하였고, 다양한 배경 소음이 포함되었습니다.
도전
다양한 지역 방언과 화자의 특성을 반영하는 프롬프트를 보장하려면 신중한 계획과 실행이 필요했습니다.
실제 적용을 위해서는 배경 소음과 환경 조건(실내 대 실외)을 처리하는 것이 매우 중요했습니다.
다양한 연령대, 교육적 배경, 농촌/도시 지역의 발표자를 포함시키다 보니 실제 데이터를 수집하는 데 복잡성이 생겼습니다.
해법
Shaip은 신속한 생성과 기록 모두에서 고급 NLP 기술과 신중한 계획을 구현하여 프로젝트의 과제를 해결하는 솔루션을 제공했습니다. 핵심 측면
솔루션 포함:
신속한 생성
- 2,500 구조와 어휘가 다양화된 고유한 프롬프트가 만들어졌습니다.
- 13 기본적인 결제 요청부터 거래 내역, 청구서 지불과 같은 보다 복잡한 문의까지 다양한 의도가 다루어졌습니다.
오디오 녹음
- 200 시간 오디오 녹음은 다음에 의해 수행되었습니다. 45 사용자모국어, 환경 및 사용자 인구 통계 전반에 걸쳐 다양성을 보장합니다.
- 자연스러운 오디오 변화를 보장하기 위해 실내와 실외 환경을 모두 사용하여 녹음했습니다.
- 발표자들은 다양한 지역 방언을 대표하여 정확한 언어 표현을 보장했습니다.
| 의지 | 전송 | 잔액 조회 | 돈을 요청 | 거래 내역 |
|---|---|---|---|---|
| 신속한 | 수마트리에 집세 2천1백원을 지불하다 | 저는 현재 저축 계좌의 잔액을 알고 싶습니다. | 긴급 상황으로 라지 318루피를 요청해 주시겠습니까? | 내 직불카드 거래 내역을 보여주세요. |
| 구자라트어 | 우리는 다음과 같은 일을 할 것입니다. | 우리는 당신의 선택을 위해 최선을 다하고 있습니다. 그래서. | 당신은 당신의 생각을 이해하는 데 도움이 될 것입니다 그게 뭐야? | 그래서 그것은 당신의 생각입니다. |
| 힌디 어 | 마칸 키라의 수마트리가 이키스의 말에 동의함 | | 나는 당신에게 말을 걸었습니다. | 긴급 상황에 대해 3개 중 하나에 대해 알아볼까요? | 무에메라 직불 카드의 레네덴 뷰라가 사라졌습니다. |
| 말라얄람어 | 이 회사는 귀하의 회사입니다. 그렇습니다. | എൻ่റെ സേവിംഗ้സ่ അക่കൗണ่ടിലെ നിലവിലെ തുക അറിയാൻ 감사합니다. | 당신이 원하는 것을 찾을 수 있습니다. 다른 점은 무엇입니까? | 우리는 당신의 선택을 환영합니다. |
| 텔루구어 | 우리는 다음과 같은 일을 할 것입니다. ించండి | 우리는 당신이 원하는 것을 얻을 수 있도록 도와줍니다. 그래서 당신은 그것을 알고 있습니다. | 우리는 다음과 같은 일을 할 것입니다. 왜? | 우리는 당신이 원하는 것을 찾을 수 있도록 도와줄 것입니다. 그래서. |
| 방글라어 | 당신은 당신의 친구가 될 것입니다. 당신은 | 당신은 당신의 친구가 될 것입니다 그건 그렇고. | 당신은 당신의 생각을 알고 있습니다. 무슨 일이 일어나고 있나요? | 그것은 당신의 생각입니다. |
| 마라타어 | Sumatri la घARA CHA CENTY RENT CY DOON Hazar A Sun Rupye Chukwa | 몰라 마이에 보셨죠? | 그럼 레이지 파슨틴이 그래서 루피 망구가 이머전시 사이에 있는 건가요? | Mala Maay 직불 카드는 Cha Lene Dena입니다. |
결과
Shaip이 제공한 고품질의 다양한 오디오 데이터를 통해 클라이언트는 다양한 방언, 환경 및 맥락에서 명령을 인식할 수 있는 AI 기반 음성 기반 UPI 결제 시스템을 개발할 수 있었습니다. 이 데이터는 다음을 향상시키는 데 도움이 되었습니다.
- 실시간 음성인식 복잡한 환경에서.
- 더욱 정확한 UPI 거래 더 광범위한 사용자를 처리할 수 있습니다.
- 확장성: 이 프로젝트는 다른 인도 언어로 확장하기 위한 강력한 기반을 마련해 줍니다.
산출물
- 200 시간 오디오 파일(8kHz PCM WAV 포맷, 모노)
- 87,000+ 고유한 의도로 주석이 달린 다양한 프롬프트
- 메타 데이터 : 스피커 프로필, 환경 세부 정보 및 필사 정확도
Shaip은 독특한 프롬프트와 진정한 오디오 녹음을 통해 인도의 다양성을 포착하는 능력이 음성 기반 UPI 결제 시스템의 게임 체인저였습니다. 그들의 팀은 프롬프트 생성에서 녹음 품질에 이르기까지 프로젝트의 모든 측면이 정밀하게 처리되도록 보장하여 보다 포괄적이고 강력한 음성 인식 모델을 구축하는 데 도움이 되었습니다.