ASR을 위한 종합 의료 대화

합성 헬스케어 대화를 통한 주변 기술 개발 활성화

주변 기술

임상 환경에서 수집 및 전사된 2000시간 이상의 오디오 데이터

빠르게 발전하는 대화형 AI 영역에서 주목할만한 애플리케이션 중 하나는 의료 부문입니다. 의료 부문에서는 기술을 활용하여 공급자와 환자의 상호 작용을 간소화합니다. 의료 기술 분야의 선두주자인 우리 고객은 임상 환경에서 다중 화자 대화를 더 잘 이해하고 기록할 수 있도록 ASR(자동 음성 인식) 모델을 향상해야 한다는 요구 사항으로 Shaip에 접근했습니다. 개인 정보 보호 규정으로 인해 실제 대화를 얻는 것이 어려웠습니다. 따라서 의료 서비스 제공자와 환자 간의 종합적이면서도 현실적인 상호 작용을 만들고 기록하는 것이 아이디어였습니다.

음량

2,000 시간 또는 대략 12,000 에 24,000 개별적인 합성 상호 작용 10 분의 평균 지속 시간입니다.

목표

우리의 주요 목표는 약 2,000시간의 오디오 녹음을 생성하여 성별, 연령, 억양 및 의학적 역할의 다양성을 구현하는 세심하게 제작된 12,000~24,000개의 합성 상호 작용으로 변환하는 것이었습니다. 실제 임상 대화를 모방하도록 설계된 이 포괄적이고 확실한 데이터 세트는 HIPAA와 같은 개인 정보 보호 규정을 엄격하게 준수하면서 생성되었습니다. 합성 상호 작용은 고객의 ASR 모델을 훈련하고 개선하는 데 중요한 역할을 하는 풍부한 데이터 세트 역할을 하여 임상 환경에서 실제 대화를 처리하는 능력을 크게 향상시켰습니다.

 

목표

도전

규제 준수

현실적이면서도 종합적인 의료 상호작용을 생성하는 동시에 HIPAA와 같은 개인정보 보호법을 준수하는 것은 어려울 수 있습니다.

규정 준수

데이터 신뢰성 및 다양성

다양한 시나리오, 억양, 연령 및 의학적 역할을 포괄하면서 실제 임상 대화를 정확하게 모방하는 합성 상호 작용을 만들려면 세심한 접근 방식과 심층적인 도메인 지식이 필요합니다.

데이터 신뢰성 및 다양성

품질 보증

목표한 95% WER(단어 정확도) 및 90% TER(태그 정확도)와 같은 높은 수준의 전사 정확도를 달성하려면 엄격한 품질 보증 프로세스가 필요합니다.

기술적 인 능력

녹음 및 전사 플랫폼을 포함한 기술 인프라가 데이터 양을 처리하고 품질을 유지할 수 있도록 보장하는 것은 중요한 과제입니다.

자원 모집 및 교육

역할극을 위해 의학적 배경을 가진 개인을 모집하고 자연스러운 대화 흐름을 유지하면서 현실적인 시나리오를 고수하도록 하는 것은 상당히 어려울 수 있습니다. 또한 엄격한 품질 지침을 준수하도록 전사 담당자를 교육하려면 상당한 노력과 전문 지식이 필요합니다.

접근 방식/솔루션

오디오 수집 및 녹음

  • 시나리오 생성: 고혈압, 당뇨병, 통증 관리 등 성인 가정의학 진료에서 직면하는 일반적이고 긴급하지 않은 상태를 반영하는 현실적인 시나리오를 개발했습니다.
  • 역할극: 제공된 시나리오를 준수하고 실제 임상 대화를 시뮬레이션하면서 의료 서비스 제공자 및 환자 역할을 수행할 의학적 배경을 가진 개인을 모집했습니다.
  • 녹음: 오디오 캡처를 위해 Shaip Work 모바일 앱을 활용하여 참가자들 사이에서 성별, 연령, 억양 및 직업적 배경 측면에서 다양한 표현을 보장했습니다.

검증 및 전사

  • 오디오 파일의 정확성과 품질을 보장하기 위해 검증 스크립트를 실행했습니다.
  • 전사는 제공된 특정 지침을 준수하고 정확한 분할을 통해 축어적 텍스트 전사를 보장하는 Bhasha 플랫폼에서 수행되었습니다.
  • 고객의 모델 교육 목적에 중요한 화자 ID, 연령, 성별, 모국어, 의료 교육/경험을 포함한 주석이 달린 메타데이터.

품질 보증

  • CQA 및 PMO의 포괄적인 품질 검사를 통해 전사 품질 목표인 WER(단어 정확도) 95%와 TER(태그 정확도) 90%를 보장했습니다.

데이터 전달

  • 명확하고 체계적인 방식으로 데이터를 구성하고 상세한 배치 노트 및 문화 디렉토리와 함께 배치로 전달했습니다.
  • 오디오 파일, 녹음본, 메타데이터를 포함한 모든 데이터가 클라이언트 사양에 따라 정확하게 레이블 지정되고 형식이 지정되었는지 확인했습니다.

피드백과 반복

결함을 식별하기 위해 클라이언트와 강력한 피드백 루프를 구축하여 수정이 이루어지고 완전하고 정확한 데이터 세트가 제공되도록 했습니다.

주요 성과

  • 2000시간에 달하는 합성 의료 상호작용을 성공적으로 수집하고 전사했습니다.
  • 놀라운 정확도로 신속하고 정확한 전사를 수행하여 ASR 모델을 향상시키려는 고객의 목표에 크게 기여합니다.
  • 품질과 정확성에 대한 세심한 접근 방식으로 대규모의 복잡한 프로젝트를 처리하는 Shaip의 능력을 입증했습니다.

결과

Shaip이 진행한 세심하게 실행된 프로젝트는 고객의 ASR 모델 향상에 크게 기여한 풍부한 데이터 세트를 생성했습니다. 합성 상호 작용은 임상 대화를 현실적으로 표현하여 고객이 의료 환경에 대해 보다 강력하고 안정적인 음성 서비스를 달성하도록 돕습니다. 체계적이고 잘 조율된 접근 방식을 통해 Shaip은 규정된 기간 내에 복잡한 프로젝트를 성공적으로 완료하여 의료 분야의 대규모 대화형 AI 프로젝트 관리에 대한 전문성을 강화했습니다.

Shaip과의 협력은 의료 분야의 주변 기술 및 대화형 AI 프로젝트를 크게 발전시켰습니다. 합성 의료 대화 작성 및 복사에 대한 전문 지식은 규제 문제를 극복하는 데 있어 합성 데이터의 잠재력을 보여주는 탄탄한 기반을 제공했습니다. Shaip을 통해 우리는 이러한 장애물을 극복했으며 이제 직관적인 의료 솔루션에 대한 비전 실현에 한 걸음 더 다가섰습니다.

골든-5성급

의료 AI 가속화
100% 애플리케이션 개발