AI 및 ML 모델을 위한 고품질 의료/의료 데이터 라이선스

의료 AI 프로젝트를 시작하기 위한 기성 의료/의료 데이터 세트

의료 데이터 카탈로그

기계 학습을 위한 의료 및 의료 데이터 세트

의사 받아쓰기 오디오 데이터

의료를 위한 익명화된 데이터 세트에는 의사가 임상 환경에서 의사-환자 접촉을 바탕으로 환자의 임상 상태와 치료 계획을 설명하는 31개 전문 분야의 오디오 파일이 포함되어 있습니다.

기성 의사 받아쓰기 오디오 파일:

  • 257,977개 전문 분야의 31시간 분량의 실제 의사 받아쓰기 음성 데이터 세트를 사용하여 의료 음성 모델을 훈련합니다.
  • 전화 받아쓰기(54.3%), 디지털 녹음기(24.9%), 음성 마이크(5.4%), 스마트폰(2.7%) 및 알 수 없음(12.7%)과 같은 다양한 장치에서 캡처한 받아쓰기 오디오
  • HIPAA에 따라 세이프 하버 지침을 준수하는 PII 수정 오디오 및 대본
의사 받아쓰기 오디오 데이터

필사본 의료 기록

의료 기록 필사란 의사와 환자 간의 대화, 진료 기록, 그리고 의료 평가 내용을 필사하는 것을 말합니다. 이는 향후 진료를 위해 환자의 병력을 체계적으로 정리하는 데 도움이 되며, 의사에게 참고 자료로 활용됩니다. 환자의 현재 상태를 평가하고 적절한 치료를 제안하는 데에도 도움이 됩니다.

기성 필사 의료 기록:

  • 257,977개 전문 분야의 실제 의사 받아쓰기 31시간을 전사하여 Healthcare Speech 모델 훈련
  • 수술 보고서, 퇴원 요약, 진료 기록, 입원 기록, ED 기록, 진료 기록, 방사선 보고서 등 다양한 업무 유형의 의무 기록
  • HIPAA에 따라 세이프 하버 지침을 준수하는 PII 수정 오디오 및 대본
필사본 의료 기록

전자 건강 기록(EHR)

전자 건강 기록 또는 EHR은 환자의 병력, 진단, 처방, 치료 계획, 예방 접종 또는 예방 접종 날짜, 알레르기, 방사선 영상(CT 스캔, MRI, X-레이) 및 실험실 검사 등이 포함된 의료 기록입니다.

기성 전자 건강 기록(EHR):

  • 5.1개 전문 분야의 31백만 개 이상의 기록 및 의사 오디오 파일
  • Clinical NLP 및 기타 Document AI 모델을 훈련하기 위한 실제 세계 표준 의료 기록
  • MRN(익명), 입원 날짜, 퇴원 날짜, 체류 기간, 성별, 환자 등급, 지불인, 재정 등급, 주, 퇴원 처분, 연령, DRG, DRG 설명, $ 환급, AMLOS, GMLOS, 위험 사망률, 질병의 심각도, 그루퍼, 병원 우편번호 등
  • 다양한 미국 주 및 지역의 의료 기록 - 북동부(46%), 남부(9%), 중서부(3%), 서부(28%), 기타(14%)
  • 입원 환자, 외래 환자(임상, 재활, 반복, 외과 데이 케어), 응급 등 모든 환자 클래스에 속하는 의료 기록.
전자 건강 기록(EHR)
  • 모든 환자 연령 그룹에 속하는 의료 기록 10세 미만(7.9%), 11~20세(5.7%), 21~30세(10.9%), 31~40세(11.7%), 41~50세(10.4%) ), 51-60세(13.8%), 61-70세(16.1%), 71-80세(13.3%), 81-90세(7.8%), 90세 이상(2.4%)
  • 환자 성별 비율 46%(남성) 및 54%(여성)
  • HIPAA에 따라 세이프 하버 지침을 준수하는 PII 수정 문서
샤이프 연락처

찾고 있는 것을 찾을 수 없습니까?

모든 데이터 유형에서 새로운 기성 의료 데이터 세트가 수집되고 있습니다. 

헬스케어 트레이닝 데이터 수집 고민은 지금 바로 연락주세요

  • 등록함으로써 Shaip에 동의합니다. 개인정보 처리방침 서비스약관 그리고 Shaip의 B2B 마케팅 커뮤니케이션 수신에 동의합니다.

의료 데이터 세트에는 의사의 받아쓰기, 필사 기록, EHR, 의료 영상(CT, MRI, X선) 등의 의료 데이터가 포함되며, AI 모델을 훈련하는 데 사용됩니다.

네, 데이터 세트는 HIPAA 및 GDPR과 같은 의료 규정을 준수하여 안전하고 윤리적인 데이터 사용을 보장합니다.

네, 데이터 세트는 특정 전문 분야, 인구 통계, 데이터 형식 및 프로젝트 요구 사항에 따라 맞춤화될 수 있습니다.

데이터는 정확성과 신뢰성을 보장하기 위해 도메인 전문가의 주석 처리를 포함한 엄격한 품질 검사를 거칩니다. 각 데이터 세트는 최고 수준의 요건을 충족하도록 설계되었습니다.

네, 데이터 세트는 수백만 개의 레코드나 수 시간 분량의 오디오를 포함하여 소규모 및 대규모 프로젝트 요구 사항을 모두 충족하도록 확장 가능합니다.

네, 데이터 세트는 기존 AI 및 ML 워크플로와 원활하게 통합할 수 있도록 즉시 사용 가능한 형식(예: JSON, CSV)으로 제공됩니다.

비용은 데이터세트 유형, 볼륨, 맞춤 설정, 제공 일정 등의 요인에 따라 달라집니다. 견적을 받으시려면 "문의하기" 양식을 작성해 주세요.

납품 일정은 프로젝트 복잡성과 데이터 세트 크기에 따라 다르지만, 프로젝트 마감일을 충족하도록 구성됩니다.

고품질 의료 데이터 세트는 AI 모델을 훈련하여 정확도를 높이고, 작업을 자동화하고, 의료 분야의 의사 결정을 개선하는 데 필수적입니다.