기계 학습을 위한 의료 및 의료 데이터 세트
의사 받아쓰기 오디오 데이터
의료를 위한 익명화된 데이터 세트에는 의사가 임상 환경에서 의사-환자 접촉을 바탕으로 환자의 임상 상태와 치료 계획을 설명하는 31개 전문 분야의 오디오 파일이 포함되어 있습니다.
기성 의사 받아쓰기 오디오 파일:
- 257,977개 전문 분야의 31시간 분량의 실제 의사 받아쓰기 음성 데이터 세트를 사용하여 의료 음성 모델을 훈련합니다.
- 전화 받아쓰기(54.3%), 디지털 녹음기(24.9%), 음성 마이크(5.4%), 스마트폰(2.7%) 및 알 수 없음(12.7%)과 같은 다양한 장치에서 캡처한 받아쓰기 오디오
- HIPAA에 따라 세이프 하버 지침을 준수하는 PII 수정 오디오 및 대본
필사본 의료 기록
의료 기록 필사란 의사와 환자 간의 대화, 진료 기록, 그리고 의료 평가 내용을 필사하는 것을 말합니다. 이는 향후 진료를 위해 환자의 병력을 체계적으로 정리하는 데 도움이 되며, 의사에게 참고 자료로 활용됩니다. 환자의 현재 상태를 평가하고 적절한 치료를 제안하는 데에도 도움이 됩니다.
기성 필사 의료 기록:
- 257,977개 전문 분야의 실제 의사 받아쓰기 31시간을 전사하여 Healthcare Speech 모델 훈련
- 수술 보고서, 퇴원 요약, 진료 기록, 입원 기록, ED 기록, 진료 기록, 방사선 보고서 등 다양한 업무 유형의 의무 기록
- HIPAA에 따라 세이프 하버 지침을 준수하는 PII 수정 오디오 및 대본
전자 건강 기록(EHR)
전자 건강 기록 또는 EHR은 환자의 병력, 진단, 처방, 치료 계획, 예방 접종 또는 예방 접종 날짜, 알레르기, 방사선 영상(CT 스캔, MRI, X-레이) 및 실험실 검사 등이 포함된 의료 기록입니다.
기성 전자 건강 기록(EHR):
- 5.1개 전문 분야의 31백만 개 이상의 기록 및 의사 오디오 파일
- Clinical NLP 및 기타 Document AI 모델을 훈련하기 위한 실제 세계 표준 의료 기록
- MRN(익명), 입원 날짜, 퇴원 날짜, 체류 기간, 성별, 환자 등급, 지불인, 재정 등급, 주, 퇴원 처분, 연령, DRG, DRG 설명, $ 환급, AMLOS, GMLOS, 위험 사망률, 질병의 심각도, 그루퍼, 병원 우편번호 등
- 다양한 미국 주 및 지역의 의료 기록 - 북동부(46%), 남부(9%), 중서부(3%), 서부(28%), 기타(14%)
- 입원 환자, 외래 환자(임상, 재활, 반복, 외과 데이 케어), 응급 등 모든 환자 클래스에 속하는 의료 기록.
- 모든 환자 연령 그룹에 속하는 의료 기록 10세 미만(7.9%), 11~20세(5.7%), 21~30세(10.9%), 31~40세(11.7%), 41~50세(10.4%) ), 51-60세(13.8%), 61-70세(16.1%), 71-80세(13.3%), 81-90세(7.8%), 90세 이상(2.4%)
- 환자 성별 비율 46%(남성) 및 54%(여성)
- HIPAA에 따라 세이프 하버 지침을 준수하는 PII 수정 문서
찾고 있는 것을 찾을 수 없습니까?
모든 데이터 유형에서 새로운 기성 의료 데이터 세트가 수집되고 있습니다.
헬스케어 트레이닝 데이터 수집 고민은 지금 바로 연락주세요
자주 묻는 질문 (FAQ)
1. 의료 데이터세트란 무엇인가요?
의료 데이터 세트에는 의사의 받아쓰기, 필사 기록, EHR, 의료 영상(CT, MRI, X선) 등의 의료 데이터가 포함되며, AI 모델을 훈련하는 데 사용됩니다.
2. 데이터가 의료 규정을 준수합니까?
네, 데이터 세트는 HIPAA 및 GDPR과 같은 의료 규정을 준수하여 안전하고 윤리적인 데이터 사용을 보장합니다.
3. 데이터 세트를 특정 요구 사항에 맞게 사용자 지정할 수 있습니까?
네, 데이터 세트는 특정 전문 분야, 인구 통계, 데이터 형식 및 프로젝트 요구 사항에 따라 맞춤화될 수 있습니다.
4. 이러한 데이터 세트에 대한 품질 보증은 어떻게 이루어집니까?
데이터는 정확성과 신뢰성을 보장하기 위해 도메인 전문가의 주석 처리를 포함한 엄격한 품질 검사를 거칩니다. 각 데이터 세트는 최고 수준의 요건을 충족하도록 설계되었습니다.
5. 이러한 데이터 세트는 대규모 AI/ML 프로젝트에 맞게 확장 가능합니까?
네, 데이터 세트는 수백만 개의 레코드나 수 시간 분량의 오디오를 포함하여 소규모 및 대규모 프로젝트 요구 사항을 모두 충족하도록 확장 가능합니다.
6. 이러한 데이터 세트를 기존 AI 모델에 통합할 수 있나요?
네, 데이터 세트는 기존 AI 및 ML 워크플로와 원활하게 통합할 수 있도록 즉시 사용 가능한 형식(예: JSON, CSV)으로 제공됩니다.
7. 의료 데이터 세트의 비용은 얼마입니까?
비용은 데이터세트 유형, 볼륨, 맞춤 설정, 제공 일정 등의 요인에 따라 달라집니다. 견적을 받으시려면 "문의하기" 양식을 작성해 주세요.
8. 데이터 세트를 전달하는 데 얼마나 걸리나요?
납품 일정은 프로젝트 복잡성과 데이터 세트 크기에 따라 다르지만, 프로젝트 마감일을 충족하도록 구성됩니다.
9. AI/ML에 있어 의료 데이터 세트가 중요한 이유는 무엇입니까?
고품질 의료 데이터 세트는 AI 모델을 훈련하여 정확도를 높이고, 작업을 자동화하고, 의료 분야의 의사 결정을 개선하는 데 필수적입니다.