AI 및 ML 프로젝트를 위한 전자 건강 기록(EHR) 데이터 세트
의료 AI 프로젝트를 시작하기 위한 기성 전자 건강 기록(EHR) 데이터 세트.
오늘 누락된 데이터 소스를 연결하세요.
의료 AI에 적합한 전자 건강 기록(EHR) 데이터 찾기
동급 최강의 교육 데이터로 기계 학습 모델을 개선하세요. 전자 건강 기록 또는 EHR은 환자의 병력, 진단, 처방, 치료 계획, 예방 접종 또는 예방 접종 날짜, 알레르기, 방사선 영상(CT 스캔, MRI, X-레이) 및 실험실 검사 등이 포함된 의료 기록입니다. 기성품 데이터 카탈로그를 통해 신뢰할 수 있는 의료 교육 데이터를 쉽게 얻을 수 있습니다.
기성 전자 건강 기록(EHR):
- 5.1개 전문 분야의 31백만 개 이상의 기록 및 의사 오디오 파일
- Clinical NLP 및 기타 Document AI 모델을 훈련하기 위한 실제 세계 표준 의료 기록
- MRN(익명), 입원 날짜, 퇴원 날짜, 체류 기간, 성별, 환자 등급, 지불인, 재정 등급, 주, 퇴원 처분, 연령, DRG, DRG 설명, $ 환급, AMLOS, GMLOS, 위험 사망률, 질병의 심각도, 그루퍼, 병원 우편번호 등
- 다양한 미국 주 및 지역의 의료 기록 - 북동부(46%), 남부(9%), 중서부(3%), 서부(28%), 기타(14%)
- 입원 환자, 외래 환자(임상, 재활, 반복, 외과 데이 케어), 응급 등 모든 환자 클래스에 속하는 의료 기록.
- 모든 환자 연령 그룹에 속하는 의료 기록 10세 미만(7.9%), 11~20세(5.7%), 21~30세(10.9%), 31~40세(11.7%), 41~50세(10.4%) ), 51-60세(13.8%), 61-70세(16.1%), 71-80세(13.3%), 81-90세(7.8%), 90세 이상(2.4%)
- 환자 성별 비율 46%(남성) 및 54%(여성)
- HIPAA에 따라 세이프 하버 지침을 준수하는 PII 수정 문서
위치별 EHR 데이터
위치 | 텍스트 문서 |
---|---|
북동 | 4,473,573 |
남쪽 | 1,801,716 |
중서부 | 781,701 |
West | 1,509,109 |
주요 진단 범주별 EHR 데이터
주요 진단 범주별 EHR 데이터 | 텍스트 문서 |
---|---|
알코올/마약 사용 및 알코올/마약 유발성 기질성 정신 장애 | 48,717 |
모든 것을 포함한 합계(MDC 카테고리가 있는 케이스와 없는 케이스) | 8,566,687 |
환급이 없는 케이스가 생성됨(MDC가 지정되지 않음) | 790,697 |
외래 환자 사례(MDC 지정되지 않음) | 1,980,606 |
3M 등의 특수 그루퍼를 사용하는 경우(MDC 미지정) | 1,619,682 |
MDC 포함 합계 | 4,175,702 |
알코올/마약 사용 또는 유도된 정신 장애 | 48,717 |
화상 | 444 |
눈 | 3,549 |
남성 생식기 | 9,230 |
인간 면역 결핍 바이러스 감염 | 12,422 |
골수증식성 질환 및 장애, 미분화된 신생물 | 15,620 |
건강 상태 및 기타 건강 서비스 접촉에 영향을 미치는 요소 | 21,294 |
여성 생식기 | 17,010 |
귀, 코, 입 및 목 | 22,987 |
다발성 중대 외상 | 27,902 |
순환기 시스템 | 589,730 |
혈액, 혈액 형성 기관, 면역 장애 | 48,990 |
부상, 중독 및 약물의 독성 효과 | 64,097 |
피부, 피하 조직 및 유방 | 89,577 |
간담도계 및 췌장 | 127,172 |
내분비, 영양 및 대사 질환 및 장애 | 142,808 |
주산기에 기원한 상태를 가진 신생아 및 기타 신생아 | 163,605 |
임신, 출산 및 산욕기 | 165,303 |
신장 및 요로 | 209,561 |
정신 질환 및 장애 | 282,501 |
신경계 | 316,243 |
소화 시스템 | 346,369 |
근골격계 및 결합 조직 | 329,344 |
호흡계 | 561,983 |
감염 및 기생충 질환 | 559,244 |
우리는 텍스트, 오디오, 비디오 또는 이미지와 같은 모든 유형의 데이터 라이선스를 다룹니다. 데이터 세트는 ML용 의료 데이터 세트로 구성됩니다. 의사 받아쓰기 데이터 세트, 의사 임상 노트, 의료 대화 데이터 세트, 의료 전사 데이터 세트, 의사-환자 대화, 의료 텍스트 데이터, 의료 이미지 – CT 스캔, MRI, 초음파(수집된 기본 사용자 정의 요구 사항) .
찾고 있는 것을 찾을 수 없습니까?
모든 데이터 유형에서 새로운 기성 의료 데이터 세트가 수집되고 있습니다.
헬스케어 트레이닝 데이터 수집 고민은 지금 바로 연락주세요
자주 묻는 질문 (FAQ)
EHR 데이터는 시간이 지남에 따라 의료 전문가가 관리하는 치료, 의료 검사 및 기타 건강 관련 정보를 포함하는 환자 의료 기록의 디지털 버전을 나타냅니다.
EMR(Electronic Medical Record)에는 한 진료소에서 수집한 표준 의료 데이터가 포함되어 있습니다. EHR(Electronic Health Record)은 EMR을 포함하는 광범위한 시스템이지만 다양한 의료 제공자의 데이터를 통합하여 보다 포괄적인 환자 기록을 제공합니다.
EHR 데이터는 실험실 결과, 이미징 시스템 및 기타 진단 도구에서 환자 방문 중 의료 전문가의 디지털 입력을 통해 수집됩니다. 그런 다음 EHR 시스템에 전자적으로 저장됩니다.
EHR 데이터는 시간이 지남에 따라 환자 치료를 추적하고, 의사 결정에서 의료 제공자를 지원하고, 청구 프로세스를 용이하게 하고, 연구를 지원하고, 전반적인 환자 치료 품질 및 결과를 개선하는 데 사용됩니다.
EHR 데이터 구매에는 엄격한 개인 정보 보호 및 규제 고려 사항이 포함됩니다. 일반적으로 개별 환자 기록을 직접 구매할 수 없습니다. 그러나 집계 및 비식별화된 데이터 세트는 적절한 윤리 및 법적 지침에 따라 연구 기관, 데이터 브로커 또는 당사와 같은 전문 의료 데이터 공급업체에서 사용할 수 있습니다.