AI 및 ML 프로젝트를 위한 전자 건강 기록(EHR) 데이터 세트
의료 AI 프로젝트를 시작하기 위한 기성 전자 건강 기록(EHR) 데이터 세트.

오늘 누락된 데이터 소스를 연결하세요.
의료 AI에 적합한 전자 건강 기록(EHR) 데이터 찾기
동급 최강의 교육 데이터로 기계 학습 모델을 개선하세요. 전자 건강 기록 또는 EHR은 환자의 병력, 진단, 처방, 치료 계획, 예방 접종 또는 예방 접종 날짜, 알레르기, 방사선 영상(CT 스캔, MRI, X-레이) 및 실험실 검사 등이 포함된 의료 기록입니다. 기성품 데이터 카탈로그를 통해 신뢰할 수 있는 의료 교육 데이터를 쉽게 얻을 수 있습니다.
기성 전자 건강 기록(EHR):
- 5.1개 전문 분야의 31백만 개 이상의 기록 및 의사 오디오 파일
- Clinical NLP 및 기타 Document AI 모델을 훈련하기 위한 실제 세계 표준 의료 기록
- MRN(익명), 입원 날짜, 퇴원 날짜, 체류 기간, 성별, 환자 등급, 지불인, 재정 등급, 주, 퇴원 처분, 연령, DRG, DRG 설명, $ 환급, AMLOS, GMLOS, 위험 사망률, 질병의 심각도, 그루퍼, 병원 우편번호 등
- 다양한 미국 주 및 지역의 의료 기록 - 북동부(46%), 남부(9%), 중서부(3%), 서부(28%), 기타(14%)
- 입원 환자, 외래 환자(임상, 재활, 반복, 외과 데이 케어), 응급 등 모든 환자 클래스에 속하는 의료 기록.
- 모든 환자 연령 그룹에 속하는 의료 기록 10세 미만(7.9%), 11~20세(5.7%), 21~30세(10.9%), 31~40세(11.7%), 41~50세(10.4%) ), 51-60세(13.8%), 61-70세(16.1%), 71-80세(13.3%), 81-90세(7.8%), 90세 이상(2.4%)
- 환자 성별 비율 46%(남성) 및 54%(여성)
- HIPAA에 따라 세이프 하버 지침을 준수하는 PII 수정 문서
위치별 EHR 데이터
위치 | 텍스트 문서 |
---|---|
북동 | 4,473,573 |
남쪽 | 1,801,716 |
중서부 | 781,701 |
West | 1,509,109 |
주요 진단 범주별 EHR 데이터
주요 진단 범주별 EHR 데이터 | 텍스트 문서 |
---|---|
알코올/마약 사용 및 알코올/마약 유발성 기질성 정신 장애 | 48,717 |
모든 것을 포함한 합계(MDC 카테고리가 있는 케이스와 없는 케이스) | 8,566,687 |
환급이 없는 케이스가 생성됨(MDC가 지정되지 않음) | 790,697 |
외래 환자 사례(MDC 지정되지 않음) | 1,980,606 |
3M 등의 특수 그루퍼를 사용하는 경우(MDC 미지정) | 1,619,682 |
MDC 포함 합계 | 4,175,702 |
알코올/마약 사용 또는 유도된 정신 장애 | 48,717 |
화상 | 444 |
눈 | 3,549 |
남성 생식기 | 9,230 |
인간 면역 결핍 바이러스 감염 | 12,422 |
골수증식성 질환 및 장애, 미분화된 신생물 | 15,620 |
건강 상태 및 기타 건강 서비스 접촉에 영향을 미치는 요소 | 21,294 |
여성 생식기 | 17,010 |
귀, 코, 입 및 목 | 22,987 |
다발성 중대 외상 | 27,902 |
순환기 시스템 | 589,730 |
혈액, 혈액 형성 기관, 면역 장애 | 48,990 |
부상, 중독 및 약물의 독성 효과 | 64,097 |
피부, 피하 조직 및 유방 | 89,577 |
간담도계 및 췌장 | 127,172 |
내분비, 영양 및 대사 질환 및 장애 | 142,808 |
주산기에 기원한 상태를 가진 신생아 및 기타 신생아 | 163,605 |
임신, 출산 및 산욕기 | 165,303 |
신장 및 요로 | 209,561 |
정신 질환 및 장애 | 282,501 |
신경계 | 316,243 |
소화 시스템 | 346,369 |
근골격계 및 결합 조직 | 329,344 |
호흡계 | 561,983 |
감염 및 기생충 질환 | 559,244 |
우리는 텍스트, 오디오, 비디오 또는 이미지와 같은 모든 유형의 데이터 라이선스를 다룹니다. 데이터 세트는 ML용 의료 데이터 세트로 구성됩니다. 의사 받아쓰기 데이터 세트, 의사 임상 노트, 의료 대화 데이터 세트, 의료 전사 데이터 세트, 의사-환자 대화, 의료 텍스트 데이터, 의료 이미지 – CT 스캔, MRI, 초음파(수집된 기본 사용자 정의 요구 사항) .
찾고 있는 것을 찾을 수 없습니까?
모든 데이터 유형에서 새로운 기성 의료 데이터 세트가 수집되고 있습니다.
헬스케어 트레이닝 데이터 수집 고민은 지금 바로 연락주세요
자주 묻는 질문 (FAQ)
EHR(전자 건강 기록) 데이터는 환자의 의료 기록을 디지털로 기록한 것입니다. 진단, 치료, 검사 결과, 처방, 영상 데이터 등의 세부 정보가 포함됩니다.
EHR 데이터는 임상적 의사결정 지원, 질병 예측, 개인화된 치료 계획, 의료 자동화를 위한 AI 모델을 훈련하는 데 사용됩니다.
네, 모든 EHR 데이터는 개인 식별 정보(PII)를 제거하고 개인정보 보호 규정을 준수하기 위해 익명화됩니다.
EHR 데이터에는 환자 인구 통계, 병력, 진단, 치료 계획, 실험실 검사 결과, 방사선 이미지(예: CT, MRI, X선), 처방전 및 예방 접종 기록과 같은 세부 정보가 포함됩니다.
네, 데이터는 HIPAA, GDPR 및 기타 글로벌 개인정보 보호 표준을 준수하여 안전하고 윤리적인 사용을 보장합니다.
네, 데이터 세트는 특정 의료 전문 분야, 지역, 환자 인구 통계 또는 프로젝트 요구 사항에 따라 맞춤화될 수 있습니다.
네, 데이터 세트는 AI 및 ML 워크플로에 쉽게 통합할 수 있도록 표준 형식(예: JSON, CSV)으로 제공됩니다.
데이터는 정확성, 일관성, 신뢰성을 보장하기 위해 엄격한 검증과 품질 검사를 거칩니다.
비용은 데이터 양, 맞춤 설정, 프로젝트 범위 등의 요인에 따라 달라집니다. 최적의 견적을 받으시려면 "문의하기" 양식을 작성해 주세요.
납품 일정은 프로젝트 규모와 복잡성에 따라 다르지만 합의된 마감일을 충족하도록 설계되었습니다.
EHR 데이터 세트를 사용하면 AI 시스템이 더 나은 진단, 예측적 통찰력, 개인화된 치료를 제공하여 환자 결과와 의료 효율성을 개선할 수 있습니다.