의료 분야의 고급 AI/ML 애플리케이션을 위한 DICOM 의료 영상 데이터 세트
익명 처리됨 DICOM 이미지 데이터 세트 메타데이터가 보존되고 선택적으로 방사선 검사 보고서도 포함되어 모델 학습, 검증 및 임상 연구를 가속화합니다.
실제 AI 환경에 최적화된 DICOM 영상 데이터
Shaip은 AI 지원 기능을 제공합니다. DICOM 의료 영상 데이터 세트 이 플랫폼은 의료 AI 팀이 임상적 가치를 보존하는 익명화된 데이터를 사용하여 진단, 분류 및 의사 결정 지원을 위한 견고한 모델을 구축, 학습 및 검증할 수 있도록 설계되었습니다.
데이터셋 스냅샷
- 총 연구 수:10M +
- (연구 결과 기준) 주요 지역: 미국, 브라질, 인도
- 표현된 양식: CR, CT, US, DX, MR, MG, OT, RF, NM, 유방촬영술
- 표현된 신체 부위: 가슴, 복부, 머리, 척추, 목, 심장 등
DICOM 이미지 데이터 세트의 일반적인 사용 사례

진단 영상 AI 모델 학습
- 이상 감지
- 질병 분류
- 심각도 점수/단계 분류
- 환자 분류 우선순위
- 다중 모달리티 개발을 지원합니다.

모델 성능 검증 및 벤치마킹
- 더 넓은 모집단을 대상으로 모델 정확도를 평가합니다.
- 측정 방식/신체 부위별 벤치마크 성능
- 과적합을 줄이기 위해 외부 검증을 실행하세요.

다양한 기기와 사이트에서 모델의 안정성을 향상시키세요.
- 다양한 스캐너/제조사에 걸쳐 일반화 테스트를 수행합니다.
- 신규 병원에 배포 시 성능 저하를 줄입니다.

이미지와 영상 보고서를 결합한 멀티모달 AI 구축
- 보고서 언어에서 약한 레이블을 도출합니다.
- 보고서 내용에 맞춰 훈련 모델을 조정하세요.
- 보고서 기반 분류 및 의사 결정 지원 시스템 구축

임상 연구 및 코호트 생성
- 시술 방식/신체 부위/시간별로 코호트를 필터링하세요
- 후향적 연구를 지원합니다.
- 개인정보 보호를 유지하면서 가설 검증 속도를 높이세요

머신러닝 학습을 위한 어노테이션 및 정답 데이터 생성
- 분류 태그
- 경계 상자
- 분할 마스크
DICOM 이미지 데이터 세트에서 받는 내용
1. DICOM 픽셀 데이터(이미지)
모든 이미지는 픽셀 수준에서 개인 식별 정보가 제거됩니다.
- 이미지의 텍스트는 삭제되거나 가명으로 처리되었습니다.
- 얼굴 복원이 가능한 경우(예: 고해상도 CT) "얼굴 변형 제거" 과정에서 인공물이 발생할 수 있습니다.
3. 연구 보고서 (선택 사항, 가능한 경우)
방사선 전문의/의사가 작성한 비정형 서술형 텍스트이며, 세이프 하버 익명화 및 동일한 날짜 이동 방식이 적용되었습니다.
2. DICOM 메타데이터(세이프 하버 포함)
모든 표준 DICOM 메타데이터는 전송을 위해 보존되는 반면, HIPAA 안전항 식별자는 익명화됩니다. 여기에는 다음이 포함됩니다.
- 환자 이름은 환자 ID로 대체됩니다.
- 환자 ID는 암호화 방식으로 해시 처리됩니다.
- 기관명이 다른 이름으로 대체되었습니다.
- 365일 이내에 날짜가 변경되었습니다(환자 수준에서 일관된 변경).
4. 사용자 지정 메타데이터 (선택적 부가 가치)
선택적으로 파생된 메타데이터에는 다음이 포함될 수 있습니다.
- 분석된 환자 나이
- SNOMED 태그(보고서에서 발췌)
- 긍정적인 요소(보고서 기준)
- 거주 국가 (주소 기준)
- 추정 인종/추정 민족(파생 필드)
개인정보 보호를 최우선으로 고려한 DICOM 비식별화 방법
이 데이터 세트는 HIPAA를 준수하면서 임상적 유용성을 유지하고 민감한 데이터를 보호하기 위해 암호화 해싱 및 가명화를 사용합니다.
픽셀 수준 보호
새겨진 글자를 수정/가명 처리하고 필요한 경우 훼손된 부분을 제거합니다.
메타데이터 보호
세이프 하버 식별자는 익명화되는 반면, 표준 DICOM 메타데이터는 유지됩니다.
날짜 이동
연구 간 시간적 관계를 유지하기 위해 환자 수준에서 날짜를 365일 범위 내에서 조정합니다.
인구통계학적 바닥재
특정 필드는 재식별 위험을 줄이기 위해 상한값/최소값으로 제한됩니다(예: 나이, 몸무게, 키, 일부 인종 값).
찾고 있는 것을 찾을 수 없습니까?
모든 데이터 유형에서 새로운 기성 의료 데이터 세트가 수집되고 있습니다.
헬스케어 트레이닝 데이터 수집 고민은 지금 바로 연락주세요
자주 묻는 질문 (FAQ)
1. DICOM 이미지 데이터셋이란 무엇인가요?
DICOM 이미지 데이터 세트는 픽셀 데이터와 임상 메타데이터를 포함하여 DICOM 표준으로 저장된 의료 영상 연구 모음으로, 일반적으로 의료 AI 모델을 학습하고 검증하는 데 사용됩니다.
2. 이 DICOM 이미지 데이터 세트에는 무엇이 포함되어 있습니까?
라이선스 범위에 따라 DICOM 픽셀 데이터, 보존된(익명 처리된) DICOM 메타데이터, 선택적 연구 보고서 및 선택적 부가 가치 사용자 지정 메타데이터가 포함될 수 있습니다.
3. 이미지에서 개인 식별 정보가 제거되었습니까?
네. 이미지는 픽셀 수준에서 개인 식별 정보가 제거되며, 이미지에 포함된 텍스트는 수정/가명 처리되고 필요한 경우 훼손 처리됩니다.
4. DICOM 메타데이터는 보존됩니까?
표준 DICOM 메타데이터는 전송을 위해 보존되는 반면, HIPAA 안전항 식별자(예: 환자/기관 식별자 및 날짜)는 익명화됩니다.
5. 날짜는 어떻게 처리되나요?
연구 간 상대적 시점을 유지하기 위해 환자 수준에서 일관되게 적용되는 날짜는 365일 내에서 조정할 수 있습니다.
6. 방사선/검사 보고서가 포함되어 있습니까?
이용 가능하고 라이선스가 있는 경우, 연구 보고서(정형화되지 않은 서술형 텍스트)를 식별 정보를 가명으로 처리하여 포함할 수 있습니다.
7. 어떤 사용자 지정 메타데이터를 사용할 수 있나요?
옵션에는 구문 분석된 환자 연령, SNOMED 태그, 긍정 개체, 거주 국가 및 기타 파생 필드가 포함될 수 있습니다.
8. 특정 코호트(검사 방식, 신체 부위, 지역 등)를 요청할 수 있나요?
네, 목표 범위와 필터를 알려주시면 Shaip이 사용 가능한 데이터셋을 기반으로 가장 적합한 데이터셋 조각을 제안해 드립니다.
9. 데이터셋 라이선스는 어떻게 취득하나요?
문의 양식을 통해 요구사항을 제출해 주세요. 저희 팀에서 가능 여부, 범위, 라이선스 조건 및 제공 옵션을 확인해 드리겠습니다.