사례 연구: 대화형 AI

종양학 데이터 정밀성: NLP 모델 혁신을 위한 라이선스, 비식별화 및 주석

최첨단 NLP 기술로 암 치료에 혁신을 가져오세요.

종양학 NLP 개발

사업 개요

의료 산업의 주요 업체인 고객은 상당한 양의 종양학 의료 기록을 처리하기 위해 고급 NLP 솔루션이 필요했습니다. 종양학 연구를 개선하기 위한 중추적 계획의 일환으로 상세한 데이터 분석과 엄격한 개인 정보 보호 표준의 균형을 맞추는 것이 무엇보다 중요합니다. 이 사례 연구에서는 HIPAA가 제공하는 규제 프레임워크 내에서 고품질 데이터 주석, 엄격한 비식별화 관행 및 자연어 처리(NLP) 기술 적용을 통해 고객의 연구 노력을 향상시키는 데 대한 우리의 기여를 간략하게 설명합니다.

종양학 NLP 개발

주요 통계

데이터 라이선스
+ 데이터 삭제

10,000 페이지

비종양학
도메인

10,000 페이지

종양학
도메인

10,000 페이지

종양학
관계

4500 페이지

부정

9000 페이지

NER + 관계
매핑

1223 페이지

도전

이 프로젝트에는 HIPAA 규정에 따라 환자의 개인 정보를 보호하는 보안 프레임워크 내에서 임상 문서에 대한 미묘한 이해, 의료 기관의 정확한 식별, 부정 라벨을 정확하게 적용할 수 있는 기능이 모두 필요했습니다. 이를 위해서는 대량의 복잡한 데이터를 처리하는 데 필요한 기술적 전문성뿐만 아니라 주석 프로세스의 모든 단계에서 피드백을 통합하고 품질을 유지하기 위한 전략적 접근 방식도 필요했습니다.

서비스에 대한 자세한 설명:

  • 포괄적인 임상 데이터 범위: 다양한 유형의 진료 기록, 치료 환경, 종양학 하위 전문 분야에 걸쳐 다양한 임상 시나리오를 반영하는 강력한 데이터 세트를 보장합니다.
  • 엄격한 익명화: HIPAA의 세이프 하버(Safe Harbor) 방법을 준수하여 라벨이 붙은 모든 기록을 식별 해제하여 데이터 개인 정보 보호 및 보안에 대한 고객의 신뢰를 보장합니다.
  • 주석 지침: HIPAA 표준에 따라 라벨 기록을 준비하기 위한 표준 데이터 주석 지침을 만들고 구현합니다.
  • 고급 주석 기술: 10,000페이지 분량의 종양학 관련 기록에 NLP를 적용하여, 기존 가이드라인에 따라 부정 상태와 기타 관련 세부 정보를 복잡하게 분류합니다.
  • 엄격한 품질 보증: 지침에 명시된 특정 품질 기준을 달성합니다.

해법

우리의 접근 방식에는 다음과 같은 주요 전략이 포함되었습니다.

포괄적인 임상 데이터 범위

클라이언트의 특정 요구 사항에 맞게 데이터 세트를 조정하기 위해 Shaip의 5만 개가 넘는 전자 건강 기록 저장소에서 타겟팅된 데이터 선택이 세심하게 추출되었습니다. 이 큐레이팅된 데이터 세트는 다양한 유형의 메모와 치료 설정을 포괄하여 풍부하고 다양한
임상 시나리오의 스펙트럼. 이를 통해 포괄적일 뿐만 아니라 실제 의료 데이터를 매우 잘 나타내는 데이터 세트를 보장합니다.

엄격한 비식별화

이 프로세스는 비식별화를 위한 HIPAA의 세이프 하버(Safe Harbor) 방법을 엄격하게 준수하여 데이터 개인 정보 보호 및 보안에 대한 고객의 신뢰를 보장합니다. 여기에는 모든 보호 건강 정보(PHI)를 제거하고 라벨이 붙은 자리 표시자로 교체하여 환자의 기밀을 보호하는 동시에 데이터의 유용성을 유지하는 것이 포함됩니다.

비식별화 변수

카테고리 하위 카테고리
이름환자명, 의사명, 전문간호사명, 가족명, 의료기관명, 진료소명, 요양원명, 회사명, 대학명
연령 
날짜날짜 패턴, 월 연도 패턴, 일 월 패턴, 일 연도 패턴, 일, 월, 연도, 계절
오시는 길 국가, 주, 도시, 거리, 우편번호, 방 번호, 호실 번호, 층 번호
ID주민등록번호, 의료기록번호, 건강보험 수혜자번호, 계좌번호, 증명서/면허번호, 생체인식 ID, 기록 ID, 접수번호, 차량식별번호, 번호판 번호, 장치 식별자 및 일련번호
문의하기전화번호, 팩스번호, 이메일 주소, 웹 URL, IP 주소

예:

25년 2106월 11일 오전 00시에 90세의 Harry Pace 씨는 예정된 고관절 수술을 위해 포레스트 종합병원에 입원했으며, 이전에 주치의인 Jose Martin 박사의 상담을 받고 Kendra Reith가 참석했습니다. MD. 머무는 동안 그는 NP의 Mary Hu와 RN의 Suzan Ray의 보살핌을 받았으며 PA의 R. Charles Melancon도 상담을 받았습니다. 입원 당일 수술은 별다른 합병증 없이 성공적으로 진행됐다. 수술 후 Mr. Pace는 회복을 위해 202층 2호실로 이송되었습니다. 그의 아내 Emma Pace가 행사 내내 참석하여 필요한 모든 업데이트를 제공받았습니다. 짧은 체류 기간 동안 MRN MR99062619 및 계정 KV000014764를 포함한 그의 의료 기록은 이전 거주지인 Gracewood Nursing Home의 표준 프로토콜에 따라 처리되었습니다. 그는 추가 회복을 위해 같은 날 오클랜드 외래환자 진료소로 퇴원했습니다. 프로세스 전반에 걸쳐 모든 절차는 기밀 유지 표준을 준수하여 문서화되고 보호되었습니다.

예: 익명화됨

On [날짜 패턴], 오전 11시, Mr. [환자 이름], 노인 [나이], 입학했다 [의료기관명] 예정된 고관절 수술을 위해 이전에 그의 주치의인 Dr. [의사 이름], 그리고 참석 [의사 이름] MD. 머무는 동안 그는 보살핌을 받았다. [간호사], NP 및 [간호사], RN, 와 함께 [의사 이름], PA도 상담을 받았습니다. 입원 당일에 시행한 그의 수술은 성공적이었으며 합병증은 보고되지 않았습니다. 수술 후, Mr. [환자 이름] XNUMX호실로 옮겨졌습니다. [객실번호], 층수 [층번호], 회복을 위해. 그의 아내, [가족 이름], 내내 존재했고 필요한 모든 업데이트를 제공받았습니다. 짧은 체류 기간 동안 MRN을 포함한 그의 의료 기록 [의료기록번호] 및 계정 [계좌 번호], 표준 프로토콜에 따라 처리되었습니다. [요양원 이름], 그의 이전 거주지. 그는 같은 날 늦게 퇴원하여 치료를 받았습니다. [클리닉명] 추가 회복을 위해. 프로세스 전반에 걸쳐 모든 절차는 기밀 유지 표준을 준수하여 문서화되고 보호되었습니다.

주석 지침 및 고급 주석 기술

Shaip은 모든 레이블이 지정된 기록이 일관되게 준비되고 HIPAA 표준을 준수하도록 보장하는 표준 데이터 주석 지침을 수립하고 구현하는 데 중요한 역할을 했습니다. 또한 다양한 의료 기록의 10,000페이지에 세심하게 주석이 달렸으며,
부정 상태 및 다양한 종양학 하위 전문 분야를 포함한 기타 임상적으로 관련된 엔터티의 자세한 라벨링에 중점을 둡니다. 주석은 종양학 및 데이터 프라이버시 규정에 대한 전문 지식을 갖춘 전문가 주석자 팀에 의해 수행되었습니다.

복잡한 주석

카테고리 하위 카테고리
날짜
주석
(종양학)
진단 날짜, 단계 날짜, 발병, 시술 날짜, 약물 시작 날짜, 약물 종료 날짜
방사선 시작 날짜, 방사선 종료 날짜
질병
(종양학)
암 문제, 조직학, 임상 상태, 신체 부위, 행동, 등급, 암 병기, TNM 병기, 종양 표지자 검사, 치수, 코드
치료
(종양학)
암약, 약물복용량, 빈도, 암수술, 수술결과, 방사선요법, 방사선량
유전체학변이 코드, 유전자 연구, 방법, 표본
부정부정, 부정 가능, 불확실, 긍정 가능
임상 NER
관계
암 문제 - 신체 부위, 조직학 - 신체 부위, 행동 - 신체 부위, 암 수술 - 신체 부위, 방사선 조사 방식 - 신체 부위, 조직학 - 등급, 암 문제 - 차원

예:

종양학 임상 노트 설명

종양학 임상 노트 설명

“환자 Jane Doe는 03년 05월 2023일에 IIIB기 비소세포폐암(NSCLC), 특히 선암종 진단을 받았습니다. 암은 폐의 오른쪽 하엽에 위치합니다. 이는 TNM 병기 결정 시스템에 따라 T3N2M0으로 분류되며 종양 크기는 5cm x 3cm입니다. EGFR 엑손 19 결실은 종양 생검 표본의 PCR 분석을 통해 확인되었습니다. Carboplatin AUC 5 및 Pemetrexed 500mg/m²를 사용한 화학요법은 03년 20월 2023일에 시작되었으며 3주마다 투여될 예정입니다. 60분할로 30Gy 용량의 외부 빔 방사선 치료(EBRT)가 04년 01월 2023일에 시작되었습니다. 환자는 치료가 진행 중이며, 최근 MRI에서 뇌 전이의 증거는 없습니다. 림프혈관 침범 가능성은 아직 결정되지 않았으며 전체 화학요법에 대한 환자의 내성은 여전히 ​​불확실합니다.

종양학 임상 노트 진술:

종양학 임상 노트 설명

엄격한 품질 보증

클라이언트 피드백의 효과적인 통합을 용이하게 하는 동시에 엄격한 품질 기준을 준수하는 유연한 프로젝트 관리 프레임워크를 구현했습니다. 포괄적인 품질 보증 프로토콜이 시행되어 필요한 품질 벤치마크에 도달하기 위한 지침에 맞춰졌습니다. 이 프로토콜은 연속적인 검토 및 검증 라운드를 특징으로 하며, 주석이 달린 데이터의 정확성과 신뢰성을 확보합니다. 이러한 세심한 품질 감독은 신뢰할 수 있는 NLP 솔루션을 만드는 데 중요하며, 정보에 입각한 임상 의사 결정과 연구 우수성에 필수적입니다.

결과

10,000개의 고품질, 식별 정보 제거 레이블이 지정된 기록을 성공적으로 전달하여 클라이언트의 NLP 모델 개발을 위한 안전하고 가치 있는 데이터 세트를 제공했습니다. NLP를 세심하게 적용하고 HIPAA 식별 정보 제거 표준을 준수하여 클라이언트의 진행 중인 및 미래의 종양학 연구 노력을 뒷받침할 고도로 정제된 데이터 세트를 만들어 궁극적으로 종양학 환자 결과와 치료 제공 효율성을 향상시키는 것을 목표로 합니다.

이 프로젝트의 성공은 복잡한 의료 데이터를 정밀하게 처리하고, 환자 치료 결과를 개선하고 의료 혁신의 속도를 가속화한다는 고객의 목표에 기여할 수 있는 당사의 능력을 보여줍니다.

Shaip과의 파트너십은 종양학 영역 내에서 NLP 역량을 발전시키는 데 중요한 역할을 했습니다. 상세한 부정 및 기타 임상 실체로 주석이 달린 10,000개의 의료 기록을 전문적으로 처리함으로써 우수성과 규정 준수에 대한 의지를 입증했습니다. 또한 HIPAA와 같은 개인 정보 보호 표준에 대한 그들의 헌신은 최첨단 종양학 치료법 및 진단을 개발하는 AI 이니셔티브를 추진하는 데 귀중한 리소스를 제공했습니다.

골든 5스타