종양학 NLP 연구 개선

종양학 데이터 정밀성: NLP 모델 혁신을 위한 라이선스, 비식별화 및 주석

종양학 nlp

최첨단 NLP 기술로 암 치료에 혁명을 일으키다

의료 산업의 주요 업체인 고객은 상당한 양의 종양학 의료 기록을 처리하기 위해 고급 NLP 솔루션이 필요했습니다. 종양학 연구를 개선하기 위한 중추적 계획의 일환으로 상세한 데이터 분석과 엄격한 개인 정보 보호 표준의 균형을 맞추는 것이 무엇보다 중요합니다. 이 사례 연구에서는 HIPAA가 제공하는 규제 프레임워크 내에서 고품질 데이터 주석, 엄격한 비식별화 관행 및 자연어 처리(NLP) 기술 적용을 통해 고객의 연구 노력을 향상시키는 데 대한 우리의 기여를 간략하게 설명합니다.

음량

데이터 라이센싱 + 데이터 ID 삭제
10 페이지
종양학 관계
10 페이지
비종양학 영역
10 페이지
부정
10 페이지
종양학 도메인
10 페이지
NER + 관계 매핑
10 페이지

도전

이 프로젝트에는 HIPAA 규정에 따라 환자의 개인 정보를 보호하는 보안 프레임워크 내에서 임상 문서에 대한 미묘한 이해, 의료 기관의 정확한 식별, 부정 라벨을 정확하게 적용할 수 있는 기능이 모두 필요했습니다. 이를 위해서는 대량의 복잡한 데이터를 처리하는 데 필요한 기술적 전문성뿐만 아니라 주석 프로세스의 모든 단계에서 피드백을 통합하고 품질을 유지하기 위한 전략적 접근 방식도 필요했습니다.

목표

서비스에 대한 자세한 설명

범주상품 설명
포괄적인 임상 데이터 범위다양한 메모 유형, 치료 설정 및 종양학 하위 전문 분야를 포괄하여 다양한 임상 시나리오를 반영하는 강력한 데이터 세트를 보장합니다.
엄격한 비식별화HIPAA의 세이프 하버(Safe Harbor) 방법을 준수하여 라벨이 붙은 모든 기록을 식별 해제하여 데이터 개인 정보 보호 및 보안에 대한 고객의 신뢰를 보장합니다.
주석 지침HIPAA 표준에 따라 라벨 기록을 준비하기 위한 표준 데이터 주석 지침을 만들고 구현합니다.
고급 주석 전략확립된 지침에 따라 부정 상태 및 기타 관련 정보를 식별하는 데 중점을 두고 10,000페이지에 달하는 종양학 관련 기록에 대한 수동 주석을 수행했습니다.
엄격한 품질 보증가이드라인에 명시된 특정 품질 표준을 달성하세요.

해법

우리의 접근 방식에는 다음과 같은 주요 전략이 포함되었습니다.

맞춤형 종양학 데이터 세트 편집

5만 개가 넘는 EHR의 방대한 아카이브에서 게놈 개체에 초점을 맞춰 종양학 데이터에 대한 고객의 특수 요구 사항을 해결하는 것을 목표로 신중하게 선택된 데이터 하위 집합이 추출되었습니다. 수집 과정에는 종양 표지자, 유전자, 변종 및 TNM 단계의 철저한 목록을 작성하고 키워드 검색을 사용하여 이 데이터에 풍부한 문서를 정확히 찾아내는 작업이 포함되었습니다. 다양한 유전적 변이와 암 단계를 식별하기 위해 정규식을 사용했습니다. 다양한 문서 유형, 전문 분야, 치료 설정 및 여러 의사의 데이터를 포괄하는 광범위한 데이터 범위와 결합된 이 접근 방식을 통해 포괄적이고 관련성이 높은 종양학 데이터 세트가 보장되었습니다.

종양학 데이터 세트 편집

엄격한 비식별화

이 프로세스는 비식별화를 위한 HIPAA의 세이프 하버(Safe Harbor) 방법을 엄격하게 준수하여 데이터 개인 정보 보호 및 보안에 대한 고객의 신뢰를 보장합니다. 여기에는 모든 보호 건강 정보(PHI)를 제거하고 라벨이 붙은 자리 표시자로 교체하여 환자의 기밀을 보호하는 동시에 데이터의 유용성을 유지하는 것이 포함됩니다.

비식별화 변수

범주하위 카테고리
성함환자명, 의사명, 전문간호사명, 가족명, 의료기관명, 진료소명, 요양원명, 회사명, 대학명
연령 
날짜날짜 패턴, 월 연도 패턴, 일 월 패턴, 일 연도 패턴, 일, 월, 연도, 계절
장소국가, 주, 도시, 거리, 우편번호, 방 번호, 호실 번호, 층 번호
ID사회 보장 번호, 의료 기록 번호, 건강 보험 수혜자 번호, 계좌 번호, 증명서/면허 번호, 생체 인식 ID, 기록 ID, 접속 번호, 차량 식별 번호, 차량 번호판 번호장치 식별자 및 일련 번호
연락처전화번호, 팩스번호, 이메일 주소, 웹 URL, IP 주소

예:

25년 2106월 11일 오전 00시에 90세의 Harry Pace 씨는 예정된 고관절 수술을 위해 포레스트 종합병원에 입원했으며, 이전에 주치의인 Jose Martin 박사의 상담을 받고 Kendra Reith가 참석했습니다. MD. 머무는 동안 그는 NP의 Mary Hu와 RN의 Suzan Ray의 보살핌을 받았으며 PA의 R. Charles Melancon도 상담을 받았습니다. 입원 당일 수술은 별다른 합병증 없이 성공적으로 진행됐다. 수술 후 Mr. Pace는 회복을 위해 202층 2호실로 이송되었습니다. 그의 아내 Emma Pace가 행사 내내 참석하여 필요한 모든 업데이트를 제공받았습니다. 짧은 체류 기간 동안 MRN MR99062619 및 계정 KV000014764를 포함한 그의 의료 기록은 이전 거주지인 Gracewood Nursing Home의 표준 프로토콜에 따라 처리되었습니다. 그는 추가 회복을 위해 같은 날 오클랜드 외래환자 진료소로 퇴원했습니다. 프로세스 전반에 걸쳐 모든 절차는 기밀 유지 표준을 준수하여 문서화되고 보호되었습니다.

예: 익명화됨

On [날짜 패턴], 오전 11시, Mr. [환자 이름],[나이], 입학했다 [의료기관명] 예정된 고관절 수술을 위해 이전에 그의 주치의인 Dr. [의사 이름], 그리고 참석 [의사 이름] MD. 머무는 동안 그는 보살핌을 받았다. [간호사 숙련자], NP 및 [간호사 숙련자], RN, 와 [의사 이름], PA도 상담중입니다. 입원 당일 수술은 별다른 합병증 없이 성공적으로 진행됐다. 수술 후 Mr. [환자 이름] XNUMX호실로 옮겨졌습니다. [방 번호], 층 번호 [층수], 회복을 위해. 그의 아내 [가족 이름]님이 행사 내내 참석하여 필요한 모든 업데이트를 제공받았습니다. 짧은 체류 기간 동안 MRN을 포함한 의료 기록 [의료기록번호] 및 계정 [계좌 번호], 표준 프로토콜에 따라 처리되었습니다. [요양원 이름], 그의 이전 거주지. 그는 같은 날 나중에 퇴원하여 보살핌을 받았습니다. [클리닉명] 추가 회복을 위해. 프로세스 전반에 걸쳐 모든 절차는 기밀 유지 표준을 준수하여 문서화되고 보호되었습니다.

주석 지침 및 고급 주석 기술

Shaip은 모든 라벨 기록이 일관되고 HIPAA 표준을 준수하도록 보장하는 표준 데이터 주석 지침을 확립하고 구현하는 데 중요한 역할을 했습니다. 또한 다양한 의료 기록 중 10,000페이지에 부정 상태 및 다양한 종양학 하위 전문 분야를 포함한 기타 임상적으로 관련된 항목에 대한 자세한 라벨링에 중점을 두고 꼼꼼하게 주석을 달았습니다. 주석은 종양학 및 데이터 개인 정보 보호 규정에 대한 전문 지식을 갖춘 전문 주석가 팀에 의해 수행되었습니다.

복잡한 주석 기준

범주하위 카테고리
날짜 주석(종양학)진단 날짜, 병기 날짜, 발병, 시술 날짜, 치료 시작 날짜, 치료 종료 날짜, 방사선 시작 날짜, 방사선 종료 날짜
질병(종양학)암 문제, 조직학, 임상 상태, 신체 부위, 행동, 등급, 암 병기, TNM 병기, 종양 표지자 검사, 치수, 코드
치료(종양학)암약, 약물복용량, 빈도, 암수술, 수술결과, 방사선요법, 방사선량
유전체학변이 코드, 유전자 연구, 방법, 표본
부정부정, 부정 가능, 불확실, 긍정 가능
임상 NER암 문제 – 신체 부위, 조직학 – 신체 부위, 행동 – 신체 부위, 암 수술 – 관계 신체 부위, 방사선 양식 – 신체 부위, 조직학 – 등급, 암 문제 – 차원

예:

종양학 임상 기록 명세서

종양학 임상 노트 설명

“환자 Jane Doe는 03년 05월 2023일에 IIIB기 비소세포폐암(NSCLC), 특히 선암종 진단을 받았습니다. 암은 폐의 오른쪽 하엽에 위치합니다. 이는 TNM 병기 결정 시스템에 따라 T3N2M0으로 분류되며 종양 크기는 5cm x 3cm입니다. EGFR 엑손 19 결실은 종양 생검 표본의 PCR 분석을 통해 확인되었습니다. Carboplatin AUC 5 및 Pemetrexed 500mg/m²를 사용한 화학요법은 03년 20월 2023일에 시작되었으며 3주마다 투여될 예정입니다. 60분할로 30Gy 용량의 외부 빔 방사선 치료(EBRT)가 04년 01월 2023일에 시작되었습니다. 환자는 치료가 진행 중이며, 최근 MRI에서 뇌 전이의 증거는 없습니다. 림프혈관 침범 가능성은 아직 결정되지 않았으며 전체 화학요법에 대한 환자의 내성은 여전히 ​​불확실합니다.

종양학 임상 노트 설명

종양학 임상 기록 명세서

엄격한 품질 보증

엄격한 품질 표준을 유지하면서 고객 피드백의 효과적인 통합을 촉진하는 유연한 프로젝트 관리 프레임워크를 구현했습니다. 필수 품질 벤치마크에 도달하기 위한 지침에 맞춰 포괄적인 품질 보증 프로토콜이 시행되었습니다. 이 프로토콜은 연속적인 검토 및 검증을 통해 주석이 달린 데이터의 정확성과 신뢰성을 보장했습니다. 이러한 세심한 품질 감독은 신뢰할 수 있는 NLP 솔루션을 만드는 데 매우 중요하며, 정보에 입각한 임상 의사 결정 및 연구 우수성에 필수적입니다.

결과

10,000개의 고품질 비식별 레이블 레코드를 성공적으로 전달하여 고객의 NLP 모델 개발을 위한 안전하고 가치 있는 데이터 세트를 제공했습니다. NLP의 세심한 적용과 HIPAA 비식별화 표준 준수를 통해 고객의 현재 진행 중인 종양학 연구 노력을 뒷받침하고 궁극적으로 종양학 환자 결과와 치료 제공 효율성을 향상시키는 것을 목표로 하는 고도로 정제된 데이터세트가 탄생했습니다.

프로젝트의 성공은 복잡한 의료 데이터를 정밀하게 처리하고 환자 치료 결과를 개선하고 의료 혁신의 속도를 가속화하려는 고객의 목표에 기여하는 우리의 능력을 보여줍니다.

Shaip과의 파트너십은 종양학 영역 내에서 NLP 역량을 발전시키는 데 중요한 역할을 했습니다. 상세한 부정 및 기타 임상 실체로 주석이 달린 10,000개의 의료 기록을 전문적으로 처리함으로써 우수성과 규정 준수에 대한 의지를 입증했습니다. 또한 HIPAA와 같은 개인 정보 보호 표준에 대한 그들의 헌신은 최첨단 종양학 치료법 및 진단을 개발하는 AI 이니셔티브를 추진하는 데 귀중한 리소스를 제공했습니다.

골든-5성급

의료 AI 가속화
100% 애플리케이션 개발