얼굴 인식 모델에 대한 사례 연구

사기 탐지 AI 모델을 위한 안티 스푸핑 비디오 데이터 세트

Shaip이 사기 탐지를 위한 AI 모델을 훈련하기 위해 실제 공격 시나리오와 재생 공격 시나리오를 담은 25,000개의 고품질 스푸핑 방지 비디오 데이터 세트를 제공한 방법을 알아보세요.

스푸핑 방지 비디오 데이터 수집

사업 개요

Shaip은 선도적인 AI 보안 회사와 협력하여 사기 탐지를 위한 AI 모델 훈련을 강화하도록 설계된 고품질의 기성형 안티 스푸핑 비디오 데이터 세트를 제공했습니다. 이 데이터 세트에는 실제 및 재생 공격 시나리오를 모두 포착한 25,000개의 비디오가 포함되어 안티 스푸핑 모델에 대한 강력한 훈련 데이터를 보장합니다.

의 각 12,500 참가자 실제 공격 영상 하나와 리플레이 공격 영상 하나 등 2개의 영상을 녹화하여 제공했습니다. 720p 이상의 해상도 프레임 속도로 26 FPS 이상.

이 프로젝트의 목표는 다음과 같습니다. 정통하고 다양한 데이터 세트 이를 통해 AI 모델이 실제 생체 인식 비디오와 가짜 생체 인식 비디오를 효과적으로 구별할 수 있고, 생체 인증 시스템의 사기 위험을 줄일 수 있습니다.

스푸핑 방지 비디오 데이터 수집

주요 통계

25,000 총 비디오 (12,500 실제 영상, 12,500 리플레이 공격 영상)

12,500 유일한
참가자

5 민족 집단
데이터 세트에 표현됨

단계적 배송: 4 배치 6,250 비디오 각각

메타데이터 속성: 12 향상된 데이터세트 활용성을 위한 주요 매개변수

안티 스푸핑 생체 인식 데이터 세트 범위

데이터 세트 큐레이션: 이 프로젝트는 다음으로 구성된 고품질 스푸핑 방지 비디오 데이터 세트를 제공하는 데 중점을 두었습니다. 실제 공격 영상과 리플레이 공격 영상. 주요 측면은 다음과 같습니다.

  • 12,500 참가자 기여 각각 2개의 비디오 (1개는 진짜이고 1개는 가짜입니다).
  • 녹음 장치의 다양성 모델의 적응성을 향상시킵니다.
  • 균형 잡힌 민족 대표 데이터 세트의 포괄성을 보장합니다.

메타데이터 수집: 각 비디오에는 다음이 포함됩니다. 12개의 메타데이터 속성 데이터 세트의 유용성을 향상시킵니다.

비디오 데이터 수집 과제

평등한 대표성 보장

고품질 비디오를 소싱하는 동시에 민족별 데이터 분포를 균형 있게 유지합니다.

품질 관리

데이터 세트 무결성을 유지하기 위해 각 참가자가 실제 공격 비디오 1개와 리플레이 공격 비디오 1개를 제공하도록 보장합니다.

기술적 일관성

FPS(≥ 26), 해상도(≥ 720p), 타임스탬프 정확도(+/- 0.5ms)에 대한 엄격한 지침을 준수합니다.

우리가 그것을 해결한 방법

Shaip은 프로젝트 요구 사항을 충족하기 위해 구조화되고 고품질의 데이터 세트를 제공했습니다. 솔루션에는 다음이 포함되었습니다.

데이터 세트 큐레이션 및 품질 관리

  • 25,000 동영상 수집됨 4 단계 병목 현상을 방지하고 꾸준하고 체계적인 데이터 흐름을 보장합니다.
  • 엄격한 검증 프로세스 준수를 보장하기 위해 FPS, 해상도 및 메타데이터 정확도각 비디오는 최종 승인 전에 여러 차례의 품질 검사를 거쳤습니다.
  • 포괄적인 메타데이터 태그 지정12가지 속성:
  • 파일 ID/이름
  • 공격 유형(실제/재생)
  • 개인 ID
  • 비디오 해상도
  • 동영상 재생 시간
  • 주제의 민족성
  • 주제의 성별
  • 비디오가 원본인지 가짜인지
  • 장치 이름/모델
  • 말하는 사람이 있든 없든
  • 타임스탬프 시작 시간
  • 타임스탬프 종료 시간
  • 균형 잡힌 민족 집단 분포: 데이터 세트는 균형 잡힌 민족적 대표성을 유지하기 위해 세심하게 큐레이션되었습니다. 분포에는 히스패닉(33%), 남아시아(21%), 백인(20%), 아프리카(15%), 동아시아 및 중동 인구(각각 최대 6%)가 포함됩니다.
  • 중복 항목 없음 데이터 세트의 고유성을 유지하고 AI 훈련의 편향을 방지합니다.
  • 다양한 인종의 참가자 선발 실제 사용자 차이를 반영하는 데이터 세트를 생성하여 AI 모델의 적응성과 공정성을 개선합니다.
  • 녹음 장치 변형 다양한 환경 설정에서 모델의 견고성을 강화하기 위해 여러 스마트폰 모델, 카메라 및 조명 조건이 포함되었습니다.

결과

Shaip이 제공한 고품질의 다양한 안티 스푸핑 비디오 데이터 세트를 통해 클라이언트는 다양한 생체 인증 시나리오에서 실제 비디오와 스푸핑 비디오를 정확하게 구별하도록 AI 모델을 훈련할 수 있었습니다. 이 데이터 세트는 다음에 기여했습니다.

향상된 사기 탐지

사기성 생체 인식 공격을 탐지하는 데 있어 AI 성능이 향상되었습니다.

다양한 훈련 데이터

다양한 인종, 기기, 환경 조건에서 리플레이 공격을 인식하는 모델의 능력이 강화되었습니다.

확장성

이 데이터 세트는 향후 스푸핑 방지 모델의 향상 및 확장을 위한 기반으로 활용됩니다.

Shaip의 데이터 세트는 AI 기반 스푸핑 방지 모델을 개선하는 데 중요한 역할을 했습니다. 다양성, 품질 및 구조화된 메타데이터는 생체 인증 시스템에서 사기 감지를 개선하기 위한 강력한 기반을 제공했습니다.

골든-5성급