컴퓨터 비전

Computer Vision용으로 가장 많이 검색된 22개 이상의 오픈 소스 데이터 세트

AI 알고리즘은 제공하는 데이터만큼만 좋습니다.

과감하거나 파격적인 표현이 아닙니다. AI는 수십 년 전만 해도 다소 억지스러워 보일 수 있었지만 그 이후로 인공 지능과 머신 러닝은 정말 먼 길을 왔습니다.

컴퓨터 비전 컴퓨터가 레이블과 이미지를 이해하고 해석하는 데 도움이 됩니다. 올바른 종류의 이미지를 사용하여 컴퓨터를 훈련하면 다양한 얼굴 특징을 감지, 이해 및 식별하고, 질병을 감지하고, 자율 차량을 운전하고, 다차원 장기 스캔을 사용하여 생명을 구할 수 있는 능력을 얻을 수 있습니다.

컴퓨터 비전 시장은 $ 144.46 Billion 2028년 7.04억 2020만 달러에서 45.64년까지 2021년에서 2028년 사이에 XNUMX%의 CAGR로 성장할 것입니다.

컴퓨터 비전의 일부 사용 사례는 다음과 같습니다.

  • 의료 이미징
  • 자율 주행 차
  • 얼굴 및 사물 인식
  • 결함 식별
  • 장면 감지

XNUMXD덴탈의 이미지 데이터세트 머신 러닝과 컴퓨터 비전 작업을 제공하고 훈련하는 것은 AI 프로젝트의 성공에 매우 중요합니다. 양질의 데이터 세트는 얻기가 매우 어렵습니다. 프로젝트의 복잡성에 따라 컴퓨터 비전용으로 신뢰할 수 있고 관련성 높은 데이터 세트를 얻는 데 며칠에서 몇 주가 소요될 수 있습니다.

여기에서 즉시 사용할 수 있는 다양한 오픈 소스 데이터 세트(편의성을 위해 분류됨)를 제공합니다.

Computer Vision 데이터 세트의 포괄적인 목록

일반 :

  1. IMAGEnet (링크)

    ImageNet은 널리 사용되는 데이터 세트이며 1.2개의 범주로 분류된 놀라운 1000만 개의 이미지와 함께 제공됩니다. 이 데이터 세트는 WorldNet 계층 구조에 따라 구성되며 훈련 데이터, 이미지 레이블 및 검증 데이터의 세 부분으로 분류됩니다.

  2. 역학 700 (링크)

    Kinetics 700은 650,000개의 다양한 인간 행동 클래스의 700개 이상의 클립이 있는 거대한 고품질 데이터 세트입니다. 각 수업 활동에는 약 700개의 비디오 클립이 있습니다. 데이터 세트의 클립에는 인간-물체 및 인간-인간 상호 작용이 있으며, 이는 비디오에서 인간의 행동을 인식할 때 매우 유용한 것으로 입증되었습니다.

  3. 시파 -10 (링크)

    CIFAR 10은 60000개의 다른 클래스를 나타내는 32개의 32 x 6000 컬러 이미지를 자랑하는 가장 큰 컴퓨터 비전 데이터 세트 중 하나입니다. 각 클래스에는 컴퓨터 비전 알고리즘과 머신 러닝을 훈련하는 데 사용되는 약 XNUMX개의 이미지가 있습니다.

얼굴 인식:

얼굴 인식

  1. 야생에서 레이블이 지정된 얼굴 (링크)

    Labeled Faced in the Wild는 인터넷에서 감지된 거의 13,230명에 대한 5,750개 이상의 이미지를 포함하는 거대한 데이터 세트입니다. 이 얼굴 데이터 세트는 제한되지 않은 얼굴 감지를 더 쉽게 연구할 수 있도록 설계되었습니다.

  2. CASIA 웹페이스 (링크)

    CASIA Web face는 기계 학습 및 제약 없는 얼굴 인식에 대한 과학적 연구를 지원하는 잘 설계된 데이터 세트입니다. 거의 494,000개의 실제 ID에 대한 10,000개 이상의 이미지가 포함되어 있어 얼굴 식별 및 확인 작업에 이상적입니다.

  3. UMD Faces 데이터세트 (링크)

    UMD는 스틸 이미지와 비디오 프레임의 두 부분을 포함하는 주석이 잘 달린 데이터세트에 직면해 있습니다. 데이터 세트에는 367,800개 이상의 얼굴 주석과 3.7만 개의 주석이 달린 주제 비디오 프레임이 있습니다.

필기 인식:

  1. MNIST 데이터베이스 (링크)

    MNIST는 0에서 9까지의 손으로 쓴 숫자 샘플을 포함하는 데이터베이스이며 60,000 및 10,000 훈련 및 테스트 이미지가 있습니다. 1999년에 출시된 MNIST를 사용하면 딥 러닝에서 이미지 처리 시스템을 더 쉽게 테스트할 수 있습니다.

  2. 인공 문자 데이터 세트 (링크)

    인공 문자 데이터 세트는 이름에서 알 수 있듯이 영어 구조를 대문자 6000개로 설명하는 인공적으로 생성된 데이터입니다. 그것은 XNUMX 개 이상의 이미지와 함께 제공됩니다.

오늘 AI 교육 데이터 요구 사항에 대해 논의해 보겠습니다.

물체 감지 :

  1. MS 코코 (링크)

    MS COCO 또는 Common Objects in Context는 개체 감지 및 캡션 데이터 세트입니다.

    키포인트 감지, 다중 객체 감지, 캡션 및 분할 마스크 주석이 포함된 328,000개 이상의 이미지가 있습니다. 이미지당 80개의 개체 범주와 XNUMX개의 캡션이 제공됩니다.

  2. 엘순(링크)

    LSUN(Large-scale Scene Understanding)은 20개 개체와 10개 장면 범주에서 300,000만 개 이상의 레이블이 지정된 이미지를 보유하고 있습니다. 일부 카테고리에는 300개에 가까운 이미지가 있으며 특히 1000개의 검증용 이미지와 XNUMX개의 테스트 데이터용 이미지가 있습니다.

  3. 홈 개체(링크)

    Home Objects 데이터셋에는 부엌, 거실, 욕실과 같은 집 주변의 임의의 개체에 대한 주석이 달린 이미지가 포함되어 있습니다. 이 데이터 세트에는 테스트용으로 설계된 주석이 달린 비디오와 주석이 없는 사진 398장도 있습니다.

자동차 :

  1. 도시 풍경 데이터 세트 (링크)

    Cityscape는 여러 도시의 거리 장면에서 녹화된 다양한 비디오 시퀀스를 찾을 때 이동하는 데이터 세트입니다. 이 이미지는 오랜 시간에 걸쳐 다양한 날씨와 조명 조건에서 캡처되었습니다. 주석은 30개의 다른 범주로 나누어진 XNUMX개의 이미지 클래스에 대한 것입니다.

  2. 바클리 딥 드라이브 (링크)

    Barkley DeepDrive는 자율 차량 훈련을 위해 특별히 설계되었으며 100개 이상의 주석이 달린 비디오 시퀀스가 ​​있습니다. 변화하는 도로 및 주행 조건에 따른 자율주행차 훈련 데이터 중 가장 도움이 되는 데이터 중 하나입니다.

  3. 메이필러리 (링크)

    Mapillary는 전 세계적으로 750억 XNUMX천만 개 이상의 거리 장면과 교통 표지판을 보유하고 있으며 이는 머신 러닝 및 AI 알고리즘에서 시각적 인식 모델을 훈련하는 데 매우 유용합니다. 이를 통해 다양한 조명, 기상 조건 및 관점에 맞는 자율 주행 차량을 개발할 수 있습니다.

의료 영상:

  1. Covid-19 공개 연구 데이터 세트 (링크)

    이 원본 데이터 세트에는 AP/PA 흉부 x-선에 대한 약 6500개의 픽셀 다각형 폐 분할이 있습니다. 또한 이름, 위치, 입원 세부 정보, 결과 등이 포함된 태그가 포함된 517개의 Covid-19 환자 엑스레이 이미지를 사용할 수 있습니다.

  2. NIH 100,000 흉부 X-선 데이터베이스 (링크)

    NIH 데이터베이스는 과학 및 연구 커뮤니티에 유용한 100,000개의 흉부 엑스레이 이미지와 관련 데이터를 포함하는 가장 광범위한 공개 데이터 세트 중 하나입니다. 폐 질환이 진행된 환자의 이미지도 있습니다.

  3. 디지털 병리학 아틀라스 (링크)

    Atlas of Digital Pathology는 여러 장기의 주석이 달린 슬라이드 17,000개 가까이에서 총 100개 이상의 여러 조직병리학적 패치 이미지를 제공합니다. 이 데이터 세트는 컴퓨터 비전 및 패턴 인식 소프트웨어를 개발하는 데 유용합니다.

장면 인식:

장면 인식

  1. 실내 장면 인식 (링크)

    실내 장면 인식은 기계 학습 및 데이터 교육에 사용되는 거의 15620개의 물체 및 실내 풍경 이미지가 포함된 고도로 분류된 데이터세트입니다. 65개 이상의 카테고리가 제공되며 각 카테고리에는 최소 100개의 이미지가 있습니다.

  2. 엑스뷰 (링크)

    공개적으로 사용 가능한 가장 잘 알려진 데이터 세트 중 하나인 xView에는 다양한 복잡하고 큰 장면에서 주석이 달린 수많은 오버헤드 이미지가 포함되어 있습니다. 약 60개의 클래스와 백만 개 이상의 개체 인스턴스가 있는 이 데이터 세트의 목적은 위성 이미지를 사용하여 더 나은 재해 구호를 제공하는 것입니다.

  3. 장소 (링크)

    MIT에서 제공한 데이터 세트인 Places에는 1.8개의 서로 다른 장면 범주에서 365만 개 이상의 이미지가 있습니다. 각 범주에는 유효성 검사를 위한 약 50개의 이미지와 테스트를 위한 900개의 이미지가 있습니다. 장면 인식 또는 시각적 인식 작업을 설정하기 위해 깊은 장면 기능을 학습하는 것이 가능합니다.

엔터테인먼트 :

  1. IMDB 위키 데이터세트 (링크)

    IMDB – Wiki는 나이, 성별 및 이름이 적절히 표시된 얼굴의 가장 인기 있는 공개 데이터베이스 중 하나입니다. 그것은 또한 약 20명의 유명인의 얼굴과 Wikipedia에서 62명의 얼굴을 가지고 있습니다.

  2. 연예인 얼굴 (링크)

    Celeb Faces는 200,000개의 주석이 달린 유명인 이미지가 있는 대규모 데이터베이스입니다. 이미지에는 배경 노이즈와 다양한 포즈가 포함되어 있어 컴퓨터 비전 작업에서 테스트 세트를 훈련하는 데 유용합니다. 얼굴 인식, 편집, 얼굴 부분 위치 파악 등의 정확도를 높이는 데 매우 유용합니다.

이제 인공 지능 기계에 연료를 공급할 오픈 소스 이미지 데이터 세트의 방대한 목록이 있습니다. AI 및 머신 러닝 모델의 결과는 주로 데이터를 공급하고 교육하는 데이터 세트의 품질에 따라 달라집니다. AI 모델이 정확한 예측을 하도록 하려면 완벽하게 집계되고 태그가 지정되고 레이블이 지정된 고품질 데이터 세트가 필요합니다. 컴퓨터 비전 시스템의 성공을 확대하려면 프로젝트 비전과 관련된 고품질 이미지 데이터베이스를 사용해야 합니다. 더 많은 데이터 세트를 찾고 있다면 Click Here

사회 공유하기

당신은 또한 같은 수 있습니다