AI/ML에 바로 사용할 수 있는 공개 데이터 세트

ML 모델을 학습시키는 데 도움이 되는 오픈 소스 데이터 세트 알아보기

데이터세트 열기

AI/ML 모델을 위한 오픈 소스 데이터 세트

AI 모델에 적합한 데이터셋을 찾는 데 몇 주씩 걸릴 필요는 없습니다. 오픈 데이터셋 라이브러리를 통해 머신러닝 팀은 자연어 처리, 컴퓨터 비전, 음성 및 생성형 AI를 아우르는 100개 이상의 엄선되고 사람이 검증한 데이터셋에 즉시 접근할 수 있으며, 모두 무료로 탐색할 수 있습니다.

따라서 새로운 AI/ML 이니셔티브를 시작하고 고품질 데이터 세트가 AI/ML ML 엔진이 실행 중입니다. 미래의 AI/ML 모델을 무료로 사용하고 교육할 수 있는 공개 데이터 세트 목록을 축적했습니다.

전문화 데이터 형식 데이터 세트 이름 산업/부서 주석/사용 사례 (링크)
+NLP 본문 Amazon 리뷰 이커머스 감정 분석 (링크)
+NLP 본문 위키피디아 링크 데이터 일반 (링크)
+NLP 본문 스탠포드 센티먼트 트리뱅크 엔터테인먼트 감정 분석 (링크)
+NLP 본문 트위터 US Airline Sentiment 항공 회사 감정 분석 (링크)
+CV 영상 이미지넷 일반 (링크)
+CV 영상 구글의 오픈 이미지 일반 (링크)
+NLP 본문 코넬 영화 대화 엔터테인먼트 대화 상자 (링크)
+NLP 본문 MS 마르코 일반 질문 답변 (링크)
+NLP 본문 자연스러운 질문 데이터 세트 일반 질문 답변 (링크)
+NLP 본문 디비피디아 일반 지식 그래프 (링크)
+NLP 본문 야고 일반 지식 그래프 (링크)
+NLP 본문 프리베이스 일반 지식 그래프 (링크)
+NLP 본문 온토노츠 일반 의미적 역할 라벨링 (링크)
+CV 영상 COCO 일반 객체 감지 (링크)
+CV 영상 파스칼 VOC 일반 객체 감지 (링크)
+CV 영상 도시 자율 주행 시맨틱 분할 (링크)
+CV 영상 MNIST 일반 숫자 분류 (링크)
+CV 영상 패션-MNIST 소매 이미지 분류 (링크)
+NLP 오디오 리브리스피치 일반 ASR (링크)
+NLP 오디오 테드리움 일반 ASR (링크)
+NLP 오디오 TIMIT 일반 음소 인식 (링크)
+NLP 오디오 일반적인 목소리 일반 ASR (링크)
+NLP 오디오 복스셀럽 일반 화자 인식 (링크)
+NLP 본문 위키피디아 덤프 일반 언어 모델링 (링크)
+NLP 본문 기가워드 ​뉴스 언어 모델링 (링크)
+NLP 본문 IMDB 리뷰 엔터테인먼트 감정 분석 (링크)
+CV Video 역학-700 일반 행동 인식 (링크)
+CV Video UCF101 일반 행동 인식 (링크)
+CV Video HMDB51 일반 행동 인식 (링크)
+CV 영상 CASIA-웹페이스 일반 얼굴 인식 (링크)
+NLP 본문 분대 일반 독해력 (링크)
+NLP 본문 멀티NLI 일반 자연어 추론 (링크)
+NLP 본문 에스엘리 일반 자연어 추론 (링크)
+CV 영상 옥스포드 플라워 102 식물학 세분화된 분류 (링크)
+CV 영상 시파 -10 일반 이미지 분류 (링크)
+CV 영상 시파 -100 일반 이미지 분류 (링크)
+CV 영상 VOC 사람 레이아웃 일반 포즈 추정 (링크)
+CV 영상 MPII 인간 포즈 일반 포즈 추정 (링크)
+NLP 본문 20개의 뉴스그룹 일반 텍스트 분류 (링크)