아랍어 & 태국어 & 베트남어 & 힌디어 & 영어 & 중국어 언어 데이터 세트

아랍어 & 태국어 & 베트남어 & 힌디어 & 영어 & 중국어 언어 데이터 세트

사용 사례 : OCR

체재: 영상

카운트 : 150k

주석 : 가능

X

상품 설명 아랍어 & 태국어 & 베트남어 & 힌디어 & 영어 & 중국어 언어 데이터 세트

아랍어 텍스트 데이터 세트

아랍어 텍스트 데이터 세트

사용 사례 : OCR

체재: 영상

카운트 : 1k

주석 : 가능

X

상품 설명 아랍어 텍스트 데이터 세트에는 아랍어로 작성된 텍스트 샘플 컬렉션이 포함되어 있습니다. 여기에는 뉴스 기사, 소셜 미디어 게시물, 문학, 대화와 같은 다양한 형태의 콘텐츠가 포함되어 있으며, 다양한 주제와 글쓰기 스타일을 포괄합니다. 이 데이터 세트는 아랍어 언어 애플리케이션에서 자연어 처리(NLP), 텍스트 분류, 감정 분석, 기계 번역과 같은 작업에 사용됩니다.

중국어 & 영어 & 티베트어 & 위구르어 데이터 세트

중국어 & 영어 & 티베트어 & 위구르어 데이터 세트

사용 사례 : OCR

체재: 영상

카운트 : 38k

주석 : 가능

X

상품 설명 중국어 & 영어 & 티베트어 & 위구르어 데이터 세트

중국어 및 영어 메뉴 데이터 세트

중국어 및 영어 메뉴 데이터 세트

사용 사례 : OCR

체재: 영상

카운트 : 60k

주석 : 가능

X

상품 설명 중국어 및 영어 메뉴 데이터 세트에는 중국어와 영어가 모두 포함된 레스토랑 메뉴의 이미지 또는 텍스트 샘플이 포함되어 있습니다. 여기에는 다양한 글꼴, 레이아웃 및 메뉴 구조가 포함되어 있으며, 이중 언어 요리 이름, 설명 및 가격을 제공합니다. 이 데이터 세트는 다국어 설정에서 광학 문자 인식(OCR), 기계 번역 및 메뉴 디지털화와 같은 작업에 유용합니다.

중국어 필기 작문 데이터 세트

중국어 필기 작문 데이터 세트

사용 사례 : OCR

체재: 영상

카운트 : 3k

주석 : 가능

X

상품 설명 Chinese Handwritten Composition Dataset에는 작문, 에세이 및 기타 장문 텍스트를 포함한 손으로 쓴 중국어 텍스트 샘플이 포함되어 있습니다. 다양한 필기 스타일과 복잡성 수준을 특징으로 하며 필기 인식, 텍스트 분석 및 머신 러닝 모델 학습과 같은 작업에 사용됩니다.

중국어 WIFI 프롬프트 데이터 세트

중국어 WIFI 프롬프트 데이터 세트

사용 사례 : OCR

체재: 영상

카운트 : 1k

주석 : 가능

X

상품 설명 중국어 WIFI 프롬프트 데이터 세트는 중국어로 작성된 WIFI 프롬프트와 로그인 화면에서 발견되는 텍스트 샘플로 구성되어 있습니다. 일반적으로 WIFI 네트워크에 연결하거나 관리하는 것과 관련된 다양한 프롬프트, 지침 및 오류 메시지가 포함됩니다. 이 데이터 세트는 텍스트 인식, 자연어 처리 및 네트워크 연결을 위한 사용자 인터페이스 개선과 같은 작업에 사용됩니다.

영어 및 중국어 필기 데이터 세트

영어 및 중국어 필기 데이터 세트

사용 사례 : OCR

체재: 영상

카운트 : 12k

주석 : 가능

X

상품 설명 영어 및 중국어 필기 데이터 세트에는 영어와 중국어로 필기한 샘플이 포함되어 있으며, 다양한 필기 스타일과 문자 복잡성을 보여줍니다. 일반적으로 필기 인식 모델을 훈련하고 평가하고, 다국어 텍스트 분석을 지원하고, 기타 관련 연구를 수행하는 데 사용됩니다. 이 데이터 세트에는 두 언어 모두의 다양한 문자, 숫자, 단어 및 문장이 포함됩니다.

영어 및 중국어 Shopsign 데이터 세트

영어 및 중국어 Shopsign 데이터 세트

사용 사례 : OCR

체재: 영상

카운트 : 30k

주석 : 가능

X

상품 설명 English & Chinese Shopsign Dataset에는 영어와 중국어 텍스트가 모두 포함된 상점 간판 이미지가 포함되어 있습니다. 다양한 글꼴, 스타일 및 형식으로 표시된 상점 이름, 광고, 프로모션 및 방향과 같은 다양한 간판 요소를 캡처합니다. 이 데이터 세트는 텍스트 감지 및 인식, 다국어 장면 이해 및 이중 언어 간판을 해석하기 위한 컴퓨터 비전 모델 개선과 같은 작업에 사용됩니다.

영어 및 중국어 특수 각도 텍스트 데이터 세트

영어 및 중국어 특수 각도 텍스트 데이터 세트

사용 사례 : OCR

체재: 영상

카운트 : 50k

주석 : 가능

X

상품 설명 영어 및 중국어 특수 각도 텍스트 데이터 세트에는 영어와 중국어로 다양한 각도와 방향으로 표시된 텍스트 이미지가 포함되어 있습니다. 여기에는 표준 수평 형식으로 표시되지 않은 간판, 광고 및 문서와 같은 소스의 텍스트가 포함됩니다. 이 데이터 세트는 텍스트 감지 및 인식 모델, 특히 비전통적인 방향 및 관점에서 텍스트를 처리할 수 있는 모델을 훈련하고 평가하는 데 사용됩니다.

영어 메뉴 데이터 세트

영어 메뉴 데이터 세트

사용 사례 : OCR

체재: 영상

카운트 : 20k

주석 : 가능

X

상품 설명 영어 메뉴 데이터 세트에는 영어로 작성된 레스토랑 메뉴의 이미지 또는 텍스트 샘플이 포함되어 있습니다. 다양한 글꼴, 레이아웃 및 서식 스타일이 특징이며, 요리 이름부터 설명 및 가격에 이르기까지 다양한 콘텐츠가 있습니다. 이 데이터 세트는 종종 식품 관련 애플리케이션에서 광학 문자 인식(OCR), 텍스트 추출 및 메뉴 디지털화와 같은 작업에 사용됩니다.

영어 장면 텍스트 데이터 세트

영어 장면 텍스트 데이터 세트

사용 사례 : OCR

체재: 영상

카운트 : 33k

주석 : 가능

X

상품 설명 영어 장면 텍스트 데이터 세트는 영어 텍스트가 포함된 자연스러운 장면을 포함하는 이미지로 구성되어 있습니다. 텍스트는 표지판, 광고판, 포스터와 같이 다양한 형태로 나타나며, 종종 다양한 글꼴, 크기 및 방향으로 나타납니다. 이 데이터 세트는 일반적으로 텍스트 감지, 인식 및 장면 이해 작업에서 모델을 훈련하고 테스트하는 데 사용됩니다.

필기 텍스트 데이터세트

필기 텍스트 데이터세트

사용 사례 : 문서 AI

체재: HEIC(이미지) 및 .mov(동영상)

카운트 : 94053

주석 : 아니

X

상품 설명 일본어, 한국어 및 러시아어를 위한 손으로 쓴 텍스트가 포함된 라이브 사진

녹음 장치: 아이폰 및 아이패드 카메라

녹음 조건: - 공격적인 조명/눈부심 - 카메라 플래시 켜짐 - 컬러 라이트 - 저조도, 카메라 플래시 없음 - 일반

일본어 및 한국어 언어 데이터 세트

일본어 및 한국어 언어 데이터 세트

사용 사례 : OCR

체재: 영상

카운트 : 40k

주석 : 가능

X

상품 설명 일본어 및 한국어 언어 데이터 세트에는 일본어와 한국어로 된 텍스트 샘플이 포함되어 있습니다. 문장, 구문, 단어와 같은 다양한 콘텐츠가 포함되어 있으며, 다양한 맥락과 스타일을 포괄합니다. 이 데이터 세트는 다국어 애플리케이션에서 자연어 처리(NLP), 기계 번역, 텍스트 분석과 같은 작업에 사용됩니다.

인쇄된 일반/초서체 텍스트 데이터 세트(Document AI)

인쇄된 일반/초서체 텍스트 데이터 세트(Document AI)

사용 사례 : 문서 AI

체재: HEIC(이미지) 및 .mov(동영상)

카운트 : 23930

주석 : 아니

X

상품 설명 일본어, 한국어 및 러시아어를 위한 손으로 쓴 텍스트가 포함된 라이브 사진

녹음 장치: 아이폰 및 아이패드 카메라

녹음 조건: - 공격적인 조명/눈부심 - 카메라 플래시 켜짐 - 컬러 라이트 - 저조도, 카메라 플래시 없음 - 일반

텍스트 + 오디오-비주얼(다국어/OCR/NLP) – 책, 저널, 오디오+텍스트

텍스트 + 오디오-비주얼(다국어/OCR/NLP) – 책, 저널, 오디오+텍스트

사용 사례 : 텍스트 + 오디오-비주얼(다국어/OCR/NLP)

체재: 비디오

카운트 : 100만 개 이상의 강의 영상 + PPT 장편 영상

주석 : 아니

X

상품 설명 중국어 도서, 영어 도서, 저널, 공공 정책, 소설, 어린이, 광둥어 오디오+텍스트, 강의 영상+PPT, 장편 ​​영상 5억 권의 도서, 질문과 답변 쌍, 기사