사례 연구: 콘텐츠 조정
콘텐츠 조정을 위해 30개 이상의 웹 문서 스크랩 및 주석 추가
우리가 연결하고 소통하는 온라인 공간을 확보하기 위해 노력하는
소셜 미디어 사용이 지속적으로 증가함에 따라
사이버 폭력 문제가 대두됐다.
노력하는 플랫폼에 대한 중요한 장애물
안전한 온라인 공간을 보장합니다. 놀라운
개인의 38%가 이 문제를 겪습니다.
매일의 유해한 행위,
발명에 대한 긴급한 요구를 강조
콘텐츠 조정 접근 방식.
오늘날 조직은
지속적인 문제를 해결하는 인공 지능
사이버 괴롭힘 문제를 사전에 예방합니다.
사이버 보안 :
Facebook의 4분기 커뮤니티 표준 시행 보고서 공개 – 6.3만 개의 따돌림 및 괴롭힘 콘텐츠에 대한 조치, 사전 적발률 49.9%
학력 :
A 2021 연구에 따르면 36.5%다음 연령대의 미국 학생 비율 12학년 및 17학년 수년 동안 학교 생활 중 한 지점 또는 다른 지점에서 사이버 괴롭힘을 경험했습니다.
2020년 보고서에 따르면 전 세계 콘텐츠 조정 솔루션 시장은 4.07년 2019억 11.94만 달러였으며 2027년에는 14.7억 XNUMX만 달러에 이를 것으로 예상되며 CAGR은 XNUMX%입니다.
실제 세계 솔루션
글로벌 대화를 조정하는 데이터
고객은 강력한 자동화 솔루션을 개발하고 있었습니다.
콘텐츠 조정 기계 학습
Cloud 오퍼링의 모델입니다.
도메인별 공급업체를 찾고 있었습니다.
정확한 훈련 데이터로 그들을 도울 수 있습니다.
자연어 처리(NLP)에 대한 광범위한 지식을 활용하여 클라이언트가 영어와 스페인어로 된 30,000개 이상의 문서를 수집, 분류 및 주석 처리하여 자동화된 콘텐츠 조정 머신 러닝 모델을 독성, 성인 또는 성적으로 노골적인 콘텐츠로 분기하도록 지원했습니다. 범주.
문제
- 우선 순위가 지정된 도메인에서 스페인어 및 영어로 된 30,000개 문서를 웹 스크래핑
- 수집된 콘텐츠를 Short, Medium, Long 세그먼트로 분류
- 편집된 데이터에 독성, 성인물 또는 성적으로 노골적인 콘텐츠로 레이블 지정
- 최소 90% 정확도로 고품질 주석을 보장합니다.
해법
- 웹은 BFSI, 의료, 제조, 소매에서 스페인어 및 영어로 각각 30,000개의 문서를 스크랩했습니다. 내용은 더 짧은, 중간 및 긴 문서로 분기되었습니다.
- 분류된 콘텐츠를 독성, 성인용 또는 성적으로 노골적인 콘텐츠로 성공적으로 레이블 지정
- 90% 품질을 달성하기 위해 Shaip은 XNUMX단계 품질 관리 프로세스를 구현했습니다.
» 레벨 1: 품질 보증 확인: 파일의 100%를 검증합니다.
» 레벨 2: 중요 품질 분석 확인: Shaips의 CQA 팀이 소급 샘플의 15%-20%를 평가합니다.
결과
교육 데이터는 더 안전한 온라인 환경을 유지하는 데 도움이 되는 여러 결과를 생성할 수 있는 자동화된 콘텐츠 조정 ML 모델을 구축하는 데 도움이 되었습니다. 주요 결과 중 일부는 다음과 같습니다.
- 방대한 양의 데이터를 처리하는 효율성
- 조정 정책의 균일한 시행을 보장하는 일관성
- 증가하는 사용자 기반 및 콘텐츠 양에 적응할 수 있는 확장성
- 실시간 중재는 &
잠재적으로 유해한 콘텐츠가 생성되면 제거 - 인간 중재자에 대한 의존도를 줄임으로써 비용 효율성
콘텐츠 조정의 예
다음 AI 이니셔티브를 지원하는 방법을 알려주세요.