대화 형 AI

Bhasini가 인도의 언어 포용성을 촉진하는 방법

나렌드라 모디(Narendra Modi) 총리는 G20 디지털 경제 실무그룹 장관 회의에서 '바시니(Bhashini)'를 공개했습니다. 이 AI 기반 언어 번역 플랫폼은 인도의 언어 다양성을 기념합니다.

바시니 디지털 격차를 해소하고 모든 인도인이 연결되어 있다는 느낌을 갖도록 하는 것을 목표로 합니다. 인도는 다양한 언어와 방언을 통해 이러한 혁신의 캔버스가 되었습니다. 이 플랫폼은 인도의 수많은 언어에 대한 디지털 포용을 지원합니다.

많은 사람들에게 이는 처음으로 모국어로 콘텐츠에 액세스하는 것을 의미합니다. 그럼 Bhashini가 무엇인지 더 자세히 살펴보겠습니다.

바시니의 필요성

디지털 세계는 영어 쪽으로 기울고 있으며 영어를 사용하지 않는 많은 사람들이 소외감을 느끼게 됩니다. 온라인에서 정보를 찾으려고 하는데 정보가 귀하의 언어로 되어 있지 않다고 상상해 보십시오. 실망스럽고 제한적입니다.

많은 인도인들은 모국어로 된 콘텐츠에 접근하는 데 어려움을 겪으면서 매일 이 문제에 직면합니다. 이것이 바로 Bhashini가 필요한 곳입니다. Bhashini는 이러한 격차를 메우고 모든 인도어에 대한 플랫폼을 제공하여 모든 사람이 디지털 공간에서 공정한 기회를 얻을 수 있도록 하는 것을 목표로 합니다. 누구도 언어 때문에 뒤쳐진다고 느껴서는 안 됩니다.

바시니 모델 이해

바시니

Bhashini는 디지털 우선 시대의 언어 포용성에 대한 희망입니다. 작동 방식과 핵심 원리를 살펴보겠습니다.

언어 운영 및 홍보

Bhashini는 지역 언어를 적극적으로 홍보하는 운동입니다. 이는 기술적 업적과 협력을 통해 이루어집니다. Bhashini는 기업 및 플랫폼과 협력하면서 자사의 제품을 통합합니다. 이를 통해 다양한 디지털 플랫폼에서 원활한 사용자 경험을 보장합니다.

Bhashini의 빌딩 블록

기술

ASR

자동 음성 인식은 음성 단어를 이해하는 데 도움이 됩니다.

OCR

광학 문자 인식은 이미지에서 텍스트를 읽습니다.

NLU

자연어 이해는 상황 이해를 보장합니다.

MT

기계 번역은 실시간 번역을 제공합니다.

TTS

텍스트 음성 변환은 작성된 콘텐츠에 음성을 제공합니다.

제품

  • 실시간 음성 대 음성 머신 즉각적인 번역을 위해.
  • 다음과 같은 번역 도구 음성 대 음성(S2S) 정부 보조원.
  • 인도어 음성 인터넷 기본 브라우징 경험을 위해.
  • 콘텐츠 현지화 현지 청중의 공감을 불러일으키는 콘텐츠를 만드는 데 도움이 됩니다.
  • 접근 용이성 도구는 모두에게 적합하므로 누구도 소외되지 않습니다.
  • 번역기 렌즈 시각적 번역 지원을 제공합니다.

Foundation

  • 데이터 코퍼스: 풍부한 언어 데이터 컬렉션이 Bhashini를 발전시킵니다.
  • 고성능 컴퓨팅 인프라(HCI): 원활하고 효율적인 운영을 보장합니다.

본질적으로 Bhashini는 인도의 광대한 언어 세계를 반영합니다. 이는 디지털 시대에 다양성 속의 통일성이 실제로 무엇을 의미하는지를 보여주는 증거입니다.

바시니의 장점

Bhashini는 단순한 번역 플랫폼 그 이상입니다. 그것은 변화의 촉매제입니다. 그 이점을 살펴보겠습니다.

지역별 언어 콘텐츠 홍보

인도는 본거지 21개의 개별 공식 언어, 총 121개 언어, 271개 모국어. 각 지역에는 고유한 언어적 매력이 있으며 Bhashini는 이를 인식합니다. 지역 언어로 된 콘텐츠를 적극적으로 추진하고 있습니다. 이를 통해 다양한 문화가 온라인에서 대표될 수 있습니다.

모든 인도인을 위한 디지털 포용성

Bhashini는 많은 인도인들이 직면하고 있는 디지털 격차를 연결하는 다리입니다. Bhashini를 사용하면 콘텐츠에 모국어로 액세스할 수 있습니다. 이는 언어에 관계없이 모든 인도인이 소속감을 느낄 수 있도록 보장합니다.

지역 콘텐츠 제작자를 위한 경제적 기회

Bhashini는 또한 지역 창작자들을 위한 길을 열어줌으로써 경제적 부양책이기도 합니다. 이제 지역 언어로 콘텐츠를 제작할 수 있습니다. 이는 과거에 언어 장벽이 문제였다고 생각했던 현지 예술가, 작가, 창작자들이 온라인 플랫폼을 찾을 수 있는 새로운 길을 열어줍니다. 그들은 이제 청중을 갖게 되므로 자신의 재능을 선보이고 그로부터 수익을 얻을 수 있습니다.

지역 언어 웹사이트

케랄라에서 온 관광객을 생각해 보십시오. 그들은 라자스탄의 문화에 대해 알고 싶어합니다. Bhashini를 사용하면 웹사이트에서 말라얄람어로 콘텐츠를 제공할 수 있습니다. 이를 통해 관광객이 정보를 쉽게 소화할 수 있습니다.

인도 언어로 된 디지털 도구 및 플랫폼

펀자브(Punjab)의 농부를 상상해 보십시오. 일기예보 앱을 사용하고 싶어합니다. Bhashini는 앱이 펀자브어에서 사용 가능한지 확인합니다. 이는 농부가 중요한 날씨 업데이트를 이해하는 데 도움이 됩니다.

더 많은 청중에게 다가가는 정부 서비스

오디샤(Odisha)의 한 노인을 생각해 보십시오. 정부 연금 포털에 접속해야 합니다. Bhashini를 사용하면 포털이 Odia(Oriya)에 있을 수 있습니다. 노인들은 이제 다음을 사용하여 손쉽게 서비스를 탐색하고 액세스할 수 있습니다. 대화 형 AI 지역 언어로.

Bhashini에 대한 Shaip의 기여: 다국어 데이터 수집을 통한 디지털 포용

인도 마드라스 공과대학과 제휴, Shaip은 다양한 인도어 데이터 세트를 수집, 분할 및 복사하는 기념비적인 작업을 수행했습니다.

목표는 강력한 다국어 음성 모델을 구축하는 것이었고 앞으로 나아갈 길에는 많은 어려움이 있습니다.

복잡성을 고려하십시오: 각각 3000개의 고유한 방언을 사용하는 8개 언어에 걸쳐 4시간의 다양한 오디오 데이터를 수집합니다. 이 데이터에는 세심한 분할과 전사가 필요했습니다.

그러나 Shaip이 승리했습니다. 그들의 포괄적인 접근 방식은 여러 측면을 다루었습니다.

  • 데이터 수집: Shaip은 연령, 성별, 교육, 사투리 전반에 걸쳐 목소리에 대한 다양한 데이터를 수집했습니다.
  • 데이터 분할: 오디오 데이터는 엄격한 분할을 거쳤습니다. 정확성을 보장하기 위해 각 세그먼트에 꼼꼼하게 태그를 지정했습니다.
  • 품질 보증: 모든 녹음은 엄격한 품질 검사를 거쳤습니다. 최고만이 컷을 만들었습니다.
  • 데이터 전사: 흠잡을 데 없는 정확성을 갖춘 고품질 작업이 필요했습니다. 그래서 우리는 모든 단어, 망설임, 뉘앙스를 정확하게 포착했습니다.

결과적으로 우리는 IIT Madras가 XNUMX개 인도 언어에 걸쳐 완벽한 음성 인식 모델을 만들 수 있도록 지원하는 고품질 오디오 데이터 세트를 만들었습니다. 이번 협업의 파급 효과는 의심할 여지 없이 디지털 세계 전체에 울려 퍼질 것입니다. 이는 언어 장벽을 해소하여 진정으로 포용적인 디지털 인도를 만드는 데 도움이 될 것입니다.

사회 공유하기