개요
LLM(대형 언어 모델)의 개발이 가속화됨에 따라 다양한 분야에 걸친 실제 적용을 종합적으로 평가하는 것이 중요합니다. 이 기사에서는 BLOOM과 같은 LLM이 엄격하게 테스트된 7가지 주요 영역을 살펴보고 인간의 통찰력을 활용하여 진정한 잠재력과 한계를 측정합니다.
AI에 대한 인간의 통찰 #1: 독성 음성 탐지
존중하는 온라인 환경을 유지하려면 효과적인 유해한 음성 탐지가 필요합니다. 인간의 평가에 따르면 LLM은 때때로 명백히 유해한 발언을 찾아낼 수 있지만 미묘하거나 상황에 맞는 댓글에서는 표시를 놓치는 경우가 많아 부정확한 결과를 낳는 경우가 많습니다. 이는 온라인 담론을 효과적으로 관리하기 위해 LLM이 보다 세련된 이해와 상황에 맞는 민감성을 개발해야 할 필요성을 강조합니다.
AI에 대한 인간 통찰력의 예 #1: 독성 음성 감지

LLM 평가: LLM은 표면적으로 중립적인 표현을 사용하므로 댓글의 근본적인 수동적-공격적 어조를 독성으로 감지하지 못할 수도 있습니다.
인간의 통찰력: 인간 중재자는 댓글의 맥락적 부정성을 이해하고, 이를 다른 사람의 입장을 훼손하기 위한 미묘한 형태의 독성으로 인식합니다. 이는 효과적인 중재를 위해 LLM에 대한 미묘한 이해가 필요함을 보여줍니다.
AI에 대한 인간의 통찰 #2: 예술적 창조
LLM은 이야기나 시와 같은 창의적인 텍스트를 생성하는 능력으로 주목을 받아왔습니다. 그러나 인간이 평가할 때 이러한 모델은 일관성 있는 이야기를 엮을 수 있지만 창의성과 감정적 깊이가 부족한 경우가 많아 AI에 진정으로 인간과 같은 창의적 불꽃을 갖추는 것이 과제임을 강조합니다.
AI에 대한 인간 통찰의 예 #2: 예술적 창작

LLM 출력: LLM은 형사가 역사적 불의를 막기 위해 과거로 여행을 떠났지만 결국 중대한 역사적 사건을 일으키게 되는 줄거리를 제안합니다.
인간의 통찰력: 줄거리는 어느 정도 일관되고 창의적이지만, 인간 평론가는 캐릭터 개발의 독창성과 깊이가 부족하다고 지적하여 AI가 생성한 개념과 인간이 만든 작품에서 발견되는 미묘한 스토리텔링 사이의 격차를 강조합니다.
AI에 대한 인간의 통찰 #3: 질문에 답하기
질문 답변 기능은 교육 리소스 및 지식 검색 애플리케이션의 기본입니다. LLM은 간단한 질문에 정확하게 응답하는 데 있어 가능성을 보여왔습니다. 그러나 복잡한 질문이나 더 깊은 이해가 필요한 경우에는 어려움을 겪으며 지속적인 학습과 모델 개선이 매우 중요하다는 점을 강조합니다.
AI에 대한 인간 통찰의 예 #3: 질문에 답하기

LLM 답변: "산업 혁명은 석탄, 철과 같은 천연 자원에 대한 접근성과 상품 시장을 제공하는 제국의 확장으로 인해 영국에서 시작되었습니다."
인간의 통찰력: 비록 정확하기는 하지만 LLM의 답변은 중요한 역할을 한 복잡한 사회 정치적 요인과 혁신에 대한 더 깊은 통찰력을 놓치고 있으며, 이는 LLM이 답변에 보다 포괄적인 이해를 통합해야 할 필요성을 보여줍니다.
[또한 읽기: 생각의 사슬 촉진 - 그것에 대해 알아야 할 모든 것]
AI에 대한 인간의 통찰 #4: 마케팅 창의성
마케팅에서는 매력적인 카피를 만드는 능력이 매우 중요합니다. LLM은 기본적인 마케팅 콘텐츠를 생성하는 데 잠재력을 입증했습니다. 그러나 이들의 창작물에는 진정으로 설득력 있는 마케팅에 필수적인 혁신과 정서적 공명이 부족한 경우가 많습니다. 이는 LLM이 아이디어를 제공할 수는 있지만 인간의 독창성은 여전히 비교할 수 없는 수준임을 시사합니다.
AI에 대한 인간 통찰의 예 #4: 마케팅 창의성

법학 석사 제안: “친환경으로 포장하고 깨끗하게 유지하세요.”
인간의 통찰력: 슬로건은 눈길을 끌지만 마케팅 전문가는 제품의 혁신적인 측면이나 구체적인 이점을 전달하지 못하고 여러 수준에서 공감할 수 있는 메시지를 작성하려면 인간의 창의성이 필요하다고 지적합니다.
AI에 대한 인간의 통찰 #5: 명명된 엔터티 인식
텍스트 내에서 명명된 엔터티를 식별하는 기능은 데이터 구성 및 분석에 매우 중요합니다. LLM은 그러한 개체를 찾아내는 데 능숙하며 데이터 처리 및 지식 추출 노력에 대한 유용성을 보여줌으로써 연구 및 정보 관리 작업을 지원합니다.
AI에 대한 인간 통찰력의 예 #5: 명명된 엔터티 인식

LLM 감지: "엘론 머스크"를 사람으로, "우주 관광"을 개념으로 식별합니다.
인간의 통찰력: 인간 독자는 또한 우주 산업에 대한 잠재적인 영향과 상업 여행에 대한 광범위한 영향을 인식할 수 있으며, 이는 LLM이 엔터티를 식별할 수 있지만 그 중요성을 완전히 파악하지 못할 수 있음을 시사합니다.
AI에 대한 인간의 통찰 #6: 코딩 지원
코딩 및 소프트웨어 개발 지원에 대한 수요로 인해 프로그래밍 보조원으로 LLM이 모색되고 있습니다. 사람의 평가에 따르면 LLM은 기본 작업에 대해 구문적으로 정확한 코드를 생성할 수 있습니다. 그러나 AI 기반 개발 지원에서 개선이 필요한 영역을 드러내면서 더욱 복잡한 프로그래밍 문제로 인해 어려움을 겪고 있습니다.
AI에 대한 인간 통찰의 예 #6: 코딩 지원

LLM 출력: 시행 분할을 통해 소수성을 확인하는 Python 함수를 제공합니다.
인간의 통찰력: 숙련된 프로그래머는 이 기능이 대규모 입력에 대한 효율성이 부족하다는 점을 지적하고 LLM이 사람의 개입 없이는 최상의 솔루션을 제공하지 못할 수 있는 영역을 나타내는 최적화 또는 대체 알고리즘을 제안합니다.
AI에 대한 인간의 통찰 #7: 수학적 추론
수학은 엄격한 규칙과 논리적 엄격함으로 인해 독특한 도전 과제를 제시합니다. LLM은 간단한 산술 문제를 해결할 수 있지만 복잡한 수학적 추론에는 어려움을 겪습니다. 이러한 불일치는 계산 능력과 고급 수학에 필요한 깊은 이해 사이의 차이를 강조합니다.
AI에 대한 인간 통찰의 예 #7: 수학적 추론

LLM 출력: "삼각형의 모든 내각의 합은 180도입니다."
인간의 통찰력: LLM은 정확하고 직접적인 답변을 제공하지만 교육자는 이 기회를 활용하여 그림이나 활동으로 개념을 설명함으로써 왜 그런 경우인지 설명할 수 있습니다. 예를 들어, 삼각형의 각을 가져와 나란히 놓으면 180도 직선을 이루는 방법을 보여줄 수 있습니다. 이러한 실습 접근 방식은 질문에 답할 뿐만 아니라 학생의 자료에 대한 이해와 참여를 심화시켜 상황에 맞는 대화형 설명의 교육적 가치를 강조합니다.
[또한 읽기: 대형 언어 모델(LLM): 전체 가이드]
결론: 앞으로의 여정
이러한 영역에 걸쳐 인간의 렌즈를 통해 LLM을 평가하면 다각적인 그림이 그려집니다. LLM은 언어 이해력과 생성 측면에서 발전하고 있지만 더 깊은 이해, 창의성 또는 전문 지식이 필요한 경우 깊이가 부족한 경우가 많습니다. 이러한 통찰력은 지속적인 연구, 개발의 필요성과 가장 중요하게는 AI 개선에 인간의 참여가 필요함을 강조합니다. 우리가 AI의 잠재력을 탐색할 때 AI의 강점을 포용하는 동시에 약점을 인정하는 것은 기술 AI 연구원, 기술 애호가, 콘텐츠 조정자, 마케팅 담당자, 교육자, 프로그래머 및 수학자들이 획기적인 발전을 달성하는 데 매우 중요합니다.
LLM 개발을 위한 엔드투엔드 솔루션(데이터 생성, 실험, 평가, 모니터링) – 데모 신청