Google, Gemini 3.1 Pro 출시: 벤치마크, 사용해 보는 방법

구글은 목요일 최신 핵심 추론 모델인 Gemini 3.1 Pro를 출시했습니다. Google은 Gemini 3.1 Pro가 모델의 논리적 추론을 측정하는 인기 벤치마크인 ARC-AGI-2에서 3 Pro보다 검증된 성능의 두 배를 달성했다고 밝혔습니다.

Google은 원래 11월에 Gemini 3 및 3 Pro를 출시했으며, 이번 새 릴리스는 AI 회사가 얼마나 빠르게 새로운 모델과 업데이트된 모델을 도입하고 있는지 보여줍니다. Gemini 3.1 Pro는 Gemini와 Gemini 3 Deep Think와 같은 다양한 Google AI 도구를 지원하는 새로운 핵심 모델입니다. Google은 보다 창의적인 솔루션을 제공하도록 설계되었다고 말합니다.

“3.1 Pro는 단순한 답변만으로는 충분하지 않은 작업을 위해 설계되었으며, 고급 추론을 통해 가장 어려운 과제에 유용하게 사용됩니다.”라고 Google 블로그 게시물에 명시되어 있습니다. “이 향상된 인텔리전스는 복잡한 주제에 대한 명확하고 시각적인 설명을 찾고 있든, 데이터를 단일 보기로 통합하는 방법을 찾고 있든, 창의적인 프로젝트에 생명을 불어넣는 등 실용적인 응용 프로그램에 도움이 될 수 있습니다.”

다음도 참조하세요:

GPT-5.2 대 Gemini 3 — 벤치마크, 가격 및 기능 세트에서 두 헤비급 모델을 비교하는 방법

Anthropic 및 OpenAI의 최신 모델과 비교하는 방법과 직접 사용해 보는 방법을 포함하여 Gemini 3.1 Pro에 대해 지금까지 우리가 알고 있는 모든 정보는 다음과 같습니다.

Gemini 3.1 Pro를 사용해 보는 방법

오늘부터 Google은 Gemini 앱, Gemini APIA 및 Notebook LM에 Gemini 3.1 Pro를 출시합니다. 무료 사용자는 Gemini 앱에서 3.1 Pro를 사용해 볼 수 있지만 Google AI Pro 및 AI Ultra 요금제의 유료 사용자는 사용률이 더 높습니다. 적어도 현재로서는 Notebook LM 내에서 이러한 유료 사용자만 3.1 Pro에 액세스할 수 있습니다. 코더와 기업 사용자는 개발자를 통해 새로운 핵심 모델에 액세스할 수 있으며 기업은 AI Studio, Antigravity, Vertex AI, Gemini Enterprise, Gemini CLI 및 Android Studio를 통해 3.1에 액세스할 수 있습니다.

Gemini 3.1 Pro는 이미 Gemini를 사용하는 Mashable 편집자에게 제공되었습니다. 직접 사용해 보려면 데스크톱에서 Gemini로 이동하거나 Gemini 모바일 앱을 여세요.

Gemini 3 Pro의 애니메이션을 보여주는 스크린샷

왼쪽:
동일한 애니메이션 프롬프트의 두 가지 결과입니다.
신용: 구글

오른쪽:
신용: 구글


Gemini 3.1 Pro가 중요한 이유

구글이 지난 11월 제미니 3 프로(Gemini 3 Pro)를 출시했을 때 이 모델은 너무 인상적이어서 OpenAI CEO 샘 알트만(Sam Altman)이 코드 레드를 선언하게 됐다고 한다. Gemini 3 Pro가 AI 리더보드 상위권으로 급등하면서 OpenAI는 ChatGPT 사용자를 Gemini에게 뺏기기 시작한 것으로 알려졌습니다. 최신 핵심 ChatGPT 모델인 GPT-5.2는 Arena(이전의 LMArena)와 같은 순위표에서 순위가 ​​하락하여 Google, Anthropic 및 xAI와 같은 경쟁업체에 상당한 입지를 잃었습니다.

Gemini 3 Pro는 이미 많은 벤치마크에서 GPT-5.2를 능가했으며, 더욱 발전된 사고 모델을 통해 Gemini는 더욱 앞서 나갈 수 있었습니다.

Gemini 3.1 Pro: 벤치마크 성능

Google은 Gemini 3.1 Pro가 이전 Gemini 모델인 Claude Sonnet 4.6, Claude Opus 4.6 및 GPT-5.2보다 성능이 우수하다는 것을 보여주는 벤치마크 성능 데이터를 발표했습니다. 그러나 Google 자체에 따르면 OpenAI의 새로운 코딩 모델인 GPT-5.3-Codex는 검증된 SWE-Bench Pro 벤치마크에서 Gemini 3.1 Pro를 능가했습니다.

Gemini 3.1 Pro 벤치마크 결과의 주목할만한 주요 내용은 다음과 같습니다.

  • 인류의 마지막 시험에서 44.4%Claude Opus 4.6의 경우 40.0%, GPT-5.2의 경우 34.5%와 비교됩니다.

  • ARC-AGI-2에서 77.1%Gemini 3 Pro의 경우 31.1%, Claude Opus 4.6의 경우 68.8%, GPT-5.2의 경우 52.9%와 비교됩니다.

  • GPQA 다이아몬드에서 94.3%Gemini 3 Pro의 경우 91.9%, Claude Opus 4.6의 경우 91.3%, GPT-5.2의 경우 92.4%와 비교됩니다.

  • SWE-Bench 인증에서 80.6%Gemini 3 Pro의 경우 76.2%, Claude Opus 4.6의 경우 80.8%, GPT-5.2의 경우 80.0%와 비교됩니다.

  • SWE-Bench Pro(공개)에서 54.2%Gemini 3 Pro의 경우 43.3%, GPT-5.2의 경우 55.6%, GPT-5.3-Codex의 경우 56.8%와 비교됩니다.

  • MMLU에서 92.6%Claude Opus 4.6의 경우 91.1%, GPT-5.2의 경우 89.6%와 비교됩니다.

Google은 Gemini 3.1 Pro의 전체 벤치마크 결과를 보여주는 이미지를 공개했습니다.


공개: Mashable의 모회사인 Ziff Davis는 2025년 4월 OpenAI가 AI 시스템 교육 및 운영에 있어 Ziff Davis의 저작권을 침해했다고 주장하며 OpenAI를 상대로 소송을 제기했습니다.

관련 기사

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다