Home/Models/OpenAI/GPT-5.1
O

GPT-5.1

Ввод:$1/M
Вывод:$8/M
GPT-5.1 — универсальная инструкционно дообученная языковая модель, ориентированная на генерацию текста и рассуждение в рамках продуктовых рабочих процессов. Она поддерживает многоходовой диалог, форматирование структурированного вывода и ориентированные на код задачи, такие как подготовка черновиков, рефакторинг и объяснение. Типичные сценарии использования включают чат-ассистенты, вопросно-ответные системы, дополненные поиском, преобразование данных и автоматизацию в агентном стиле с использованием инструментов или API при наличии поддержки. К ключевым техническим особенностям относятся текстоцентричная модальность, следование инструкциям, вывод в стиле JSON и совместимость с вызовом функций в распространённых оркестрационных фреймворках.
Новый
Коммерческое использование
Playground
Обзор
Функции
Цены
API

GPT 5.1 API — это... GPT-5.1 Thinking — продвинутая версия рассуждений в семействе OpenAI GPT-5.1; она отдает приоритет адаптивному, более качественному рассуждению и предоставляет разработчикам явный контроль над компромиссом между задержкой и вычислениями.

Basic features

  • Adaptive reasoning: модель динамически регулирует глубину размышлений для каждого запроса — быстрее на рутинных задачах, более настойчива на сложных. Это сокращает задержку и использование токенов для типовых запросов. Явно выделяет больше времени на рассуждение для сложных подсказок и является более настойчивой в многошаговых задачах; может работать медленнее на трудных задачах, но дает более глубокие ответы.
  • Reasoning modes: none / low / medium / high (GPT-5.1 по умолчанию использует none для сценариев с низкой задержкой; выбирайте более высокие уровни для более требовательных задач). Responses API предоставляет параметр reasoning для управления этим.
  • Тон и стиль по умолчанию: более понятно изложение сложных тем (меньше жаргона), более объяснительный и «терпеливый» стиль.
  • Context window (tokens / long context) Thinking: значительно больше — контекст 400K токенов для платных тарифов.

Key technical details

  • Adaptive compute allocation — архитектура обучения и инференса приводит к тому, что модель тратит меньше токенов рассуждения на тривиальные задачи и пропорционально больше — на сложные. Это не отдельный «движок мышления», а динамическое распределение внутри конвейера рассуждений.
  • Reasoning parameter in the Responses API — клиенты передают объект reasoning (например, reasoning: { "effort": "high" }), чтобы запросить более глубокие внутренние рассуждения; установка reasoning: { "effort": "none" } фактически отключает расширенный проход внутренних рассуждений для снижения задержки. Responses API также возвращает метаданные о рассуждении/токенах (полезно для оценки стоимости и отладки). )
  • Tools & parallel tool calls — GPT-5.1 улучшает параллельные вызовы инструментов и включает именованные инструменты (например, apply_patch), которые сокращают сценарии отказов при программных правках; параллелизация повышает сквозную пропускную способность в рабочих процессах с интенсивным использованием инструментов.
  • Prompt cache and persistence — поддерживается prompt_cache_retention='24h' в эндпойнтах Responses и Chat Completions для сохранения контекста между несколькими репликами в сессии (уменьшает повторное кодирование токенов).

Benchmark performance

Примеры задержки / эффективности по токенам (предоставлены вендором): на рутинных запросах OpenAI сообщает о существенном снижении времени/токенов (пример: команда списка npm, занимавшая ~10 с / ~250 токенов на GPT-5, теперь выполняется ~2 с / ~50 токенов на GPT-5.1 в их репрезентативном тесте). Ранние сторонние тестировщики (например, управляющие активами, компании по разработке ПО) сообщили об ускорении в 2–3 раза на многих задачах и росте эффективности по токенам в сценариях с активным использованием инструментов.

OpenAI и ранние партнеры опубликовали репрезентативные заявления о бенчмарках и измеренные улучшения:

ОценкаGPT‑5.1 (high)GPT‑5 (high)
SWE-bench Verified (all 500 problems)76.3%72.8%
GPQA Diamond (no tools)88.1%85.7%
AIME 2025 (no tools)94.0%94.6%
FrontierMath (with Python tool)26.7%26.3%
MMMU85.4%84.2%
Tau2-bench Airline67.0%62.6%
Tau2-bench Telecom*95.6%96.7%
Tau2-bench Retail77.9%81.1%
BrowseComp Long Context 128k90.0%90.0%

Limitations & safety considerations

  • Риск галлюцинаций сохраняется. Адаптивное рассуждение помогает на сложных задачах, но не устраняет галлюцинации; более высокий reasoning_effort улучшает проверки, но не гарантирует корректность. Всегда проверяйте результаты в критичных случаях.
  • Компромиссы по ресурсам и стоимости: хотя GPT-5.1 может быть значительно эффективнее по токенам на простых сценариях, включение высокого уровня рассуждений или длительного агентного использования инструментов может увеличить потребление токенов и задержку. Используйте кеширование подсказок, чтобы снизить повторяющиеся затраты, где это уместно.
  • Безопасность инструментов: инструменты apply_patch и shell повышают степень автоматизации (и риск). В продакшене следует ограничивать выполнение инструментов (просматривать diff/команды перед запуском), применять наименьшие привилегии и обеспечивать надежные CI/CD и операционные меры защиты.

Comparison with other models

  • vs GPT-5: GPT-5.1 улучшает адаптивное рассуждение и следование инструкциям; OpenAI сообщает о более быстрых ответах на простых задачах и лучшей настойчивости на сложных. GPT-5.1 также добавляет опцию рассуждения none и расширенное кеширование подсказок.
  • vs GPT-4.x / 4.1: GPT-5.1 разработан для более агентных, инструментально-насыщенных и кодовых задач; OpenAI и партнеры сообщают о росте показателей на бенчмарках по программированию и многошаговым рассуждениям. Для многих стандартных разговорных задач GPT-5.1 Instant может быть сопоставим с ранними чат-моделями GPT-4.x, но с улучшенной управляемостью и предустановками «личности».
  • vs Anthropic / Claude / other LLMs: архитектура MoA у ChatGPT 5.1 дает ему заметное преимущество в задачах, требующих сложных многошаговых рассуждений. Он набрал беспрецедентные 98.20 на бенчмарке HELM для сложных рассуждений, по сравнению с 95.60 у Claude 4 и 94.80 у Gemini 2.0 Ultra.

Функции для GPT-5.1

Изучите ключевые функции GPT-5.1, разработанные для повышения производительности и удобства использования. Узнайте, как эти возможности могут принести пользу вашим проектам и улучшить пользовательский опыт.

Цены для GPT-5.1

Изучите конкурентоспособные цены на GPT-5.1, разработанные для различных бюджетов и потребностей использования. Наши гибкие планы гарантируют, что вы платите только за то, что используете, что упрощает масштабирование по мере роста ваших требований. Узнайте, как GPT-5.1 может улучшить ваши проекты, сохраняя при этом управляемые расходы.
Цена Comet (USD / M Tokens)Официальная цена (USD / M Tokens)Скидка
Ввод:$1/M
Вывод:$8/M
Ввод:$1.25/M
Вывод:$10/M
-20%

Пример кода и API для GPT-5.1

Что такое GPT-5.1 API? GPT-5.1 Thinking — это вариант с продвинутым рассуждением из семейства OpenAI GPT-5.1; он отдает приоритет адаптивным, более качественным рассуждениям и предоставляет разработчикам явный контроль над компромиссом между задержкой и вычислительными затратами.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5.1", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Больше моделей