Home/Models/OpenAI/GPT-5.1
O

GPT-5.1

Inndata:$1/M
Utdata:$8/M
GPT-5.1 er en generell, instruksjonsfinjustert språkmodell med fokus på tekstgenerering og resonnering på tvers av produktarbeidsflyter. Den støtter dialog i flere omganger, strukturert formatering av utdata og kodeorienterte oppgaver som utforming, refaktorering og forklaring. Typiske bruksområder inkluderer chatassistenter, gjenfinning-forsterket QA, datatransformasjon og automatisering i agent-stil med verktøy eller API-er når det støttes. Tekniske høydepunkter inkluderer tekstsentrisk modalitet, evne til å følge instruksjoner, utdata i JSON-stil og kompatibilitet med funksjonskall i vanlige orkestreringsrammeverk.
Ny
Kommersiell bruk
Playground
Oversikt
Funksjoner
Priser
API

GPT-5.1 Thinking er den avanserte resonneringsvarianten i OpenAIs GPT-5.1-familie; den prioriterer adaptiv, mer høyverdig resonnering og gir utviklere eksplisitt kontroll over avveiingen mellom latens og beregning.

Grunnleggende funksjoner

  • Adaptiv resonnering: modellen justerer tenkedybden dynamisk per forespørsel — raskere på rutineoppgaver, mer utholdende på komplekse. Dette reduserer latens og token-bruk for vanlige spørsmål, allokerer eksplisitt mer resonnementstid for komplekse prompt, og er mer utholdende på flerstegsproblemer; kan være tregere på vanskelige oppgaver men gir dypere svar.
  • Resonneringsmoduser: none / low / medium / high (GPT-5.1 bruker som standard none for lav-latens-tilfeller; velg høyere nivåer for mer krevende oppgaver). Responses API eksponerer en reasoning-parameter for å kontrollere dette.
  • Standard tone og stil: skrevet for å være tydeligere om komplekse temaer (mindre sjargong), mer forklarende og “tålmodig”.
  • Kontekstvindu (tokens / lang kontekst) Thinking: mye større — 400K token-kontekst for betalende nivåer.

Viktige tekniske detaljer

  • Adaptiv beregningsallokering — trenings- og inferensdesignet gjør at modellen bruker færre resonneringstoken på trivielle oppgaver og proporsjonalt flere på vanskelige oppgaver. Dette er ikke en separat “tenkemotor”, men en dynamisk allokering innenfor resonnementspipelinen.
  • Reasoning-parameter i Responses API — klienter sender inn et reasoning-objekt (for eksempel reasoning: { "effort": "high" }) for å be om dypere intern resonnering; ved å sette reasoning: { "effort": "none" } deaktiveres den utvidede interne resonnementspassasjen for lavere latens. Responses API returnerer også metadata om resonnement/token (nyttig for kostnad og feilsøking). )
  • Verktøy og parallelle verktøykall — GPT-5.1 forbedrer parallelle verktøykall og inkluderer navngitte verktøy (som apply_patch) som reduserer feilmønstre ved programmatisk redigering; parallelisering øker ende-til-ende-gjennomstrømningen for arbeidsflyter som er tunge på verktøy.
  • Prompt-cache og persistens — prompt_cache_retention='24h' støttes på Responses- og Chat Completions-endepunktene for å beholde kontekst på tvers av flerstegssamtaler (reduserer gjentatt token-koding).

Benchmark-ytelse

Eksempler på latens / tokeneffektivitet (leverandør-oppgitt): for rutineforespørsler rapporterer OpenAI dramatiske reduksjoner i tid og tokens (eksempel: en npm listing-kommando som tok ~10s / ~250 tokens på GPT-5 tar nå ~2s / ~50 tokens på GPT-5.1 i deres representative test). Uavhengige tidlige testere (f.eks. kapitalforvaltere, kodefirmaer) rapporterte 2–3× hastighetsøkning på mange oppgaver og gevinster i tokeneffektivitet i verktøytunge flyter.

OpenAI og tidlige partnere publiserte representative benchmark-påstander og målte forbedringer:

EvalueringGPT‑5.1 (high)GPT‑5 (high)
SWE-bench Verified (all 500 problems)76.3%72.8%
GPQA Diamond (no tools)88.1%85.7%
AIME 2025 (no tools)94.0%94.6%
FrontierMath (with Python tool)26.7%26.3%
MMMU85.4%84.2%
Tau2-bench Airline67.0%62.6%
Tau2-bench Telecom*95.6%96.7%
Tau2-bench Retail77.9%81.1%
BrowseComp Long Context 128k90.0%90.0%

Begrensninger og sikkerhetshensyn

  • Hallusinasjonsrisiko består. Adaptiv resonnering hjelper ved komplekse problemer, men eliminerer ikke hallusinasjoner; høyere reasoning_effort forbedrer kontrollene, men garanterer ikke korrekthet. Valider alltid utdata i høyrisikosammenhenger.
  • Ressurs- og kostnadsavveiinger: selv om GPT-5.1 kan være langt mer token-effektiv i enkle flyter, kan høy resonneringsinnsats eller langvarig agentisk verktøybruk øke token-forbruk og latens. Bruk prompt-caching for å dempe gjentatte kostnader der det er hensiktsmessig.
  • Verktøysikkerhet: apply_patch- og shell-verktøy øker automasjonskraften (og risikoen). Produksjonsutrullinger bør styre verktøyeksekvering (gjennomgå diff’er/kommandoer før kjøring), bruke minste privilegium og sikre robuste CI/CD- og operasjonelle sikringsmekanismer.

Sammenligning med andre modeller

  • vs GPT-5: GPT-5.1 forbedrer adaptiv resonnering og instruksjonsfølging; OpenAI rapporterer raskere svartider på enkle oppgaver og bedre utholdenhet på vanskelige oppgaver. GPT-5.1 legger også til none-resonneringsalternativet og utvidet prompt-caching.
  • vs GPT-4.x / 4.1: GPT-5.1 er designet for mer agentiske, verktøytunge og kodingstunge oppgaver; OpenAI og partnere rapporterer gevinster på kodebenchmarker og flerstegsresonnering. For mange standard samtaleoppgaver kan GPT-5.1 Instant være sammenlignbar med tidligere GPT-4.x chat-modeller, men med bedre styrbarhet og personlighetspresets.
  • vs Anthropic / Claude / andre LLM-er: ChatGPT 5.1s MoA-arkitektur gir en tydelig fordel i oppgaver som krever kompleks, flerstegsresonnering. Den oppnådde en enestående 98.20 på HELM-benchmarket for kompleks resonnering, sammenlignet med Claude 4s 95.60 og Gemini 2.0 Ultras 94.80.

Funksjoner for GPT-5.1

Utforsk nøkkelfunksjonene til GPT-5.1, designet for å forbedre ytelse og brukervennlighet. Oppdag hvordan disse mulighetene kan være til nytte for prosjektene dine og forbedre brukeropplevelsen.

Priser for GPT-5.1

Utforsk konkurransedyktige priser for GPT-5.1, designet for å passe ulike budsjetter og bruksbehov. Våre fleksible planer sikrer at du bare betaler for det du bruker, noe som gjør det enkelt å skalere etter hvert som kravene dine vokser. Oppdag hvordan GPT-5.1 kan forbedre prosjektene dine samtidig som kostnadene holdes håndterbare.
Komet-pris (USD / M Tokens)Offisiell pris (USD / M Tokens)Rabatt
Inndata:$1/M
Utdata:$8/M
Inndata:$1.25/M
Utdata:$10/M
-20%

Eksempelkode og API for GPT-5.1

GPT 5.1 API er det GPT-5.1 Thinking er: den avanserte resonneringsvarianten i OpenAIs GPT-5.1-familie; den prioriterer adaptiv resonnering av høyere kvalitet samtidig som den gir utviklere eksplisitt kontroll over avveiningen mellom latens og beregning.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5.1", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Flere modeller