OpenAI lanceert GPT‑5.1-Codex-Max programmeermodel ontworpen voor langlopende taken

OpenAI heeft vandaag GPT‑5.1-Codex-Max uitgebracht, een Agentic-coderingsmodel van de nieuwe generatie, ontworpen voor langlopende taken. Vergeleken met eerdere modellen maakt GPT-5.1-Codex-Max gebruik van "compaction"-technologie, die in meerdere contextvensters kan werken en zelfs op betrouwbare wijze miljoenen tokens in één enkele taak kan verwerken. OpenAI zei dat het model niet alleen de prestaties verbetert, maar ook een sneller en efficiënter tokengebruik realiseert.

Het is duidelijk dat het GPT-5.1-Codex-Max-trainingsproces praktische software-engineeringtaken omvat, zoals PR-creatie, codebeoordeling, front-endontwikkeling en vraag en antwoord, enz., en beter heeft gepresteerd dan eerdere modellen in veel geavanceerde programmeerevaluaties. Het model behaalde bijvoorbeeld een score van 77,9% op SWE-Bench Verified (500 samples), 79,9% op de SWE-Lancer IC SWE-evaluatie en 58,1% op de TerminalBench 2.0-evaluatie, allemaal hoger dan de vorige prestaties van GPT-5.1-Codex.

Naast de ondersteuning van Unix-platforms is GPT‑5.1-Codex-Max specifiek getraind voor Windows-omgevingen. Bij complexe reconstructie- en langlopende agentlussen worden de meeste codeermodellen op de markt beperkt door het contextvenster en zijn ze moeilijk continu te gebruiken. GPT-5.1-Codex-Max kan daarentegen uren of zelfs tientallen uren autonoom draaien door de sessie-inhoud automatisch te comprimeren wanneer de vensterlimiet nadert. Volgens interne testgegevens van OpenAI kan het model meer dan 24 uur continu draaien.

Bovendien gebruikt GPT-5.1-Codex-Max, dankzij verbeterde redeneermogelijkheden, 30% minder denktokens dan GPT-5.1-Codex bij het voltooien van dezelfde taak op SWE-Bench Verified. Via de redeneermodus "Extra Hoog (xhigh)" kan het model dieper nadenken over complexe taken.

Momenteel is GPT‑5.1-Codex-Max gelanceerd in Codex CLI-, IDE-extensie-, cloud- en codebeoordelingsproducten, ter ondersteuning van ChatGPT Plus-, Pro-, Business-, Edu- en Enterprise-premiumabonneegebruikers. Tegelijkertijd zal OpenAI dit model in de nabije toekomst ook in de API introduceren en vervangen door het standaardmodel in Codex.