OpenAI Codex18. Apr. 20268 Min.

OpenAI Codex geht über Code hinaus: computer use, Automatisierungen, Speicher und Agenten-Workflows

Die Codex-Veröffentlichung vom 16. April macht aus Codex mehr als einen Code-Assistenten: einen breiteren Agenten für Software-Workflows. Er kann einen Mac mit eigenem Cursor bedienen, einen integrierten Browser nutzen, Bilder erzeugen, Präferenzen behalten, Automatisierungen ausführen und tiefer mit Entwicklerwerkzeugen arbeiten.

Was passiert istCodex erhielt computer use, Plugins, Bildgenerierung, Memory Preview, Automatisierungen, SSH, PR-Review-Support und Verbesserungen für Multi-File-Workspaces.

Warum das wichtig istAgentenarbeit wandert von Code-Edits in den gesamten Software-Lebenszyklus.

TRH-AktionDefiniert Scope, Output-Vertrag und Quellgrenzen, bevor Codex app-übergreifend agiert.

Was OpenAI angekündigt hat

OpenAI sagt, dass Codex inzwischen mehr als 3 Millionen wöchentliche Entwickler bedient und auf den gesamten Softwareentwicklungszyklus ausgeweitet wird. Die App kann Computersteuerung im Hintergrund auf macOS nutzen, mit einem In-App-Browser arbeiten, Bilder mit gpt-image-1.5 erzeugen und iterieren und mehr als 90 zusätzliche Plugins in Tools wie GitLab Issues, CircleCI, CodeRabbit, Render, Microsoft Suite, Atlassian Rovo, Remotion, Neon und Superpowers einsetzen.

Warum das mehr ist als ein Feature-Drop

Die wichtige Verschiebung ist, dass Codex sich von isolierten Coding-Aufgaben hin zu echten Workflows bewegt: Review-Kommentare, Terminals, PDFs, Tabellen, Slides, Dokumente, Remote-Devboxes über SSH, visuelle Iteration und geplante Folgearbeit. OpenAI sagt außerdem, dass threadbasierte Automatisierungen Kontext über Tage oder Wochen erhalten können, während Memory Präferenzen, Korrekturen und mühsam erarbeitete Projektfakten bewahren kann.

Das Risiko: mehr Kontext bedeutet auch mehr Verschwendung

Dieselben Funktionen, die Codex nützlicher machen, können Runs auch teurer und schwerer auditierbar machen. Ein Computer-Use-Agent kann sich durch irrelevante UI klicken. Ein Agent mit Memory kann veraltete Annahmen mitschleppen. Ein pluginreicher Agent kann mehr Kontext einsammeln als nötig. Ein visueller Workflow kann Tokens mit Screenshots und wiederholten Inspektionsschleifen verbrennen.

TRH-Betriebs-Playbook

Bevor ihr einen Workflow an Codex delegiert, definiert Zielartefakt, erlaubte Apps, Quellenrahmen, Stoppbedingungen und Verifikationsbefehl. Nutzt Automatisierungen für wiederkehrende Recherche und Entwürfe, aber lasst Publishing hinter menschlicher Freigabe. Für Teams zählt das Verhältnis zwischen gesammeltem Kontext, ausgeführten Aktionen und ausgelieferten Artefakten. Genau dort liegt der Unterschied zwischen Agentenhebel und Agentendrag.