OpenAI Codex geht über Code hinaus: computer use, Automatisierungen, Speicher und Agenten-Workflows
Die Codex-Veröffentlichung vom 16. April macht aus Codex mehr als einen Code-Assistenten: einen breiteren Agenten für Software-Workflows. Er kann einen Mac mit eigenem Cursor bedienen, einen integrierten Browser nutzen, Bilder erzeugen, Präferenzen behalten, Automatisierungen ausführen und tiefer mit Entwicklerwerkzeugen arbeiten.
Was OpenAI angekündigt hat
OpenAI sagt, dass Codex inzwischen mehr als 3 Millionen wöchentliche Entwickler bedient und auf den gesamten Softwareentwicklungszyklus ausgeweitet wird. Die App kann Computersteuerung im Hintergrund auf macOS nutzen, mit einem In-App-Browser arbeiten, Bilder mit gpt-image-1.5 erzeugen und iterieren und mehr als 90 zusätzliche Plugins in Tools wie GitLab Issues, CircleCI, CodeRabbit, Render, Microsoft Suite, Atlassian Rovo, Remotion, Neon und Superpowers einsetzen.
Warum das mehr ist als ein Feature-Drop
Die wichtige Verschiebung ist, dass Codex sich von isolierten Coding-Aufgaben hin zu echten Workflows bewegt: Review-Kommentare, Terminals, PDFs, Tabellen, Slides, Dokumente, Remote-Devboxes über SSH, visuelle Iteration und geplante Folgearbeit. OpenAI sagt außerdem, dass threadbasierte Automatisierungen Kontext über Tage oder Wochen erhalten können, während Memory Präferenzen, Korrekturen und mühsam erarbeitete Projektfakten bewahren kann.
Das Risiko: mehr Kontext bedeutet auch mehr Verschwendung
Dieselben Funktionen, die Codex nützlicher machen, können Runs auch teurer und schwerer auditierbar machen. Ein Computer-Use-Agent kann sich durch irrelevante UI klicken. Ein Agent mit Memory kann veraltete Annahmen mitschleppen. Ein pluginreicher Agent kann mehr Kontext einsammeln als nötig. Ein visueller Workflow kann Tokens mit Screenshots und wiederholten Inspektionsschleifen verbrennen.
TRH-Betriebs-Playbook
Bevor ihr einen Workflow an Codex delegiert, definiert Zielartefakt, erlaubte Apps, Quellenrahmen, Stoppbedingungen und Verifikationsbefehl. Nutzt Automatisierungen für wiederkehrende Recherche und Entwürfe, aber lasst Publishing hinter menschlicher Freigabe. Für Teams zählt das Verhältnis zwischen gesammeltem Kontext, ausgeführten Aktionen und ausgelieferten Artefakten. Genau dort liegt der Unterschied zwischen Agentenhebel und Agentendrag.