xAI20 april 20267 minuten

xAI voegt spraak-naar-tekst en nieuwe opslagfacturering toe: Grok wordt een gemeten agentruntime

De nieuwste ontwikkelaarsupdates van xAI gaan niet alleen over nog een modaliteit. Ze laten zien dat Grok op weg is naar een volledig runtime-bedrijfsmodel: audio in, bestanden opgeslagen, zoekopdrachten uitgevoerd, code uitgevoerd en elk oppervlak expliciet geprijsd.

Wat is er gebeurdxAI heeft spraak-naar-tekst gemarkeerd als beschikbaar op 15 april 2026, terwijl in de prijsdocumentatie staat dat de opslagkosten voor bestanden en verzamelingen beginnen op 20 april 2026.

Waarom bouwers erom gevenAls je Grok gebruikt voor spraak, bestanden, zoeken, code-uitvoering of MCP, bestaat je factuur niet langer alleen maar uit tokens. Het is runtime-gedrag.

TRH-actieBudget audiominuten, opslagruimte, tooloproepen en tokengebruik als één systeem in plaats van ze als afzonderlijke verrassingen te behandelen.

Wat xAI feitelijk heeft veranderd

In de release notes van xAI staat dat Speech to Text beschikbaar kwam op 15 april 2026. De speciale documenten beschrijven batch- en streaming-transcriptie, geprijsd op $ 0,10 per uur voor REST en $ 0,20 per uur voor streaming, met meerdere audioformaten en realtime tussentijdse resultaten.

Dat is op zichzelf nuttig. De belangrijkste verschuiving bevindt zich op de prijspagina. xAI prijst zoeken op internet, X-zoeken, code-uitvoering, zoeken naar bijlagen, zoeken naar collecties, MCP-tools op afstand, spraaksessies en bestandsopslag nu als afzonderlijke meetoppervlakken. Op dezelfde pagina staat dat de opslagkosten voor bestanden en collecties van kracht worden vanaf 20 april 2026.

Waarom dit belangrijker is dan een nieuw audio-eindpunt

Veel teams beschouwen AI-kosten nog steeds als een modelkeuzeprobleem: kies het goedkopere model, comprimeer aanwijzingen en ga verder. Dat is onvolledig zodra uw agent begint met het transcriberen van gesprekken, het opslaan van bestanden, het zoeken op internet, het bladeren door X, het bellen van tools en het uitvoeren van code. De looptijd wordt het product.

xAI maakt dat prijsmodel expliciet. Zoeken wordt gefactureerd. Uitvoering van de code wordt gefactureerd. Spraaksessies worden gefactureerd. Opslag wordt gefactureerd. Dat is een gezonder signaal voor bouwers dan de oude gewoonte om het gedrag van agenten binnen één gemengd mentaal getal te verbergen.

De TRH-invalshoek: de kosten van agenten zijn nu multi-surface

Voor Token Robin Hood lezers, de les is duidelijk: tokenherstel moet worden uitgebreid naar runtimeherstel. Als uw agent bestanden voor altijd bewaart, meer audio transcribeert dan hij gebruikt, of zoekopdrachten en code-uitvoering activeert op basis van routinematige aanwijzingen, vindt de verspilling niet langer alleen binnen het contextvenster plaats.

Een nuttige interne maatstaf zijn de kosten per duurzaam artefact. Hoeveel geeft u uit om een transcriptie te krijgen die iemand daadwerkelijk leest, een rapport dat iemand daadwerkelijk verzendt, of een oplossing die iemand daadwerkelijk samenvoegt? Zodra je dat meet, worden het beleid voor het bewaren van opslag en het gebruik van tools net zo belangrijk als snelle engineering.

Wat bouwers vervolgens moeten doen

Verdeel uw Grok-boekhouding in vier segmenten: teksttokens, audiominuten, toolaanroepen en opgeslagen gegevens. Voeg limieten op taakniveau toe, zodat een agent deze niet stilletjes kan opblazen. Verwijder verouderde bestanden agressief en laat niet elke transcriptie standaard een permanente opslag worden.

Als u providers vergelijkt, vergelijk dan de volledige runtime-stack in plaats van de hoofdmodelprijzen. Dat betekent dat u de zoekkosten, de kosten voor het uitvoeren van code, de opslagkosten en de hoeveelheid extra context die deze tools ervoor zorgen dat de agent verzamelt, moet controleren. Dat is waar de echte uitgaven vaak verborgen blijven. Lees meer op token herstel als je een breder kader wilt.