Token Robin Hood
xAI2026 年 4 月 20 日7分钟

xAI 添加了语音转文本和新的存储计费:Grok 正在成为计量代理运行时

xAI 的最新开发人员更新不仅仅是关于多一种模式。它们表明 Grok 正在走向完整的运行时业务模型:音频输入、文件存储、搜索运行、代码执行以及每个表面的明确定价。

发生了什么xAI 将 Speech-to-Text 标记为 2026 年 4 月 15 日可用,而其定价文档称文件和集合存储费用从 2026 年 4 月 20 日开始。
为什么建筑商关心如果您使用 Grok 进行语音、文件、搜索、代码执行或 MCP,您的账单将不再只是代币。这是运行时行为。
TRH 行动将音频分钟数、存储占用空间、工具调用和令牌使用作为一个系统进行预算,而不是将它们视为单独的意外。

xAI 到底改变了什么

xAI 的发行说明称,Speech to Text 于 2026 年 4 月 15 日推出。专用文档描述了批量和流式转录,REST 的价格为每小时 0.10 美元,流式传输的价格为每小时 0.20 美元,具有多种音频格式和实时中期结果。

这本身就是有用的。更重要的转变位于定价页面。 xAI 现在将网络搜索、X 搜索、代码执行、附件搜索、集合搜索、远程​​ MCP 工具、语音会话和文件存储作为不同的计量表面进行定价。同一页显示文件和馆藏存储费用自 2026 年 4 月 20 日起生效。

为什么这比新的音频端点更重要

许多团队仍然将人工智能成本视为模型选择问题:选择更便宜的模型,压缩提示,然后继续。一旦您的代理开始转录呼叫、存储文件、搜索网络、浏览 X、调用工具和运行代码,这就是不完整的。运行时成为产品。

xAI 正在使该定价模型变得明确。搜索是收费的。代码执行是收费的。语音会话是计费的。存储是收费的。对于建设者来说,这是一个比将特工行为隐藏在一个混合心理数字中的旧习惯更健康的信号。

TRH角度:代理成本现在是多面的

为了 Token Robin Hood 读者们,这个教训很简单:令牌恢复必须扩展到运行时恢复。如果您的代理永远保留文件,转录的音频多于其使用的音频,或者根据例行提示触发搜索和代码执行,则浪费不再仅存在于上下文窗口内。

一个有用的内部指标是每个耐用工件的成本。您花费多少钱来获得某人实际阅读的记录、某人实际发送的报告或某人实际合并的修复?一旦衡量了这一点,存储保留策略和工具门控就开始与即时工程一样重要。

建设者下一步应该做什么

将 Grok 记账分为四个部分:文本标记、音频分钟、工具调用和存储的数据。添加任务级别上限,以便代理无法悄悄地夸大其中任何一项。积极删除过时的文件,并且不要让每个转录都默认成为永久存储。

如果您要比较提供商,请比较完整的运行时堆栈而不是标题模型定价。这意味着检查搜索费用、代码执行费用、存储费用,以及这些工具导致代理积累了多少额外的上下文。这就是真实支出经常隐藏的地方。阅读更多内容 令牌恢复 如果你想要更广泛的框架。

来源