人类项目 Glasswing 将前沿人工智能转变为捍卫者的网络安全竞赛
Anthropic 于 4 月 7 日宣布的 Glasswing 项目是迄今为止最明确的信号之一,表明前沿编码模型不再仅仅是代码助手。他们正在成为安全参与者:能够发现、推理并在某些情况下利用关键软件缺陷,其水平 Anthropic 表示现在已经接近顶级人类专家。
Anthropic 宣布了什么
Anthropic 表示,Project Glasswing 汇集了 AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、摩根大通、Linux 基金会、微软、NVIDIA 和 Palo Alto Networks,以及 40 多个构建或维护关键软件基础设施的其他组织。该项目由 Claude Mythos Preview 提供支持,这是一个未发布的前沿模型,Anthropic 表示已经发现了数千个高严重性漏洞,其中一些存在于每个主要操作系统和网络浏览器中。
该公司将投入高达 1 亿美元的使用积分来支持这项工作,并直接向开源安全组织捐款。这个论点很简单:如果这些能力无论如何都会到来,防御者需要时间和计算才能让攻击者获得相同的影响力。
为什么这对于安全团队来说很重要
即使您不构建网络安全产品,这也是一个构建者的故事。当代理编写的代码投入生产时,每家严肃的软件公司都正在成为一家安全公司。如果人工智能现在能够比正常审查流程更快地识别深层错误,那么未经验证的交付速度就会成为一种负担。
这也是一个市场信号。 Anthropic 有效地表示,前沿模型的价值正在超越生成阶段,转变为运营优势:谁可以检查大型代码库,找到隐藏的故障模式,并缩短从错误发现到补丁部署的时间。
TRH 角度:代币效率不仅仅是更快的编码
许多人工智能团队仍然将大部分代币预算用于创建,而很少用于检查。在发电成本低廉且错误复杂的环境中,这是倒退的。 Glasswing 项目提醒我们,验证、补丁审查和对抗性检查值得一流的预算。
对于 Token Robin Hood 读者来说,操作经验很简单:最便宜的代币通常是花在有针对性的验证通行证上的代币,该验证通行证可以防止十次重试、噪音事件或稍后的仓促回滚。安全代理不仅更安全,而且更安全。它们通常更高效,因为它们减少了烧毁上下文窗口的下游混乱。
现在该怎么办
将明确的安全性和可靠性传递添加到重要的代理工作流程中。将生成与验证分开。记录代理更改的内容、测试的内容以及使用的证据。如果您只测量输出速度,您将错过人工智能辅助软件工作的真正经济效益。
Anthropic 的主张将继续在构建者社区中引起争论,但前进的方向已经很明确:强大的编码模型现在是威胁模型和防御堆栈的一部分。