أنثروبي19 أبريل 20268 دقائق

يقوم مشروع Glasswing الأنثروبي بتحويل الذكاء الاصطناعي الحدودي إلى سباق للأمن السيبراني للمدافعين

يعد إعلان مشروع Glasswing الذي أصدرته Anthropic في 7 أبريل واحدًا من أوضح الإشارات حتى الآن على أن نماذج البرمجة الحدودية لم تعد مجرد مساعدين برمجيين. لقد أصبحوا جهات فاعلة أمنية: قادرون على العثور على عيوب البرمجيات الخطيرة، والتفكير فيها، وفي بعض الحالات استغلالها على مستوى يقول Anthropic إنه يقترب الآن من كبار الخبراء البشريين.

ماذا حدثأطلقت Anthropic مشروع Glasswing، مما أتاح لشركاء البنية التحتية الرئيسيين والمشرفين الإضافيين إمكانية الوصول إلى Claude Mythos Preview للعثور على نقاط الضعف الحرجة وإصلاحها.

لماذا يهتم البناةإذا تمكنت أفضل النماذج من اكتشاف الأخطاء واستغلال ذلك بشكل فعال، فإن تطوير البرامج الآمنة يصبح سباقًا للوكلاء، وليس مجرد مشكلة مراجعة التعليمات البرمجية.

عمل TRHانقل عمليات التحقق من الأمان مسبقًا في حلقة الوكيل ورموز الميزانية للتحقق، وليس فقط الإنشاء.

ما أعلن الأنثروبي

تقول Anthropic أن Project Glasswing يجمع بين AWS وApple وBroadcom وCisco وCrowdStrike وGoogle وJPMorganChase وLinux Foundation وMicrosoft وNVIDIA وPalo Alto Networks، إلى جانب أكثر من 40 مؤسسة إضافية تعمل على إنشاء البنية التحتية المهمة للبرامج أو صيانتها. يتم تشغيل المشروع بواسطة Claude Mythos Preview، وهو نموذج حدودي لم يتم طرحه بعد، تقول Anthropic إنه اكتشف بالفعل الآلاف من نقاط الضعف عالية الخطورة، بما في ذلك بعض الثغرات الموجودة في كل نظام تشغيل ومتصفح ويب رئيسي.

وتضع الشركة ما يصل إلى 100 مليون دولار من أرصدة الاستخدام لدعم هذا الجهد، بالإضافة إلى التبرعات المباشرة لمنظمات الأمن مفتوحة المصدر. والحجة واضحة ومباشرة: إذا وصلت هذه القدرات على أي حال، فإن المدافعين يحتاجون إلى الوقت والحساب قبل أن يحصل المهاجمون على نفس النفوذ.

لماذا هذا مهم خارج فرق الأمن

حتى لو لم تقم ببناء منتجات الأمن السيبراني، فهذه قصة بناء. تتحول كل شركة برمجيات جادة إلى شركة أمنية في اللحظة التي يصل فيها الكود المكتوب من قبل الوكيل إلى مرحلة الإنتاج. إذا تمكن الذكاء الاصطناعي الآن من تحديد الأخطاء العميقة بشكل أسرع مما تستطيع عمليات المراجعة العادية اكتشافها، فإن سرعة الشحن دون التحقق تصبح مسؤولية.

وهذه أيضًا إشارة للسوق. تقول Anthropic بشكل فعال أن قيمة النموذج الحدودي تنتقل إلى ما هو أبعد من التوليد إلى الميزة التشغيلية: من يمكنه فحص قواعد التعليمات البرمجية الكبيرة، والعثور على أوضاع الفشل المخفية، وتقصير الوقت من اكتشاف الأخطاء إلى نشر التصحيح.

زاوية TRH: كفاءة الرمز المميز لا تتعلق فقط بالترميز بشكل أسرع

لا يزال الكثير من فرق الذكاء الاصطناعي تنفق معظم ميزانيتها المميزة على الإنشاء والقليل جدًا على التحقق. وهذا يعتبر تراجعا في بيئة يكون فيها التوليد رخيصا والأخطاء تتفاقم. يعد مشروع Glasswing بمثابة تذكير بأن التحقق ومراجعة التصحيح والفحص التنافسي تستحق ميزانية من الدرجة الأولى.

بالنسبة لقراء Token Robin Hood، فإن الدرس التشغيلي بسيط: أرخص رمز مميز غالبًا ما يكون هو الذي يتم إنفاقه على تمرير التحقق المستهدف الذي يمنع عشر محاولات إعادة، أو وقوع حادث صاخب، أو التراجع السريع لاحقًا. إن الوكلاء الآمنين ليسوا أكثر أماناً فحسب؛ عادةً ما تكون أكثر كفاءة لأنها تقلل من الفوضى التي تؤدي إلى حرق نوافذ السياق.

ماذا تفعل الآن

أضف تمريرات أمان وموثوقية واضحة إلى سير عمل الوكيل المهم. جيل منفصل عن التحقق. احتفظ بسجل لما قام الوكيل بتغييره، وما اختبره، وما هي الأدلة التي استخدمها. إذا قمت بقياس سرعة الإخراج فقط، فسوف تفوت الاقتصاد الحقيقي لعمل البرامج المدعومة بالذكاء الاصطناعي.

سيظل ادعاء Anthropic موضع نقاش في مجتمعات البناء، لكن اتجاه السفر واضح بالفعل: أصبحت نماذج الترميز القوية الآن جزءًا من نموذج التهديد وجزءًا من حزمة الدفاع.