OpenAI22 أبريل 20266 دقائق

يضيف OpenAI وضع WebSocket إلى واجهة API للاستجابات: أصبحت حلقات الوكيل الأسرع الآن ميزة وقت التشغيل

يعد المنشور الهندسي لـ OpenAI بتاريخ 22 أبريل أمرًا مهمًا لأنه ينقل المحادثة إلى ما هو أبعد من نموذج معدل الذكاء وتسعير الرمز المميز. تقول الشركة أنه بمجرد أن يصبح الاستدلال سريعًا بما فيه الكفاية، تفوز منتجات الوكيل أو تخسر في النقل، وحالة التخزين المؤقت، ومدى ضآلة العمل الزائد الذي تفرضه خلال الحلقة.

ماذا حدثفي 22 أبريل 2026، قالت OpenAI إن وضع WebSocket جعل وكيل واجهة برمجة التطبيقات للردود ينفذ حلقات أسرع بنسبة 40% من البداية إلى النهاية من خلال الحفاظ على اتصال مستمر وإعادة استخدام حالة الاستجابة السابقة.

لماذا يهتم البناؤونأصبح التحقق المتكرر من الصحة والترميز والتوجيه وإعادة بناء السجل بمثابة ضريبة منتج مرئية على وكلاء الترميز وسير العمل الذي يستخدم الأدوات.

عمل TRHقم بتكوين حلقة وكيلك حسب المرحلة وقم بقطع العمل المتكرر قبل السعي وراء ميزانية نموذجية أكبر.

ما تغير فعلا

يصف OpenAI عنق الزجاجة القديم بوضوح. يمكن أن تتطلب مهمة إصلاح الأخطاء بأسلوب Codex عشرات الرحلات ذهابًا وإيابًا: حدد الإجراء التالي، واستدعاء أداة، وأرسل نتيجة الأداة مرة أخرى، ثم كرر ذلك. كان من الأسهل تجاهل هذا الحمل عندما أنتجت النماذج حوالي 65 رمزًا في الثانية. أصبح إخفاء الأمر أكثر صعوبة عندما دفعت OpenAI GPT-5.3-Codex-Spark نحو 1000 رمز في الثانية.

لم يكن الإصلاح خدعة سريعة جديدة. لقد كان تغييرًا في النقل. حافظت OpenAI على اتصال WebSocket المستمر على قيد الحياة، وخزنت حالة استجابة قابلة لإعادة الاستخدام في الذاكرة مؤقتًا، وسمحت لطلبات المتابعة بالمتابعة من خلال previous_response_id بدلاً من إعادة بناء المحادثة بأكملها في كل مرة.

لماذا يعد هذا أكبر من ميزة واحدة لواجهة برمجة التطبيقات (API)؟

تعد هذه إشارة إنشاء مهمة لأنها تجعل سرعة الوكيل مشكلة في الأنظمة. يقول OpenAI أن إصدار WebSocket يعيد استخدام عناصر الإدخال والإخراج السابقة وتعريفات الأدوات ومساحات الأسماء والرموز المميزة. كما أنه يتيح للنظام الأساسي معالجة المدخلات الجديدة فقط لبعض أدوات التحقق من الصحة وفحوصات السلامة بدلاً من إعادة معالجة السجل الكامل في كل منعطف.

هذا هو بالضبط المكان الذي تتسرب فيه العديد من منتجات الوكلاء الوقت والمال. الفاتورة المرئية تقول "الرموز المميزة". تظهر الفاتورة المخفية على شكل تشكيل متكرر للسياق، والتحقق المتكرر، ومصافحات واجهة برمجة التطبيقات الإضافية، وعمليات تسليم نتائج الأدوات البطيئة. النماذج الأسرع تكشف تلك الأخطاء.

ماذا تعني نتائج الإطلاق

تقول OpenAI أن مستخدمي ألفا شهدوا ما يصل إلى 40% من تحسينات سير العمل وأن Codex نقلت معظم حركة مرور واجهة API الخاصة بالاستجابات إلى وضع WebSocket. وتقول الشركة أيضًا إن Vercel وCline وCursor أبلغوا عن مكاسب مادية في زمن الاستجابة بعد دمجها. إن الفكرة العملية بسيطة: أصبحت السباكة في وقت التشغيل الآن جزءًا من السطح التنافسي لوكلاء البرمجة.

بالنسبة لقراء TRH، هذا هو نفس الدرس الموجود خلفنا لماذا يبدو الذكاء الاصطناعي الوكيل باهظ الثمن؟ و تصميم وقت التشغيل لوكلاء الإنتاج. إذا كانت كل أداة تقوم بإعادة بناء الكثير من الحالة، فسيشعر المستخدمون بالسحب قبل أن يلاحظوا أن النموذج أصبح أكثر ذكاءً.

ما الذي يجب على البناة فعله بعد ذلك

قم بقياس سير عمل وكيل حقيقي واحد وتقسيم وقت الاستجابة إلى أربع مجموعات: استدلال النموذج، وعبء واجهة برمجة التطبيقات (API)، ووقت الأداة من جانب العميل، والمعالجة اللاحقة. إذا كان يتم إعادة التحقق من صحة نفس السجل أو مخطط الأداة في كل منعطف، فقم بإصلاح ذلك أولاً.

ثم قم بإجراء ثلاث عمليات فحص للهندسة المعمارية. حافظ على حالة المحادثة تزايدية حيثما أمكن ذلك. افصل زمن استجابة تنفيذ الأداة عن زمن انتقال النموذج في لوحات المعلومات الخاصة بك. وحدد أين تكون الاتصالات المستمرة منطقية بدلاً من الإعداد الافتراضي لسلاسل الطلبات عديمة الحالة للحلقات طويلة الأمد.

النقطة المهمة ليست أن كل وكيل يحتاج إلى WebSockets غدًا. النقطة المهمة هنا هي أن إعادة استخدام وسائل النقل والدولة تعمل الآن بشكل مباشر على تشكيل الذكاء الذي يدركه المستخدم. عندما يتسارع الاستدلال، تصبح النفايات في الحلقة هي المنتج.