Token Robin Hood
OpenAI25 أبريل 20265 دقائق

يعمل مرشح خصوصية OpenAI على جعل عملية تنقيح معلومات تحديد الهوية الشخصية (PII) المحلية عملية لمجموعات الوكلاء

من السهل أن يُساء فهم إصدار OpenAI الصادر في 22 أبريل لمرشح الخصوصية باعتباره نموذجًا متخصصًا للسلامة. إنه أكثر فائدة من ذلك. يمنح عامل تصفية الخصوصية المنشئين طريقة محلية أولى مفتوحة الوزن لاكتشاف معلومات التعريف الشخصية وإخفائها قبل أن يتدفق النص إلى المطالبات أو فهارس المتجهات أو السجلات أو قوائم انتظار مراجعة ضمان الجودة أو أدوات الدعم. بالنسبة إلى منتجات وكيل بناء الفرق، فإن ذلك يجعل حماية الخصوصية تبدو أقل كمذكرة سياسة وأكثر تشابهًا مع التحكم الملموس في وقت التشغيل.

ماذا حدثأصدرت OpenAI مرشح الخصوصية، وهو نموذج صغير مفتوح الوزن لاكتشاف وإخفاء معلومات تحديد الهوية الشخصية (PII) المدركة للسياق والتي يمكن تشغيلها محليًا.
لماذا يهتم البناةيمكن للفرق إضافة خطوة خصوصية قبل أن يغادر النص الحساس الجهاز، بدلاً من الأمل في أن يتمكن البائعون المتلقون للمعلومات أو قواعد regex من التقاط كل شيء.
عمل TRHأدخل تنقيحًا محليًا قبل السجلات والتتبعات والتضمينات ودعم الصادرات، ثم قم بقياس الحقول الحساسة التي كانت تتسرب مسبقًا بشكل افتراضي.

هذا خط أنابيب بدائي، وليس مجرد إصدار نموذجي

تصف OpenAI مرشح الخصوصية بأنه نموذج تصنيف رمزي ثنائي الاتجاه يقوم بتسمية النص في مسار واحد ويدعم ما يصل إلى 128000 رمزًا مميزًا للسياق. يحتوي النموذج الذي تم إصداره على إجمالي 1.5 مليار معلمة مع 50 مليون معلمة نشطة، ويغطي ثماني فئات للخصوصية، وهو متاح ضمن Apache 2.0 على Hugging Face وGitHub. إن التأثير المهم للمنتج بسيط: يمكن للفرق الآن تشغيل إخفاء معلومات تحديد الهوية الشخصية (PII) داخل الشركة أو على الجهاز قبل أن تنتقل البيانات إلى بقية المجموعة.

وهذا مهم لأن أنظمة الوكيل تتسرب في أماكن مملة. ليس فقط الإجابات النهائية. غالبًا ما يظهر التسرب في سجلات المطالبة، وتتبعات الفشل، ومجموعات بيانات التقييم، ونصوص الدعم المنسوخة، ومجموعات الاسترجاع المبنية من نص داخلي فوضوي. تساعد التعابير المنطقية في الأنماط الضيقة، ولكنها تميل إلى تفويت الحالات ذات السياق الثقيل أو المبالغة في إخفاء المعلومات العامة. يمنح عامل تصفية الخصوصية الفرق طبقة افتراضية أقوى قبل نشر تلك النصوص أو تخزينها في مكان آخر.

يؤدي التنقيح المحلي إلى تغيير محادثة الهندسة المعمارية

بمجرد إمكانية إجراء التنقيح محليًا، يتغير سؤال التصميم من "أي بائع سحابي يجب أن يرى النص الأولي؟" إلى "ما هي أجزاء المسار التي تستحق النص الخام على الإطلاق؟" يعد هذا إطارًا أفضل لمنتجات وكيل المؤسسة. يمكن للمنشئين تجريد الأسماء ورسائل البريد الإلكتروني وأرقام الهواتف وأرقام الحسابات والتواريخ الخاصة والأسرار قبل تمرير النص إلى أنظمة التلخيص أو البحث أو التصنيف.

وينطبق هذا بشكل خاص على المنتجات التي تعتمد بالفعل على عوامل كثيفة الحركة. وكلاء مساحة العمل, برامج طرح Codex، وأدوات سير العمل الأخرى تستمر في إنشاء المزيد من التتبعات والموافقات وعناصر المراجعة. يوفر عامل تصفية الخصوصية للفرق طبقة معالجة مسبقة أكثر نظافة حتى لا تصبح هذه السجلات التشغيلية مجرد بيانات عرضية.

لماذا هذا مهم بالنسبة للرمز المميز وكفاءة المراجعة أيضًا

حماية الخصوصية ليست مجرد قصة امتثال. يمكن أن يؤدي التنقيح محليًا أيضًا إلى تقليل النفايات في اتجاه مجرى النهر. تعد العناصر النائبة النظيفة أسهل في التمييز، وأكثر أمانًا لإرسالها إلى أدوات التقييم، وأقل خطورة في الاحتفاظ بها لتصحيح الأخطاء. يؤدي ذلك إلى تقليل عدد مسارات العمل التي تحتاج إلى تنقية يدوية قبل إعادة استخدامها لضمان الجودة أو مراجعة الحوادث أو تحليلات المنتج.

ل Token Robin Hood أيها القراء، هذه هي النقطة العملية: التحكم في التكاليف ليس مجرد توجيه للنموذج. كما أنه يقرر أي البيانات يجب أن تدخل الأجزاء الباهظة الثمن من النظام على الإطلاق، وبأي شكل.

ما الذي يجب على الفرق فعله بعد ذلك؟

قم بمراجعة سير عمل وكيل واحد حيث ينتشر النص الخام حاليًا في أنظمة متعددة. ضع عامل تصفية الخصوصية أو خطوة تنقيح محلية مكافئة قبل التسجيل أو التضمين أو المراجعة البشرية. ثم قارن بين الحقول الحساسة التي توقفت عن الانتشار، ومقدار التنظيف اليدوي الذي يختفي، وما إذا كان الاسترداد أو تصحيح الأخطاء لا يزال يعمل مع العناصر النائبة. سيخبرك ذلك ما إذا كانت الخصوصية الافتراضية تعمل بالفعل في مجموعتك أم أنها موصوفة فقط في مستندات السياسة الخاصة بك.

مصادر