OpenAI25 เมษายน 20265 นาที

ตัวกรองความเป็นส่วนตัวของ OpenAI ทำให้การแก้ไข PII ในเครื่องเป็นประโยชน์สำหรับกลุ่มตัวแทน

ตัวกรองความเป็นส่วนตัวที่เผยแพร่ในวันที่ 22 เมษายนของ OpenAI นั้นง่ายต่อการเข้าใจผิดว่าเป็นโมเดลความปลอดภัยเฉพาะกลุ่ม มันมีประโยชน์มากกว่านั้น ตัวกรองความเป็นส่วนตัวช่วยให้ผู้สร้างมีวิธีแบบเปิดที่เน้นเฉพาะท้องถิ่นในการตรวจจับและปกปิดข้อมูลส่วนบุคคลก่อนที่ข้อความจะไหลเข้าสู่พร้อมท์ ดัชนีเวกเตอร์ บันทึก คิวการตรวจสอบ QA หรือเครื่องมือสนับสนุน สำหรับทีมที่สร้างผลิตภัณฑ์ตัวแทน นั่นทำให้การปกป้องความเป็นส่วนตัวดูเหมือนบันทึกนโยบายน้อยลง แต่ดูเหมือนการควบคุมรันไทม์ที่เป็นรูปธรรมมากขึ้น

เกิดอะไรขึ้นOpenAI เปิดตัว Privacy Filter ซึ่งเป็นโมเดล open-weight ขนาดเล็กสำหรับการตรวจจับและการมาสก์ PII แบบรับรู้บริบทที่สามารถทำงานได้ในเครื่อง

เหตุใดผู้สร้างจึงสนใจทีมสามารถเพิ่มขั้นตอนความเป็นส่วนตัวก่อนที่ข้อความที่ละเอียดอ่อนจะออกจากเครื่อง แทนที่จะหวังว่าผู้จำหน่ายขั้นปลายหรือกฎ regex จะตรวจจับทุกอย่าง

การกระทำ TRHแทรกการแก้ไขในเครื่องก่อนบันทึก การติดตาม การฝัง และการสนับสนุนการส่งออก จากนั้นวัดว่าฟิลด์ที่ละเอียดอ่อนใดบ้างที่รั่วไหลก่อนหน้านี้ตามค่าเริ่มต้น

นี่คือไปป์ไลน์ดั้งเดิม ไม่ใช่แค่การเผยแพร่โมเดลเท่านั้น

OpenAI อธิบายตัวกรองความเป็นส่วนตัวว่าเป็นโมเดลการจำแนกโทเค็นแบบสองทิศทางที่ติดป้ายกำกับข้อความในการส่งครั้งเดียว และรองรับโทเค็นบริบทได้มากถึง 128,000 รายการ รุ่นที่เปิดตัวมีพารามิเตอร์รวม 1.5B พร้อมพารามิเตอร์ที่ใช้งานอยู่ 50M ครอบคลุมหมวดหมู่ความเป็นส่วนตัว 8 หมวดหมู่ และพร้อมใช้งานภายใต้ Apache 2.0 บน Hugging Face และ GitHub นัยสำคัญของผลิตภัณฑ์นั้นเรียบง่าย: ขณะนี้ทีมสามารถเรียกใช้การมาสก์ PII ในองค์กรหรือในอุปกรณ์ได้ ก่อนที่ข้อมูลจะย้ายไปยังส่วนที่เหลือของสแต็ก

นั่นสำคัญเพราะระบบตัวแทนรั่วไหลในจุดที่น่าเบื่อ ไม่ใช่แค่คำตอบสุดท้ายเท่านั้น การรั่วไหลมักจะปรากฏในบันทึกพร้อมท์ การติดตามความล้มเหลว ชุดข้อมูลประเมิน บันทึกการสนับสนุนที่คัดลอก และการดึงข้อมูลที่สร้างขึ้นจากข้อความภายในที่ยุ่งเหยิง Regexes ช่วยในรูปแบบที่แคบ แต่มักจะพลาดกรณีที่มีบริบทจำนวนมากหรือปกปิดข้อมูลสาธารณะมากเกินไป ตัวกรองความเป็นส่วนตัวช่วยให้ทีมมีเลเยอร์เริ่มต้นที่แข็งแกร่งขึ้น ก่อนที่ข้อความเหล่านั้นจะถูกเผยแพร่หรือจัดเก็บไว้ที่อื่น

การแก้ไขในท้องถิ่นจะเปลี่ยนการสนทนาทางสถาปัตยกรรม

เมื่อการแก้ไขสามารถเกิดขึ้นภายในเครื่องได้ คำถามเกี่ยวกับการออกแบบจะเปลี่ยนจาก “ผู้จำหน่ายระบบคลาวด์รายใดควรเห็นข้อความดิบ” ถึง "ส่วนใดของไปป์ไลน์ที่สมควรได้รับข้อความดิบเลย" นั่นเป็นกรอบที่ดีกว่าสำหรับผลิตภัณฑ์ตัวแทนระดับองค์กร ผู้สร้างสามารถดึงชื่อ อีเมล หมายเลขโทรศัพท์ หมายเลขบัญชี วันที่ส่วนตัว และความลับ ก่อนที่จะส่งข้อความไปยังระบบการสรุป การค้นหา หรือการติดป้ายกำกับ

สิ่งนี้มีความเกี่ยวข้องโดยเฉพาะกับผลิตภัณฑ์ที่ต้องใช้สารออกฤทธิ์ที่ออกฤทธิ์หนักอยู่แล้ว ตัวแทนพื้นที่ทำงาน, โปรแกรมการเปิดตัว Codexและเครื่องมือเวิร์กโฟลว์อื่นๆ จะสร้างการติดตาม การอนุมัติ และการตรวจทานอาร์ติแฟกต์เพิ่มมากขึ้น ตัวกรองความเป็นส่วนตัวช่วยให้ทีมมีชั้นการประมวลผลล่วงหน้าที่สะอาดขึ้น ดังนั้นบันทึกการปฏิบัติงานเหล่านั้นจะไม่ทำให้ข้อมูลหมดไปโดยไม่ได้ตั้งใจ

เหตุใดจึงมีความสำคัญต่อโทเค็นและตรวจสอบประสิทธิภาพด้วย

การคุ้มครองความเป็นส่วนตัวไม่ได้เป็นเพียงเรื่องของการปฏิบัติตามข้อกำหนดเท่านั้น การปรับปรุงแก้ไขในพื้นที่สามารถลดของเสียจากปลายน้ำได้ ตัวยึดตำแหน่งที่สะอาดจะกระจายได้ง่ายกว่า ปลอดภัยกว่าในการส่งไปยังชุดควบคุม Eval และมีความเสี่ยงน้อยกว่าที่จะเก็บไว้เพื่อแก้ไขจุดบกพร่อง ซึ่งจะช่วยลดจำนวนเวิร์กโฟลว์ที่จำเป็นต้องขัดด้วยตนเองก่อนที่จะนำมาใช้ซ้ำสำหรับ QA การตรวจสอบเหตุการณ์ หรือการวิเคราะห์ผลิตภัณฑ์

สำหรับ Token Robin Hood ผู้อ่าน นี่คือจุดที่ใช้งานได้จริง: การควบคุมต้นทุนไม่ใช่แค่การกำหนดเส้นทางแบบจำลองเท่านั้น นอกจากนี้ยังกำลังตัดสินใจว่าข้อมูลใดควรเข้าสู่ส่วนที่มีราคาแพงของระบบ และในรูปแบบใด

ว่าทีมไหนควรทำต่อไป

ตรวจสอบเวิร์กโฟลว์ตัวแทนหนึ่งรายการซึ่งมีข้อความดิบกระจายไปยังหลายระบบ ใส่ตัวกรองความเป็นส่วนตัวหรือขั้นตอนการปกปิดในพื้นที่ที่เทียบเท่า ก่อนที่จะบันทึก การฝัง หรือการตรวจสอบโดยเจ้าหน้าที่ จากนั้นเปรียบเทียบว่าช่องที่ละเอียดอ่อนใดหยุดเผยแพร่ จำนวนการล้างข้อมูลด้วยตนเองที่หายไป และการเรียกข้อมูลหรือการแก้ไขจุดบกพร่องยังคงใช้งานได้กับตัวยึดตำแหน่งหรือไม่ ซึ่งจะบอกคุณว่าความเป็นส่วนตัวโดยค่าเริ่มต้นนั้นใช้งานได้จริงในสแต็กของคุณหรืออธิบายไว้ในเอกสารนโยบายของคุณเท่านั้น