오픈AI2026년 4월 25일5분

OpenAI 개인 정보 보호 필터를 사용하면 에이전트 스택에 대한 로컬 PII 수정이 실용적입니다.

OpenAI의 4월 22일 프라이버시 필터 릴리스는 틈새 안전 모델로 오해되기 쉽습니다. 그보다 더 유용합니다. 개인 정보 보호 필터는 텍스트가 프롬프트, 벡터 인덱스, 로그, QA 검토 대기열 또는 지원 도구로 유입되기 전에 개인 식별 정보를 감지하고 마스킹하는 개방형 로컬 우선 방법을 빌더에게 제공합니다. 에이전트 제품을 구축하는 팀의 경우 개인정보 보호가 정책 노트라기보다는 구체적인 런타임 제어처럼 보입니다.

무슨 일이에요OpenAI는 로컬에서 실행할 수 있는 상황 인식 PII 감지 및 마스킹을 위한 소형 개방형 모델인 개인 정보 보호 필터를 출시했습니다.

건축업자들이 관심을 갖는 이유팀은 다운스트림 공급업체나 정규식 규칙이 모든 것을 포착하기를 바라지 않고 민감한 텍스트가 컴퓨터를 떠나기 전에 개인 정보 보호 단계를 추가할 수 있습니다.

TRH 액션로그, 추적, 임베딩 및 지원 내보내기 앞에 로컬 수정을 삽입한 다음 기본적으로 이전에 유출된 민감한 필드가 무엇인지 측정합니다.

이는 모델 출시일 뿐만 아니라 파이프라인 기본 요소입니다.

OpenAI는 개인 정보 보호 필터를 한 번의 패스로 텍스트에 레이블을 지정하고 최대 128,000개의 컨텍스트 토큰을 지원하는 양방향 토큰 분류 모델로 설명합니다. 출시된 모델에는 총 15억 개의 매개변수와 5천만 개의 활성 매개변수가 있으며 8개의 개인 정보 보호 카테고리를 다루며 Hugging Face 및 GitHub의 Apache 2.0에서 사용할 수 있습니다. 중요한 제품 의미는 간단합니다. 이제 팀은 데이터가 스택의 나머지 부분으로 이동하기 전에 온프레미스 또는 기기 내에서 PII 마스킹을 실행할 수 있습니다.

에이전트 시스템이 지루한 곳에서 누출되기 때문에 이는 중요합니다. 최종 답변뿐만이 아닙니다. 누출은 종종 프롬프트 로그, 오류 추적, 평가 데이터 세트, 복사된 지원 기록 및 지저분한 내부 텍스트로 구축된 검색 말뭉치에 나타납니다. 정규식은 좁은 패턴에 도움이 되지만 상황이 많은 경우나 공개 정보를 과도하게 마스크하는 경우를 놓치는 경향이 있습니다. 개인 정보 보호 필터는 해당 텍스트가 다른 곳에 전파되거나 저장되기 전에 팀에 더 강력한 기본 레이어를 제공합니다.

로컬 편집은 아키텍처 대화를 변경합니다.

로컬에서 수정이 이루어지면 설계 질문이 "어느 클라우드 공급업체가 원시 텍스트를 봐야 합니까?"에서 변경됩니다. "파이프라인의 어느 부분에 원시 텍스트가 필요한가?" 이는 엔터프라이즈 에이전트 제품에 대한 더 나은 구성입니다. 빌더는 텍스트를 요약, 검색 또는 라벨링 시스템에 전달하기 전에 이름, 이메일, 전화번호, 계좌 번호, 개인 날짜 및 비밀을 제거할 수 있습니다.

이는 이미 액션이 많은 에이전트에 의존하고 있는 제품과 관련이 있습니다. Workspace 에이전트, Codex 출시 프로그램및 기타 워크플로 도구는 계속해서 더 많은 추적, 승인 및 검토 아티팩트를 생성합니다. 개인 정보 보호 필터는 팀에 더 깔끔한 사전 처리 계층을 제공하므로 해당 운영 기록이 실수로 데이터가 소진되는 일이 없습니다.

이것이 토큰 및 검토 효율성에도 중요한 이유

개인정보 보호는 단순히 규정 준수 이야기가 아닙니다. 로컬에서 수정하면 다운스트림 낭비도 줄일 수 있습니다. 깨끗한 자리 표시자는 비교하기 쉽고, 평가 도구로 보내는 것이 더 안전하며, 디버깅을 위해 보관하는 것이 덜 위험합니다. 그러면 QA, 사건 검토 또는 제품 분석에 재사용하기 전에 수동으로 스크러빙해야 하는 워크플로의 수가 줄어듭니다.

을 위한 Token Robin Hood 독자 여러분, 이것이 실용적인 요점입니다. 비용 관리는 모델 라우팅에만 국한되지 않습니다. 또한 어떤 데이터가 시스템의 값비싼 부분에 어떤 형식으로 입력되어야 하는지 결정하는 것입니다.

다음 팀은 무엇을 해야 할까요?

현재 원시 텍스트가 여러 시스템으로 확산되는 단일 에이전트 워크플로를 감사합니다. 로깅, 삽입 또는 사람의 검토 전에 개인정보 보호 필터 또는 이에 상응하는 로컬 수정 단계를 적용하세요. 그런 다음 어떤 민감한 필드가 전파를 중지하는지, 수동 정리가 얼마나 사라지는지, 검색 또는 디버깅이 여전히 자리 표시자로 작동하는지 비교합니다. 그러면 기본적으로 개인 정보 보호가 실제로 스택에서 작동하는지 아니면 정책 문서에만 설명되어 있는지 알 수 있습니다.