OpenAI发布Privacy Filter新模型

AI快讯 2026-04-28 09:45:22 来源:中房网

  中房网讯 近日,OpenAI发布了一款名为Privacy Filter的新模型,旨在帮助开发者有效脱敏文本中的个人身份信息(PII)。该模型的参数规模达到了1.5亿,采用了混合专家(MoE)设计,并以Apache 2.0协议在Hugging Face和GitHub平台开源,供开发者下载、定制和商业使用。

  据悉,Privacy Filter的核心优势在于其深度语言理解能力,能够通过上下文识别非结构化文本中的敏感信息。与传统的基于规则的隐私过滤工具不同,该模型能够准确保留公开信息的同时,对与特定个体相关的敏感数据进行遮盖或脱敏。这一能力使得开发者在训练管线、索引流程、日志记录和审核环节中,能够构建更为强大的隐私保护机制。

  该模型能够支持高达12.8万个Token的上下文窗口,并通过受限维特比算法解码出连贯的片段。在评估中,Privacy Filter在PII-Masking-300k 基准测试中表现出色,F1分数达到了96%。经过对评估中发现的标注问题进行修正后,该模型的F1分数进一步提升至97.43%,显示了其在识别个人敏感信息方面的高效性。