生成式人工智能(大语言模型)上线备案参考指南

为保障生成式人工智能服务的合规上线与安全运营,根据国家相关法律法规及《信息安全技术 生成式人工智能服务安全基本要求》、《互联网交互式服务安全管理要求》(GA 1277系列)等标准规范,特整理本大模型备案参考指南。本指南旨在明确大模型备案所需的具体材料、文档撰写要求及合规要点,供各企业在准备上线备案时参考。

一、 核心备案材料全清单

企业在进行大模型上线备案时,必须准备并提交以下三大类核心材料:

  1. 《生成式人工智能(大语言模型)上线备案表》(需法人与安全评估负责人签字并加盖公章)。
  2. 《生成式人工智能服务自查表 GA 1277 》
  3. 五大核心附件文档
    • 附件1:生成式人工智能服务安全评估报告。
    • 附件2:模型服务协议。
    • 附件3:语料标注规则。
    • 附件4:拦截关键词列表(附电子版)。
    • 附件5:评估测试题集(附电子版)。

二、 《上线备案表》重点填报要求

《上线备案表》是备案材料的核心框架,企业需如实、详尽地填写以下四大板块内容:

1. 基本情况界定

  • 产品属性:明确服务的主要功能(如人机对话、文字/图片生成、代码生成等),清晰界定适用人群(是否适用未成年人)及具体适用场合。
  • 未成年人保护:若服务不适用于未成年人,必须详细说明已采取的用户协议声明、服务界面提示等防范未成年人使用的技术或管理措施。
  • 舆论属性评估:需明确声明该服务是否具有舆论属性或社会动员能力。

2. 模型研制与语料合规

  • 基座模型情况:说明是采用自研模型,还是基于已备案的第三方开源/商业模型进行二次开发(需提供备案号及采用方式)。
  • 算力资源说明:列明用于训练的服务器数量、GPU厂商及是否采用第三方云平台。
  • 语料来源与规模:需详细量化中英文文本、图片、音视频等各种语料的规模(存储量及Token数),清晰划分开源语料、自采语料与商业语料的占比。若使用境外开源网站语料,必须逐一列举。
  • 标注团队与管理:说明标注人员数量、类型(内部或外包),以及标注人员的上岗培训机制与核验比例。
  • 语料合法性声明:明确承诺语料来源合法,不包含侵害他人知识产权或违法违规的个人信息内容。

3. 服务与安全防范能力

  • 身份与隐私管理:详述用户注册认证方式,以及在服务过程中收集、保存个人信息(如手机号、密码等)的类型、用途与保存期限,并说明征得用户同意的方式及受理用户行使个人信息权利的具体途径。
  • 拦截与巡查措施:明确专职监看人员数量、日常抽查比例、应急处置预案等;需提供完整的预置关键词拦截库(涵盖涉政、暴恐、歧视等多维度的违法有害词汇分类)。
  • 内容标识与投诉机制:说明在生成文本、图片或视频时的标识样式、位置与频度;明确向公众公开的投诉举报热线或邮箱,及相应的反馈时限。

4. 安全评估执行情况

  • 需按《基本要求》开展多维度的深度评估,并在备案表中报告人工抽检与自动化抽检的样本数量与合格率,主要涵盖:
    • ① 语料内容与 ② 生成内容评估(合格率指标要求)。
    • ③ 涉知识产权、商业秘密评估(评估拒绝实质性侵权或泄密的能力)。
    • ④ 涉民族、信仰、性别等反歧视评估(评估模型的公平性表现)。
    • ⑤ 涉透明性、准确性、可靠性评估(评估模型客观事实类问题的准确率与任务完成率)。
    • ⑥ 模型性能(拒答率)评估:必须提供“应拒答测试”(测试合法合规的拦截能力)与“非拒答测试”(测试正常问题的防误杀能力)的详细数据。

三、 《GA 1277 自查表》填报指南

依据《互联网交互式服务安全管理要求》(GA 1277系列标准),企业需提交自查表。填报要求如下:

  • 表单选择:表1(基本信息表)和表2(GA 1277.1 基本要求)为所有服务必填;若使用自研或二次开发模型需填写表3;若仅直接调用第三方API且不修改模型则填写表4。
  • 自查核心域:自查内容必须逐项写明“是否适用”、“自查结果(包含管理制度与技术措施)”及“符合度”。核心检查点包括:
    • 组织与人员:设立安全管理岗位、算法安全组织及数据标注管理组织;落实关键岗位背景核查与保密协议。
    • 数据与标注安全:建立数据源筛查机制、数据清洗与过滤规则;制定详尽的数据标注规则(含功能性与安全性标注),并落实“标注执行与审核分离”机制。
    • 模型与内容安全:具备防范提示词注入、数据投毒等攻击的能力;实施严格的违法有害信息过滤与黑名单控制机制。
    • 日志与权限控制:确保访问权限的角色分离与最小化;依法留存注册信息、活动日志及安全事件日志(不少于6个月)以备溯源。

四、 核心附件文档撰写要求

1. 生成式人工智能服务安全评估报告 该报告是备案的最核心证明文件,需由安全评估负责人牵头出具,必须包含以下章节:

  • 语料安全评估:论证语料来源的合法性与纯净性,详述自动化脱敏与人工核验等数据清洗流程,证明不存在知识产权与隐私泄露风险。
  • 模型安全评估:通过构建对抗性测试题库,对模型的生成内容进行深度评估,重点论证模型在“防侵权、反歧视、防幻觉”方面的表现,以及应拒答/非拒答指标的达标情况。
  • 安全措施评估:系统性阐述企业在事前(过滤网关、词库拦截)、事中(人工监看、告警处理)、事后(应急预案、数据留存)部署的整体安全防范体系。

2. 模型服务协议 协议内容必须满足法律的透明性与告知义务:

  • 明确声明服务的性质、限制用途(如禁止用于社会动员等)及适用人群。
  • 明确告知生成内容的概率性本质及局限性,并包含相应的免责声明。
  • 明确用户行为规范(“十不准”等违法违规内容红线),并公开个人信息收集规则与投诉处理渠道。

3. 语料标注规则 该规则需详细定义企业内部的标注规范与质量把控流程:

  • 包含“功能性数据标注”(意图识别、复杂思维链编写等)与“安全性数据标注”(基于风险类别的安全护栏构建,及动态拒答模板)的具体标准。
  • 确立“双盲-仲裁”等质量审核机制,以及针对错误标注的作废重标等质量红线指标(如安全红线零差错)。

五、 备案材料提交方式

  • 相关材料准备齐全后,可随评估测试题目及相关附件,采用**光盘刻录(加密)**的方式,通过EMS等指定快递邮寄至管辖机构指定的受理地点。