在2026年1月1日或之前,以及此后每次于2022年1月1日或之后发布、并向加州居民公开提供使用的生成式人工智能系统或服务,或对此类系统或服务的重大修改,无论其使用条款是否包含报酬,该系统或服务的开发者应在其互联网网站上发布关于开发者用于训练该生成式人工智能系统或服务的数据的文档,包括但不限于以下所有内容:
(a)CA 民法 Code § 3111(a) 用于开发生成式人工智能系统或服务的数据集的高级概述,包括但不限于:
(1)CA 民法 Code § 3111(a)(1) 数据集的来源或所有者。
(2)CA 民法 Code § 3111(a)(2) 描述数据集如何促进人工智能系统或服务的预期目的。
(3)CA 民法 Code § 3111(a)(3) 数据集中包含的数据点数量,可以是大致范围,并提供动态数据集的估计数字。
(4)CA 民法 Code § 3111(a)(4) 数据集中数据点的类型描述。就本款而言,适用以下定义:
(A)CA 民法 Code § 3111(a)(4)(A) 适用于包含标签的数据集,“数据点类型”指所使用的标签类型。
(B)CA 民法 Code § 3111(a)(4)(B) 适用于不含标签的数据集,“数据点类型”指一般特征。
(5)CA 民法 Code § 3111(a)(5) 数据集是否包含受版权、商标或专利保护的任何数据,或数据集是否完全属于公共领域。
(6)CA 民法 Code § 3111(a)(6) 数据集是否由开发者购买或授权使用。
(7)CA 民法 Code § 3111(a)(7) 数据集是否包含个人信息,如第1798.140条(v)款所定义。
(8)CA 民法 Code § 3111(a)(8) 数据集是否包含汇总消费者信息,如第1798.140条(b)款所定义。
(9)CA 民法 Code § 3111(a)(9) 开发者是否对数据集进行了任何清理、处理或其他修改,包括这些工作与人工智能系统或服务相关的预期目的。
(10)CA 民法 Code § 3111(a)(10) 数据集中数据收集的时间段,包括数据收集正在进行中的通知。
(11)CA 民法 Code § 3111(a)(11) 数据集在人工智能系统或服务开发过程中首次使用的日期。
(12)CA 民法 Code § 3111(a)(12) 生成式人工智能系统或服务在其开发过程中是否使用或持续使用合成数据生成。开发者可以包含合成数据与系统或服务预期目的相关的功能需求或期望目的的描述。
(b)CA 民法 Code § 3111(b) 开发者无需发布关于用于训练生成式人工智能系统或服务的数据的文档,如果该系统或服务属于以下任何一种情况:
(1)CA 民法 Code § 3111(b)(1) 其唯一目的是帮助确保安全和完整性的生成式人工智能系统或服务。就本款而言,“安全和完整性”具有第1798.140条(ac)款所定义的相同含义,但适用于任何开发者或用户,且不限于该条(d)款所定义的业务。
(2)CA 民法 Code § 3111(b)(2) 其唯一目的是在国家空域内操作飞机的生成式人工智能系统或服务。
(3)CA 民法 Code § 3111(b)(3) 为国家安全、军事或国防目的而开发,且仅提供给联邦实体的生成式人工智能系统或服务。