Section § 3110

Explanation

本法案为本标题的目的定义了与人工智能(AI)相关的关键术语。它解释了“人工智能”和“生成式人工智能”的含义,侧重于它们的能力和功能,例如生成内容。它描述了“开发者”是谁,详细说明了参与创建或修改供公众使用的人工智能系统的实体。该法案还将“实质性修改”定义为改变人工智能功能的变更,并将“合成数据生成”解释为从种子数据创建人工数据的过程。最后,它阐明了“训练生成式人工智能系统”的含义,包括测试和微调等活动。

为本标题之目的,以下定义适用:
(a)CA 民法 Code § 3110(a) “人工智能”是指一种工程化或基于机器的系统,其自主程度各异,并能为明确或隐含的目标,从其接收的输入中推断如何生成可影响物理或虚拟环境的输出。
(b)CA 民法 Code § 3110(b) “开发者”是指设计、编码、生产或实质性修改人工智能系统或服务以供公众使用的个人、合伙企业、州或地方政府机构或公司。就本款而言,“公众”不包括第1799.1a条 (c) 款 (1) 项 (A) 目所定义的关联方,或医院的医务人员。
(c)CA 民法 Code § 3110(c) “生成式人工智能”是指能够生成派生的人工合成内容(例如文本、图像、视频和音频),并模仿人工智能训练数据的结构和特征的人工智能。
(d)CA 民法 Code § 3110(d) “实质性修改”是指对生成式人工智能系统或服务进行的新版本、新发布或其他更新,这些更新实质性地改变了其功能或性能,包括再训练或微调的结果。
(e)CA 民法 Code § 3110(e) “合成数据生成”是指一个过程,其中使用种子数据来创建具有种子数据某些统计特征的人工数据。
(f)CA 民法 Code § 3110(f) “训练生成式人工智能系统或服务”包括由人工智能系统或服务的开发者进行的测试、验证或微调。

Section § 3111

Explanation

这项法律要求加州的生成式人工智能系统开发者公布用于训练其AI系统的详细数据信息。这包括提供数据集的摘要、数据来源、数据类型、任何法律保护以及所做的修改。他们必须披露是否使用了个人数据或合成数据,以及数据何时收集和首次使用。然而,对于专门用于安全、空域操作或国家安全等特定联邦用途的AI系统,开发者无需提供这些文档。

在2026年1月1日或之前,以及此后每次于2022年1月1日或之后发布、并向加州居民公开提供使用的生成式人工智能系统或服务,或对此类系统或服务的重大修改,无论其使用条款是否包含报酬,该系统或服务的开发者应在其互联网网站上发布关于开发者用于训练该生成式人工智能系统或服务的数据的文档,包括但不限于以下所有内容:
(a)CA 民法 Code § 3111(a) 用于开发生成式人工智能系统或服务的数据集的高级概述,包括但不限于:
(1)CA 民法 Code § 3111(a)(1) 数据集的来源或所有者。
(2)CA 民法 Code § 3111(a)(2) 描述数据集如何促进人工智能系统或服务的预期目的。
(3)CA 民法 Code § 3111(a)(3) 数据集中包含的数据点数量,可以是大致范围,并提供动态数据集的估计数字。
(4)CA 民法 Code § 3111(a)(4) 数据集中数据点的类型描述。就本款而言,适用以下定义:
(A)CA 民法 Code § 3111(a)(4)(A) 适用于包含标签的数据集,“数据点类型”指所使用的标签类型。
(B)CA 民法 Code § 3111(a)(4)(B) 适用于不含标签的数据集,“数据点类型”指一般特征。
(5)CA 民法 Code § 3111(a)(5) 数据集是否包含受版权、商标或专利保护的任何数据,或数据集是否完全属于公共领域。
(6)CA 民法 Code § 3111(a)(6) 数据集是否由开发者购买或授权使用。
(7)CA 民法 Code § 3111(a)(7) 数据集是否包含个人信息,如第1798.140条(v)款所定义。
(8)CA 民法 Code § 3111(a)(8) 数据集是否包含汇总消费者信息,如第1798.140条(b)款所定义。
(9)CA 民法 Code § 3111(a)(9) 开发者是否对数据集进行了任何清理、处理或其他修改,包括这些工作与人工智能系统或服务相关的预期目的。
(10)CA 民法 Code § 3111(a)(10) 数据集中数据收集的时间段,包括数据收集正在进行中的通知。
(11)CA 民法 Code § 3111(a)(11) 数据集在人工智能系统或服务开发过程中首次使用的日期。
(12)CA 民法 Code § 3111(a)(12) 生成式人工智能系统或服务在其开发过程中是否使用或持续使用合成数据生成。开发者可以包含合成数据与系统或服务预期目的相关的功能需求或期望目的的描述。
(b)CA 民法 Code § 3111(b) 开发者无需发布关于用于训练生成式人工智能系统或服务的数据的文档,如果该系统或服务属于以下任何一种情况:
(1)CA 民法 Code § 3111(b)(1) 其唯一目的是帮助确保安全和完整性的生成式人工智能系统或服务。就本款而言,“安全和完整性”具有第1798.140条(ac)款所定义的相同含义,但适用于任何开发者或用户,且不限于该条(d)款所定义的业务。
(2)CA 民法 Code § 3111(b)(2) 其唯一目的是在国家空域内操作飞机的生成式人工智能系统或服务。
(3)CA 民法 Code § 3111(b)(3) 为国家安全、军事或国防目的而开发,且仅提供给联邦实体的生成式人工智能系统或服务。