术语库和概念

许多机器学习 (ML) 术语的主要可靠来源是 ML 词汇表。我们不会重复他们的工作,而只会收录机器学习词汇表中没有的常用字词和术语。

AI 系统蓝图

在构建新的 AI 功能或产品时,请定义 AI 系统蓝图,将 AI 的机会与您构建解决方案的方式相关联。您应定义:

  • 您要构建什么?有哪些 AI 用例,它们能为用户带来哪些价值?
  • 您的申请流程如何运作?
  • 如何确保系统的每个部分都以负责任的方式开发?

如需了解蓝图,请参阅 Web 上的 AI 简介

复合 AI 架构

复合 AI 架构,即一个或多个模型与其他组件(例如数据库、API 和安全防护措施)的组合,这些组件协同工作以提供强大的情境感知行为

上下文工程

上下文工程是指根据给定的请求动态选择最相关的信息(token),以最大限度地提高获得有价值结果的概率。

数据漂移

当训练数据不再能代表现实情况时,就会发生数据漂移。用户行为、数据收集和数据环境随时都可能发生变化,这可能会导致模型性能下降。

确定性软件

在给定特定输入的情况下,确定性软件始终遵循相同的步骤序列,从而产生相同的输出。这些是最可靠的软件类型,因为它们可预测且运行高效。

人工智能不是确定性的。即使使用相同的提示,生成路径和结果也可能大相径庭。

评估驱动型开发 (EDD)

评估驱动型开发 (EDD) 框架提供了一个可重复、可测试的流程,可帮助您以小而有把握的步骤改进输出、捕获回归,并随着时间的推移使模型行为与用户和产品预期保持一致。

您可以将其视为测试驱动开发 (TDD),但针对 AI 的不确定性进行了调整。与确定性单元测试不同,AI 评估无法进行硬编码,因为输出(无论是格式正确的输出还是失败的输出)可能有很多不同的形式,您无法预料。

生成式 AI

生成式 AI 是一种可以创建内容的机器学习系统。这意味着,该模型可以撰写文本、生成图片、生成代码,甚至设计完整的界面。

治理

我们从三个维度介绍了 AI 治理:

  • 隐私权:负责任地处理数据,说明收集的数据,并尽量减少离开浏览器的数据。
  • 公平性:检查模型是否存在歧视性行为(偏差),并构建可让用户标记问题的反馈环。
  • 信任和透明度:设计系统时要注重透明度和适当的信任度,这样即使存在不确定性和潜在错误,用户也能继续从中受益。

最后一个维度是安全性,这是 AI 治理的重要维度。我们打算在未来的模块中提供更多有关安全性的信息。

在此期间,我们建议您阅读 Google 的安全 AI 框架 (SAIF)Google 安全博客

型号

模型是 AI 系统最重要的主干。从核心本质上来说,模型是一组参数和结构,可支持系统进行预测。 模型的运作方式可能会因训练方式(监督式或非监督式)和模型用途(预测性或生成性)而异。

模型卡片

模型卡片是关于模型设计和评估方式的结构化概览。这些原则是支持 Google Responsible AI 方法的关键制品。

模型权重

模型权重是用于确定某些信息重要性的数值。这些值会在模型训练中不断更新,直到设置了理想的权重。您可以修改开放模型的权重,例如 Gemma

AI 的应用机会

您可以从多个类别来构建 AI 解决方案:

  • 数据洞见:改进决策流程。
  • 便捷:消除阻力。
  • 自动化:取代重复性工作。
  • 增强:协助用户完成复杂或富有创意的任务。
  • 个性化:根据个人的需求和偏好调整产品。

探索使用场景中对此进行了详细介绍。

平台

客户端 AI 直接在浏览器中运行。这意味着数据可以保留在用户设备上,保持私密性,并且不会出现网络延迟。不过,为了实现出色的性能,客户端 AI 需要高度具体、明确定义的应用场景。

服务器端 AI 包括在云端托管和运行推理的模型。这种设备功能强大且可扩缩,但价格可能更高,并且需要网络连接。

预测性 AI

预测性(或分析性)AI 是一组算法,可帮助您了解现有数据并预测接下来可能会发生的情况。预测性 AI 模型会根据历史模式学习预测结果、挖掘数据洞见,并促成更明智的决策。

提示工程

提示工程是指通过撰写和重写提示来生成符合用户预期的输出。撰写良好的提示:

  • 说明 LLM 应如何构建回答。
  • 包含多个可随时间推移进行版本控制、测试和改进的组件。
  • 可作为共享制品,用于跨团队协作。

在提示工程中,您可以采用多种技巧,详情请参阅提示工程模块

提示类型

您可以将提示类型视为提示受众群体。如需详细了解此内容,请参阅提示工程模块

系统提示

系统提示由应用开发者提供,用于定义模型的总体行为。它可以设置模型的角色(“你是一位写作助理”)、预期语气、输出格式(例如严格的 JSON 架构)以及任何全局限制。此提示在不同请求之间保持稳定。

用户提示

用户提示包含直接促成输出的即时请求。用户提供某种形式的输入变量(例如所选文本或预期样式),并请求执行特定任务。例如,“为这篇帖子生成三个标题”“继续写这段内容”或“让这段内容更正式”。