透明度是人工智能领域的重要概念,其具体含义往往因人而异。因此,我们必须明确界定其适用范围、排除内容以及特定事项未被涵盖的原因。
可解释AI与透明度
可解释AI常被定义为具有透明性的人工智能,这也解释了为何在描述负责任AI方法时,这两个术语常被混用或并列使用。但它们的实质含义是什么?根据定义,透明度是介于不透明与完全清晰之间的状态,这意味着透明存在程度之分。在数据治理领域,透明度指开放的数据实践;而在数据架构层面,它意味着对系统运作原理的充分理解。就AI而言,透明度兼具这两层含义:既要求模型符合伦理规范,也要求使用或设计该模型的企业完整记录其开发与应用过程。具体而言,透明度可表征为以下维度:
- 可诠释性
能够以可理解的方式,解释系统创建、选择、优化、维护或停用的决策逻辑; - 可获取性
能够访问必要信息以支持基于该信息的决策; - 全面性
能够从端到端流程、多重视角及不同深度层面完整阐释系统行为; - 可追责性
能够以标准化、可复现的方式持续追踪、验证和审查全流程操作与决策。
AI架构中的透明度层次
AI架构的不同层级可能涉及不同维度的透明度,具体取决于架构中采用的组件类型。传统AI架构组件包括数据库、搜索引擎、持续集成与持续交付/部署(CI/CD)工具等,而更典型的AI专用组件则涵盖向量数据库、提示词工程、智能体等技术。
AI训练作为架构中的常见模块,其概念在业内常被混用——实际上它可能指代多种不同的技术流程。虽然EBSCO不直接参与AI模型训练,但在审阅AI技术文档时,理解模型运作机制的各个透明化维度仍至关重要。
与AI模型的交互方式
AI模型可通过以下不同形式进行交互,各形式涉及的信息处理机制存在显著差异:
- 用于生成词嵌入、输入嵌入或向量嵌入的信息(即传统意义上的AI训练数据)
- 模型推理与预测过程中使用的信息及嵌入(即AI基于提示词生成文本、图像或流程步骤时的直接输出)
- 用于知识锚定(Grounding)的信息及嵌入(非训练环节,作为生成后的补充数据源以提升准确性与上下文相关性)
- 用于模型微调的信息及嵌入(通常为基于启发式或规则的指导,用于优化模型处理逻辑与输出)
- 基于本体论或知识图谱等模式进行推理的信息及嵌入(通常为使模型更契合特定组织需求的指导性信息)
- 用于特征/实体抽取的信息及嵌入(通常不属于训练环节,而是文本与数据挖掘的一种形式)
- 当AI用于理解文本/图像结构与上下文时的处理(非训练环节)
- 当AI基于查询或提示词进行信息搜索与获取时的处理(非训练环节)
可解释且透明的AI能使用户判断其质量、伦理合规性、安全性、隐私保护、环境影响等指标是否符合使用预期,并确认该AI功能是否满足其需求。
可解释且透明的AI能使用户判断其质量、伦理合规性、安全性、隐私保护、环境影响等指标是否符合使用预期,并确认该AI功能是否满足其需求。
评估AI的透明度
从上述内容可以看出,AI包含诸多要素。虽然并非所有要素都适用于每个使用场景或产品,但这些要素可作为评估透明度时的关键考察点,同时也是审阅相关文档时需要重点关注的方面——特别是那些需要透明度指标支持的环节。
拥有可解释的AI意味着:用于评估AI的指标,以及AI的使用、设计和维护方式,都需要透明地呈现给终端用户。可解释且透明的AI能使用户判断其质量、伦理合规性、安全性、隐私保护、环境影响等指标是否符合使用预期,并确认该AI功能是否满足其需求。
EBSCO透明度承诺
为践行透明度原则,EBSCO在产品中应用AI技术时均会明确标注。我们为每项AI功能设立了专属产品页面,详细说明以下内容:
- 所采用的AI模型及其选型依据
- 为确保质量、安全及环境影响而设置的防护机制
- 使用的质量标准体系
- 模型的锚定(grounding)与维护方案
虽然EBSCO目前不训练AI模型,但若未来开展此类工作,相关细节也将在专属产品页面完整记录。
您可通过EBSCO Connect平台查阅AI 洞察(AI Insights)与自然语言搜索(Natural Language Search,NLS)的透明度文档。我们承诺为每个发布的AI功能提供透明度文档,敬请定期访问EBSCO Connect获取最新信息。