EBSCO如何保障AI系统的准确性
EBSCO对AI响应进行质量评估,以确保质量达标且不会随时间推移而下降。在AI流程的每个环节中,质量均可被量化评估:既可通过优化措施提升质量,也可能因意外误差导致质量下降。 正因如此,除了偏见、成本、环境影响、平等等考量因素外,在每个阶段进行质量评估都至关重要, 并定期进行更多维度的评估,同时确保评估方法的透明度。
我们采用以下技术来保障AI功能输出的质量:
检索增强生成(Retrieval-Augmented Generation, RAG)
该AI系统基于权威内容构建,可大幅减少“幻觉”(即AI生成不准确或无依据信息)的发生。
通过将AI的响应建立在经过验证的全面信息基础上,该系统能够更可靠地生成符合语境、准确且可信的输出结果。 该技术方案确保用户能够对所获取的信息拥有更高信任度。
系统评估例如延迟(AI完成任务的速度有多慢)、运行/停机时间(您需要使用它时系统的可靠性) 成本与环境效率(践行节约责任与环保承诺)、安全与隐私防护(严格的数据保护机制)、提示词工程同行评审(有效减少算法偏见)、温度控制(有点像AI响应的置信度阈值)以及其他多项系统级防护措施。
图书馆员与学科专家 (SMEs)的严格审核
我们的AI功能经过多样化用户群体的严谨测试与审核,包括研究人员、图书馆员及教育工作者,以确保这些功能不仅高效实用,更能负责任地融入科研流程。
这一全面的测试流程帮助我们收集宝贵反馈,并持续优化各项功能,以确保达到准确性、可用性和伦理责任的最高标准。
我们让终端用户全程参与开发,确保AI工具真正服务于科研全流程——在提升研究效率的同时,始终恪守学术研究的严谨规范。
我们对负责任AI的承诺:这一承诺确保我们的技术始终符合学术界的需求和期望,在每一步都建立信任与可靠性。
AI回答评估样本量表
EBSCO采用的AI回答质量评估量表标准包含以下维度:
- 时效性:该见解中的信息是否及时且未过时?为最新信息,而不是过时信息?
- 语气匹配度:该见解中的信息语气是否与原文一致?
- 术语一致性:该见解中的术语使用是否与原文一致?
- 信息准确性:基于原文细节,该见解中的信息是否准确?
- 主题覆盖度:该见解是否涵盖了文章的主要主题?
- 实用价值性:该见解作为摘要和/或研究的补充材料是否有用?
EBSCO始终致力于提供高质量、可信赖的数据,在AI质量方面同样坚持这一标准。

实时更新
请联系我们,以了解更多关于EBSCO的AI信息,报名参加我们的AI测试版计划,或与我们合作开展研发项目。