EBSCO 如何確保其 AI 的準確性
EBSCO進行人工智慧回覆的品質評估,以確保符合品質並且不會隨著時間的推移而下降。 對於 AI 流程的每個階段,都可以測量其回覆品質,可以採取相關措施以提高品質,或者衡量可能會引入意外的錯誤,從而降低品質。 這就是為什麼除了評估偏見、成本、環境影響、平等性等其他衡量標準外,在每個階段評估品質至關重要。 定期進行更多研究,並且保持透明地評估這些測試。
我們使用以下技術以確保 AI 功能輸出的品質。
檢索增強式生成 AI (Retrieval-Augmented Generation,簡稱RAG)
是建立在權威內容的基礎上,這可以顯著減少「AI 幻覺」的發生 — AI 會產生不準確或無根據的資訊。
透過將經過驗證的、全面的資訊作為其回答基礎,AI可以更好地產生可靠的、上下文準確和值得信賴的輸出。 這種方法確保使用者可以對提供的資訊有更大的信心。
系統性評估,例如延遲(人工智能完成任務的速度有多慢),運行/停機時間(需要使用它時系統的可靠性), 成本和環境效率(對節約和地球的責任),安全和隱私權保護,即時的 AI 提問設計同儕評鑑(有助於減少偏見),溫度值(Temperature)控制 (AI 回應的多樣性與信心程度),以及更多的系統級的保護準則。
圖書館員和主題專家(SMEs)的嚴格審查
我們的 AI 功能已經過包括研究人員、圖書館員和教育工作者在內的各種使用者團體的嚴格測試和仔細審查,以確保它們既有效又負責任地整合到研究過程中。
這種全面的測試過程可以幫助我們收集有價值的反饋並完善每個功能,以達到準確性、可用性和道德責任的最高標準。
透過讓一般使用者參與整個開發過程,我們確保我們的 AI 工具真正支援和加強研究過程,提供尊重學術探究的複雜性和完整性的見解和效率。
對負責任的人工智慧的承諾確保我們的技術與學術界的需求和期望保持一致,並在每一步發展上的信任和可靠性。
用於評估人工智慧響應的範例規則
EBSCO用於 AI 響應評估措施的範例規則:
- 即時性:Insight 中呈現的資訊是否為最新且非過時訊息?
- 語氣:Insight 中的資訊是否與文章中的語氣相匹配?
- 專業術語:Insight中的術語是否與文章中的術語匹配?
- 準確性:根據文章中的詳細資訊,Insight中的資訊是否準確?
- 主題:Insight 中是否包含文章內的主要主題?
- 實用性:Insight作為摘要和/或研究的補充材料是否有用?
EBSCO 始終致力於高品質、值得信賴的資源,而 AI 提供內容的品質也必須如此。

隨時了解最新資訊
聯繫我們了解有關 EBSCO在AI使用上的更多資訊,註冊參加我們的 AI beta計劃,或與我們合作進行研發計劃。