„Transparenz“ ist ein wichtiges Schlagwort im Bereich der künstlichen Intelligenz (KI). Da es jedoch für verschiedene Menschen unterschiedliche Bedeutungen haben kann, ist es wichtig zu definieren, was es genau beinhaltet und was nicht – und auch weshalb.
„Erklärbare KI“ und Transparenz
Manche definieren „erklärbare KI“ als KI, die transparent ist. Die beiden Begriffe werden daher oft synonym oder zusammen verwendet, wenn es um erklärbare KI-Methoden geht. Aber was bedeutet das eigentlich? Laut Definition ist Transparenz ein Zustand zwischen undurchsichtig und völlig transparent, d. h. es gibt verschiedene Stufen der Transparenz. Bei der Datenverwaltung bezieht sich Transparenz auf offene Datenpraktiken, während sie sich bei der Datenarchitektur darauf bezieht, dass man vollständig versteht, wie etwas funktioniert. Im Bereich der KI handelt es sich um ein bisschen von beidem: Ein transparentes KI-Modell bedeutet, dass es ethisch vertretbar ist und dass das Unternehmen, das es einsetzt oder entwickelt, genau dokumentiert, wie die KI funktioniert.
Transparenz kann wie folgt charakterisiert werden:
- Interpretierbar – In der Lage zu sein, in verständlichen Worten zu erklären oder darzulegen, wie etwas erstellt, ausgewählt, verbessert, gepflegt oder eingestellt wurde
- Verfügbar – Zugang zu Informationen, um Entscheidungen über diese Informationen treffen zu können
- Vollständig – Die Fähigkeit, etwas von Anfang bis Ende, aus verschiedenen Perspektiven und von verschiedenen Tiefenstufen aus zu erklären
- Verantwortungsbewusst – Die Fähigkeit, Prozesse, Handlungen, Nutzung und Entscheidungen regelmäßig und kontinuierlich zu überwachen, zu verfolgen, zu überprüfen oder zu kontrollieren
Transparenz in der KI-Architektur
Die verschiedenen Ebenen von KI-Architekturen können alle unterschiedliche Transparenzaspekte aufweisen, je nachdem, was in der KI-Architektur verwendet wird. KI-Architekturen umfassen traditionelle Komponenten wie Datenbanken, Suchmaschinen und kontinuierliche Integration, aber es gibt auch Elemente, die spezifischer sind, wie Vektordatenbanken, Prompt Engineering, Agents und mehr. Ein wichtiger Bereich der KI-Architektur ist das KI-Training – ein oft verwirrender Begriff, der für viele verschiedene Dinge verwendet wird. Auch wenn EBSCO kein KI-Training vornimmt, ist es gut, die verschiedenen Aspekte der Funktionsweise von KI-Modellen zu verstehen, wenn man die Dokumentation zu KI sichtet.
Interaktion mit KI-Modellen
Die Interaktion mit KI-Modellen kann auf verschiedene Weise erfolgen:
- Informationen, die zur Erstellung von Wort-, Eingabe- oder Vektoreinbettungen verwendet werden (dies wird traditionell als KI-Training bezeichnet)
- Informationen und/oder Einbettungsinformationen, die zum Training von Transformationsmodellen verwendet werden (dies wird traditionell als KI-Training bezeichnet)
- Informationen und/oder Einbettungsinformationen, die für die Modellableitung und -vorhersage verwendet werden (dies wird traditionell als KI-Training bezeichnet, wenn Texte, Bilder oder Schritte in einem Prozess von der KI generiert werden; die direkte Ausgabe des KI-Trainings auf der Grundlage einer Eingabeaufforderung)
- Informationen und/oder eingebettete Informationen, die für das „Grounding“ verwendet werden (dies ist nicht Teil des KI-Trainings; „Grounding“ ist die Verwendung einer zusätzlichen Datenquelle, die die KI nach der Generierung konsultieren kann, um die Genauigkeit und Kontextrelevanz zu erhöhen)
- Informationen und/oder eingebettete Informationen, die zur Verfeinerung verwendet werden (dies sind in der Regel heuristische oder regelbasierte Anleitungen, die zur Verfeinerung der Verarbeitung und der Ausgabe des KI-Modells hinzugefügt werden)
- Informationen und/oder eingebettete Informationen, die zur Interpretation auf der Grundlage von Schemata wie einer Ontologie oder eines Knowledge-Graphs verwendet werden (dies sind in der Regel Anleitungen, die einem KI-Modell hinzugefügt werden, um es für einen bestimmten organisatorischen Bedarf relevanter zu machen)
- Informationen und/oder eingebettete Informationen, die zur Extraktion von Merkmalen oder Entitäten verwendet werden (dies ist in der Regel nicht Teil des Trainings, sondern eine Form des Text- und Data-Mining)
- Parsing von Daten (dies ist der Einsatz von KI, um die Struktur und den Kontext von Texten oder Bildern zu verstehen; dies ist nicht Teil des Trainings).
- Information Retrieval (wenn eine KI eingesetzt wird, um Informationen auf Grundlage einer Anfrage oder Frage zu suchen und abzurufen; dies ist nicht Teil des Trainings)
Bewertung der KI-Transparenz
Aus dieser Liste geht hervor, dass KI viele Elemente aufweist. Auch wenn sie nicht alle für jede Anwendung oder jedes Produkt relevant sind, ist es sinnvoll, nach diesen Elementen zu fragen, wenn es darum geht, die Transparenz sowie die Kriterien, für die Transparenz erforderlich ist, zu bewerten.
Erklärbare KI bedeutet, dass die Metriken, die zur Bewertung der KI verwendet werden, und die Art und Weise, wie die KI eingesetzt, entwickelt und gepflegt wird, auch für die Endnutzer:innen transparent dargelegt werden. Erklärbare und transparente KI ermöglicht den Nutzer:innen festzustellen, ob Qualität, Ethik, Sicherheit, Datenschutz, Umweltauswirkungen und andere Kriterien ihren Erwartungen entsprechen.
Transparente Nutzung von KI bei EBSCO
Im Sinne der Transparenz legt EBSCO stets offen, wenn KI in einem seiner Produkte eingesetzt wird. Wir haben Produktseiten für jede KI-Funktion, auf denen erklärt wird, welches Modell verwendet wird, weshalb es ausgewählt wurde, welche Qualitäts-, Sicherheits- und Umweltauswirkungen es hat, welche Qualitätskriterien verwendet werden und wie das Modell gestützt und gepflegt wird. EBSCO trainiert keine KI-Modelle, so dass hierfür keine Dokumentation erforderlich ist.
Möchten Sie mehr über KI-Transparenz für das Feature „AI Insights“ erfahren? Dann schauen Sie hier nach. Informationen zur natürlichen Sprachsuche, der sogenannten „Natural Language Search“, finden Sie hier. Wir werden für jede neue KI-Funktionalität stets Informationen zur KI-Transparenz auf EBSCO Connect zur Verfügung stellen.