Frühjahrstagung 2025 Medien-Archiv-Sphären - Nachhaltigkeit und Informationsethik in der Mediendokumentation - 05.05.2025 - 07.05.2025 (Biosphäre Postdam) -

Zugangshürden senken: KI-Recherche in der Pressedatenbank des SPIEGEL

Der SPIEGEL unterhält eine der größten Pressedatenbanken in Deutschland. Mehr als 160 Millionen Artikel seit 1945 findet man im Digitalen Archivsystem (DIGAS) und tagesaktuell fließen zahlreiche neue ein. Darunter alle Texte des SPIEGEL und anderer Leitmedien sowie vieler Regionalzeitungen und Fachblätter. Rechercheure konnten das Archiv bereits mithilfe einer Volltextsuche nutzen oder etwa nach Signaturen, Zeitangaben und Quellen filtern. Allerdings stößt eine klassische Recherche über die Suchmaske immer wieder an Grenzen: Wie lässt sich beispielsweise eine Antwort auf die Frage finden: „Welche CDU-Politiker haben sich für eine Koalition mit den Grünen ausgesprochen, welche dagegen?“ Oder wie können Redakteure aus einem Dossier von tausend Artikeln zum Ukraine-Krieg schnell eine Chronologie erstellen oder die Argumente der Befürworter und Gegner von Waffenlieferungen zusammenfassen – ohne hunderte von Artikeln selbst zu lesen? Hier hilft nun Künstliche Intelligenz. Die SPIEGEL-Dokumentation hat ein KI-Recherche-Tool für das hauseigene Archivsystem entwickelt. Es basiert auf großen Sprachmodellen (LLMs) und nutzt Retrieval Augmented Generation (RAG), um die umfangreichen exklusiven Text-Corpora im Archiv zu erschließen. Da für die journalistische Recherche faktische Korrektheit und Nachvollziehbarkeit von zentraler Bedeutung sind, wurde bei der Softwareentwicklung großen Wert auf Transparenz gelegt. Alle Antworten der KI sind mit wörtlichen Zitaten aus den Quellen belegt und können jederzeit von den Usern überprüft werden.
Im Vortrag wird die KI-Recherche im Digitalen Archivsystems des SPIEGEL demonstriert und von den Herausforderungen während der Entwicklungen des KI-Tools berichtet.