KI-AVA – dokumentarische Erschließung von fremdsprachigen Inhalten leicht(er) gemacht
KI-AVA – dokumentarische Erschließung von fremdsprachigen Inhalten leicht(er) gemacht
Die Deutsche Welle (DW) sendet Inhalte in aktuell 32 Sprachen in die ganze Welt. Dieses bunte Programmvermögen in all seiner sprachlichen und kulturellen Vielfalt landet auch im Archiv, wo es nicht nur aufbewahrt, sondern den Redaktionen bei Bedarf wieder zur Verfügung gestellt werden soll. Aber wie nähert man sich der Erschließung dieses fremdsprachigen Materials? Wie erhalten hauptsächlich formal erschlossene Inhalte in 32 und mehr Sprachen Metadaten, die sie auch für diejenigen zugänglich machen, die nicht polyglott aufgewachsen sind? Dankenswerterweise liefern die technologischen Entwicklungen der letzten Jahre einen Lösungsansatz: Künstliche Intelligenz.
Das Sonderprojekt KI-AVA („KI-gestützte Analyseverfahren zur Verfügbarmachung von Archivinhalten“) soll die Herausforderungen der Vielsprachigkeit händelbar machen. Ausgangspunkt ist die Tonspur von Audio- und Videobeiträgen: Für muttersprachliche Rechercheur*innen sollen originalsprachige Transkripte zum Durchsuchen zur Verfügung gestellt werden. Deutschsprachige Kolleg*innen stöbern durch die deutsche Übersetzung dieses Transkripts oder suchen über die automatisiert erstellte, ebenfalls deutsche Verschlagwortung des Materials.
Der Vortrag betrachtet kurz den Use Case des Projekts sowie die Herangehensweise des Projektteams. Außerdem werden wichtige Schritte auf dem Weg zu einer KI-unterstützten Erschließung fremdsprachiger Inhalte skizziert, etwa die Evaluation von im Sprachmodell Whisper angebotenen Sprachen. Den Abschluss bildet eine Übersicht über die Herausforderungen des Projekts und ein Ausblick in dessen Umsetzung bis 2026.