Frühjahrstagung 2026 Nix bliev wie et wor! - Ein Ansatz zur Qualitätssicherung von KI-generierten Transkripten im Medienarchiv - 27.04.2026 - 29.04.2026 (Deutschlandradio Köln) -

Automated Transcription Quality and Dialect Recognition System – Ein Ansatz zur Qualitätssicherung von KI-generierten Transkripten im Medienarchiv

Automated Transcription Quality and Dialect Recognition System

Ein Ansatz zur Qualitätssicherung von KI-generierten Transkripten im Medienarchiv

Der Einsatz von KI-Sprachmodellen gehört zunehmend zum Standard in Medienarchiven, die Leistung der Modelle wächst stetig und verspricht erhebliche Entlastungen in der alltäglichen Archivarbeit. Gleichwohl birgt der Einsatz der Modelle Schwachstellen, etwa mangelnde Transparenz und erhöhte Fehleranfälligkeit bei Material, das vom standardisierten Trainingsmaterial abweicht, wie etwa das Vorkommen von Dialekten, phonetische Varianzen oder technische Unsauberkeiten der Aufnahme.
Das Projekt „Ampel für die KI“ beschreibt einen Ansatz zur automatisierten Bewertung von KI-Transkripten. Kern ist eine Prüf-Pipeline, welche die Qualität der KI-Transkripte auf Grundlage der Konfidenzwerte mittels eines Ampelsystems bewertet. Dieser Ansatz ermöglicht eine signifikante Reduktion des Erschließungsaufwands bei gleichzeitigem Erhalt der Qualitätsstandards im Archiv. Dabei bleiben Dokumentar*innen als ‚Human-in-the-Loop‘ ein essenzielles Element, da sie gezielt dort eingreifen, wo die automatisierte Verarbeitung die gesetzten Qualitätskriterien unterschreitet und menschliche Expertise unverzichtbar bleibt.