Im Bereich der angewandten Forschung wurden in den letzten Jahren zahlreiche neue und verbesserte Verfahren zur automatischen Erschließung von audiovisuellen und textuellen Medien entwickelt. Viele dieser Verfahren sind inzwischen ausgereift und in Form von Technologien, Anwendungen und Dienstleistungen für einen Einsatz in Archiven und anderen Bereichen der Medienbranche verfügbar. Nachfolgend wird ein Überblick über vorhandene Technologien gegeben, der in die Bereiche Audio und Sprache, Bild und Video sowie Printdokumente untergliedert ist.
Erschließung und Verarbeitung von Audio- und Sprachdaten
Folgende Technologien, Anwendungen und Dienstleistungen existieren und können in Medienarchiven verwendet werden:
- Audiofingerprinting
Wiedererkennung von bekannten Audiosegmenten (Jingles, Musikbeiträge, etc.) - Audiomining
Spracherkennung und Indizierung von Radio und TV-Beiträgen - Audiosegmentierung
Segmentierung von Audiobeiträgen: Sprache/Musik/Hintergrund, Sprecherwechsel, etc. - Audiowatermarking
Wasserzeichen für Musik und Sprache - Musikanteilsmessung
Automatische Feststellung des Musikanteils - Musikempfehlung
Automatische Annotationen & Empfehlungen für Musik
Erschließung und Verarbeitung von Bild- und Videodaten
Folgende Technologien, Anwendungen und Dienstleistungen existieren und können in Medienarchiven verwendet werden:
- AV-Qualitätsprüfung
Automatisierte Erkennung von Fehlern und Qualitätsproblemen in A/V-Material - Videosegmentierung in Shots
Segmentierung von Videos in Shots inklusive Keyframeerzeugung - Bildähnlichkeitssuche
Anfrage per Bild und Visualisierung von ähnlichen Bildern
Erschließung und Verarbeitung von Printdokumenten
Folgende Technologien, Anwendungen und Dienstleistungen existieren und können in Medienarchiven verwendet werden (noch nicht vollständig):
- Dokumentenklassifikation
Klassifikation von Dokumenten in vorgegebene Klassen - Entitätenerkennung
Erkennung von Entitäten: Personen, Orte, Ereignisse, etc. inklusive Disambiguierung - Layout-Analyse
(Zeitungen, Bücher) und Extraktion von einzelnen Artikeln - Linked-Data
Semantische Vernetzung von Dokumenten
Erschließung und Verarbeitung von Webinhalten
Folgende Technologien, Anwendungen und Dienstleistungen existieren und können in Medienarchiven verwendet werden:
- tbd: xxx