EU Projekt AXES

Projektname

AXES – Access to Audiovisual Archives

Projektart

Forschung

Auftraggeber

EU

Laufzeit/Jahr

Januar 2011 – Dezember 2014

Projektpartner

ERCIM (FR), Katholieke Universiteit Leuven (BE), University of Oxford (UK), INRIA (FR), DCU (IE), Fraunhofer IAIS (DE), Universiteit Twente (NL), BBC (UK), Beeld En Geluid (NL), Deutsche Welle (DE), technicolor (FR), Cassidian (FR), Erasmus Universiteit Rotterdam (NL)

Projektinhalt

Ziel von AXES ist die Entwicklung von Werkzeugen zur Annotation und Aufbereitung von audio-visuellen Datenbeständen und Archiven. Hierbei kommen verschiedene Technologien zur Erschließung, Verknüpfung und Suche zum Einsatz. Neben der Audiomining-Technologie zur Indizierung und Suche im gesprochenen Wort, können z.B. auch Konzepte im Video oder ähnliche Bilder zu einem Beispielbild gesucht werden.
Durch eine Verbindung der verschiedenen Modalitäten und eine intelligente Verknüpfung werden weitere innovative Such- und Navigationsmöglichkeiten untersucht und entwickelt, um den Zugriff auf und die Verwertung von großen Medienbeständen zu verbessern. Für unterschiedliche Anwendungen und Anwender sollen jeweils optimierte Zugriffsmöglichkeiten vom unterstützten „Durchstöbern“ über geführte Navigation bis hin zur gezielten multimodalen Suche erforscht und bereitgestellt werden.

Eingesetzte Technologien

Audiomining, Audiosegmentierung (LINK), Videosegmentierung in Shots (LINK), Face-Recognition (LINK), Video-Konzepterkennung (LINK), Bildähnlichkeitssuche (LINK)

Nutzungspotentiale und Einsatzgebiete

Erschließung von audiovisuellen Archiven; Such- und Navigationsfunktionalität für Archivare, Redakteure, Wissenschaftler, Endanwender, etc.; Verknüpfung und Empfehlung ähnlicher Inhalte

Webseite

http://www.axes-project.eu

Ansprechpartner

Fraunhofer IAIS (http://www.iais.fraunhofer.de/axes.html) – Jochen Schwenninger (Telefon 02241 14-2062)

Ansprechpartner im Medienunternehmen

Deutsche Welle (Peggy van der Kreeft , Email)

Bilder

Axes-logo-rgb-01-e1345542215627

AudioMining

Name

AudioMining: Indizierung von Radio- und TV-Sendungen mittels Spracherkennung

Funktionsweise

Audiomining-Lösungen verwenden Spracherkennungstechnologien mit umfangreichen Wortschätzen. Die als Sprache identifizierten Abschnitte in einem Audiostrom werden in der Regel in eine textuelle wortbasierte Darstellung überführt. Die erkannten Worte werden in einer Indexstruktur gespeichert und können dann für Suchanwendungen verwendet werden.
Die zeitlichen Informationen der gesprochenen und erkannten Wörter/Phrasen werden so verwendet, dass der Nutzer direkt an die relevanten Stellen springen kann. Häufig enthält die Audiominingtechnologie Segmentierungsmodule, die eine Einteilung des Audiostroms in verschiedene Sprecherabschnitte ermöglicht. Alternativ zur reinen Worterkennung existieren Lösungen zur Erkennung von Wortuntereinheiten (Silben, Phoneme) die eine Wortschatzunabhängigkeit bei der Suche ermöglichen.
Erschwert wird die Erkennung von gesprochener Sprache durch Störgeräusche, Dialekte oder starker Spontansprache. Dadurch muss immer damit gerechnet werden, dass keine 100% Transkriptionen geliefert werden. Je nach Qualität der Daten liegen die Erkennungsraten für dokumentarartiges Material zwischen 80% und 92%. Sind perfekte Transkriptionen notwendig, kann optional eine manuelle Nachbearbeitung die Lücke zu den 100% schließen.

Nutzungspotentiale und Einsatzgebiete

Erschließung von audiovisuellen Archivdaten; Suche nach gesprochenen Stichwörtern; Erstellung von Inhaltsübersichten (Tag-Clouds) für Radio- und TV Beiträge; Suchfunktionalität für Archivare, Redakteure, Nutzer von Mediatheken, …

Referenzprojekte

Anbieter und Ansprechpartner

Bilder

AudioMiningSearchGUI