KIGVI: AUTOMATISCHE KI-GESTÜTZTE GENERIERUNG VON VIDEOREPORTAGEN

Auf einen Blick

Forschungsprojekt

KIGVI: Automatische KI-gestützte Generierung von Videoreportagen

Fachbereich

Ingenieurwissenschaften

Leitung

Prof. Dr.-Ing. Matthias Narroschke

Prof. Dr.-Ing. Wolfgang Ruppel

Beteiligte

M.Sc. Philipp Altmeyer

M.Sc. Dennis Quandt

Jori Hinderfeld

Prof. Dr. Till Dannewald

Prof. Dr. Matthias Kowald

Ansprechpartner Forschungsförderung

Dr. Michael Anton

Projektpartner

Qvest Media GmbH

Fördermittelgeber

BMBF (FH-Kooperativ 2019)

Laufzeit

01.05.2021 – 31.10.2025

Projektbeschreibung

Ziel des Projekts ist eine innovative Lösung zur KI-basierten Erstellung von Reportagen, die aus Videosequenzen geeignete Abschnitte extrahiert und zu einem sendefähigen Beitrag komponiert. In sozialen Netzwerken, aber auch auf Nachrichtenportalen, ersetzen zunehmend kurze Videoreportagen konventionelle Textbeiträge, um die Aufmerksamkeit der Nutzer zu gewinnen. Für Anbieter von Videoinhalten ist daher eine kostengünstige und effiziente Produktion kurzer Videoreportagen besonders wichtig. Die Erstellung von Videoreportagen erfolgt bisher manuell, was mit großem Zeitaufwand und hohen Kosten verbunden ist. 

Im Rahmen des Projektes soll daher ein System entwickelt werden, das die Qualitätsbewertung und die Komposition zu einer sendefähigen Reportage automatisch durchführen kann. Dabei lässt sich die Entwicklung in zwei Kernthemen unterteilen. Zum einen ein KI-Modell, mit dem aus vorliegenden Videosequenzen geeignete Videoabschnitte extrahiert werden und zum anderen ein weiteres Modell, das aus den extrahierten Abschnitten die Videoreportage erzeugt. Dazu sollen für die extrahierten Videoabschnitte automatisch geeignete Parameter geschätzt werden, die relevante Qualitätsmerkmale beschreiben. Neben rein technischen Merkmalen, wie Bildauflösung und Konformität zu Videostandards, sollen auch inhaltliche und stilistische Merkmale definiert und entsprechende Parameter geschätzt werden. Hierzu zählen zum Beispiel die Kategorisierung der Abschnitte in „Hintergrundmaterial“, „Mitschnitt“, „Interview“ oder „Original-Ton-Sequenz“, oder die Einhaltung des „Goldenen Schnittes“ im Bild. Anhand der geschätzten Parameter sollen die zugehörigen Videoabschnitte mit dem zweiten KI-Modell zu einer sendefähigen Reportage komponiert werden. Dabei sollen insbesondere Genre-abhängige Musterabläufe für Reportagen berücksichtigt werden, die in der Regel unterschiedlich sind, wie etwa für Sport-Nachrichten, Produktvorstellungen oder Politik-Beiträge.