Neuronale Netzwerke und Videocodierung
Hiwitätigkeit

Beschreibung

Moderne Videocodierverfahren wie HEVC und dessen Nachfolger VVC, der voraussichtlich 2020 standardisiert wird, basieren auf dem Prinzip der blockbasierten hybriden Videocodierung. Dabei werden einzelne Bildblöcke wahlweise aus vergangenen und zukünftigen Einzelbildern (Interprädiktion) oder aus anderen Blöcken des selben Einzelbildes (Intraprädiktion) prädiziert. Zur Interprädiktion verwendet HEVC ein translatorisches und VVC ein affines Bewegungsmodell. Videosequenzen mit z.B. einer Fluchtpunktperspektive können durch translatorische und affine Bewegungsmodelle nur schlecht abgebildet werden und führen daher zu einer hohen Datenrate.
Als Forschungsschwerpunkt beschäftige ich mich damit Prädiktoren zu entwickeln, die eine effizientere Codierung von Szenen mit starker 3D-Geometrie ermöglichen. Dabei werden insbesondere moderne Machine-Learning-Verfahren wie neuronale Netzwerke eingesetzt.
Deine Aufgabengebiete würden unter anderem das Implementieren und Testen verschiedener neuronaler Netzwerke aus der Literatur umfassen. Wenn du dich für Machine-Learning und/oder Videocodierung interessierst und deine theoretischen Kenntnisse gerne in der Praxis umsetzten möchtest, dann freue ich mich über deine Nachricht.

Voraussetzungen

Sehr gute Programmierkenntnisse in Python und ggf. C++ sind Voraussetzung. Gute Kenntnisse aus den Vorlesungen Machine Learning, Digitale Bildverarbeitung und Quellencodierung sind wünschenswert. Erste Erfahrungen mit Tensorflow oder PyTorch sind hilfreich. Bei Fragen oder Interesse bitte gerne melden.

Ansprechpartner: Martin Benjak