Big Data in Genomic
Bachelorarbeit,Masterarbeit,Diplomarbeit
Im Rahmen des Projekts Omics

Beschreibung

Der Forschungsbereich der Genomik und insbesondere der DNA-Sequenzierung hat in den letzten Jahren große Fortschritte gemacht. Ein zentrales Ziel von Sequenzierungsexperimen-ten ist das Detektieren und Identifizieren verschiedener Typen genetischer Varianten (engl. Variant Calling). Die entstehenden sehr großen Datenmengen (Big Data) ermöglichen Forschern neue Kenntnisse zu erwerben. Die genannten Datenmengen steigen kontinuierlich exponentiell an und der jährlich hinzukommende Speicherbedarf übersteigt die zur Verfügung stehenden Kapazitäten. Um den Speicherbedarf zu senken, forscht das TNT daher an Kompressions- und Verarbeitungsverfahren für sequenziertes DNA-Material.

Arbeitsumfang für eine kleine Seminararbeit:
Im Rahmen dieser Arbeit soll ein Add-on für ein bereitgestelltes Visualisierungstool entwickelt werden. Das Ziel dieser Arbeit ist es, ein Interface mit Machine-Learning-Tools aufzubauen. Damit soll es Forschern ermöglicht werden, die Daten als auch die Ergebnisse zu analysieren und zu visualisieren.

Arbeitsumfang für eine Bachelor-, Master-, oder Diplomarbeit:
Im Rahmen dieser Arbeit sollen Methoden wie die Kompression untersucht und evaluiert werden.

Voraussetzungen

  • (Alle)
    • Programmierkenntnisse in Python
  • (Kleine Seminararbeit)
    • Programmierkenntnisse in Java
  • (Bachelorarbeit, Masterarbeit, Diplomarbeit)
    • Kenntnisse in den Bereichen Stochastik/Statistik, Machinelles Lernen, insbesondere Deep Learning
    • Empfohlen sind Kenntnisse in den Bereichen Informationstheorie, Signalverarbeitung und Quellencodierung

Ansprechpartner: Yeremia Gunawan Adhisantoso