Die AG Bioinformatik und translationale Genetik am Berliner Institut für Gesundheitsforschung/Charité beschäftigt sich insbesondere mit der Aufklärung monogener Krankheiten (Krankheiten, die durch DNA-Mutationen in einem einzelnen Gen ausgelöst werden). Dazu entwickeln wir benutzerfreundliche Software, die ohne IT-Kenntnisse verwendet werden kann. Unser Ziel ist es, dass die behandelnden Ärztinnen und Ärzte die Daten ihrer Patient(inn)en ohne die Hilfe von Computerspezialist(inn)en selber analysieren können.
Weitere Informationen:
Im Sommersemester 2024 bietet die Arbeitsgruppe wieder zwei Themen im Rahmen der Veranstaltung "Projektmanagement im Softwarebereich" an der Freien Universität Berlin an. Detaillierte Informationen dazu erhalten Sie nach einem Klick auf die Titel unten.
Am Donnerstag, 18.01.2024 um 17:00 Uhr findet eine offene virtuelle Informationsveranstaltung zu den zwei Themen statt. Eine Teilnahme ist ohne Anmeldung unter diesem Link möglich:
https://meet.jit.si/BTG_SWP_2024 (Update 11.01.2024: Link aktualisiert)
Das Praktikum findet vom 04.03.2024 bis 26.04.2024 überwiegend in Vollzeit statt. Teilnehmerinnen und Teilnehmer erhalten im Vorfeld weitere Informationen über den Ablauf.
Dozent: Oliver Küchler [ Schreibt mir gerne ]
Teilnehmerzahl: 1-3
Zeitraum: 04.03.2024 bis 26.04.2024
Ort: Charité Campus Mitte, Invalidenstr. 97 (Homeoffice möglich)
Schwerpunkte: Datenakquise & -auswertung, Set-up und Vergleich aktueller wissenschaftlicher Software
Qualitatives Profil:
Bei der Suche nach Krankheitsmutationen in Exom- oder Genomsequenzdaten stellt die Auswertung regulatorischer Varianten eine Herausforderung dar. Innerhalb von protein-kodierender Gene ist hier vor allem das Splicing relevant, da sowohl intronische als auch synonyme und nicht-synonyme Varianten das Splicing beeinflussen können. Das hier vorgestellte Projekt ist in drei miteinander verbundene Teilprojekte gegliedert, die sich auf die umfassende Analyse und Erweiterung von Splice-Analyse-Tools konzentrieren.
Vorhandene Splice-Vorhersage-Tools basieren auf maschinellem Lernen, dabei hängt das Ergebnis des Lernprozesses stark von den verwendeten Trainingsdaten ab. Für das maschinelle Lernen werden sehr große Datenmengen benötigt. Da nur wenige Splice Sites tatsächlich punktgenau experimentell validiert wurden, sind in den Trainingsdaten in der Regel vorhergesagte Splice Sites annotiert. Dabei basiert die Vorhersage auf einem Alignment der mRNA/cDNA gegen die genomische Sequenz, gepaart mit einer Vorhersage von Genen und ihrer Exon/Intron-Grenzen die zum Teil durch weitere Inter-Spezies-Vergleiche gestützt sind.
In diesem Projekt sollen
Zur gezielten Auswertung von Transkriptomdaten, wobei insbesondere das Splice-Verhalten betrachtet wird, wurde die Software-Pipeline “SnakeSplice” in unserer Arbeitsgruppe (AG Seelow) entwickelt. Die Pipeline basiert auf dem SnakeMake-Framework und ist modular aufgebaut. In ihrer bisherigen Fassung besteht sie aus 4 Modulen:
Eine gezielte Detektion genetischer Varianten ist wichtig für die funktionelle Analyse der Aktivität von Allelen und die klinische Interpretation des Genoms. Ein Modul, das die Funktionalität bietet, ist jedoch bisher nicht in SnakeSplice implementiert.
Deshalb wird in diesem Praktikum die Entwicklung eines weiteren (unabhängigen) Snakemake-Moduls zur gezielten Identifikation von Varianten in Transkriptom- (und Genomdaten) angestrebt. Die Implementierung der benötigten Software soll in Form eines SnakeMake-Moduls erfolgen, sodass eine direkte Integration in die schon etablierte Pipeline möglich ist.
Konkrete ZieleNeben Splice-Faktoren, die durch RNA-bindende Proteine gegeben sind, können auch weitere posttranskriptionelle Regulationsmechanismen in den Splice-Prozess eingreifen, um die Zellentwicklung und Gewebespezifität zu steuern. Insbesondere microRNAs (miRNAs), kurze nicht-kodierende (~22 nt) RNA-Moleküle, können, indem sie mit der 3’ untranslatierten Region (3’UTR) interagieren, die Translation von spezifischen mRNAs hemmen.
Neben dieser durch miRNA vermittelten kanonischen Art der posttranskriptionellen Regulierung haben in den letzten Jahren Studien auch die indirekte Modulation der Splice-Faktoren über die co-transkriptionelle Ebene aufgezeigt. Dabei wird durch Senkung der Dosierung mehrerer Splice-Faktoren eine gezielte Steuerung des Splicings erreicht, sodass alternatives Splicing gewebespezifisch ausgelöst werden kann.
In diesem Praktikum wird die Entwicklung eines weiteren (unabhängigen) Snakemake-Moduls zur Detektion von nicht-kodierender RNA in Transkriptomdaten angestrebt. Hierbei steht vorrangig eine explorative Untersuchung der Transkripte im Vordergrund. Dies ermöglicht den Anschluss weiterführender Analyse-Schritte, beispielsweise sind Korrelationsanalysen zu den identifizierten mRNA-Isoformen und ihren Expressionswerten denkbar. Dieses Modul wird ein tieferes Verständnis für das dynamische Zusammenspiel zwischen ncRNA und Splicing ermöglichen.
Die Student:innen können wahlweise zu Hause oder in unseren Büros in Mitte arbeiten. Wir planen eine wöchentliche Fortschrittsbesprechung in unseren Büros mit den beteiligten Student:innen aus allen hier vorgeschlagenen Projekten.
Teilnehmerzahl: 2
Zeitraum: 04.03.2024 bis 26.04.2024
Ort: Charité Campus Mitte, Invalidenstr. 97 (Homeoffice möglich)
Schwerpunkte: Praktische Programmierarbeit (66 %), Erwerb von Soft Skills (34 %)
Qualitatives Profil: Programmieren (★★★★★), Projektmanagement (★★), Biologie (★)
Inhaltliche Beschreibung:
Das Ziel dieses Praktikums ist die Entwicklung eines ACME (Automatic Certificate Management Environment)-Clients. ACME ist ein Protokoll zur Kommunikation zwischen Zertifizierungsstellen (z. B. Let's Encrypt) und Servern, die SSL-Zertifikate benötigen (z. B. für den Betrieb von https-Websites). Im Rahmen dieses Praktikums soll ein funktionsfähiger ACME-Client in C/C++ oder Bash entwickelt werden, der es ermöglicht, automatisiert Zertifikate abzurufen und zu erneuern.
Aufgaben:
Erforderlich sind:
Das Praktikum wird von einem Diplom-Informatiker betreut. Während des Praktikums sind Studierende Teil der Arbeitsgruppe. Es wird Zugang zu einem Linux-Server und einer GitLab-Versionsverwaltung bereitgestellt. Wahlweise kann vor Ort am Charité Campus Mitte oder im Homeoffice gearbeitet werden. Das Praktikum ist nur in Vollzeit möglich. Es finden regelmäßige Termine zur Besprechung des Fortschritts statt.