home changes contents help options diff edit

Vorlesung

Titel: "Data Mining in der Bioinformatik" (Vorlesungsverzeichnis)

Dozent: Prof. Dr. Karsten Borgwardt, MPI Entwicklungsbiologie und MPI Intelligente Systeme

Übungsgruppenleiter: Dr. Chloé-Agathe Azencott, Dominik Grimm und Barbara Rakitsch

AKTUELLE INFOS:

Zeitlicher Umfang:

Raum: Hörsaal F 122 in Sand 6/7 (2/49 Pl./Inform)

Anrechenbarkeit:

Voraussetzungen: Grundlegende Mathematikkenntnisse, ansonsten erfordert der Kurs keine Vorkenntnisse

Inhalt: Data Mining ist die computerbasierte Suche nach Mustern in großen Datenbeständen, aus denen man sich neue Erkenntnisse über das zugrundliegende System erhofft. In der Bioinformatik dient Data Mining dazu, in der Transkriptom-, Proteom- und Genomforschung Biologen bei der Analyse umfangreicher experimentell erzeugter Datenmengen zu unterstützen, um daraus neue Hypothesen ableiten oder darauf neue Hypothesen untersuchen zu können.

In dieser Vorlesung stellen wir die algorithmischen Grundlagen des Data Mining und seine Anwendungen in der Bioinformatik vor. Die Vorlesung beginnt mit einer Einführung in die wichtigsten Verfahren zur Klassifikation, zum Clustering, zur Featureselektion und zur Assoziationsregelsuche. Darauf aufbauend werden wir untersuchen, wie diese Data Mining-Verfahren zur Genselektion aus Expressionsdaten, zur Proteinfunktionsvorhersage und zur Mustersuche in biologischen Netzwerken verwendet werden können. Diese Vorlesung richtet sich sowohl an Studenten, die an der Anwendung und Weiterentwicklung von Data Mining-Verfahren in der Bioinformatik interessiert sind, als auch an jene, die die algorithmischen Grundlagen des Data Mining kennenlernen möchten.

Sprache: Vorlesung und Übungen auf Englisch

Contents:

Feb 6 Classification: Nearest Neighbour, Naive Bayes, Decision Trees, Support Vector Machines
Feb 7 Feature Selection: Greedy feature selection, Selection Criteria, Submodularity
Feb 9 Graph Mining: Frequent subgraph mining
Feb 10 Clustering: K-means, Kernel k-means, Graph-based Clustering, DBScan?, Hierarchical Clustering
Feb 13 Classification in Bioinformatics: Protein function prediction via graph kernels, Promoter recognition
Feb 14 Feature Selection in Bioinformatics: BAHSIC, Genome-Wide Association Studies
Feb 15 Clustering in Bioinformatics: Microarray Analysis in NCBI Geo, Two-sample tests, Biclustering
Feb 16 Graph Mining for Chemoinformatics and Drug Discovery
Feb 17 Project Presentations (starting 9:00 am s.t.)

DIB12_1.pdf

DIB12_2.pdf

DIB12_3.pdf

DIB12_3_appendix.pdf

DIB12_4.pdf

DIB12_5.pdf

DIB12_6.pdf

DIB12_7.pdf

DIB12_8.pdf

Prüfung: Oral exams will take place on March 6 and March 7, 2012 in office 1.B.02 in Spemannstr. 41 (Max Planck Campus, red building). Content of the exam is all the material we covered in the lectures and the project you worked on.

Mündliche Scheinprüfung am 6.3/7.3.2012 im Büro 1.B.02 in Spemannstr. 41 (Max Planck Campus, rotes Gebaeude). Der Inhalt der Prüfungen erstreckt sich auf das in der Vorlesung und in Ihrem Projekt behandelte Material.

Access number is "582 + bell sign". Please call this number at the entrance.

Die Zugangsnummer ist "582 + Klingelzeichen". Bitte rufen Sie diese Numme am Eingang an.

Aicheler 6.3 10:00
Friedrich 6.3 10:30
Güler 6.3 11:00
Hennig 6.3 11:30
Kasenburg 6.3 12:00
Luhn 6.3 17:00
Kirstahler 6.3 17:30
Michel 6.3 18:00
Piven 6.3 18:30
Peltzer 7.3 10:00
Pfeuffer 7.3 10:30
Pourriahi 7.3 11:00
Schubert 7.3 11:30
Stevens 7.3 12:00
Wojnar 7.3 16:30
Zwießele 7.3 17:00
Römer 7.3 17:30
Söllner 7.3 18:00
Petri 7.3 18:30