Mit immer größeren Mengen an verfügbaren Daten werden auch immer neue Methoden zur Datenanalyse benötigt. Dieser drei-Tages-Kurs gibt Ihnen einen Überblick über die gängigen Methoden, die typischerweise unter dem Begriff Datamining zusammengefasst werden. Ausgehend von multivarianten Verfahren ohne besondere Zielgröße (unsupervised learning) werden Hauptkomponenten- und Clusteranalysen besprochen. Der Schwerpunkt des Kurses liegt jedoch auf verschiedenen Modellen zur Prognose. Das beinhaltet logistische Regression, Entscheidungsbäume und Neuronale Netze. Abgerundet wird das Training durch die Einführung in die Theorie der Ensemble-Modelle.
Inhalte:
- Kennenlernen der verschiedenen Anwendungen im Bereich Datamining
- Clustering (KMEANS, Hierarchisches Clustering)
- Hauptkomponentenanalyse
- Prognosemodelle (Logistische Regression, Entscheidungsbäume, Neuronale Netze)
- Idee der Ensemble-Modelle
Voraussetzungen:
Keine.