R - Datamining
Es gibt viele Programme zur Auswertung von Big Data, doch kaum eines ist so flexibel wie R. In dieser 3-Tages-Schulung erfahren Sie alles, was Sie brauchen um ihr erstes Data-Mining-Projekt erfolgreich zum Abschluss zu bringen.
Angefangen bei den Grundprinzipien und bewährten Arbeitsweisen des Datamining in R erhalten Sie einen Überblick über die wichtigsten Pakete und Werkzeuge. Anhand von zahlreichen praktischen Demonstrationen und Übungen verinnerlichen Sie die wichtigen ersten Schritte jedes Datamining-Projekts: Daten-Exploration und Management.
Im zweiten Teil des Kurses lernen Sie die wichtigsten Verfahren zur Auswertung von Big Data kennen. Hier werden Modelle des Clusterings (K-means, hierarchisches Clustering) sowie Prognosemodelle (Entscheidungsbäume, Neuronale Netzwerke, Random Forrests) besprochen. Im Detail lernen die Teilnehmer wie die entsprechenden Modelle in R berechnet, bewertet und interpretiert werden können.
Inhalte
- Strukturieren von Data-Mining-Projekten (SEMMA-Algorithmus)
- Explorative Datenanalyse und Datenmanagement für Big-Data in R
- Unsupervised Learning: Suche nach Strukturen (Clustering)
- Supervised Learning: Erstellen von Prognosemodellen
- Entscheidungsbäume
- Künstliche, neuronale Netze
- Das Prinzip von Ensemble-Modellen & Random Forrests
Voraussetzungen
Teilnehmer sollten bereits erste Erfahrungen mit R gesammelt haben und die grundlegende Arbeitsweise kennen. Dieses Wissen wird z.B. im Kurs Explorative Datenanalyse mit R vermittelt.