Termine:

09.04.2018 : (R1-Basis) Einführung in R, R und Massendaten (ORE) / Teil 1
Aufgrund der Erfahrung mit den bisherigen R-Seminaren haben wir in 2018, dieses Seminar in 2 Teile, - - einen ersten mit Sprachengrundlagen (R1-Basis) und - einen zweiten für Machine Learning (R2-ML) aufgespalten. Die Breite des Themas und gleichzeitig praktische Übungen am Rechner, wie das für eine solche Analysesprache nötig ist, haben immer wieder dazu geführt, dass wichtige Einzelaspekte auf der Strecke blieben.
R ist der Newcomer unter den Analysesprachen im Data Warehouse und im Big Data - Kontext schon fast ein Standardwerkzeug. Rasend schnell verbreitet sich aktuell R auch in der kommerziellen IT in den Unternehmen.
R ist heute mehr als nur Statistik + Data Mining –Software: Mit Oracle R liest und bearbeitet man Daten in der Datenbank, im Big Data Umfeld, auf dem File Server oder zapft Datenquellen im Internet an. Man tauscht Daten zwischen den Lagerstätten durch. Man mischt klassische Statistik-Methoden mit Data Mining. Mit wenigen Skript-Zeilen erzeugt man Grafiken oder greift direkt in die Datenbank mit Datenmengen im Gigabyte- und Terabyte-Bereich.
Jeder, der R noch nicht kennt und sich in die Sprache einarbeiten will, kann dieses Seminar als Startpunkt benutzen. Diejenigen, die R bereits kennen, erfahren mehr über die Nutzung von R im Kontext der Oracle Datenbank bzw. Big Data.
Themen sind:
• Einführung in R und Überblick über mögliche Bedienoberfläche
• Erstellen von Skripten und Arbeiten mit der Bedienumgebung
• R-Datenstrukturen, Variablen und Datentypen, Kontrollstrukturen
• Umgang mit Textdateien / Einlesen und Bearbeiten von Analysedaten
• Erstellen von Grafiken – Einführen in das Graphik-Konzept von R
• Einbinden von R in die Oracle Datenbank – Transparent Layer
• Lesen, Erstellen und Analysieren von Datenbanktabellen mit R
• Tabellendaten-Profil-Analysen mit R
• Grafiken aus Datenbankdaten generieren
• Steuern von R-Skripten in der Oracle-Datenbank
• Arbeiten mit Massendaten
• Parallelisieren von R-Analysen
Es werden Übungen am Rechner durchgeführt. Dafür stehen Laptops zur Verfügung.
Termine und Orte:
19. – 20. Feb. 2018 GS Frankfurt, 1. Tag 09:30 - 17:00 Uhr, 2. Tag 09:00 – 12:00 Uhr
09. – 10. April 2018 GS Hamburg 1. Tag 09:30 - 17:00 Uhr, 2. Tag 09:00 – 12:00 Uhr
02. – 03. Juli 2018 GS München 1. Tag 09:30 - 17:00 Uhr, 2. Tag 09:00 – 12:00 Uhr

Eine der spannendsten Entwicklungen der letzten Jahre! R ist ein Vertreter heutiger moderner Analysesprachen für Objekte außerhalb und innerhalb der Oracle Datenbank mit flexiblen Schnittstellen nach HDFS, Hive und Spark.