Termine:

11.02.2016 : Einführung in R und R im Kontext der Oracle Datenbank
R ist der Newcomer unter den Techniken im Data Warehouse und in Big Data mittlerweile ein Standardwerkzeug. Rasend schnell verbreitet sich aktuell R auch in der kommerziellen IT in den Unternehmen.
R ist heute mehr als nur Statistik –Software: Mit Oracle R liest und bearbeitet man Daten in der Datenbank, im Big Data Umfeld, auf dem File Server oder zapft Datenquellen im Internet an. Man tauscht Daten zwischen den Lagerstätten durch. Man mischt klassische Statistik-Methoden mit Data Mining. Mit wenigen Skript-Zeilen erzeugt man Grafiken, wie sie in keinem BI-Werkzeug zu finden sind und das direkt in der Datenablage der Datenbank mit Datenmengen im Gigabyte- und Terabyte-Bereich.
Jeder, der R noch nicht kennt und sich in die Sprache einarbeiten will, kann dieses Seminar als Startpunkt benutzen. Diejenigen, die R bereits kennen, erfahren mehr über die Nutzung von R im Kontext der Oracle Datenbank bzw. Big Data.
Die R-Integration in die Oracle Datenbank (Oracle R Enterprise) ist die a weitesten entwickelte Kombination von R mit einer Datenbank.
Das Seminar ist nach 3 Jahre Seminarerfahrung mittlerweile zu einem fundierten Praxisseminar herangewachsen. Die Teilnehmer verfügen danach über einen Startpunkt für eigene, selbstständige Schritte in dem Umgang mit R.

Themen sind:
• Einführung in R und Überblick über mögliche Bedienoberfläche
• Erstellen von Skripten und Arbeiten mit der Bedienumgebung
• R-Datenstrukturen, Variablen und Datentypen, Kontrollstrukturen
• Umgang mit Textdateien / Einlesen und Bearbeiten von Analysedaten
• Erstellen von Grafiken – Einführen in das Graphik-Konzept von R
• Statistische Grundlagen, Häufigkeitsverteilungen, deskriptive Statistik mit R, Mittelwerte und Streuung, Normalverteilung
• Übersicht und Beispiele zu Data Mining-Verfahren mit R
• Einbinden von R in die Oracle Datenbank – Transparent Layer
• Lesen, Erstellen und Analysieren von Datenbanktabellen mit R
• Tabellendaten-Profil-Analysen mit R
• Grafiken aus Datenbankdaten generieren
• Steuern von R-Skripten in der Oracle-Datenbank
• Zugriff auf Betriebssystem-Objekte wie HDFS-Daten oder auch Hive-Zugriffe
• Durchführen von Data Mining Analysen mit Daten in der Oracle Datenbank oder HDFS