big

Big Data und Datawarehouse

 

Big Data

In diesem Seminar erhalten Sie einen Einblick in die wichtigsten Komponenten des Hadoop-Ökosystems. Sie bekommen einen Überblick über die "Cloudera Distribution for Hadoop" und die zentralen Komponenten HDFS, YARN und MapReduce. Weitere oft genutzte Dienste im Hadoop-Umfeld wie ZooKeeper, Kafka oder Spark werden Sie ebenfalls kennenlernen. Praktische Übungen vertiefen das Gelernte.

Mehr Details...

Hadoop geprägte Big-Data-Systemumgebungen zeichnen sich durch eine Vielzahl unterschiedlichster Komponenten aus, welche in Kombination die Realisierung vielfältigster Anwendungsfälle im Big-Data-Umfeld ermöglichen. Bedingt durch die damit verbundene heterogene Systemlandschaft ergibt sich, insbesondere im Rahmen der Administration, ein herausforderndes Tätigkeitsumfeld. Dieses Seminar vermittelt das notwendige Know-how zur Installation und Administration eines Hadoop-Clusters auf Basis der Cloudera-Distribution.

Mehr Details...

Wir leben in einer Zeit, in der immer mehr Daten in immer kürzerer Zeit gespeichert und verarbeitet werden müssen. Klassische Frameworks und Algorithmen stoßen hier schnell an ihre Grenzen. Eine Lösung bietet Apache Spark - ein Framework zur verteilten Verarbeitung und Berechnung großer Datenmengen. In diesem Seminar bekommen Sie einen Überblick über die wichtigsten Spark-Komponenten und die Architektur einer Spark-Applikation. In praktischen Übungen wenden Sie das Erlernte an und schreiben Ihre ersten eigenen Spark-Jobs in Python. Unter anderem verwenden Sie dabei Spark Core - die Grundlage der parallelen Verarbeitung in Spark -, analysieren Daten mit Spark SQL und lernen die wichtigsten Konfigurationen, auch im Zusammenhang mit YARN, kennen. Des Weiteren erhalten Sie eine kurze Einführung in die Bibliotheken für Streaming (Spark Streaming), Machine Learning (MLlib) und Graph-Verarbeitung (GraphX).

Mehr Details...

Die stets wachsenden Datenmengen der heutigen Zeit stellen große Herausforderungen an die IT-Infrastruktur dar. Die NoSQL-Datenbank Apache Cassandra wird somit immer wichtiger für viele Szenarien, in denen relationale Datenbanken an ihre Grenzen stoßen. In diesem Seminar lernen Sie wichtige administrative Tätigkeiten kennen, die für den Betrieb eines Apache-Cassandra-Clustersystems notwendig sind. Anhand von praxisnahen Übungen werden alle relevanten Administrationsaufgaben und die zugehörigen Kommandos und Werkzeuge geschult.

Mehr Details...

NoSQL (Not Only SQL)-Datenbanksysteme gewinnen im Kontext mit Big-Data-geprägten Problemstellungen kontinuierlich an Bedeutung. Einerseits steigt die Vielfalt speziell entwickelter Systeme, die eine dem Anwendungsfall gegenüber optimierte Einsatzfähigkeit ermöglicht. Andererseits entwickeln sich bereits etablierte NoSQL-Datenbanksysteme stetig weiter und erweitern mit optionalen Funktionalitäten das jeweilige Leistungsspektrum. Das Seminar gibt einen Überblick über die unterschiedlichen Kategorien von NoSQL-Datenbanken und vermittelt grundlegende Technologien und Konzepte. Zusätzlich werden mit Redis, MongoDB und Cassandra drei populäre NoSQL-Datenbanksysteme vorgestellt.

Mehr Details...

Beratung / Kontakt

Seminarteam
Sie haben Fragen zu Seminaren
oder zu einer Bestellung?
phone 0611 77840-00
 envelope2 seminare@ordix.de