Direkt zum Inhalt
Startseite

Spark-Kurse

Mit Spark werden Daten in den Speicher eingelesen, Operationen durchgeführt und die Ergebnisse zurückgeschrieben, was zu einer schnelleren Ausführung führt. Lerne auf dem DataCamp die wichtigsten Prinzipien und gängigen Pakete kennen.
Spark-Kurse icon
Group

Trainierst du 2 oder mehr?

Versuchen DataCamp for Business

Empfohlen für Spark-Anfänger

Baue deine Spark-Fähigkeiten mit interaktiven Kursen auf, die von Experten aus der Praxis kuratiert werden.

Kurs

Einführung in PySpark

IntermediateSkill Level
4 Stunden
1.3K
Lernen Sie, verteiltes Datenmanagement und maschinelles Lernen in Spark mit dem PySpark-Paket umzusetzen.

Lernpfad

Big Data mit PySpark

25 Stunden
60
Meistere die Verarbeitung von Big Data und deren effiziente Nutzung mit Apache Spark unter Verwendung von PySpark API.

Bist du dir nicht sicher, wo du anfangen sollst?

Jetzt Testen Lassen
8 Ergebnisse

Kurs

Einführung in PySpark

IntermediateSkill Level
4 Stunden
1.3K
Lernen Sie, verteiltes Datenmanagement und maschinelles Lernen in Spark mit dem PySpark-Paket umzusetzen.

Kurs

Machine Learning with PySpark

AdvancedSkill Level
4 Stunden
326
Learn how to make predictions from data with Apache Spark, using decision trees, logistic regression, linear regression, ensembles, and pipelines.

Kurs

Feature Engineering with PySpark

AdvancedSkill Level
4 Stunden
276
Learn the gritty details that data scientists are spending 70-80% of their time on; data wrangling and feature engineering.

Verwandte Ressourcen auf Spark

Lernprogramm

Pyspark Tutorial: Erste Schritte mit Pyspark

Erfahre, was Pyspark ist und wie es verwendet werden kann, und gib Beispiele.
Natassha Selvaraj's photo

Natassha Selvaraj

10 Min.


Bist du bereit, deine Fähigkeiten einzusetzen?

Projekte ermöglichen es dir, dein Wissen auf eine breite Palette von Datensätzen anzuwenden um reale Probleme in deinem Browser zu lösen

Mehr Anzeigen

Häufig gestellte Fragen

Welcher Spark-Kurs ist der beste für absolute Anfänger?

Für neue Lernende bietet DataCamp drei Spark-Einführungskurse in den gängigsten Programmiersprachen an:

Einführung in PySpark 

Einführung in Spark mit sparklyr in R 

Einführung in Spark SQL in Python Kurs

Brauche ich Vorkenntnisse, um an einem Spark-Kurs teilzunehmen?

Du musst einen Einführungskurs in die Programmiersprache absolviert haben, in der du Spark einsetzen willst. 

All das kannst du hier finden:

Einführung in Python

Einführung in R

Einführung in SQL

Darüber hinaus kann jeder durch einfache, interaktive Übungen auf dem DataCamp in Spark einsteigen.

Wofür wird PySpark verwendet?

Wenn du bereits mit Python und Bibliotheken wie Pandas vertraut bist, dann ist PySpark eine gute Sprache, um skalierbare Analysen und Pipelines zu erstellen.

Apache Spark ist im Grunde eine Rechenmaschine, die mit großen Datenmengen arbeitet, indem sie diese in Parallel- und Batch-Systemen verarbeitet.

Spark ist in Scala geschrieben, und PySpark wurde veröffentlicht, um die Zusammenarbeit von Spark und Python zu unterstützen.

Wie kann Spark meiner Karriere helfen?

Du erwirbst die Fähigkeit, Daten zu analysieren und Machine-Learning-Modelle auf großen Datensätzen zu trainieren - eine wertvolle Fähigkeit, um ein/e Data Scientist zu werden. 

Wenn du mit Big-Data-Frameworks wie Apache Spark arbeiten kannst, hebst du dich von anderen ab.

Was ist Apache Spark?

Apache Spark ist ein verteiltes Open-Source-Verarbeitungssystem, das für Big Data-Workloads verwendet wird. 

Sie nutzt das In-Memory-Caching und die optimierte Abfrageausführung für schnelle analytische Abfragen von Daten beliebiger Größe. 

Es bietet Entwicklungs-APIs in Java, Scala, Python und R und unterstützt die Wiederverwendung von Code für verschiedene Arbeitslasten - Batch-Verarbeitung, interaktive Abfragen, Echtzeit-Analysen, maschinelles Lernen und Graphenverarbeitung.

Weitere Technologien und Themen

Technologien