Direkt zum Inhalt
StartseiteSpark

Einführung in PySpark

Lernen Sie, verteiltes Datenmanagement und maschinelles Lernen in Spark mit dem PySpark-Paket umzusetzen.

Kurs Kostenlos Starten
4 Stunden45 Übungen146.788 LernendeTrophyLeistungsnachweis

Kostenloses Konto erstellen

GoogleLinkedInFacebook

oder

Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.
Group

Trainierst du 2 oder mehr?

Versuchen DataCamp for Business

Beliebt bei Lernenden in Tausenden Unternehmen


Kursbeschreibung

In diesem Kurs lernst du, wie du Spark mit Python verwendest! Spark ist ein Tool für parallele Berechnungen mit großen Datensätzen und lässt sich gut in Python integrieren. PySpark ist das Python-Paket, das diese Magie möglich macht. Du wirst dieses Paket nutzen, um mit Daten über Flüge von Portland nach Seattle zu arbeiten. Du lernst, diese Daten zu verarbeiten und eine ganze Machine-Learning-Pipeline zu erstellen, um vorherzusagen, ob Flüge verspätet sein werden oder nicht. Mach dich bereit, Spark in deinen Python-Code einzubauen und in die Welt des leistungsstarken Machine Learning einzutauchen!
Für Unternehmen

Trainierst du 2 oder mehr?

Verschaffen Sie Ihrem Team Zugriff auf die vollständige DataCamp-Plattform, einschließlich aller Funktionen.
DataCamp Für UnternehmenFür eine maßgeschneiderte Lösung buchen Sie eine Demo.

In den folgenden Tracks

Big Data mit PySpark

Gehe zu Track

Machine Learning Scientist mit Python

Gehe zu Track
  1. 1

    PySpark kennen lernen

    Kostenlos

    In diesem Kapitel lernst du, wie Spark mit Daten umgeht und wie du mit Python Tabellen lesen und schreiben kannst.

    Kapitel Jetzt Abspielen
    Was ist Spark eigentlich?
    50 xp
    Spark in Python verwenden
    50 xp
    Den SparkContext untersuchen
    100 xp
    DataFrames verwenden
    50 xp
    Erstellen einer SparkSession
    100 xp
    Tabellen betrachten
    100 xp
    Neugierig geworden?
    100 xp
    Einen Spark DataFrame pandafizieren
    100 xp
    Bringe etwas Spark in deine Daten
    100 xp
    Den Mittelsmann weglassen
    100 xp
  2. 3

    Erste Schritte mit Machine-Learning-Pipelines

    PySpark verfügt über integrierte, hochmoderne Machine-Learning-Routinen sowie über Hilfsprogramme zur Erstellung kompletter Machine-Learning-Pipelines. In diesem Kapitel lernst du mehr darüber.

    Kapitel Jetzt Abspielen
  3. 4

    Modelloptimierung und -auswahl

    In diesem letzten Kapitel wendest du das Gelernte an, um ein Modell zu erstellen, das vorhersagt, welche Flüge verspätet sein werden.

    Kapitel Jetzt Abspielen
Für Unternehmen

Trainierst du 2 oder mehr?

Verschaffen Sie Ihrem Team Zugriff auf die vollständige DataCamp-Plattform, einschließlich aller Funktionen.

In den folgenden Tracks

Big Data mit PySpark

Gehe zu Track

Machine Learning Scientist mit Python

Gehe zu Track

Datensätze

AirportsFlightsPlanes

Mitwirkende

Collaborator's avatar
Colin Ricardo

Voraussetzungen

Introduction to Python
Lore Dirick HeadshotLore Dirick

Director of Data Science Education at Flatiron School

Mehr Anzeigen

Was sagen andere Lernende?

Melden Sie sich an 15 Millionen Lernende und starten Sie Einführung in PySpark Heute!

Kostenloses Konto erstellen

GoogleLinkedInFacebook

oder

Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.