Datenmanipulation mit dplyr
Erlernen Sie Tidyverse-Fähigkeiten durch Datenumwandlung und -manipulation mit dplyr.
Kurs Kostenlos Starten4 Stunden13 Videos44 Übungen142.443 LernendeLeistungsnachweis
Kostenloses Konto erstellen
oder
Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.Trainierst du 2 oder mehr?
Versuchen DataCamp for BusinessBeliebt bei Lernenden in Tausenden Unternehmen
Kursbeschreibung
Angenommen, du hast einen tollen Datensatz gefunden und würdest gerne mehr darüber erfahren. Wie kannst du anfangen, die Fragen zu beantworten, die du zu den Daten hast? Verwende dplyr, um diese Fragen zu beantworten.
Erforsche zunächst die grundlegenden Datenumwandlungstechniken, einschließlich der Verwendung der wichtigsten dplyr-Verben wie select, filter, arrange und mutate. Mit diesen Funktionen lernst du, wie du Datensätze ändern kannst, indem du bestimmte Spalten auswählst, Zeilen anhand von Bedingungen filterst, Daten sortierst und neue berechnete Spalten erstellst.
Du wirst verstehen, wie du deine Daten besser interpretieren und verwalten kannst. Funktionen wie count, group_by und summarize werden vorgestellt, um Operationen durchzuführen, die viele Beobachtungen zu aussagekräftigen Zusammenfassungen aggregieren, die für die Datenanalyse und die Berichterstattung wichtig sind.
Am Ende des Kurses wirst du robuste Fähigkeiten zur Datenmanipulation mit dplyr entwickelt haben, die eine effizientere und effektivere Datenanalyse ermöglichen-eine wichtige Fähigkeit für jeden Datenanalysten oder Wissenschaftler.
Erste Schritte: Daten mit dplyr transformieren
In diesem Kurs lernst du, wie du mit dem dplyr-Paket in R Daten effizient manipulieren und umwandeln kannst.Erforsche zunächst die grundlegenden Datenumwandlungstechniken, einschließlich der Verwendung der wichtigsten dplyr-Verben wie select, filter, arrange und mutate. Mit diesen Funktionen lernst du, wie du Datensätze ändern kannst, indem du bestimmte Spalten auswählst, Zeilen anhand von Bedingungen filterst, Daten sortierst und neue berechnete Spalten erstellst.
Aggregieren von Daten mit dplyr
Als Nächstes behandelt der Kurs die Datenaggregation, bei der du lernst, wie du Daten zur besseren Interpretation zusammenfassen und verdichten kannst.Du wirst verstehen, wie du deine Daten besser interpretieren und verwalten kannst. Funktionen wie count, group_by und summarize werden vorgestellt, um Operationen durchzuführen, die viele Beobachtungen zu aussagekräftigen Zusammenfassungen aggregieren, die für die Datenanalyse und die Berichterstattung wichtig sind.
Auswahl und Umwandlung von Daten
Schließlich lernst du fortgeschrittene Techniken zur Datenauswahl und -umwandlung kennen, z. B. die Verwendung von Auswahlhilfen und das Verb umbenennen. Du wirst deine Fähigkeiten auch auf eine reale Fallstudie anwenden und gruppierte Mutationen, Fensterfunktionen und Datenvisualisierung mit ggplot2 üben.Am Ende des Kurses wirst du robuste Fähigkeiten zur Datenmanipulation mit dplyr entwickelt haben, die eine effizientere und effektivere Datenanalyse ermöglichen-eine wichtige Fähigkeit für jeden Datenanalysten oder Wissenschaftler.
Trainierst du 2 oder mehr?
Verschaffen Sie Ihrem Team Zugriff auf die vollständige DataCamp-Plattform, einschließlich aller Funktionen.In den folgenden Tracks
Datenmanipulation mit R
Gehe zu Track- 1
Daten mit dplyr transformieren
KostenlosLerne Verben kennen, mit denen du deine Daten transformieren kannst, z.B. auswählen, filtern, anordnen und verändern. Mit diesen Funktionen kannst du den Datensatz der Landkreise verändern, um bestimmte Beobachtungen anzuzeigen und Fragen zu den Daten zu beantworten.
Daten mit dplyr erforschen50 xpDeine Daten verstehen50 xpSpalten auswählen100 xpDie Verben filtern und ordnen50 xpBeobachtungen arrangieren100 xpFiltern nach Bedingungen100 xpFiltern und Anordnen100 xpDas Verb „mutate“ (mutieren)50 xpBerechnung der Anzahl der Staatsbediensteten100 xpBerechnung des Frauenanteils in einem Bezirk100 xpMutieren, filtern und arrangieren100 xp - 2
DataFrames aggregieren
Jetzt, wo du weißt, wie du deine Daten umwandeln kannst, willst du sicher mehr darüber wissen, wie du deine Daten aggregieren kannst, um sie besser interpretieren zu können. Du lernst eine Reihe von Funktionen kennen, mit denen du viele Beobachtungen in deinen Daten zusammenfassen kannst, darunter count, group_by, summarize, ungroup und slice_min/slice_max.
Das Verb zählen50 xpZählung nach Region100 xpZählung der Bürger nach Bundesland100 xpMutieren und Zählen100 xpDie Verben group_by, summarize und ungroup50 xpZusammenfassend100 xpZusammenfassung nach Bundesland100 xpZusammenfassend nach Bundesland und Region100 xpDie Verben slice_min und slice_max50 xpEinen Bezirk aus jeder Region auswählen100 xpDen Staat mit dem niedrigsten Einkommen in jeder Region finden100 xpZusammenfassen, slice_max und count zusammen verwenden100 xp - 3
Auswahl und Umwandlung von Daten
Lerne fortgeschrittene Methoden zum Auswählen und Transformieren von Spalten. Außerdem lernst du die Select-Helfer kennen, d.h. Funktionen, die Kriterien für die auszuwählenden Spalten angeben, sowie das Verb umbenennen.
- 4
Fallstudie: Der babynames-Datensatz
Arbeite mit einem neuen Datensatz, der die Namen der Babys enthält, die jedes Jahr in den Vereinigten Staaten geboren werden. Lerne, wie du gruppierte Mutationen und Fensterfunktionen nutzen kannst, um komplexere Fragen zu deinen Daten zu stellen und zu beantworten. Und verwende eine Kombination aus dplyr und ggplot2, um interessante Diagramme zu erstellen und deine Daten weiter zu untersuchen.
Die Babynamen-Daten50 xpFiltern und Ordnen für ein Jahr100 xpJedes Jahr die beliebtesten Namen finden100 xpVisualisierung von Namen mit ggplot2100 xpGruppierte Mutationen50 xpFinde das Jahr, in dem jeder Name am häufigsten vorkommt100 xpSumme und Maximum für jeden Namen addieren100 xpVisualisierung der normalisierten Veränderung der Popularität100 xpFensterfunktionen50 xpVerhältnisse verwenden, um die Häufigkeit eines Namens zu beschreiben100 xpDie größten Sprünge in einem Namen100 xpHerzlichen Glückwunsch!50 xp
Trainierst du 2 oder mehr?
Verschaffen Sie Ihrem Team Zugriff auf die vollständige DataCamp-Plattform, einschließlich aller Funktionen.In den folgenden Tracks
Datenmanipulation mit R
Gehe zu TrackIn anderen Tracks
R EntwicklerMitwirkende
Audio aufgenommen von
Voraussetzungen
Introduction to the TidyverseJames Chapman
Mehr AnzeigenCurriculum Manager, DataCamp
Was sagen andere Lernende?
Melden Sie sich an 15 Millionen Lernende und starten Sie Datenmanipulation mit dplyr Heute!
Kostenloses Konto erstellen
oder
Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.