Daten mit pandas verknüpfen
Lernen Sie, Daten aus mehreren Tabellen zu kombinieren, indem Sie Daten mit Pandas zusammenführen.
Kurs Kostenlos Starten4 Stunden15 Videos51 Übungen164.429 LernendeLeistungsnachweis
Kostenloses Konto erstellen
oder
Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.Trainierst du 2 oder mehr?
Versuchen DataCamp for BusinessBeliebt bei Lernenden in Tausenden Unternehmen
Kursbeschreibung
Die Fähigkeit, mehrere Datensätze zu kombinieren und mit ihnen gleichzeitig zu arbeiten, ist für angehende Data Scientists unerlässlich. pandas ist eine wichtige Komponente des Python-Ökosystems für Data Science. Stack Overflow hat inzwischen schon 5 Millionen Seitenaufrufe für die zu pandas gestellten Fragen verzeichnet. In diesem Kurs lernst du den Umgang mit mehreren DataFrames, indem du sie mithilfe von pandas kombinierst, organisierst, zusammenfügst und umformst. Du arbeitest dabei mit Datensätzen der Weltbank und der Stadt Chicago. Am Ende des Kurses verfügst du über solides Know-how zum Verknüpfen von Daten mit pandas.
Trainierst du 2 oder mehr?
Verschaffen Sie Ihrem Team Zugriff auf die vollständige DataCamp-Plattform, einschließlich aller Funktionen.In den folgenden Tracks
Datenmanipulation mit Python
Gehe zu Track- 1
Grundlagen der Datenverknüpfung
KostenlosLerne, wie du unterschiedliche Daten mithilfe von inneren Joins verknüpfen kannst. Indem du Daten aus verschiedenen Quellen kombinierst, deckst du interessante Erkenntnisse auf, die bisher vielleicht verborgen waren. Du erfährst auch, wie sich die Beziehung zwischen diesen Quellen (zum Beispiel 1:1- oder 1:n-Beziehung) auf das Ergebnis auswirken kann.
Innerer Join50 xpVerknüpfung anhand welcher Spalte?50 xpDein erster innerer Join100 xpInnere Joins und Anzahl der zurückgegebenen Zeilen100 xp1:n-Beziehungen50 xp1:n-Klassifizierung100 xp1:n-Verknüpfung100 xpVerknüpfung mehrerer DataFrames50 xpFahrgäste pro Monat100 xpVerknüpfung von drei Tabellen100 xp1:n-Verknüpfung mit mehreren Tabellen100 xp - 2
Verknüpfung von Tabellen mit verschiedenen Join-Typen
Erweitere dein Wissen zu Joins! In diesem Kapitel arbeitest du mit TMDb-Filmdaten und erfährst mehr zu linksseitigen, rechtsseitigen und äußeren Joins. Außerdem lernst du, wie du eine Tabelle mit sich selbst zusammenführst und wie du anhand eines DataFrame-Index verknüpfst.
Linksseitiger Join50 xpZählen fehlender Zeilen mit linksseitigem Join100 xpAnreicherung eines Datensatzes100 xpWie viele Zeilen mit linksseitigem Join?50 xpWeitere Joins50 xpRechtsseitiger Join zur Auswahl von Filmtiteln100 xpRechtsseitiger Join zur Bestimmung beliebter Genres100 xpÄußerer Join zur Auswahl von Schauspielern100 xpVerknüpfung einer Tabelle mit sich selbst50 xpReflexiver Join100 xpWie funktionieren reflexive Joins in pandas?50 xpVerknüpfung über Indizes50 xpIndexverknüpfung für Filmbewertungen100 xpErzielen Fortsetzungen höhere Umsätze?100 xp - 3
Komplexere Verknüpfung und Verkettung
In diesem Kapitel lernst du leistungsstarke Filtertechniken kennen, darunter Semi-Joins und Anti-Joins. Außerdem lernst du, wie du DataFrames vertikal zusammenfügen und mit der pandas.concat-Funktion neue Datensätze erstellen kannst. Da Daten selten makellos vorliegen, lernst du auch, wie du deine neu kombinierten Datenstrukturen validieren kannst.
Filternde Joins50 xpSchritte beim Semi-Join100 xpProgrammierung von Anti-Joins100 xpProgrammierung von Semi-Joins100 xpVertikale Verkettung von DataFrames50 xpGrundlagen der Verkettung100 xpVerkettung mit Schlüsseln100 xpÜberprüfung der Integrität50 xpValidierung einer Verknüpfung50 xpVerkettung und Verknüpfung zur Suche nach beliebten Songs100 xp - 4
Verknüpfung von geordneten Daten und Zeitreihendaten
In diesem letzten Kapitel schaltest du einen Gang höher und lernst, die speziellen Methoden von pandas für das Verknüpfen von Zeitreihen und geordneten Daten mit realen Finanz- und Wirtschaftsdaten der Stadt Chicago anzuwenden. Außerdem lernst du, wie du die resultierenden Tabellen in einem SQL-ähnlichen Stil abfragst und wie du die Daten mit der .melt()-Methode entpivotierst.
Verwendung von merge_ordered()50 xpKorrelation zwischen BIP und S&P500100 xpPhillipskurve mit merge_ordered()100 xpVorsicht bei merge_ordered() und mehreren Spalten100 xpVerwendung von merge_asof()50 xpVerwendung von merge_asof() zur Aktienanalyse100 xpVerwendung von merge_asof() zur Datensatzerstellung100 xpUnterschiede zwischen merge_asof() und merge_ordered()100 xpAuswahl von Daten mit .query()50 xpAnalyse von Finanzdaten mit .query()50 xpZeilenauswahl mit .query()100 xpDatenumformung mit .melt()50 xpAuswahl der richtigen .melt()-Argumente50 xpUmformung von Behördendaten mit .melt()100 xpVergleich der Performance von Aktien und Anleihen mit .melt()100 xpKurszusammenfassung50 xp
Trainierst du 2 oder mehr?
Verschaffen Sie Ihrem Team Zugriff auf die vollständige DataCamp-Plattform, einschließlich aller Funktionen.In den folgenden Tracks
Datenmanipulation mit Python
Gehe zu TrackIn anderen Tracks
Python Data FundamentalsDatensätze
Chicago WardsChicago Business LicensesChicago CensusChicago Demographics by Zip CodeChicago Business OwnersChicago Land UseChicago Taxi VehiclesChicago Taxi OwnersCTA RidershipCTA CalendarCTA StationsMoviesMovie ActorsMovie RatingsMovie CastsMovie CrewsMovie GenresMovie SequelsMovie Financial DataMovie Tag LinesS&P 500World Bank GDPWorld Bank PopulationMitwirkende
Voraussetzungen
Data Manipulation with pandasAaren Stubberfield
Mehr AnzeigenSenior Data Scientist @ Microsoft
Was sagen andere Lernende?
Melden Sie sich an 15 Millionen Lernende und starten Sie Daten mit pandas verknüpfen Heute!
Kostenloses Konto erstellen
oder
Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.