Joindre des données avec pandas
Apprenez à combiner des données provenant de plusieurs tableaux en joignant des données à l'aide de pandas.
Commencer Le Cours Gratuitement4 heures15 vidéos51 exercices164 427 apprenantsDéclaration de réalisation
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.Formation de 2 personnes ou plus ?
Essayer DataCamp for BusinessApprécié par les apprenants de milliers d'entreprises
Description du cours
Être capable de combiner et de travailler avec plusieurs ensembles de données est une compétence essentielle pour tout Data Scientist en herbe. pandas est une pierre angulaire cruciale de l'écosystème de la science des données Python, Stack Overflow enregistrant 5 millions de vues pour des questions sur pandas. Apprenez à gérer plusieurs DataFrame en les combinant, en les organisant, en les joignant et en les remodelant à l'aide de pandas. Vous travaillerez avec des ensembles de données de la Banque mondiale et de la ville de Chicago. Vous terminerez le cours avec un ensemble de compétences solides pour la jonction de données dans pandas.
Formation de 2 personnes ou plus ?
Donnez à votre équipe l’accès à la plateforme DataCamp complète, y compris toutes les fonctionnalités.Dans les titres suivants
Manipulation de données en Python
Aller à la piste- 1
Notions de base sur la fusion de données
GratuitDécouvrez comment vous pouvez fusionner des données disparates à l'aide de jointures internes. En combinant des informations provenant de sources multiples, vous découvrirez des informations intéressantes qui auraient pu être cachées auparavant. Vous apprendrez également comment la relation entre ces sources, telle que one-to-one ou one-to-many, peut affecter votre résultat.
Jointure interne50 xpSur quelle colonne fusionner ?50 xpVotre première jointure intérieure100 xpJointures internes et nombre de lignes renvoyées100 xpRelations de un à plusieurs50 xpClassification "un à plusieurs100 xpFusion d'un à plusieurs100 xpFusionner plusieurs DataFrame50 xpNombre total de coureurs en un mois100 xpFusion de trois tableaux100 xpFusion un-à-plusieurs avec plusieurs tableaux100 xp - 2
Fusion de tableaux avec différents types de jointure
Améliorez vos connaissances en matière de jointures. Dans ce chapitre, vous travaillerez avec des données de films TMDb et vous découvrirez les jointures gauches, droites et externes. Vous découvrirez également comment fusionner un tableau avec lui-même et comment fusionner sur un index DataFrame.
Raccordement gauche50 xpCompter les lignes manquantes avec une jointure gauche100 xpEnrichir un ensemble de données100 xpCombien de lignes avec une jointure à gauche ?50 xpAutres jonctions50 xpUn bon moyen de trouver des films uniques100 xpGenres populaires avec jointure droite100 xpUtilisation d'une jointure externe pour sélectionner des acteurs100 xpFusionner un tableau avec lui-même50 xpS'unir à soi-même100 xpComment pandas gère-t-il les jointures automatiques ?50 xpFusion sur les index50 xpFusion d'index pour les classements de films100 xpLes suites gagnent-elles plus ?100 xp - 3
Fusion et concaténation avancées
Dans ce chapitre, vous tirerez parti de techniques de filtrage puissantes, notamment les semi-joints et les anti-joints. Vous apprendrez également à coller des DataFrame en les combinant verticalement et en utilisant la fonction pandas.concat pour créer de nouveaux ensembles de données. Enfin, les données étant rarement propres, vous apprendrez également à valider vos nouvelles structures de données combinées.
Filtrer les jointures50 xpÉtapes d'une jonction partielle100 xpExécution d'une antijonction100 xpExécution d'une semi-jonction100 xpConcaténer les DataFrame ensemble verticalement50 xpNotions de concaténation100 xpConcaténation avec des clés100 xpVérification de l'intégrité50 xpValider une fusion50 xpConcaténer et fusionner pour trouver des chansons communes100 xp - 4
Fusionner des données ordonnées et des séries temporelles
Dans ce dernier chapitre, vous passerez à la vitesse supérieure et apprendrez à appliquer les méthodes spécialisées de pandas pour fusionner des séries temporelles et des données ordonnées avec des données financières et économiques réelles provenant de la ville de Chicago. Vous apprendrez également à interroger les tableaux résultants à l'aide d'un format de type SQL et à décomposer les données à l'aide de la méthode de fusion.
Utilisation de merge_ordered()50 xpCorrélation entre GDP et S&P500100 xpCourbe de Phillips à l'aide de la fonction merge_ordered()100 xpmerge_ordered() caution, plusieurs colonnes100 xpUtilisation de merge_asof()50 xpUtiliser merge_asof() pour étudier les stocks100 xpUtilisation de merge_asof() pour créer un jeu de données100 xpdifférences entre merge_asof() et merge_ordered()100 xpSélectionner des données avec .query()50 xpExplorez les données financières avec .query()50 xpSubstituer des lignes avec .query()100 xpRemodelage des données avec .melt()50 xpSélectionnez les bons arguments de .melt()50 xpUtiliser .melt() pour remodeler les données gouvernementales100 xpUtilisation de .melt() pour la performance des actions par rapport aux obligations100 xpSynthèse du cours50 xp
Formation de 2 personnes ou plus ?
Donnez à votre équipe l’accès à la plateforme DataCamp complète, y compris toutes les fonctionnalités.Dans les titres suivants
Manipulation de données en Python
Aller à la pisteDans d’autres morceaux
Principes de base des données en Pythonensembles de données
Chicago WardsChicago Business LicensesChicago CensusChicago Demographics by Zip CodeChicago Business OwnersChicago Land UseChicago Taxi VehiclesChicago Taxi OwnersCTA RidershipCTA CalendarCTA StationsMoviesMovie ActorsMovie RatingsMovie CastsMovie CrewsMovie GenresMovie SequelsMovie Financial DataMovie Tag LinesS&P 500World Bank GDPWorld Bank Populationcollaborateurs
prérequis
Data Manipulation with pandasAaren Stubberfield
Voir PlusSenior Data Scientist @ Microsoft
Qu’est-ce que les autres apprenants ont à dire ?
Inscrivez-vous 15 millions d’apprenants et commencer Joindre des données avec pandas Aujourd’hui!
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.