Introduction au Tidyverse
Commencez à explorer et à visualiser vos propres données avec tidyverse, une collection puissante et populaire d'outils de science des données au sein de R.
Commencer Le Cours Gratuitement4 heures16 vidéos50 exercices340 796 apprenantsDéclaration de réalisation
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.Formation de 2 personnes ou plus ?
Essayer DataCamp for BusinessApprécié par les apprenants de milliers d'entreprises
Description du cours
Il s'agit d'une introduction au langage de programmation R, centrée sur un ensemble d'outils puissants connus sous le nom de Tidyverse. Vous apprendrez les processus interdépendants de la manipulation et de la visualisation des données en utilisant les outils dplyr et ggplot2. Vous apprendrez à manipuler des données en filtrant, triant et résumant un ensemble réel de données historiques sur les pays afin de répondre à des questions exploratoires. Vous apprendrez ensuite à transformer ces données traitées en graphiques linéaires, en diagrammes à barres, en histogrammes, etc. à l'aide du progiciel ggplot2. Vous découvrirez la valeur de l'analyse exploratoire des données et la puissance des outils Tidyverse. Il s'agit d'une introduction appropriée pour ceux qui n'ont pas d'expérience préalable de R et qui sont intéressés par l'analyse de données.
Formation de 2 personnes ou plus ?
Donnez à votre équipe l’accès à la plateforme DataCamp complète, y compris toutes les fonctionnalités.Dans les titres suivants
R Développeur
Aller à la piste- 1
Traitement des données
GratuitDans ce chapitre, vous apprendrez à faire trois choses avec un tableau : filtrer des observations particulières, classer les observations dans l'ordre souhaité et effectuer des mutations pour ajouter ou modifier une colonne. Vous verrez comment chacune de ces étapes vous permet de répondre à des questions sur vos données.
L'ensemble de données gapminder50 xpChargement des paquets gapminder et dplyr100 xpComprendre un cadre de données50 xpLe verbe filtrer50 xpFiltrage pendant un an100 xpFiltrage pour un pays et une année100 xpLe verbe arranger50 xpClasser les observations par espérance de vie100 xpFiltrer et arranger100 xpLe verbe muter50 xpUtilisation de mutate pour modifier ou créer une colonne100 xpCombiner le filtre, la mutation et l'arrangement100 xp - 2
Visualisation des données
Un graphique est souvent une meilleure façon de comprendre et de présenter des données. Dans ce chapitre, vous apprendrez les compétences essentielles de la visualisation de données à l'aide du package ggplot2, et vous verrez comment les packages dplyr et ggplot2 travaillent en étroite collaboration pour créer des graphiques informatifs.
Visualiser avec ggplot250 xpAffectation des variables100 xpComparaison de la population et de GDP par habitant100 xpComparaison de la population et de l'espérance de vie100 xpÉchelles logarithmiques50 xpPlacer l'axe des x sur une échelle logarithmique100 xpPlacer les axes x et y sur une échelle logarithmique100 xpEsthétique supplémentaire50 xpAjouter de la couleur à un nuage de points100 xpAjouter de la taille et de la couleur à un tracé100 xpFacettes50 xpCréation d'un sous-graphe pour chaque continent100 xpFacettes par année100 xp - 3
Regroupement et synthèse
Jusqu'à présent, vous avez répondu à des questions sur des paires pays-année individuelles, mais vous pourriez être intéressé par des agrégations de données, telles que l'espérance de vie moyenne de tous les pays pour chaque année. Vous apprendrez ici à utiliser les verbes "grouper par" et "résumer", qui permettent de réduire de vastes ensembles de données à des résumés faciles à gérer.
Le verbe résumer50 xpRésumé de l'espérance de vie médiane100 xpRésumé de l'espérance de vie médiane en 1957100 xpRésumé de plusieurs variables en 1957100 xpLe verbe group_by50 xpRécapitulation par année100 xpRécapitulation par continent100 xpRécapitulation par continent et par année100 xpVisualisation de données résumées50 xpVisualisation de l'espérance de vie médiane dans le temps100 xpVisualisation de la médiane de GDP par habitant et par continent au fil du temps100 xpComparaison de l'espérance de vie médiane et de la valeur médiane de GDP par continent en 2007100 xp - 4
Types de visualisations
Dans ce chapitre, vous apprendrez à créer des tracés linéaires, des diagrammes à barres, des histogrammes et des diagrammes en boîte. Vous verrez que chaque type de graphique nécessite des méthodes différentes de manipulation et de préparation des données, et vous comprendrez comment chacun de ces types de graphique joue un rôle différent dans l'analyse des données.
Diagrammes linéaires50 xpVisualisation de la médiane de GDP par habitant au fil du temps100 xpVisualisation de la médiane de GDP par habitant par continent au fil du temps100 xpDiagrammes à barres50 xpVisualisation de la médiane de GDP par habitant par continent100 xpVisualisation de GDP par habitant par pays en Océanie100 xpHistogrammes50 xpVisualiser la population100 xpVisualisation de la population avec l'axe des x sur une échelle logarithmique100 xpGraphiques en boîte50 xpComparaison de GDP par habitant sur les différents continents100 xpAjouter un titre à votre graphique100 xpConclusion50 xp
Formation de 2 personnes ou plus ?
Donnez à votre équipe l’accès à la plateforme DataCamp complète, y compris toutes les fonctionnalités.Dans les titres suivants
R Développeur
Aller à la pisteDans d’autres morceaux
Principes de base de Tidyverse en Rensembles de données
Gapmindercollaborateurs
David Robinson
Voir PlusPrincipal Data Scientist at Heap
Qu’est-ce que les autres apprenants ont à dire ?
Inscrivez-vous 15 millions d’apprenants et commencer Introduction au Tidyverse Aujourd’hui!
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.