Analyse de données exploratoires en Python
Apprenez à explorer, visualiser et extraire des informations des données à l'aide de l'analyse exploratoire des données (AED) en Python.
Commencer Le Cours Gratuitement4 heures14 vidéos49 exercices55 062 apprenantsDéclaration de réalisation
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.Formation de 2 personnes ou plus ?
Essayer DataCamp for BusinessApprécié par les apprenants de milliers d'entreprises
Description du cours
Vous disposez donc de données intéressantes - par où commencer votre analyse ? Ce cours couvre le processus d'exploration et d'analyse des données, de la compréhension de ce qui est inclus dans un ensemble de données à l'incorporation des résultats de l'exploration dans un flux de travail de science des données.
À l'aide de données sur les chiffres du chômage et le prix des billets d'avion, vous tirerez parti de Python pour résumer et valider les données, calculer, identifier et remplacer les valeurs manquantes, et nettoyer les valeurs numériques et catégorielles. Tout au long du cours, vous créerez de superbes visualisations Seaborn pour comprendre les variables et leurs relations.
Par exemple, vous examinerez le lien entre la consommation d'alcool et les performances des élèves. Enfin, le cours montrera comment les résultats exploratoires alimentent les flux de travail de la science des données en créant de nouvelles caractéristiques, en équilibrant les caractéristiques catégorielles et en générant des hypothèses à partir des résultats.
À la fin de ce cours, vous aurez la confiance nécessaire pour effectuer votre propre analyse exploratoire des données (EDA) en Python.Vous serez en mesure d'expliquer vos résultats visuellement aux autres et de suggérer les prochaines étapes pour recueillir des informations à partir de vos données !
À l'aide de données sur les chiffres du chômage et le prix des billets d'avion, vous tirerez parti de Python pour résumer et valider les données, calculer, identifier et remplacer les valeurs manquantes, et nettoyer les valeurs numériques et catégorielles. Tout au long du cours, vous créerez de superbes visualisations Seaborn pour comprendre les variables et leurs relations.
Par exemple, vous examinerez le lien entre la consommation d'alcool et les performances des élèves. Enfin, le cours montrera comment les résultats exploratoires alimentent les flux de travail de la science des données en créant de nouvelles caractéristiques, en équilibrant les caractéristiques catégorielles et en générant des hypothèses à partir des résultats.
À la fin de ce cours, vous aurez la confiance nécessaire pour effectuer votre propre analyse exploratoire des données (EDA) en Python.Vous serez en mesure d'expliquer vos résultats visuellement aux autres et de suggérer les prochaines étapes pour recueillir des informations à partir de vos données !
Formation de 2 personnes ou plus ?
Donnez à votre équipe l’accès à la plateforme DataCamp complète, y compris toutes les fonctionnalités.Dans les titres suivants
Principes de base des données en Python
Aller à la piste- 1
Connaître un ensemble de données
GratuitQuelle est la meilleure façon d'aborder un nouvel ensemble de données ? Apprenez à valider et à résumer des données catégorielles et numériques et à créer des visualisations Seaborn pour communiquer vos résultats.
Exploration initiale50 xpFonctions pour l'exploration initiale100 xpComptage des valeurs catégorielles100 xpLe chômage mondial en 2021100 xpValidation des données50 xpDétection des types de données100 xpValidation des continents100 xpValidation de la gamme100 xpSynthèse des données50 xpRésumés avec .groupby() et .agg()100 xpAgrégats nommés100 xpVisualisation de résumés catégoriels100 xp - 2
Nettoyage des données et imputation
L'exploration et l'analyse des données impliquent souvent de traiter des valeurs manquantes, des types de données incorrects et des valeurs aberrantes. Dans ce chapitre, vous apprendrez des techniques pour gérer ces problèmes et rationaliser vos processus EDA!
Traiter les données manquantes50 xpTraitement des données manquantes100 xpStratégies pour les données manquantes restantes100 xpImputation des prix manquants des avions100 xpConversion et analyse des données catégorielles50 xpTrouver le nombre de valeurs uniques100 xpCatégories de durée de vol100 xpAjouter des catégories de durée100 xpTravailler avec des données numériques50 xpDurée du vol100 xpAjouter des statistiques descriptives100 xpTraitement des valeurs aberrantes50 xpQue faire des valeurs aberrantes ?100 xpIdentifier les valeurs aberrantes100 xpSuppression des valeurs aberrantes100 xp - 3
Relations dans les données
Les variables des ensembles de données n'existent pas dans le vide ; elles sont liées les unes aux autres. Dans ce chapitre, vous étudierez les relations entre les données numériques, catégorielles et même les données de type DateTime, en explorant la direction et la force de ces relations ainsi que les moyens de les visualiser.
Les tendances dans le temps50 xpImportation de données de type DateTime100 xpMise à jour du type de données en DateTime100 xpVisualiser les relations dans le temps100 xpCorrélation50 xpInterprétation d'une carte thermique50 xpVisualiser les relations entre les variables100 xpVisualiser les relations entre plusieurs variables100 xpRelations et distributions des facteurs50 xpDonnées catégorielles dans les diagrammes de dispersion100 xpExploration avec KDE plots100 xp - 4
Passer de l'analyse exploratoire à l'action
L'analyse exploratoire des données est une étape cruciale dans le flux de travail de la science des données, mais ce n'est pas la fin ! Il est maintenant temps d'apprendre des techniques et des considérations que vous pouvez utiliser pour avancer avec succès dans vos projets une fois que vous avez fini d'explorer !
Considérations relatives aux données catégorielles50 xpVérifier le déséquilibre des classes100 xpTableau croisé100 xpGénérer de nouvelles fonctionnalités50 xpExtraction de caractéristiques pour la corrélation100 xpCalcul des percentiles salariaux100 xpCatégorisation des salaires100 xpGénérer des hypothèses50 xpComparaison des salaires100 xpChoix d'une hypothèse100 xpFélicitations50 xp
Formation de 2 personnes ou plus ?
Donnez à votre équipe l’accès à la plateforme DataCamp complète, y compris toutes les fonctionnalités.Dans les titres suivants
Principes de base des données en Python
Aller à la pistecollaborateurs
George Boorman
Voir PlusCurriculum Manager, DataCamp
Izzy Weber
Voir PlusData Coach at iO-Sphere
Qu’est-ce que les autres apprenants ont à dire ?
Inscrivez-vous 15 millions d’apprenants et commencer Analyse de données exploratoires en Python Aujourd’hui!
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.