Accéder au contenu principal

cours

Dealing With Missing Data in R

Débutant

Updated 12/2024

Make it easy to visualize, explore, and impute missing data with naniar, a tidyverse friendly approach to missing data.

Commencer le cours gratuitement

Inclus gratuitementPremium or Teams

RPréparation des données4 heures14 vidéos52 exercices4,350 XP15,306Déclaration de réalisation

Créez votre compte gratuit

Google LinkedIn Facebook

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.

Formation de 2 personnes ou plus ?

Essayer DataCamp for Business

Apprécié par les apprenants de milliers d’entreprises

Description du cours

Missing data is part of any real world data analysis. It can crop up in unexpected places, making analyses challenging to understand. In this course, you will learn how to use tidyverse tools and the naniar R package to visualize missing values. You'll tidy missing values so they can be used in analysis and explore missing values to find bias in the data. Lastly, you'll reveal other underlying patterns of missingness. You will also learn how to "fill in the blanks" of missing values with imputation models, and how to visualize, assess, and make decisions based on these imputed datasets.

Conditions préalables

Introduction to R Introduction to the Tidyverse

1

Why care about missing data?

Commencer le chapitre

Introduction to missing data

Using and finding missing values

How many missing values are there?

Working with missing values

Why care about missing values?

Summarizing missingness

Tabulating Missingness

Other summaries of missingness

How do we visualize missing values?

Your first missing data visualizations

Visualizing missing cases and variables

Visualizing missingness patterns

2

Wrangling and tidying up missing values

Commencer le chapitre

Searching for and replacing missing values

Using miss_scan_count

Using replace_with_na

Using replace_with_na scoped variants

Filling down missing values

Fix implicit missings using complete()

Fix explicit missings using fill()

Using complete() and fill() together

Missing Data dependence

Differences between MCAR and MAR

Exploring missingness dependence

Further exploring missingness dependence

3

Testing missing relationships

Commencer le chapitre

Tools to explore missing data dependence

Creating shadow matrix data

Performing grouped summaries of missingness

Further exploring more combinations of missingness

Visualizing missingness across one variable

Nabular data and filling by missingness

Nabular data and summarising by missingness

Explore variation by missingness: box plots

Visualizing missingness across two variables

Exploring missing data with scatter plots

Using facets to explore missingness

Faceting to explore missingness (multiple plots)

4

Connecting the dots (Imputation)

Commencer le chapitre

Filling in the blanks

Impute data below range with nabular data

Visualize imputed values in a scatter plot

Create histogram of imputed data

What makes a good imputation

Evaluating bad imputations

Evaluating imputations: The scale

Evaluating imputations: Across many variables

Performing imputations

Using simputation to impute data

Evaluating and comparing imputations

Evaluating imputations (many models & variables)

Evaluating imputations and models

Combining and comparing many imputation models

Evaluating the different parameters in the model

Final Lesson

Dealing With Missing Data in R

Cours
terminé

Earn Déclaration de réalisation

Ajoutez ces informations d’identification à votre profil LinkedIn, à votre CV ou à votre CV
Partagez-le sur les réseaux sociaux et dans votre évaluation de performance

Inclus avecPremium or Teams

S'inscrire maintenant

Inscrivez-vous 15 millions d’apprenants et commencer Dealing With Missing Data in R Aujourd’hui!

Créez votre compte gratuit

Google LinkedIn Facebook

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.