Saltar al contenido principal
InicioRLimpieza de datos en R

Limpieza de datos en R

Comience El Curso Gratis
4 Horas13 Videos44 Ejercicios
48.440 AprendicesTrophyDeclaración de cumplimiento

Crea Tu Cuenta Gratuita

GoogleLinkedInFacebook

o

Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.
Group¿Entrenar a 2 o más personas?Pruebe DataCamp para empresas

Preferido por estudiantes en miles de empresas


Descripción del curso

Superar problemas comunes de datos como la eliminación de duplicados en R

Se suele decir que los científicos de datos dedican el 80% de su tiempo a limpiar y manipular los datos y sólo el 20% a analizarlos. El tiempo dedicado a la limpieza es vital, ya que analizar datos sucios puede llevarle a sacar conclusiones inexactas.

En este curso, aprenderá una variedad de técnicas que le ayudarán a limpiar datos sucios utilizando R. Empezará convirtiendo tipos de datos, aplicando restricciones de rango y tratando con duplicados completos y parciales para evitar el doble recuento.

Profundizar en los retos de los datos avanzados

Una vez que haya practicado el trabajo con problemas de datos comunes, pasará a retos más avanzados, como garantizar la coherencia de las mediciones y tratar los datos que faltan. Después de cada nuevo concepto, tendrá la oportunidad de realizar un ejercicio práctico para consolidar sus conocimientos y aumentar su experiencia.

Aprenda a utilizar la vinculación de registros durante la limpieza de datos

La vinculación de registros se utiliza para fusionar conjuntos de datos cuando los valores presentan problemas, como errores tipográficos o grafías diferentes. Explorará esta útil técnica en el último capítulo y practicará su aplicación utilizándola para unir dos conjuntos de datos de reseñas de restaurantes en un único conjunto de datos.
Empresas

Group¿Entrenar a 2 o más personas?

Obtenga acceso de su equipo a la biblioteca completa de DataCamp, con informes centralizados, tareas, proyectos y más
Pruebe DataCamp Para EmpresasPara obtener una solución a medida, reserve una demostración.

En las siguientes pistas

Certificación disponible

Científico de datos asociado en R

Ir a la pista

Importar y limpiar datos con R

Ir a la pista
  1. 1

    Problemas comunes con los datos

    Gratuito

    En este capítulo, aprenderás a superar algunos de los problemas más comunes con los datos sucios. Convertirá tipos de datos, aplicará restricciones de rango para eliminar puntos de datos futuros y eliminará puntos de datos duplicados para evitar el doble recuento.

    Reproducir Capítulo Ahora
    Restricciones del tipo de datos
    50 xp
    Tipos de datos comunes
    100 xp
    Conversión de tipos de datos
    100 xp
    Recorte de cuerdas
    100 xp
    Restricciones de alcance
    50 xp
    Limitaciones de la duración del viaje
    100 xp
    Regreso al futuro
    100 xp
    Restricciones de unicidad
    50 xp
    Duplicados completos
    100 xp
    Eliminar duplicados parciales
    100 xp
    Agregación de duplicados parciales
    100 xp
  2. 2

    Datos categóricos y de texto

    Los datos categóricos y de texto suelen ser algunas de las partes más desordenadas de un conjunto de datos debido a su naturaleza no estructurada. En este capítulo, aprenderá a corregir las incoherencias de los espacios en blanco y las mayúsculas en las etiquetas de las categorías, a contraer varias categorías en una sola y a reformatear las cadenas para mantener la coherencia.

    Reproducir Capítulo Ahora
  3. 3

    Problemas de datos avanzados

    En este capítulo, se adentrará en problemas más avanzados de limpieza de datos, como asegurarse de que todos los pesos están escritos en kilogramos en lugar de libras. También adquirirá conocimientos muy valiosos que le ayudarán a verificar que los valores se han añadido correctamente y que los valores que faltan no afectan negativamente a sus análisis.

    Reproducir Capítulo Ahora
  4. 4

    Vinculación de registros

    La vinculación de registros es una potente técnica para fusionar varios conjuntos de datos, que se utiliza cuando los valores tienen errores tipográficos o diferente ortografía. En este capítulo, aprenderá a vincular registros mediante el cálculo de la similitud entre cadenas y, a continuación, utilizará sus nuevos conocimientos para unir dos conjuntos de datos de reseñas de restaurantes en un conjunto de datos maestro limpio.

    Reproducir Capítulo Ahora
Empresas

Group¿Entrenar a 2 o más personas?

Obtenga acceso de su equipo a la biblioteca completa de DataCamp, con informes centralizados, tareas, proyectos y más

En las siguientes pistas

Certificación disponible

Científico de datos asociado en R

Ir a la pista

Importar y limpiar datos con R

Ir a la pista

Sets De Datos

ZagatFodor'sBike SharingSFO Satisfaction SurveyCustomer Accounts

Colaboradores

Collaborator's avatar
Richie Cotton
Collaborator's avatar
Adel Nehme
Collaborator's avatar
Amy Peterson

Requisitos Previos

Joining Data with dplyr
Maggie Matsui HeadshotMaggie Matsui

Curriculum Manager at DataCamp

Ver Mas

¿Qué tienen que decir otros alumnos?

¡Únete a 13 millones de estudiantes y empieza Limpieza de datos en R hoy mismo!

Crea Tu Cuenta Gratuita

GoogleLinkedInFacebook

o

Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.