Saltar al contenido principal
InicioPythonLimpiar datos en Python

Limpiar datos en Python

Comience El Curso Gratis
4 Horas13 Videos44 Ejercicios
107.930 AprendicesTrophyDeclaración de cumplimiento

Crea Tu Cuenta Gratuita

GoogleLinkedInFacebook

o

Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.
Group¿Entrenar a 2 o más personas?Pruebe DataCamp para empresas

Preferido por estudiantes en miles de empresas


Descripción del curso

Se suele decir que los científicos de datos dedican el 80% de su tiempo a limpiar y manipular los datos y sólo el 20% a analizarlos. El tiempo dedicado a la limpieza es vital, ya que analizar datos sucios puede llevarte a sacar conclusiones inexactas. La limpieza de datos es una tarea esencial en la ciencia de datos. Sin unos datos correctamente depurados, los resultados de cualquier análisis de datos o modelo de machine learning podrían ser inexactos. En este curso, aprenderás a identificar, diagnosticar y tratar diversos problemas de limpieza de datos en Python, desde los más sencillos a los más avanzados. Tratarás con tipos de datos incorrectos, comprobarás que tus datos están en el intervalo correcto, manejarás los datos que faltan, realizarás la vinculación de registros, ¡y mucho más!
Empresas

Group¿Entrenar a 2 o más personas?

Obtenga acceso de su equipo a la biblioteca completa de DataCamp, con informes centralizados, tareas, proyectos y más
Pruebe DataCamp Para EmpresasPara obtener una solución a medida, reserve una demostración.

En las siguientes pistas

Certificación disponible

Ingeniero de datos en Python

Ir a la pista
Certificación disponible

Científico de datos asociado en Python

Ir a la pista

Importar y limpiar datos con Python

Ir a la pista
  1. 1

    Problemas habituales con los datos

    Gratuito

    En este capítulo, aprenderás a superar algunos de los problemas más comunes con los datos sucios. Convertirás los tipos de datos, aplicarás restricciones de rango para eliminar puntos de datos futuros y eliminarás puntos de datos duplicados para evitar la doble contabilidad.

    Reproducir Capítulo Ahora
    Restricciones del tipo de datos
    50 xp
    Tipos de datos comunes
    100 xp
    ¿Datos numéricos o ... ?
    100 xp
    Sumar cadenas y concatenar números
    100 xp
    Restricciones del rango de datos
    50 xp
    Limitaciones del tamaño de los neumáticos
    100 xp
    Regreso al futuro
    100 xp
    Restricciones de unicidad
    50 xp
    ¿Qué tamaño tiene tu subconjunto?
    50 xp
    Encontrar duplicados
    100 xp
    Tratamiento de duplicados
    100 xp
  2. 2

    Problemas de texto y datos categóricos

    Los datos categóricos y de texto pueden ser a menudo algunas de las partes más desordenadas de un conjunto de datos, debido a su naturaleza no estructurada. En este capítulo, aprenderás a corregir incoherencias de espacios en blanco y mayúsculas en las etiquetas de las categorías, a contraer varias categorías en una sola y a reformatear cadenas para que sean coherentes.

    Reproducir Capítulo Ahora
  3. 3

    Problemas avanzados de datos

    En este capítulo, te sumergirás en problemas más avanzados de limpieza de datos, como asegurarte de que todos los pesos están escritos en kilogramos en lugar de libras. También adquirirás conocimientos muy valiosos que te ayudarán a verificar que los valores se han añadido correctamente y que los valores que faltan no afectan negativamente a tus análisis.

    Reproducir Capítulo Ahora
  4. 4

    Vinculación de registros

    La vinculación de registros es una potente técnica para fusionar varios conjuntos de datos, que se utiliza cuando los valores tienen erratas o diferente ortografía. En este capítulo, aprenderás a enlazar registros calculando la similitud entre cadenas; luego, utilizarás tus nuevas habilidades para unir dos conjuntos de datos de reseñas de restaurantes en un conjunto de datos maestro limpio.

    Reproducir Capítulo Ahora
Empresas

Group¿Entrenar a 2 o más personas?

Obtenga acceso de su equipo a la biblioteca completa de DataCamp, con informes centralizados, tareas, proyectos y más

En las siguientes pistas

Certificación disponible

Ingeniero de datos en Python

Ir a la pista
Certificación disponible

Científico de datos asociado en Python

Ir a la pista

Importar y limpiar datos con Python

Ir a la pista

Sets De Datos

Ride sharing datasetAirlines datasetBanking datasetRestaurants datasetRestaurants dataset II

Colaboradores

Collaborator's avatar
Maggie Matsui
Collaborator's avatar
Richie Cotton
Collaborator's avatar
Amy Peterson
Adel Nehme HeadshotAdel Nehme

VP of Media, DataCamp

Ver Mas

¿Qué tienen que decir otros alumnos?

¡Únete a 13 millones de estudiantes y empieza Limpiar datos en Python hoy mismo!

Crea Tu Cuenta Gratuita

GoogleLinkedInFacebook

o

Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.