Preprocesamiento para el Aprendizaje Automático en Python
Aprende a limpiar y preparar tus datos para el aprendizaje automático.
Comienza El Curso Gratis4 horas20 vídeos62 ejercicios50.957 aprendicesDeclaración de cumplimiento
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.¿Entrenar a 2 o más personas?
Probar DataCamp for BusinessPreferido por estudiantes en miles de empresas
Descripción del curso
Este curso abarca los fundamentos de cómo y cuándo realizar el preprocesamiento de datos. Este paso esencial en cualquier proyecto de aprendizaje automático es cuando preparas tus datos para el modelado. Entre la importación y limpieza de tus datos y el ajuste de tu modelo de aprendizaje automático es cuando entra en juego el preprocesamiento. Aprenderás a normalizar tus datos para que tengan la forma adecuada para tu modelo, a crear nuevas características para aprovechar mejor la información de tu conjunto de datos y a seleccionar las mejores características para mejorar el ajuste de tu modelo. Por último, practicarás un poco el preprocesamiento consiguiendo un conjunto de datos sobre avistamientos de UFO listo para el modelado.
¿Entrenar a 2 o más personas?
Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.En las siguientes pistas
Científico de machine learning en Python
Ir a la pista- 1
Introducción al Preprocesamiento de Datos
GratuitoEn este capítulo aprenderás qué significa exactamente preprocesar datos. Darás los primeros pasos en cualquier viaje de preprocesamiento, incluyendo la exploración de los tipos de datos y el tratamiento de los datos que faltan.
- 2
Normalización de datos
Este capítulo trata sobre la normalización de los datos. A menudo, un modelo hará algunas suposiciones sobre la distribución o la escala de tus características. La normalización es una forma de hacer que tus datos se ajusten a estos supuestos y mejorar el rendimiento del algoritmo.
Normalización50 xpCuándo normalizar50 xpModelar sin normalizar100 xpNormalización50 xpComprobación de la varianza50 xpNormalización de registros en Python100 xpEscalar datos para comparar características50 xpEscalar datos - investigar columnas50 xpEscalar datos - estandarizar columnas100 xpDatos y modelos normalizados50 xpKNN sobre datos no escalados100 xpKNN sobre datos escalados100 xp - 3
Ingeniería de caracteristicas (Feature engineering)
En esta sección aprenderás sobre ingeniería de caracteristicas. Explorarás distintas formas de crear características nuevas y más útiles a partir de las que ya existen en tu conjunto de datos. Verás cómo codificar, agregar y extraer información de características numéricas y textuales.
Ingeniería de caracteristicas (Feature engineering)50 xpPrueba de conocimientos de ingeniería de rasgos50 xpIdentificar áreas para la ingeniería de características50 xpContar variables categóricas50 xpCodificación de variables categóricas - binarias100 xpCodificación de variables categóricas - one-hot100 xpCaracterísticas numéricas de ingeniería50 xpAgregación de características numéricas100 xpExtraer componentes fecha-hora100 xpCaracterísticas del texto de ingeniería50 xpExtraer patrones de cadenas100 xpVectorizar texto100 xpClasificación de textos mediante vectores tf/idf100 xp - 4
Selección de características para el modelado
Este capítulo repasa algunas técnicas diferentes para seleccionar las características más importantes de tu conjunto de datos. Aprenderás a eliminar características redundantes, a trabajar con vectores de texto y a reducir el número de características de tu conjunto de datos mediante el análisis de componentes principales (PCA).
Selección de características50 xpCuándo utilizar la selección de rasgos50 xpIdentificación de áreas para la selección de rasgos50 xpEliminación de caracteristicas redundantes50 xpSeleccionar características relevantes100 xpComprobación de características correlacionadas100 xpSeleccionar características utilizando vectores de texto50 xpExplorando los vectores de texto, parte 1100 xpExplorando los vectores de texto, parte 2100 xpEntrenamiento de Naive Bayes con selección de características100 xpReducción de dimensionalidad50 xpUtilizar PCA100 xpEntrenar un modelo con PCA100 xp - 5
Unirlo todo
Ahora que has aprendido todo sobre el preprocesamiento, probarás estas técnicas en un conjunto de datos que registra información sobre avistamientos de UFO.
UFOs y preprocesamiento50 xpComprobación de los tipos de columna100 xpEliminar los datos que faltan100 xpVariables categóricas y estandarización50 xpExtraer números de cadenas100 xpIdentificar características para la normalización100 xpNuevas funciones de ingeniería50 xpContar variables categóricas100 xpCaracterísticas de las fechas100 xpVectorización de texto100 xpSelección de rasgos y modelado50 xpSeleccionar el conjunto de datos ideal100 xpModelización del conjunto de datos UFO, parte 1100 xpModelización del conjunto de datos UFO, parte 2100 xp¡Enhorabuena!50 xp
¿Entrenar a 2 o más personas?
Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.En las siguientes pistas
Científico de machine learning en Python
Ir a la pistacolaboradores
James Chapman
Ver MásCurriculum Manager, DataCamp
¿Qué tienen que decir otros alumnos?
¡Únete a 15 millones de estudiantes y empieza Preprocesamiento para el Aprendizaje Automático en Python hoy mismo!
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.