Introducción a las canalizaciones de datos
Este curso introductorio te ayudará a desarrollar habilidades para crear pipelines de datos efectivos y fiables.
Comienza El Curso Gratis4 horas14 vídeos53 ejercicios14.668 aprendicesDeclaración de cumplimiento
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.¿Entrenar a 2 o más personas?
Probar DataCamp for BusinessPreferido por estudiantes en miles de empresas
Descripción del curso
Potenciar la analítica con canalizaciones de datos
Los conductos de datos son la base de toda plataforma de datos sólida. La construcción de estas canalizaciones es una habilidad esencial para los ingenieros de datos, que aportan un valor increíble a una empresa preparada para dar el paso hacia un futuro impulsado por los datos. Este curso introductorio te ayudará a perfeccionar las habilidades necesarias para construir canalizaciones de datos eficaces, eficaces y fiables.
Creación y mantenimiento de soluciones ETL y ELT
A lo largo de este curso, te sumergirás en el proceso completo de construcción de una canalización de datos. Desarrollarás tus habilidades aprovechando bibliotecas de Python como `pandas` y `json` para extraer datos de fuentes estructuradas y no estructuradas antes de transformarlos y almacenarlos para su uso posterior. Por el camino, ganarás confianza en herramientas y técnicas como los diagramas de arquitectura, las pruebas unitarias y la supervisión, que te ayudarán a diferenciar tus canalizaciones de datos del resto. A medida que avances, pondrás a prueba tus nuevas habilidades con ejercicios prácticos.
¿Entrenar a 2 o más personas?
Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.En las siguientes pistas
Ingeniero de Aprendizaje Automático
Ir a la pista- 1
Introducción a las canalizaciones de datos
GratuitoPrepárate para descubrir cómo se recopilan, procesan y mueven los datos mediante canalizaciones de datos. Explorarás las cualidades de los mejores conductos de datos, y te prepararás para diseñar y construir el tuyo propio.
- 2
Construyendo ETL Pipelines
Sumérgete en el aprovechamiento de pandas para extraer, transformar y cargar datos mientras construyes tus primeras canalizaciones de datos. Aprende a hacer que tu lógica ETL sea reutilizable, y aplica el registro y la gestión de excepciones a tus canalizaciones.
Extraer datos de fuentes de estructuras50 xpExtraer datos de archivos parquet100 xpObtención de datos de las bases de datos SQL100 xpConstruir funciones para extraer datos100 xpTransformar datos con pandas50 xpFiltrar DataFrames de pandas100 xpTransformar datos de ventas con pandas100 xpValidar las transformaciones de datos100 xpPersistencia de datos con pandas50 xpCarga de datos de ventas en un archivo CSV100 xpPersonalizar un archivo CSV100 xpPersistencia de datos en ficheros100 xpSupervisar una canalización de datos50 xpRegistro en un canal de datos100 xpTratamiento de excepciones al cargar datos100 xpSupervisión y alerta dentro de un canal de datos100 xp - 3
Técnicas avanzadas ETL
Potencia tu flujo de trabajo con técnicas avanzadas de canalización de datos, como el trabajo con datos no tabulares y la persistencia de DataFrames en bases de datos SQL. Descubre herramientas para abordar transformaciones avanzadas con pandas, y descubre las mejores prácticas para trabajar con datos complejos.
Extraer datos no tabulares50 xpIngesta de datos de JSON con pandas100 xpLectura de los datos de JSON en la memoria100 xpTransformar datos no tabulares50 xpIterar sobre diccionarios100 xpAnálisis sintáctico de datos de diccionarios100 xpTransformación de datos JSON100 xpTransformar y limpiar DataFrames100 xpTransformación avanzada de datos con pandas50 xpRellenar valores perdidos con pandas100 xpAgrupar datos con pandas100 xpAplicar transformaciones avanzadas a los DataFrames100 xpCarga de datos en una base de datos SQL con pandas50 xpCargar datos en una base de datos Postgres100 xpValidar los datos cargados en una base de datos Postgres100 xp - 4
Despliegue y mantenimiento de una canalización de datos
En este último capítulo, crearás marcos para validar y probar las canalizaciones de datos antes de enviarlas a producción. Después de haber probado tu canalización, explorarás técnicas para ejecutar tu canalización de datos de extremo a extremo, todo ello permitiendo la visibilidad del rendimiento de la canalización.
Probar manualmente una canalización de datos50 xpProbar canalizaciones de datos50 xpValidar un canal de datos en "puntos de control"100 xpProbar una canalización de datos de principio a fin100 xpPruebas unitarias de una canalización de datos50 xpValidar una canalización de datos con assert e isinstance100 xpEscribir pruebas unitarias con pytest100 xpCrear fixtures con pytest100 xpPruebas unitarias de una canalización de datos con fixtures100 xpEjecutar una canalización de datos en producción50 xpHerramientas de orquestación y ETL50 xpPatrones de arquitectura de canalización de datos100 xpEjecutar una canalización de datos de extremo a extremo100 xp¡Enhorabuena!50 xp
¿Entrenar a 2 o más personas?
Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.En las siguientes pistas
Ingeniero de Aprendizaje Automático
Ir a la pistacolaboradores
Jake Roach
Ver MásData Engineer
¿Qué tienen que decir otros alumnos?
¡Únete a 15 millones de estudiantes y empieza Introducción a las canalizaciones de datos hoy mismo!
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.