Saltar al contenido principal
InicioSpark

Cursos Spark

Con Spark, los datos se leen en la memoria, se realizan las operaciones y se escriben los resultados, lo que permite una ejecución más rápida. Aprende principios básicos y paquetes comunes en DataCamp.
Cursos Spark icon

Recomendado para principiantes en Spark

Desarrolla tus habilidades Spark con cursos interactivos impartidos por expertos del mundo real

curso

Introducción a PySpark

IntermediateSkill Level
4 horas
1.2K
Aprende a implementar la gestión de datos distribuidos y el machine learning en Spark utilizando el paquete PySpark.

programa

Big Data con PySpark

25 horas
74
Domina cómo procesar big data y aprovecharlo eficientemente con Apache Spark utilizando la API PySpark.

¿No sabes por dónde empezar?

Toma Una Evaluación
8 resultados

curso

Introducción a PySpark

IntermediateSkill Level
4 horas
1.2K
Aprende a implementar la gestión de datos distribuidos y el machine learning en Spark utilizando el paquete PySpark.

curso

Machine learning con PySpark

AdvancedSkill Level
4 horas
334
Aprende a hacer predicciones con Apache Spark usando árboles de decisión, regresión logística y más.

curso

Feature Engineering with PySpark

AdvancedSkill Level
4 horas
165
Learn the gritty details that data scientists are spending 70-80% of their time on; data wrangling and feature engineering.

Recursos relacionados sobre Spark

tutorial

Tutorial de Pyspark: Primeros pasos con Pyspark

Descubre qué es Pyspark y cómo se puede utilizar, con ejemplos.
Natassha Selvaraj's photo

Natassha Selvaraj

10 min


¿Listo para aplicar tus habilidades?

Los proyectos te permiten aplicar tus conocimientos a una amplia gama de conjuntos de datos para resolver problemas del mundo real en tu navegador

Ver Más

Preguntas más frecuentes

¿Qué curso de Spark es el mejor para principiantes absolutos?

Para los nuevos alumnos, DataCamp tiene tres cursos introductorios a Spark en los lenguajes de programación más populares:

Introducción a PySpark 

Introducción a Spark con sparklyr en R 

Curso de Introducción a Spark SQL en Python

¿Necesito experiencia previa para hacer un curso de Spark?

Necesitarás haber realizado un curso de introducción al lenguaje de programación en el que vayas a utilizar Spark. 

Todo ello lo puedes encontrar aquí:

Introducción a Python

Introducción a R

Introducción a SQL

Además, cualquiera puede iniciarse en Spark mediante ejercicios sencillos e interactivos en DataCamp.

¿Para qué se utiliza PySpark?

Si ya estás familiarizado con Python y bibliotecas como Pandas, entonces PySpark es un buen lenguaje que aprender para crear análisis y pipelines más escalables.

Apache Spark es básicamente un motor computacional que trabaja con enormes conjuntos de datos procesándolos en paralelo y por lotes.

Spark está escrito en Scala, y PySpark se lanzó para apoyar la colaboración de Spark y Python.

¿Cómo puede ayudar Spark a mi carrera?

Adquirirás la capacidad de analizar datos y entrenar modelos de aprendizaje automático en conjuntos de datos a gran escala, una valiosa habilidad para convertirte en un científico de datos. 

Tener la experiencia para trabajar con marcos de big data como Apache Spark te diferenciará.

¿Qué es Apache Spark?

Apache Spark es un sistema de procesamiento distribuido de código abierto utilizado para cargas de trabajo de big data. 

Utiliza caché en memoria y ejecución optimizada de consultas para realizar consultas analíticas rápidas contra datos de cualquier tamaño. 

Proporciona API de desarrollo en Java, Scala, Python y R, y admite la reutilización de código en múltiples cargas de trabajo: procesamiento por lotes, consultas interactivas, análisis en tiempo real, aprendizaje automático y procesamiento de gráficos.

Otras tecnologías y temas

tecnologías