Saltar al contenido principal
InicioSpark

Machine learning con PySpark

Aprende a hacer predicciones con Apache Spark usando árboles de decisión, regresión logística y más.

Comienza El Curso Gratis
4 horas16 vídeos56 ejercicios23.730 aprendicesTrophyDeclaración de cumplimiento

Crea Tu Cuenta Gratuita

GoogleLinkedInFacebook

o

Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.
Group

¿Entrenar a 2 o más personas?

Probar DataCamp for Business

Preferido por estudiantes en miles de empresas


Descripción del curso

Aprende a utilizar Apache Spark para el machine learning

Spark es una potente herramienta de propósito general para trabajar con Big Data. Spark gestiona de forma transparente la distribución de tareas de cálculo en un clúster. Esto significa que las operaciones son rápidas, pero también te permite centrarte en el análisis en lugar de preocuparte por los detalles técnicos. En este curso aprenderás a introducir datos en Spark y, a continuación, profundizarás en los tres algoritmos fundamentales de Spark Machine learning: Regresión lineal, regresión logística/clasificadores y creación de pipelines.

Construir y probar árboles de decisión

Construir tus propios árboles de decisión es una forma estupenda de empezar a explorar los modelos de machine learning. Utilizarás un algoritmo llamado "Partición Recursiva" para dividir los datos en dos clases y encontrar un predictor dentro de tus datos que dé como resultado la división más informativa de las dos clases, y repetirás esta acción con más nodos. Luego puedes utilizar tu árbol de decisión para hacer predicciones con nuevos datos.

Domina la Regresión Logística y Lineal en PySpark

La regresión logística y lineal son técnicas esenciales de machine learning compatibles con PySpark. Aprenderás a construir y evaluar modelos de regresión logística, antes de pasar a crear modelos de regresión lineal para ayudarte a refinar tus predictores a sólo las opciones más relevantes.

Al final del curso, te sentirás seguro al aplicar tus nuevos conocimientos sobre machine learning, gracias a las tareas prácticas y a los conjuntos de datos de práctica que encontrarás a lo largo del curso.
Empresas

¿Entrenar a 2 o más personas?

Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.
DataCamp Para EmpresasPara obtener una solución a medida, reserve una demostración.

En las siguientes pistas

Big Data con PySpark

Ir a la pista

Científico de machine learning en Python

Ir a la pista
  1. 1

    Introducción

    Gratuito

    Spark es un marco para trabajar con Big Data. En este capítulo cubrirás algunos antecedentes sobre Spark y Machine learning. A continuación, descubrirás cómo conectarte a Spark utilizando Python y cargar datos CSV.

    Reproducir Capítulo Ahora
    Machine learning y Spark
    50 xp
    Características de la chispa
    50 xp
    Componentes de un clúster Spark
    50 xp
    Conectarse a Spark
    50 xp
    Ubicación del maestro Spark
    50 xp
    Crear una SparkSession
    100 xp
    Carga de datos
    50 xp
    Cargar datos de vuelos
    100 xp
    Carga de datos de spam SMS
    100 xp
Empresas

¿Entrenar a 2 o más personas?

Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.

En las siguientes pistas

Big Data con PySpark

Ir a la pista

Científico de machine learning en Python

Ir a la pista

conjuntos de datos

FlightsSMS

colaboradores

Collaborator's avatar
Hadrien Lacroix
Collaborator's avatar
Mona Khalil
Andrew Collier HeadshotAndrew Collier

Data Scientist @ Exegetic Analytics

Ver Más

¿Qué tienen que decir otros alumnos?

¡Únete a 15 millones de estudiantes y empieza Machine learning con PySpark hoy mismo!

Crea Tu Cuenta Gratuita

GoogleLinkedInFacebook

o

Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.