programa de habilidad
Big Data con PySpark
Mejora tus conocimientos de datos dominando Apache Spark. Utilizando la API Python de Spark, PySpark, aprovecharás la computación paralela con grandes conjuntos de datos, y te prepararás para el machine learning de alto rendimiento. Desde la limpieza de datos hasta la creación de funciones y la implementación de modelos de machine learning, ejecutarás flujos de trabajo integrales con Spark. El programa termina con la creación de un motor de recomendación utilizando el popular conjunto de datos MovieLens y el conjunto de datos Million Songs.
Python25 horas6 cursos1 proyectoDeclaración de cumplimiento
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.¿Entrenar a 2 o más personas?
Probar DataCamp for BusinessPreferido por estudiantes en miles de empresas
Asistente de IARegístrate para usar el Asistente de IANuestro asistente de IA es de uso gratuito para todos los usuarios registrados. Regístrese o inicie sesión para acceder al asistente y mejorar su experiencia de aprendizaje.
¿Entrenar a 2 o más personas?
Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.Instructores
Únete a 15,150,000 estudiantes y empeza Big Data con PySpark hoy!
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.