Accéder au contenu principal
AccueilPython

cursus

Big Data avec PySpark

Apprenez à traiter les données volumineuses et à les exploiter efficacement avec Apache Spark en utilisant l'API PySpark.
Démarrez le parcours gratuitement

Inclus avecPremium or Teams

Pythontopics.importationEtNettoyageDesDonnees25 heures22,799

Créez votre compte gratuit

GoogleLinkedInFacebook

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.
Group

Formation de 2 personnes ou plus ?

Essayer DataCamp for Business

Apprécié par les apprenants de milliers d’entreprises

Description du cursus

Big Data avec PySpark

Améliorez vos compétences en matière de données en maîtrisant Apache Spark. En utilisant l'API Spark Python, PySpark, vous tirerez parti du calcul parallèle avec de grands ensembles de données et vous vous préparerez à l'apprentissage automatique à haute performance. Du nettoyage des données à la création de fonctionnalités et à la mise en œuvre de modèles d'apprentissage automatique, vous exécuterez des flux de travail de bout en bout avec Spark. Le cours se termine par la construction d'un moteur de recommandation utilisant les populaires ensembles de données MovieLens et Million Songs.

Conditions préalables

Il n’y a pas de prérequis pour ce parcours
  • Course

    1

    Introduction à PySpark

    Apprenez à mettre en œuvre la gestion des données distribuées et l'apprentissage automatique dans Spark à l'aide du package PySpark.

  • Course

    Learn the gritty details that data scientists are spending 70-80% of their time on; data wrangling and feature engineering.

  • Course

    Learn how to make predictions from data with Apache Spark, using decision trees, logistic regression, linear regression, ensembles, and pipelines.

  • Project

    Bonus

    Building a Demand Forecasting Model

    Use PySpark to build an e-commerce forecasting model!

Big Data avec PySpark
6 cours
Piste
terminée

Earn Déclaration de réalisation

Ajoutez ces informations d’identification à votre profil LinkedIn, à votre CV ou à votre CV
Partagez-le sur les réseaux sociaux et dans votre évaluation de performance

Inclus avecPremium or Teams

S'inscrire maintenant

Inscrivez-vous 15 millions d’apprenants et commencer Big Data avec PySpark Aujourd’hui!

Créez votre compte gratuit

GoogleLinkedInFacebook

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.