Pular para o conteúdo principal
InícioSpark

curso

Cleaning Data with PySpark

Avançado
Updated 01/2025
Learn how to clean data with Apache Spark in Python.
Iniciar curso gratuitamente

Incluído gratuitamentePremium or Teams

SparkPreparação de dados4 horas16 vídeos53 exercícios4,150 XP27,749Declaração de Realização

Crie sua conta gratuita

GoogleLinkedInFacebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.
Group

Treinar 2 ou mais pessoas?

Tentar DataCamp for Business

Amado por alunos de milhares de empresas

Descrição do curso

Working with data is tricky - working with millions or even billions of rows is worse. Did you receive some data processing code written on a laptop with fairly pristine data? Chances are you’ve probably been put in charge of moving a basic data process from prototype to production. You may have worked with real world datasets, with missing fields, bizarre formatting, and orders of magnitude more data. Even if this is all new to you, this course helps you learn what’s needed to prepare data processes using Python with Apache Spark. You’ll learn terminology, methods, and some best practices to create a performant, maintainable, and understandable data processing platform.

Pré-requisitos

Intermediate PythonIntroduction to PySpark
1

DataFrame details

Iniciar capítulo
2

Manipulating DataFrames in the real world

Iniciar capítulo
3

Improving Performance

Iniciar capítulo
4

Complex processing and data pipelines

Iniciar capítulo
Cleaning Data with PySpark
Curso
Completo

Declaração de Realização Earn

Adicione esta credencial ao seu perfil, currículo ou currículo do LinkedIn
Compartilhe nas redes sociais e em sua avaliação de desempenho

Incluído comPremium or Teams

Inscreva-se agora

Junte-se a mais 15 milhões de alunos e comece Cleaning Data with PySpark Hoje!

Crie sua conta gratuita

GoogleLinkedInFacebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.