Direkt zum Inhalt
StartseiteSpark

Projekt

Cleaning an Orders Dataset with PySpark

Fortgeschritten
Updated 07/2024
Step into a data engineer's shoes and master data cleaning with PySpark on an e-commerce orders dataset!
Projekt Kostenlos Starten

Im Lieferumfang enthaltenPremium or Teams

1 Task1,500 XP861

Kostenloses Konto erstellen

GoogleLinkedInFacebook

oder

Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.
Group

Trainierst du 2 oder mehr?

Versuchen DataCamp for Business

Project Description

Data cleaning is an essential skill for any data professional.

In this project, you will step into a role of a data engineer at an e-commerce company and use PySpark, a powerful tool for data processing, to clean an orders dataset.

This hands-on experience will sharpen your ability to format, extract and amend data for further analysis.

Project Tasks

  1. 1
    Task 1

Technologies

Python Spark

Topics

Data EngineeringData Preparation
Rufat Mustafaev HeadshotRufat Mustafaev

Data Scientist, Booking.com

Mehr Anzeigen

What do other learners have to say?