Accéder au contenu principal
AccueilSQL

Cleaning Data in PostgreSQL Databases

Learn to tame your raw, messy data stored in a PostgreSQL database to extract accurate insights.

Commencer Le Cours Gratuitement
4 heures15 vidéos49 exercices10 738 apprenantsTrophyDéclaration de réalisation

Créez votre compte gratuit

GoogleLinkedInFacebook

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.
Group

Formation de 2 personnes ou plus ?

Essayer DataCamp for Business

Apprécié par les apprenants de milliers d'entreprises


Description du cours

If you surveyed a large number of data scientists and data analysts about which tasks are most common in their workday, cleaning data would likely be in almost all responses. This is the case because real-world data is messy. To help you tame messy data, this course teaches you how to clean data stored in a PostgreSQL database. You’ll learn how to solve common problems such as how to clean messy strings, deal with empty values, compare the similarity between strings, and much more. You’ll get hands-on practice with these tasks using interesting (but messy) datasets made available by New York City's Open Data program. Are you ready to whip that messy data into shape?
Pour les entreprises

Formation de 2 personnes ou plus ?

Donnez à votre équipe l’accès à la plateforme DataCamp complète, y compris toutes les fonctionnalités.
DataCamp Pour Les EntreprisesPour une solution sur mesure , réservez une démo.
  1. 1

    Data Cleaning Basics

    Gratuit

    In this chapter, you’ll gain an understanding of data cleaning approaches when working with PostgreSQL databases and learn the value of cleaning data as early as possible in the pipeline. You’ll also learn basic string editing approaches such as removing unnecessary spaces as well as more involved topics such as pattern matching and string similarity to identify string values in need of cleaning.

    Jouez Au Chapitre Maintenant
    Introduction to data cleaning
    50 xp
    Developing a data cleaning mindset
    50 xp
    Applying functions for string cleaning
    100 xp
    Pattern matching
    50 xp
    Classifying parking violations by time of day
    100 xp
    Masking identifying information with regular expressions
    100 xp
    Matching similar strings
    50 xp
    Matching inconsistent color names
    100 xp
    Standardizing color names
    100 xp
    Standardizing multiple colors
    100 xp
    Formatting text for colleagues
    100 xp
  2. 3

    Converting Data

    Sometimes you need to convert data stored in a PostgreSQL database from one data type to another. In this chapter, you’ll explore the expressions you need to convert text to numeric types and how to format strings for temporal data.

    Jouez Au Chapitre Maintenant
  3. 4

    Transforming Data

    In the final chapter, you’ll learn how to transform your data and construct pivot tables. Working with real-world postal data, you’ll discover how to combine and split addresses into city, state, and zip codes using a multitude of powerful functions including CONCAT(), SUBSTRING(), and REGEXP_SPLIT_TO_TABLE().

    Jouez Au Chapitre Maintenant
Pour les entreprises

Formation de 2 personnes ou plus ?

Donnez à votre équipe l’accès à la plateforme DataCamp complète, y compris toutes les fonctionnalités.

ensembles de données

Parking violations in NYCRestaurant inspections in NYCFilm permits in NYC

collaborateurs

Collaborator's avatar
Amy Peterson
Collaborator's avatar
Maggie Matsui
Darryl Reeves Ph.D HeadshotDarryl Reeves Ph.D

Industry Assistant Professor, NYU Tandon School of Engineering

Voir Plus

Qu’est-ce que les autres apprenants ont à dire ?

Inscrivez-vous 15 millions d’apprenants et commencer Cleaning Data in PostgreSQL Databases Aujourd’hui!

Créez votre compte gratuit

GoogleLinkedInFacebook

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.