Accéder au contenu principal
AccueilPython

Preprocessing for Machine Learning in Python

Learn how to clean and prepare your data for machine learning!

Commencer Le Cours Gratuitement
4 heures20 vidéos62 exercices50 958 apprenantsTrophyDéclaration de réalisation

Créez votre compte gratuit

GoogleLinkedInFacebook

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.
Group

Formation de 2 personnes ou plus ?

Essayer DataCamp for Business

Apprécié par les apprenants de milliers d'entreprises


Description du cours

This course covers the basics of how and when to perform data preprocessing. This essential step in any machine learning project is when you get your data ready for modeling. Between importing and cleaning your data and fitting your machine learning model is when preprocessing comes into play. You'll learn how to standardize your data so that it's in the right form for your model, create new features to best leverage the information in your dataset, and select the best features to improve your model fit. Finally, you'll have some practice preprocessing by getting a dataset on UFO sightings ready for modeling.
Pour les entreprises

Formation de 2 personnes ou plus ?

Donnez à votre équipe l’accès à la plateforme DataCamp complète, y compris toutes les fonctionnalités.
DataCamp Pour Les EntreprisesPour une solution sur mesure , réservez une démo.

Dans les titres suivants

Certification disponible

Scientifique des données en Python

Aller à la piste

Scientifique en apprentissage automatique en Python

Aller à la piste
  1. 1

    Introduction to Data Preprocessing

    Gratuit

    In this chapter you'll learn exactly what it means to preprocess data. You'll take the first steps in any preprocessing journey, including exploring data types and dealing with missing data.

    Jouez Au Chapitre Maintenant
    Introduction to preprocessing
    50 xp
    Exploring missing data
    50 xp
    Dropping missing data
    100 xp
    Working with data types
    50 xp
    Exploring data types
    50 xp
    Converting a column type
    100 xp
    Training and test sets
    50 xp
    Class imbalance
    50 xp
    Stratified sampling
    100 xp
  2. 2

    Standardizing Data

    This chapter is all about standardizing data. Often a model will make some assumptions about the distribution or scale of your features. Standardization is a way to make your data fit these assumptions and improve the algorithm's performance.

    Jouez Au Chapitre Maintenant
  3. 4

    Selecting Features for Modeling

    This chapter goes over a few different techniques for selecting the most important features from your dataset. You'll learn how to drop redundant features, work with text vectors, and reduce the number of features in your dataset using principal component analysis (PCA).

    Jouez Au Chapitre Maintenant
Pour les entreprises

Formation de 2 personnes ou plus ?

Donnez à votre équipe l’accès à la plateforme DataCamp complète, y compris toutes les fonctionnalités.

Dans les titres suivants

Certification disponible

Scientifique des données en Python

Aller à la piste

Scientifique en apprentissage automatique en Python

Aller à la piste

ensembles de données

Hiking dataWine dataUFO sightings dataVolunteering data

collaborateurs

Collaborator's avatar
Nick Solomon
Collaborator's avatar
Kara Woo
James Chapman HeadshotJames Chapman

Curriculum Manager, DataCamp

Voir Plus

Qu’est-ce que les autres apprenants ont à dire ?

Inscrivez-vous 15 millions d’apprenants et commencer Preprocessing for Machine Learning in Python Aujourd’hui!

Créez votre compte gratuit

GoogleLinkedInFacebook

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.