Accéder au contenu principal
AccueilPython

Apprentissage non supervisé en Python

Apprenez à regrouper, transformer, visualiser et extraire des informations à partir d'ensembles de données non marquées en utilisant scikit-learn et scipy.

Commencer Le Cours Gratuitement
4 heures13 vidéos52 exercices146 621 apprenantsTrophyDéclaration de réalisation

Créez votre compte gratuit

GoogleLinkedInFacebook

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.
Group

Formation de 2 personnes ou plus ?

Essayer DataCamp for Business

Apprécié par les apprenants de milliers d'entreprises


Description du cours

Supposons que vous disposiez d'une collection de clients présentant diverses caractéristiques telles que l'âge, la localisation et les antécédents financiers, et que vous souhaitiez découvrir des modèles et les classer en groupes. Ou encore, vous disposez d'un ensemble de textes, tels que des pages Wikipédia, et vous souhaitez les segmenter en catégories sur la base de leur contenu. C'est le monde de l'apprentissage non supervisé, appelé ainsi parce que vous ne guidez pas, ou ne supervisez pas, la découverte de modèles par une tâche de prédiction, mais que vous découvrez plutôt une structure cachée à partir de données non étiquetées. L'apprentissage non supervisé englobe une variété de techniques d'apprentissage automatique, allant du regroupement à la réduction des dimensions en passant par la factorisation des matrices. Dans ce cours, vous apprendrez les principes fondamentaux de l'apprentissage non supervisé et mettrez en œuvre les algorithmes essentiels en utilisant scikit-learn et SciPy. Vous apprendrez à regrouper, transformer, visualiser et extraire des informations à partir d'ensembles de données non étiquetées, et terminerez le cours en construisant un système de recommandation d'artistes musicaux populaires.
Pour les entreprises

Formation de 2 personnes ou plus ?

Donnez à votre équipe l’accès à la plateforme DataCamp complète, y compris toutes les fonctionnalités.
DataCamp Pour Les EntreprisesPour une solution sur mesure , réservez une démo.

Dans les titres suivants

Certification disponible

Scientifique de données associé en Python

Aller à la piste

Ingénieur IA associé pour les scientifiques de données

Aller à la piste

Principes fondamentaux de l'apprentissage automatique en Python

Aller à la piste
  1. 1

    Regroupement pour l'exploration des ensembles de données

    Gratuit

    Apprenez à découvrir les groupes sous-jacents (ou "clusters") dans un ensemble de données. À la fin de ce chapitre, vous saurez regrouper les entreprises en fonction de leur cours de bourse et distinguer les différentes espèces en regroupant leurs mesures.

    Jouez Au Chapitre Maintenant
    Apprentissage non supervisé
    50 xp
    Combien de groupes ?
    50 xp
    Regroupement de points 2D
    100 xp
    Inspectez votre clustering
    100 xp
    Évaluation d'un regroupement
    50 xp
    Combien de grappes de céréales ?
    100 xp
    Évaluation du regroupement des grains
    100 xp
    Transformer les caractéristiques pour améliorer les regroupements
    50 xp
    Mise à l'échelle des données sur les poissons pour le regroupement
    100 xp
    Regroupement des données sur les poissons
    100 xp
    Regroupement des stocks à l'aide de KMeans
    100 xp
    Quels sont les titres qui évoluent ensemble ?
    100 xp
  2. 2

    Visualisation avec clustering hiérarchique et t-SNE

    Dans ce chapitre, vous découvrirez deux techniques d'apprentissage non supervisé pour la visualisation des données, le clustering hiérarchique et le t-SNE. Le regroupement hiérarchique fusionne les échantillons de données en grappes de plus en plus fines, ce qui donne une visualisation arborescente de la hiérarchie des grappes qui en résulte. t-SNE cartographie les échantillons de données dans l'espace 2D afin de visualiser la proximité des échantillons les uns par rapport aux autres.

    Jouez Au Chapitre Maintenant
  3. 3

    Décorréler vos données et réduire les dimensions

    La réduction des dimensions permet de résumer un ensemble de données à l'aide des motifs les plus courants. Dans ce chapitre, vous découvrirez la plus fondamentale des techniques de réduction des dimensions, l'analyse en composantes principales ("PCA"). PCA est souvent utilisée avant l'apprentissage supervisé pour améliorer les performances et la généralisation des modèles. Il peut également être utile pour l'apprentissage non supervisé. Par exemple, vous utiliserez une variante de PCA qui vous permettra de regrouper les articles de Wikipédia en fonction de leur contenu !

    Jouez Au Chapitre Maintenant
  4. 4

    Découvrir les caractéristiques interprétables

    Dans ce chapitre, vous découvrirez une technique de réduction des dimensions appelée "factorisation de la matrice non négative" ("NMF") qui exprime les échantillons sous forme de combinaisons de parties interprétables. Par exemple, il exprime les documents comme des combinaisons de sujets, et les images en termes de modèles visuels courants. Vous apprendrez également à utiliser NMF pour construire des systèmes de recommandation qui peuvent vous trouver des articles similaires à lire, ou des artistes musicaux qui correspondent à votre historique d'écoute !

    Jouez Au Chapitre Maintenant
Pour les entreprises

Formation de 2 personnes ou plus ?

Donnez à votre équipe l’accès à la plateforme DataCamp complète, y compris toutes les fonctionnalités.

Dans les titres suivants

Certification disponible

Scientifique de données associé en Python

Aller à la piste

Ingénieur IA associé pour les scientifiques de données

Aller à la piste

Principes fondamentaux de l'apprentissage automatique en Python

Aller à la piste

Dans d’autres morceaux

Scientifique en apprentissage automatique en Python

ensembles de données

Company stock price movementsEurovision 2016Fish measurementsGrainsLCD digitsMusical artistsWikipedia articlesWine

collaborateurs

Collaborator's avatar
Yashas Roy
Collaborator's avatar
Hugo Bowne-Anderson
Benjamin Wilson HeadshotBenjamin Wilson

Director of Research at lateral.io

Voir Plus

Qu’est-ce que les autres apprenants ont à dire ?

Inscrivez-vous 15 millions d’apprenants et commencer Apprentissage non supervisé en Python Aujourd’hui!

Créez votre compte gratuit

GoogleLinkedInFacebook

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.