Accéder au contenu principal

cours

Apprentissage automatique avec des modèles arborescents en Python

Intermédiaire

Updated 12/2024

Dans ce cours, vous apprendrez à utiliser des modèles basés sur des arbres et des ensembles pour la régression et la classification en utilisant scikit-learn.

Commencer le cours gratuitement

Inclus gratuitementPremium or Teams

PythonMachine learning5 heures15 vidéos57 exercices4,650 XP96,505Déclaration de réalisation

Créez votre compte gratuit

Google LinkedIn Facebook

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.

Formation de 2 personnes ou plus ?

Essayer DataCamp for Business

Apprécié par les apprenants de milliers d’entreprises

Description du cours

Les arbres de décision sont des modèles d'apprentissage supervisé utilisés pour les problèmes de classification et de régression. Les modèles arborescents présentent une grande flexibilité qui a un prix : d'une part, les arbres sont capables de capturer des relations non linéaires complexes ; d'autre part, ils sont enclins à mémoriser le bruit présent dans un ensemble de données. En regroupant les prédictions d'arbres formés différemment, les méthodes d'ensemble tirent parti de la flexibilité des arbres tout en réduisant leur tendance à mémoriser le bruit. Les méthodes d'ensemble sont utilisées dans de nombreux domaines et ont fait leurs preuves en remportant de nombreux concours d'apprentissage automatique. Dans ce cours, vous apprendrez à utiliser Python pour former des arbres de décision et des modèles basés sur des arbres avec la bibliothèque d'apprentissage machine conviviale scikit-learn. Vous comprendrez les avantages et les inconvénients des arbres et démontrerez comment l'assemblage peut atténuer ces inconvénients, tout en vous exerçant sur des ensembles de données réels. Enfin, vous comprendrez également comment ajuster les hyperparamètres les plus influents afin de tirer le meilleur parti de vos modèles.

Conditions préalables

Supervised Learning with scikit-learn

1

Arbres de classification et de régression

Commencer le chapitre

Arbre de décision pour la classification

Entraînez votre premier arbre de classification

Évaluer l'arbre de classification

Régression logistique ou arbre de classification

Arbre de classification Apprentissage

Croissance d'un arbre de classification

Utiliser l'entropie comme critère

Entropie et indice de Gini

Arbre de décision pour la régression

Formez votre premier arbre de régression

Évaluer l'arbre de régression

Régression linéaire ou arbre de régression

2

Le compromis biais-variance

Commencer le chapitre

Erreur de généralisation

Complexité, biais et variance

Surajustement et sous-ajustement

Diagnostiquer les problèmes de biais et de variance

Instancier le modèle

Évaluez l'erreur 10 fois supérieure CV

Évaluer l'erreur d'apprentissage

Biais élevé ou variance élevée ?

Apprentissage d'ensemble

Définir l'ensemble

Évaluer les classificateurs individuels

De meilleures performances avec un classificateur de vote

3

Forêts à sac et Forêts aléatoires

Commencer le chapitre

Définir le classificateur à sac

Évaluer les performances de l'ensachage

Évaluation hors sac

Préparer le terrain

OOB Score par rapport au score de l'ensemble des tests

Forêts aléatoires (RF)

Entraînement d'un régresseur RF

Évaluez le régresseur RF

Visualisation de l'importance des caractéristiques

4

Renforcer l'efficacité

Commencer le chapitre

Définir le classificateur AdaBoost

Entraînez le classificateur AdaBoost

Évaluer le classificateur AdaBoost

Renforcement du gradient (GB)

Définissez le régresseur GB

Entraînez le régresseur GB

Évaluez le régresseur GB

Boosting stochastique de gradient (SGB)

Régression avec SGB

Entraînez le régresseur SGB

Évaluez le régresseur SGB

5

Modèle Tuning

Commencer le chapitre

Ajustement des hyperparamètres d'un site CART

Hyperparamètres de l'arbre

Définir la grille d'hyperparamètres de l'arbre

Recherche de l'arbre optimal

Évaluer l'arbre optimal

Ajustement des hyperparamètres d'un site RF

Hyperparamètres des forêts aléatoires

Définissez la grille d'hyperparamètres de RF

Recherche de la forêt optimale

Évaluer la forêt optimale

Félicitations !

Apprentissage automatique avec des modèles arborescents en Python

Cours
terminé

Earn Déclaration de réalisation

Ajoutez ces informations d’identification à votre profil LinkedIn, à votre CV ou à votre CV
Partagez-le sur les réseaux sociaux et dans votre évaluation de performance

Inclus avecPremium or Teams

S'inscrire maintenant

Inscrivez-vous 15 millions d’apprenants et commencer Apprentissage automatique avec des modèles arborescents en Python Aujourd’hui!

Créez votre compte gratuit

Google LinkedIn Facebook

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.