Accéder au contenu principal
AccueilPython

cursus

Apprentissage par renforcement en Python

Maîtrisez les principes fondamentaux de l'apprentissage par renforcement (RL) pour créer des modèles capables de naviguer dans des environnements réels complexes et de former des LLM.
Démarrez le parcours gratuitement

Inclus avecPremium or Teams

Pythontopics.apprentissageAutomatique12 heures

Créez votre compte gratuit

GoogleLinkedInFacebook

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.
Group

Formation de 2 personnes ou plus ?

Essayer DataCamp for Business

Apprécié par les apprenants de milliers d’entreprises

Description du cursus

Apprentissage par renforcement en Python

Maîtrisez les principes fondamentaux de l'apprentissage par renforcement (RL) et découvrez comment construire des modèles pour naviguer dans des environnements complexes que l'on retrouve souvent en robotique et dans les jeux vidéo. Si vous êtes novice en matière d'apprentissage par renforcement ou si vous souhaitez vous spécialiser dans l'apprentissage par renforcement en tant que branche de l'apprentissage automatique, il s'agit d'un point de départ idéal. Vous commencerez par découvrir les concepts fondamentaux de l'apprentissage par renforcement, tels que les processus décisionnels de Markov, les compromis exploration/exploitation et les algorithmes de programmation dynamique. Vous apprendrez à appliquer les méthodes Q-learning, SARSA et autres pour naviguer dans les chaînes de montagnes et les lacs gelés de la bibliothèque du Gymnase. Vous fusionnerez l'apprentissage profond et l'apprentissage par renforcement et découvrirez l'apprentissage par renforcement profond, qui peut être utilisé pour former des agents à naviguer dans des environnements très complexes avec peu de supervision. En cours de route, vous appliquerez ces techniques à des projets réels, notamment l'optimisation des itinéraires de taxi et la simulation d'opérations boursières. Avec ces outils d'apprentissage par renforcement en main, vous êtes prêt à vous attaquer à une nouvelle application passionnante de l'apprentissage par renforcement : l'apprentissage par renforcement à partir du retour d'expérience humain (RLHF). La RLHF peut être utilisée pour améliorer les résultats du LLM en s'entraînant sur les réactions humaines à ses réponses. Commencez dès aujourd'hui votre parcours d'apprentissage par renforcement !

Conditions préalables

Il n’y a pas de prérequis pour ce parcours
  • Course

    1

    Reinforcement Learning with Gymnasium in Python

    Start your reinforcement learning journey! Learn how agents can learn to solve environments through interactions.

  • Project

    Bonus

    Taxi Route Optimization with Reinforcement Learning

    Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.

Apprentissage par renforcement en Python
3 cours
Piste
terminée

Earn Déclaration de réalisation

Ajoutez ces informations d’identification à votre profil LinkedIn, à votre CV ou à votre CV
Partagez-le sur les réseaux sociaux et dans votre évaluation de performance

Inclus avecPremium or Teams

S'inscrire maintenant

Inscrivez-vous 15 millions d’apprenants et commencer Apprentissage par renforcement en Python Aujourd’hui!

Créez votre compte gratuit

GoogleLinkedInFacebook

ou

En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données sont stockées aux États-Unis.