Aprendizaje por Refuerzo en Python

Domina los fundamentos del aprendizaje por refuerzo (RL) para crear modelos que puedan navegar por entornos complejos del mundo real y entrenar LLMs.

Crea Tu Cuenta Gratuita

Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.

Descripción de la pista

Aprendizaje por Refuerzo en Python

Domina los fundamentos del aprendizaje por refuerzo (RL) y descubre cómo construir modelos para navegar por entornos complejos que suelen encontrarse en robótica y videojuegos. Si eres nuevo en el aprendizaje por refuerzo o quieres especializarte en el aprendizaje por refuerzo como rama del aprendizaje automático, éste es un lugar ideal para empezar. Empezarás aprendiendo los conceptos básicos del aprendizaje por refuerzo, como los procesos de decisión de Markov, los equilibrios exploración/explotación y los algoritmos de programación dinámica. Aprenderás a aplicar Q-learning, SARSA y otros métodos para navegar por cordilleras y lagos helados desde la biblioteca del Gimnasio. Fusionarás el aprendizaje profundo y el aprendizaje por refuerzo y descubrirás el aprendizaje por refuerzo profundo, que puede utilizarse para entrenar agentes que naveguen por entornos muy complejos con poca supervisión. Por el camino, aplicarás estas técnicas para abordar proyectos del mundo real, como la optimización de rutas de taxi y la simulación de operaciones bursátiles. Con estas herramientas de aprendizaje por refuerzo a mano, estás preparado para empezar a abordar una nueva y emocionante aplicación del aprendizaje por refuerzo: el aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF). El RLHF se puede utilizar para mejorar los resultados del LLM entrenando la respuesta humana a sus respuestas. ¡Comienza hoy mismo tu viaje por el aprendizaje reforzado!

Prerrequisitos

No hay requisitos previos para esta pista

Course
1
Reinforcement Learning with Gymnasium in Python
Start your reinforcement learning journey! Learn how agents can learn to solve environments through interactions.
Project
Sobresueldo
Taxi Route Optimization with Reinforcement Learning
Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.
Course
3
Aprendizaje profundo por refuerzo en Python
Aprende y utiliza potentes algoritmos de Aprendizaje por Refuerzo Profundo, incluyendo técnicas de optimización.
Project
Sobresueldo
Stock Trading Simulation with Gymnasium
Train a simple reinforcement learning agent in stock trading simulation.
Course
5
Reinforcement Learning from Human Feedback (RLHF)
Learn how to make GenAI models truly reflect human values while gaining hands-on experience with advanced LLMs.

Aprendizaje por Refuerzo en Python

3 cursos

Pista
completa

Obtener Declaración de Logro

Añade esta credencial a tu perfil, currículum vitae o CV de LinkedIn
Compártelo en las redes sociales y en tu evaluación de desempeño

Incluido conPremium or Teams

Inscríbete ahora

Únete a más 15 millones de estudiantes y empezar Aprendizaje por Refuerzo en Python ¡Hoy!

Crea Tu Cuenta Gratuita

Google LinkedIn Facebook

Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.

Descripción de la pista

Aprendizaje por Refuerzo en Python

Obtener Declaración de Logro

Únete a más .css-nklxlk{color:var(--wf-brand--main, #03EF62);}15 millones de estudiantes y empezar Aprendizaje por Refuerzo en Python ¡Hoy!

Crea Tu Cuenta Gratuita

Únete a más 15 millones de estudiantes y empezar Aprendizaje por Refuerzo en Python ¡Hoy!