Saltar al contenido principal
InicioPython

programa

Aprendizaje por Refuerzo en Python

Domina los fundamentos del aprendizaje por refuerzo (RL) para crear modelos que puedan navegar por entornos complejos del mundo real y entrenar LLMs.
Iniciar pista de forma gratuita

Incluido conPremium or Teams

PythonMachine Learning12 horas

Crea Tu Cuenta Gratuita

GoogleLinkedInFacebook

o

Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.
Group

¿Entrenar a 2 o más personas?

Probar DataCamp for Business

Preferido por estudiantes en miles de empresas

Descripción de la pista

Aprendizaje por Refuerzo en Python

Domina los fundamentos del aprendizaje por refuerzo (RL) y descubre cómo construir modelos para navegar por entornos complejos que suelen encontrarse en robótica y videojuegos. Si eres nuevo en el aprendizaje por refuerzo o quieres especializarte en el aprendizaje por refuerzo como rama del aprendizaje automático, éste es un lugar ideal para empezar. Empezarás aprendiendo los conceptos básicos del aprendizaje por refuerzo, como los procesos de decisión de Markov, los equilibrios exploración/explotación y los algoritmos de programación dinámica. Aprenderás a aplicar Q-learning, SARSA y otros métodos para navegar por cordilleras y lagos helados desde la biblioteca del Gimnasio. Fusionarás el aprendizaje profundo y el aprendizaje por refuerzo y descubrirás el aprendizaje por refuerzo profundo, que puede utilizarse para entrenar agentes que naveguen por entornos muy complejos con poca supervisión. Por el camino, aplicarás estas técnicas para abordar proyectos del mundo real, como la optimización de rutas de taxi y la simulación de operaciones bursátiles. Con estas herramientas de aprendizaje por refuerzo a mano, estás preparado para empezar a abordar una nueva y emocionante aplicación del aprendizaje por refuerzo: el aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF). El RLHF se puede utilizar para mejorar los resultados del LLM entrenando la respuesta humana a sus respuestas. ¡Comienza hoy mismo tu viaje por el aprendizaje reforzado!

Prerrequisitos

No hay requisitos previos para esta pista
  • Course

    1

    Reinforcement Learning with Gymnasium in Python

    Start your reinforcement learning journey! Learn how agents can learn to solve environments through interactions.

  • Project

    Sobresueldo

    Taxi Route Optimization with Reinforcement Learning

    Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.

Aprendizaje por Refuerzo en Python
3 cursos
Pista
completa

Obtener Declaración de Logro

Añade esta credencial a tu perfil, currículum vitae o CV de LinkedIn
Compártelo en las redes sociales y en tu evaluación de desempeño

Incluido conPremium or Teams

Inscríbete ahora

Únete a más 15 millones de estudiantes y empezar Aprendizaje por Refuerzo en Python ¡Hoy!

Crea Tu Cuenta Gratuita

GoogleLinkedInFacebook

o

Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.