Direkt zum Inhalt
StartseiteArtificial Intelligence

Deep Reinforcement Learning in Python

"Lernen und nutzen Sie leistungsstarke Deep Reinforcement Learning-Algorithmen, inkl. Optimierungstechniken."

Kurs Kostenlos Starten
4 Stunden15 Videos49 Übungen

Kostenloses Konto erstellen

GoogleLinkedInFacebook

oder

Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.
Group

Trainierst du 2 oder mehr?

Versuchen DataCamp for Business

Beliebt bei Lernenden in Tausenden Unternehmen


Kursbeschreibung

Entdecke die modernsten Techniken, die es Maschinen ermöglichen, zu lernen und mit ihrer Umgebung zu interagieren. Du wirst in die Welt des Deep Reinforcement Learning (DRL) eintauchen und praktische Erfahrungen mit den leistungsstärksten Algorithmen sammeln, die dieses Feld vorantreiben. Du wirst PyTorch und die Gymnasium-Umgebung nutzen, um deine eigenen Agenten zu bauen.

Beherrsche die Grundlagen des Deep Reinforcement Learning

Unsere Reise beginnt mit den Grundlagen von DRL und ihrer Beziehung zum traditionellen Reinforcement Learning. Von dort aus gehen wir schnell zur Implementierung von Deep Q-Networks (DQN) in PyTorch über, einschließlich fortgeschrittener Verfeinerungen wie Double DQN und Prioritized Experience Replay, um deine Modelle zu verbessern. Bringe deine Fähigkeiten auf die nächste Stufe, indem du politikbasierte Methoden erforschst. Du erlernst und implementierst wichtige politikorientierte Techniken wie die REINFORCE- und Actor-Critic-Methode.

Modernste Algorithmen verwenden

Du wirst leistungsstarke DRL-Algorithmen kennenlernen, die heute in der Branche üblich sind, darunter die Proximal Policy Optimization (PPO). Du wirst praktische Erfahrungen mit den Techniken sammeln, die den Durchbruch in der Robotik, der Spiele-KI und darüber hinaus vorantreiben. Schließlich lernst du, wie du deine Modelle mithilfe von Optuna für die Abstimmung der Hyperparameter optimierst. Am Ende dieses Kurses wirst du in der Lage sein, diese hochmodernen Techniken auf reale Probleme anzuwenden und das volle Potenzial von DRL auszuschöpfen!
Für Unternehmen

Trainierst du 2 oder mehr?

Verschaffen Sie Ihrem Team Zugriff auf die vollständige DataCamp-Plattform, einschließlich aller Funktionen.
DataCamp Für UnternehmenFür eine maßgeschneiderte Lösung buchen Sie eine Demo.
  1. 1

    Einführung in Deep Reinforcement Learning

    Kostenlos

    Entdecke, wie Deep Reinforcement Learning das traditionelle Reinforcement Learning verbessert, während du deinen ersten Deep Q Learning-Algorithmus studierst und implementierst.

    Kapitel Jetzt Abspielen
    Einführung in Deep Reinforcement Learning
    50 xp
    Umgebung und Aufbau des neuronalen Netzes
    100 xp
    DRL Trainingsschleife
    100 xp
    Einführung in Deep Q Learning
    50 xp
    Deep Learning und DQN
    50 xp
    Die Architektur des Q-Netzes
    100 xp
    Instanziierung des Q-Netzes
    100 xp
    Der Barebone-Algorithmus DQN
    50 xp
    Barebone DQN Aktionsauswahl
    100 xp
    Barebone DQN Verlustfunktion
    100 xp
    Ausbildung des Barebone DQN
    100 xp
  2. 2

    Deep Q-learning

    Tauche ein in das Deep Q-learning, indem du den ursprünglichen DQN Algorithmus mit Experience Replay, Epsilon-Greediness und festen Q-Zielen implementierst. Über DQN hinaus wirst du zwei faszinierende Erweiterungen kennenlernen, die die Leistung und Stabilität von Deep Q-learning verbessern: Doppelte DQN und priorisierte Erfahrungswiederholung.

    Kapitel Jetzt Abspielen
  3. 3

    Einführung in politische Gradientenmethoden

    Lerne die grundlegenden Konzepte der politischen Gradientenmethoden auf DRL kennen. Du beginnst mit dem politischen Gradiententheorem, das die Grundlage für diese Methoden bildet. Dann implementierst du den REINFORCE Algorithmus, einen leistungsstarken Ansatz zum Lernen von Richtlinien. Das Kapitel führt dich dann durch die Actor-Critic-Methoden und konzentriert sich dabei auf den Advantage Actor-Critic (A2C)-Algorithmus, der die Stärken der Policy-Gradienten- und der wertbasierten Methoden kombiniert, um die Lerneffizienz und die Stabilität zu verbessern.

    Kapitel Jetzt Abspielen
  4. 4

    Proximal Policy Optimization und DRL Tipps

    Erforsche Proximal Policy Optimization (PPO) für eine robuste DRL Leistung. Als Nächstes wirst du die Verwendung eines Entropie-Bonus in PPO untersuchen, der die Erkundung fördert, indem er eine vorzeitige Konvergenz zu deterministischen Strategien verhindert. Du lernst auch etwas über Batch-Updates bei Policy-Gradienten-Methoden. Schließlich lernst du die Optimierung von Hyperparametern mit Optuna kennen, einem leistungsstarken Tool zur Optimierung der Leistung deiner DRL Modelle.

    Kapitel Jetzt Abspielen
Für Unternehmen

Trainierst du 2 oder mehr?

Verschaffen Sie Ihrem Team Zugriff auf die vollständige DataCamp-Plattform, einschließlich aller Funktionen.

Mitwirkende

Collaborator's avatar
James Chapman
Collaborator's avatar
Jasmin Ludolf
Collaborator's avatar
Francesca Donadoni

Audio aufgenommen von

Timothée Carayol's avatar
Timothée Carayol

Voraussetzungen

Intermediate Deep Learning with PyTorchReinforcement Learning with Gymnasium in Python
Timothée Carayol HeadshotTimothée Carayol

Principal Machine Learning Engineer

Mehr Anzeigen

Was sagen andere Lernende?

Melden Sie sich an 15 Millionen Lernende und starten Sie Deep Reinforcement Learning in Python Heute!

Kostenloses Konto erstellen

GoogleLinkedInFacebook

oder

Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.