Überwachtes Lernen mit scikit-learn
"Verbessern Sie Ihre Machine-Learning-Fähigkeiten mit scikit-learn in Python. Nutzen Sie reale Datensätze!"
Kurs Kostenlos Starten4 Stunden15 Videos49 Übungen154.814 LernendeLeistungsnachweis
Kostenloses Konto erstellen
oder
Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.Trainierst du 2 oder mehr?
Versuchen DataCamp for BusinessBeliebt bei Lernenden in Tausenden Unternehmen
Kursbeschreibung
Erweitere deine Kenntnisse über maschinelles Lernen mit scikit-learn und entdecke, wie du mit dieser beliebten Python-Bibliothek Modelle mit beschrifteten Daten trainieren kannst. In diesem Kurs lernst du, wie du aussagekräftige Vorhersagen treffen kannst, z. B. ob ein Kunde dein Unternehmen verlassen wird, ob eine Person Diabetes hat und sogar welchem Genre ein Song zugehört. Anhand von realen Datensätzen erfährst du, wie du Vorhersagemodelle erstellst, ihre Parameter abstimmst und feststellst, wie gut sie bei ungesehenen Daten funktionieren werden.
Trainierst du 2 oder mehr?
Verschaffen Sie Ihrem Team Zugriff auf die vollständige DataCamp-Plattform, einschließlich aller Funktionen.In den folgenden Tracks
Associate AI Engineer für Datenwissenschaftler
Gehe zu TrackGrundlagen des Machine Learning mit Python
Gehe zu Track- 1
Klassifikation
KostenlosIn diesem Kapitel lernst du Klassifikationsprobleme kennen und erfährst, wie du sie mit überwachten Lerntechniken lösen kannst. Du lernst, wie du Daten in Trainings- und Testgruppen aufteilst, ein Modell anpasst, Vorhersagen machst und die Genauigkeit auswertest. Du entdeckst den Zusammenhang zwischen Modellkomplexität und Leistung und wendest das Gelernte auf einen Abwanderungsdatensatz an, in dem du den Abwanderungsstatus der Kunden eines Telekommunikationsunternehmens klassifizierst.
Maschinelles Lernen mit scikit-learn50 xpBinäre Klassifikation50 xpDer Arbeitsablauf beim überwachten Lernen100 xpDie Herausforderung der Klassifikation50 xpNächste-Nachbarn-Klassifikation: Anpassung100 xpNächste-Nachbarn-Klassifikation: Vorhersage100 xpMessung der Modellleistung50 xpTraining/Test-Zerlegung und Berechnung der Korrektklassifikationsrate100 xpÜberanpassung und Unteranpassung100 xpModellkomplexität visualisieren100 xp - 2
Regression
In diesem Kapitel wirst du in die Regression eingeführt und erstellst Modelle zur Vorhersage von Umsatzwerten anhand eines Datensatzes über Werbeausgaben. Du lernst die Mechanismen der linearen Regression und gängige Leistungskennzahlen wie das Bestimmtheitsmaß und die Quadratwurzel des mittleren quadratischen Fehlers kennen. Du führst eine k-fache Kreuzvalidierung durch und wendest die Regularisierung auf Regressionsmodelle an, um das Risiko einer Überanpassung zu verringern.
Einführung in die Regression50 xpMerkmale erstellen100 xpAufbau eines linearen Regressionsmodells100 xpVisualisierung eines linearen Regressionsmodells100 xpDie Grundlagen der linearen Regression50 xpAnpassung und Vorhersage für Regression100 xpLeistungsbewertung der Regression100 xpKreuzvalidierung50 xpKreuzvalidierung für Bestimmtheitsmaß100 xpAnalyse der Metriken der Kreuzvalidierung100 xpRegularisierte Regression50 xpRegularisierte Regression: Ridge100 xpLasso-Regression für die Bedeutung von Merkmalen100 xp - 3
Feinabstimmung deines Modells
Nachdem du Modelle trainiert hast, lernst du jetzt, wie du sie auswerten kannst. In diesem Kapitel lernst du verschiedene Metriken und eine Visualisierungstechnik kennen, um die Leistung von Klassifikationsmodellen mit scikit-learn zu analysieren. Außerdem lernst du, wie du Klassifikations- und Regressionsmodelle mithilfe von Hyperparameter-Tuning optimierst.
Wie gut ist dein Modell?50 xpEntscheidung für eine primäre Metrik50 xpBewertung eines Klassifikators zur Diabetesvorhersage100 xpLogistische Regression und die ROC-Kurve50 xpAufbau eines logistischen Regressionsmodells100 xpDie ROC-Kurve100 xpROC AUC100 xpHyperparameter-Tuning50 xpHyperparameter-Tuning mit GridSearchCV100 xpHyperparameter-Tuning mit RandomizedSearchCV100 xp - 4
Vorverarbeitung und Pipelines
Lerne, wie du fehlende Werte ausgleichst, kategoriale Daten in numerische Werte umwandelst, Daten skalierst, mehrere überwachte Lernmodelle gleichzeitig auswertest und Pipelines erstellst, um deinen Workflow zu optimieren!
Daten vorverarbeiten50 xpDummy-Variablen erstellen100 xpRegression mit kategorialen Merkmalen100 xpUmgang mit fehlenden Daten50 xpVerwerfen von fehlenden Daten100 xpPipeline zur Vorhersage von Songgenres: Teil 1100 xpPipeline zur Vorhersage von Songgenres: Teil 2100 xpZentrieren und Skalieren50 xpZentrieren und Skalieren für die Regression100 xpZentrieren und Skalieren für die Klassifikation100 xpMehrere Modelle evaluieren50 xpVisualisierung der Leistung von Regressionsmodellen100 xpVorhersage für die Testmenge100 xpVisualisierung der Leistung von Klassifikationsmodellen100 xpPipeline zur Vorhersage der Songpopularität100 xpGlückwunsch!50 xp
Trainierst du 2 oder mehr?
Verschaffen Sie Ihrem Team Zugriff auf die vollständige DataCamp-Plattform, einschließlich aller Funktionen.In den folgenden Tracks
Associate AI Engineer für Datenwissenschaftler
Gehe zu TrackGrundlagen des Machine Learning mit Python
Gehe zu TrackMitwirkende
Voraussetzungen
Introduction to Statistics in PythonGeorge Boorman
Mehr AnzeigenCurriculum Manager, DataCamp
Was sagen andere Lernende?
Melden Sie sich an 15 Millionen Lernende und starten Sie Überwachtes Lernen mit scikit-learn Heute!
Kostenloses Konto erstellen
oder
Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.