Direkt zum Inhalt
StartseitePython

Unüberwachtes Lernen in Python

Lernen Sie, wie Sie mit scikit-learn und scipy unbeschriftete Datensätze clustern, transformieren und visualisieren.

Kurs Kostenlos Starten
4 Stunden13 Videos52 Übungen146.621 LernendeTrophyLeistungsnachweis

Kostenloses Konto erstellen

GoogleLinkedInFacebook

oder

Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.
Group

Trainierst du 2 oder mehr?

Versuchen DataCamp for Business

Beliebt bei Lernenden in Tausenden Unternehmen


Kursbeschreibung

Angenommen, du hast eine Sammlung von Kunden mit einer Vielzahl von Merkmalen wie Alter, Standort und finanziellem Werdegang, und du möchtest Muster entdecken und sie in Clustern sortieren. Oder du hast eine Reihe von Texten, wie z.B. Wikipedia-Seiten, und möchtest sie anhand ihres Inhalts in Kategorien einteilen. Dies ist die Welt des unüberwachten Lernens, das so genannt wird, weil du die Entdeckung von Mustern nicht durch eine Vorhersageaufgabe anleitest oder überwachst, sondern stattdessen versteckte Strukturen aus unmarkierten Daten aufdeckst. Unüberwachtes Lernen umfasst eine Vielzahl von Techniken des maschinellen Lernens, vom Clustering über die Dimensionsreduktion bis hin zur Matrixfaktorisierung. In diesem Kurs lernst du die Grundlagen des unüberwachten Lernens und implementierst die wichtigsten Algorithmen mit scikit-learn und SciPy. Du lernst, wie man Datensätze clustert, transformiert, visualisiert und Erkenntnisse aus unbeschrifteten Datensätzen gewinnt. Am Ende des Kurses baust du ein Empfehlungssystem auf, das beliebte Musikkünstler empfiehlt.
Für Unternehmen

Trainierst du 2 oder mehr?

Verschaffen Sie Ihrem Team Zugriff auf die vollständige DataCamp-Plattform, einschließlich aller Funktionen.
DataCamp Für UnternehmenFür eine maßgeschneiderte Lösung buchen Sie eine Demo.

In den folgenden Tracks

Zertifizierung verfügbar

Associate Data Scientist in Python

Gehe zu Track

Associate AI Engineer für Datenwissenschaftler

Gehe zu Track

Grundlagen des Machine Learning mit Python

Gehe zu Track
  1. 1

    Clustering für die Datensatz-Erkundung

    Kostenlos

    Lerne, wie du die zugrunde liegenden Gruppen (oder "Cluster") in einem Datensatz entdecken kannst. Am Ende dieses Kapitels wirst du in der Lage sein, Unternehmen anhand ihrer Börsenkurse in Clustern zusammenzufassen und die verschiedenen Arten anhand ihrer Messwerte zu unterscheiden.

    Kapitel Jetzt Abspielen
    Unüberwachtes Lernen
    50 xp
    Wie viele Cluster?
    50 xp
    2D-Punkte clustern
    100 xp
    Überprüfe dein Clustering
    100 xp
    Bewertung eines Clustering
    50 xp
    Wie viele Getreidebüschel?
    100 xp
    Bewertung der Getreideclusterung
    100 xp
    Transformieren von Merkmalen für eine bessere Clusterung
    50 xp
    Skalierung von Fischdaten für das Clustering
    100 xp
    Clustering der Fischdaten
    100 xp
    Clustering von Aktien mit KMeans
    100 xp
    Welche Aktien bewegen sich gemeinsam?
    100 xp
  2. 2

    Visualisierung mit Hierarchischem Clustering und t-SNE

    In diesem Kapitel lernst du zwei unüberwachte Lerntechniken für die Datenvisualisierung kennen: hierarchisches Clustering und t-SNE. Beim hierarchischen Clustering werden die Datenproben zu immer gröberen Clustern zusammengefasst und die daraus resultierende Clusterhierarchie in einem Baum visualisiert. t-SNE bildet die Datenproben im 2D-Raum ab, sodass die Nähe der Proben zueinander visualisiert werden kann.

    Kapitel Jetzt Abspielen
  3. 3

    Dekorrelieren deiner Daten und Dimensionsreduktion

    Die Dimensionsreduktion fasst einen Datensatz anhand seiner häufig vorkommenden Muster zusammen. In diesem Kapitel lernst du die grundlegendste Technik zur Dimensionsreduktion kennen, die "Hauptkomponentenanalyse" ("PCA"). PCA wird oft vor dem überwachten Lernen eingesetzt, um die Leistung und Verallgemeinerung der Modelle zu verbessern. Sie kann auch für unüberwachtes Lernen nützlich sein. Mit einer Variante von PCA kannst du zum Beispiel Wikipedia-Artikel nach ihrem Inhalt clustern!

    Kapitel Jetzt Abspielen
  4. 4

    Interpretierbare Merkmale entdecken

    In diesem Kapitel lernst du eine Technik zur Dimensionsreduzierung kennen, die "Nicht-negative Matrixfaktorisierung" ("NMF"), die Stichproben als Kombinationen von interpretierbaren Teilen ausdrückt. Es drückt zum Beispiel Dokumente als Kombinationen von Themen und Bilder als häufig vorkommende visuelle Muster aus. Du lernst auch, wie du mit NMF Empfehlungssysteme erstellen kannst, die dir ähnliche Artikel zum Lesen oder Musikkünstler, die zu deinem Hörverhalten passen, finden!

    Kapitel Jetzt Abspielen
Für Unternehmen

Trainierst du 2 oder mehr?

Verschaffen Sie Ihrem Team Zugriff auf die vollständige DataCamp-Plattform, einschließlich aller Funktionen.

In den folgenden Tracks

Zertifizierung verfügbar

Associate Data Scientist in Python

Gehe zu Track

Associate AI Engineer für Datenwissenschaftler

Gehe zu Track

Grundlagen des Machine Learning mit Python

Gehe zu Track

In anderen Tracks

Machine Learning Scientist mit Python

Datensätze

Company stock price movementsEurovision 2016Fish measurementsGrainsLCD digitsMusical artistsWikipedia articlesWine

Mitwirkende

Collaborator's avatar
Yashas Roy
Collaborator's avatar
Hugo Bowne-Anderson
Benjamin Wilson HeadshotBenjamin Wilson

Director of Research at lateral.io

Mehr Anzeigen

Was sagen andere Lernende?

Melden Sie sich an 15 Millionen Lernende und starten Sie Unüberwachtes Lernen in Python Heute!

Kostenloses Konto erstellen

GoogleLinkedInFacebook

oder

Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.