Unüberwachtes Lernen in Python
Lernen Sie, wie Sie mit scikit-learn und scipy unbeschriftete Datensätze clustern, transformieren und visualisieren.
Kurs Kostenlos Starten4 Stunden13 Videos52 Übungen146.621 LernendeLeistungsnachweis
Kostenloses Konto erstellen
oder
Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.Trainierst du 2 oder mehr?
Versuchen DataCamp for BusinessBeliebt bei Lernenden in Tausenden Unternehmen
Kursbeschreibung
Angenommen, du hast eine Sammlung von Kunden mit einer Vielzahl von Merkmalen wie Alter, Standort und finanziellem Werdegang, und du möchtest Muster entdecken und sie in Clustern sortieren. Oder du hast eine Reihe von Texten, wie z.B. Wikipedia-Seiten, und möchtest sie anhand ihres Inhalts in Kategorien einteilen. Dies ist die Welt des unüberwachten Lernens, das so genannt wird, weil du die Entdeckung von Mustern nicht durch eine Vorhersageaufgabe anleitest oder überwachst, sondern stattdessen versteckte Strukturen aus unmarkierten Daten aufdeckst. Unüberwachtes Lernen umfasst eine Vielzahl von Techniken des maschinellen Lernens, vom Clustering über die Dimensionsreduktion bis hin zur Matrixfaktorisierung. In diesem Kurs lernst du die Grundlagen des unüberwachten Lernens und implementierst die wichtigsten Algorithmen mit scikit-learn und SciPy. Du lernst, wie man Datensätze clustert, transformiert, visualisiert und Erkenntnisse aus unbeschrifteten Datensätzen gewinnt. Am Ende des Kurses baust du ein Empfehlungssystem auf, das beliebte Musikkünstler empfiehlt.
Trainierst du 2 oder mehr?
Verschaffen Sie Ihrem Team Zugriff auf die vollständige DataCamp-Plattform, einschließlich aller Funktionen.In den folgenden Tracks
Associate AI Engineer für Datenwissenschaftler
Gehe zu TrackGrundlagen des Machine Learning mit Python
Gehe zu Track- 1
Clustering für die Datensatz-Erkundung
KostenlosLerne, wie du die zugrunde liegenden Gruppen (oder "Cluster") in einem Datensatz entdecken kannst. Am Ende dieses Kapitels wirst du in der Lage sein, Unternehmen anhand ihrer Börsenkurse in Clustern zusammenzufassen und die verschiedenen Arten anhand ihrer Messwerte zu unterscheiden.
Unüberwachtes Lernen50 xpWie viele Cluster?50 xp2D-Punkte clustern100 xpÜberprüfe dein Clustering100 xpBewertung eines Clustering50 xpWie viele Getreidebüschel?100 xpBewertung der Getreideclusterung100 xpTransformieren von Merkmalen für eine bessere Clusterung50 xpSkalierung von Fischdaten für das Clustering100 xpClustering der Fischdaten100 xpClustering von Aktien mit KMeans100 xpWelche Aktien bewegen sich gemeinsam?100 xp - 2
Visualisierung mit Hierarchischem Clustering und t-SNE
In diesem Kapitel lernst du zwei unüberwachte Lerntechniken für die Datenvisualisierung kennen: hierarchisches Clustering und t-SNE. Beim hierarchischen Clustering werden die Datenproben zu immer gröberen Clustern zusammengefasst und die daraus resultierende Clusterhierarchie in einem Baum visualisiert. t-SNE bildet die Datenproben im 2D-Raum ab, sodass die Nähe der Proben zueinander visualisiert werden kann.
Hierarchien visualisieren50 xpWie viele Fusionen?50 xpHierarchisches Clustering der Getreidedaten100 xpHierarchien der Bestände100 xpCluster-Labels im hierarchischen Clustering50 xpWelche Cluster sind am nächsten?50 xpUnterschiedliche Verknüpfungen, unterschiedliche hierarchische Clustering!100 xpZwischen-Clustern50 xpExtrahieren der Cluster-Labels100 xpt-SNE für 2-dimensionale Karten50 xpt-SNE Visualisierung des Getreidedatensatzes100 xpEine t-SNE Karte des Aktienmarktes100 xp - 3
Dekorrelieren deiner Daten und Dimensionsreduktion
Die Dimensionsreduktion fasst einen Datensatz anhand seiner häufig vorkommenden Muster zusammen. In diesem Kapitel lernst du die grundlegendste Technik zur Dimensionsreduktion kennen, die "Hauptkomponentenanalyse" ("PCA"). PCA wird oft vor dem überwachten Lernen eingesetzt, um die Leistung und Verallgemeinerung der Modelle zu verbessern. Sie kann auch für unüberwachtes Lernen nützlich sein. Mit einer Variante von PCA kannst du zum Beispiel Wikipedia-Artikel nach ihrem Inhalt clustern!
Visualisierung der PCA Transformation50 xpKorrelierte Daten in der Natur100 xpDekorrelieren der Körnermessungen mit PCA100 xpHauptkomponenten50 xpIntrinsische Dimension50 xpDie erste Hauptkomponente100 xpVarianz der PCA Merkmale100 xpIntrinsische Dimension der Fischdaten50 xpDimensionsreduzierung mit PCA50 xpDimensionsreduzierung der Fischmessungen100 xpEin tf-idf-Wortfrequenz-Array100 xpClustering Wikipedia Teil I100 xpClustering Wikipedia Teil II100 xp - 4
Interpretierbare Merkmale entdecken
In diesem Kapitel lernst du eine Technik zur Dimensionsreduzierung kennen, die "Nicht-negative Matrixfaktorisierung" ("NMF"), die Stichproben als Kombinationen von interpretierbaren Teilen ausdrückt. Es drückt zum Beispiel Dokumente als Kombinationen von Themen und Bilder als häufig vorkommende visuelle Muster aus. Du lernst auch, wie du mit NMF Empfehlungssysteme erstellen kannst, die dir ähnliche Artikel zum Lesen oder Musikkünstler, die zu deinem Hörverhalten passen, finden!
Nicht-negative Matrixfaktorisierung (NMF)50 xpNicht-negative Daten50 xpNMF angewendet auf Wikipedia-Artikel100 xpNMF Merkmale der Wikipedia-Artikel100 xpNMF rekonstruiert Proben50 xpNMF lernt interpretierbare Teile50 xpNMF lernt die Themen der Dokumente100 xpErforsche den Datensatz LED digits100 xpNMF lernt die Teile von Bildern100 xpPCA lernt keine Teile100 xpAufbau von Empfehlungssystemen mit NMF50 xpWelche Artikel sind ähnlich wie "Cristiano Ronaldo"?100 xpMusikkünstler empfehlen Teil I100 xpMusikkünstler empfehlen Teil II100 xpAbschließende Gedanken50 xp
Trainierst du 2 oder mehr?
Verschaffen Sie Ihrem Team Zugriff auf die vollständige DataCamp-Plattform, einschließlich aller Funktionen.In den folgenden Tracks
Associate AI Engineer für Datenwissenschaftler
Gehe zu TrackGrundlagen des Machine Learning mit Python
Gehe zu TrackIn anderen Tracks
Machine Learning Scientist mit PythonDatensätze
Company stock price movementsEurovision 2016Fish measurementsGrainsLCD digitsMusical artistsWikipedia articlesWineMitwirkende
Voraussetzungen
Supervised Learning with scikit-learnBenjamin Wilson
Mehr AnzeigenDirector of Research at lateral.io
Was sagen andere Lernende?
Melden Sie sich an 15 Millionen Lernende und starten Sie Unüberwachtes Lernen in Python Heute!
Kostenloses Konto erstellen
oder
Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.