Einführung in die natürliche Sprachverarbeitung in Python
Lerne grundlegende Techniken der Verarbeitung natürlicher Sprache mit Python und wende sie auf Textdaten an.
Kurs Kostenlos Starten4 Stunden15 Videos51 Übungen125.146 LernendeLeistungsnachweis
Kostenloses Konto erstellen
oder
Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.Trainierst du 2 oder mehr?
Versuchen DataCamp for BusinessBeliebt bei Lernenden in Tausenden Unternehmen
Kursbeschreibung
In diesem Kurs lernst du die Grundlagen der natürlichen Sprachverarbeitung (NLP) kennen, z. B. wie man Wörter identifiziert und trennt, wie man Themen in einem Text extrahiert und wie man einen eigenen Fake-News-Klassifikator erstellt. Außerdem lernst du, wie du grundlegende Bibliotheken wie NLTK nutzen kannst, sowie Bibliotheken, die Deep Learning einsetzen, um gängige NLP Probleme zu lösen. Dieser Kurs vermittelt dir die Grundlagen für die Verarbeitung und das Parsen von Text, wenn du mit deinem Python-Lernen weiterkommst.
Trainierst du 2 oder mehr?
Verschaffen Sie Ihrem Team Zugriff auf die vollständige DataCamp-Plattform, einschließlich aller Funktionen.In den folgenden Tracks
Machine Learning Scientist mit Python
Gehe zu TrackNatürliche Sprachverarbeitung in Python
Gehe zu Track- 1
Reguläre Ausdrücke & Wort-Tokenisierung
KostenlosIn diesem Kapitel werden einige grundlegende Konzepte von NLP vorgestellt, z. B. die Tokenisierung von Wörtern und reguläre Ausdrücke, die beim Parsen von Text helfen. Außerdem lernst du, wie du mit nicht-englischen Texten und schwierigeren Tokenisierungen umgehst, die du vielleicht findest.
Einführung in reguläre Ausdrücke50 xpWelches Muster?50 xpReguläre Ausdrücke üben: re.split() und re.findall()100 xpEinführung in die Tokenisierung50 xpWort-Tokenisierung mit NLTK100 xpMehr Regex mit re.search()100 xpErweiterte Tokenisierung mit NLTK und Regex50 xpAuswahl eines Tokenizers50 xpRegex mit NLTK Tokenisierung100 xpNicht-Ascii-Tokenisierung100 xpKartierung der Wortlänge mit NLTK50 xpCharting Praxis100 xp - 2
Einfache Themenfindung
Dieses Kapitel führt dich in die Themenfindung ein, die du auf jeden Text anwenden kannst, der dir in der Natur begegnet. Mithilfe grundlegender NLP Modelle identifizierst du Themen aus Texten anhand von Begriffshäufigkeiten. Du wirst zwei einfache Methoden ausprobieren und vergleichen: Bag-of-Words und Tf-idf mit NLTK und einer neuen Bibliothek Gensim.
Wörter zählen mit Bag-of-Words50 xpBag-of-Words-Auswahl50 xpEinen Zähler mit Bag-of-Words bauen100 xpEinfache Textvorverarbeitung50 xpSchritte der Textvorverarbeitung50 xpPraxis der Textvorverarbeitung100 xpEinführung in gensim50 xpWas sind Wortvektoren?50 xpErstellen und Abfragen eines Korpus mit gensim100 xpGensim bag-of-words100 xpTf-idf mit gensim50 xpWas ist tf-idf?50 xpTf-idf mit Wikipedia100 xp - 3
Erkennung benannter Personen
In diesem Kapitel geht es um ein etwas fortgeschritteneres Thema: die Erkennung von Namen (named-entity). Du lernst, wie du das "Wer", "Was" und "Wo" deiner Texte mit Hilfe von vortrainierten Modellen für englische und nicht-englische Texte identifizieren kannst. Außerdem lernst du, wie du die neuen Bibliotheken polyglot und spaCy nutzen kannst, um deinen NLP Werkzeugkasten zu erweitern.
Erkennung von benannten Entitäten50 xpNER mit NLTK100 xpCharting Praxis100 xpStanford Bibliothek mit NLTK50 xpEinführung in SpaCy50 xpVergleich von NLTK mit spaCy NER100 xpspaCy NER Kategorien50 xpMehrsprachig NER mit polyglott50 xpFranzösisch NER mit Polyglott I100 xpFranzösisch NER mit Polyglott II100 xpSpanisch NER mit Polyglott100 xp - 4
Erstellung eines "Fake News"-Klassifikators
Du wendest die Grundlagen des Gelernten zusammen mit überwachtem maschinellem Lernen an, um einen "Fake News"-Detektor zu entwickeln. Du lernst zunächst die Grundlagen des überwachten maschinellen Lernens und wählst dann einige wichtige Merkmale aus und testest Ideen zur Identifizierung und Klassifizierung von Fake-News-Artikeln.
Klassifizierung von Fake News durch überwachtes Lernen mit NLP50 xpWelche Merkmale sind möglich?50 xpAusbildung und Prüfung50 xpErstellen von Wortzählungsvektoren mit Scikit-Learn50 xpCountVectorizer für die Textklassifizierung100 xpTfidfVectorizer für die Textklassifizierung100 xpPrüfung der Vektoren100 xpTrainieren und Testen eines Klassifizierungsmodells mit Scikit-Learn50 xpModelle zur Textklassifizierung50 xpTraining und Test des "Fake News"-Modells mit CountVectorizer100 xpTraining und Test des "Fake News"-Modells mit TfidfVectorizer100 xpEinfache NLP, komplexe Probleme50 xpDas Modell verbessern50 xpVerbessere dein Modell100 xpInspektion deines Modells100 xp
Trainierst du 2 oder mehr?
Verschaffen Sie Ihrem Team Zugriff auf die vollständige DataCamp-Plattform, einschließlich aller Funktionen.In den folgenden Tracks
Machine Learning Scientist mit Python
Gehe zu TrackNatürliche Sprachverarbeitung in Python
Gehe zu TrackMitwirkende
Voraussetzungen
Python ToolboxKatharine Jarmul
Mehr AnzeigenFounder, kjamistan
Was sagen andere Lernende?
Melden Sie sich an 15 Millionen Lernende und starten Sie Einführung in die natürliche Sprachverarbeitung in Python Heute!
Kostenloses Konto erstellen
oder
Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.