Direkt zum Inhalt
StartseiteR

Daten in R bereinigen

Lernen Sie, Daten schnell und genau zu bereinigen, um Ihr Unternehmen von Rohdaten zu tollen Erkenntnissen zu führen.

Kurs Kostenlos Starten
4 Stunden13 Videos44 Übungen52.112 LernendeTrophyLeistungsnachweis

Kostenloses Konto erstellen

GoogleLinkedInFacebook

oder

Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.
Group

Trainierst du 2 oder mehr?

Versuchen DataCamp for Business

Beliebt bei Lernenden in Tausenden Unternehmen


Kursbeschreibung

Überwinde häufige Datenprobleme wie das Entfernen von Duplikaten in R

Man sagt, dass Datenwissenschaftler/innen 80 % ihrer Zeit mit dem Bereinigen und Bearbeiten von Daten verbringen und nur 20 % ihrer Zeit mit der Analyse. Die Zeit, die du für die Bereinigung aufbringst, ist sehr wichtig, denn die Analyse verschmutzter Daten kann dich zu falschen Schlussfolgerungen verleiten.

In diesem Kurs lernst du eine Reihe von Techniken kennen, mit denen du schmutzige Daten mit R bereinigen kannst. Du beginnst mit der Konvertierung von Datentypen, der Anwendung von Bereichseinschränkungen und dem Umgang mit vollständigen und teilweisen Duplikaten, um Doppelzählungen zu vermeiden.

Sich mit fortgeschrittenen Datenherausforderungen befassen

Wenn du dich mit den üblichen Datenproblemen vertraut gemacht hast, kannst du dich fortgeschritteneren Herausforderungen zuwenden, wie z.B. der Sicherstellung der Konsistenz von Messungen und dem Umgang mit fehlenden Daten. Nach jedem neuen Konzept hast du die Möglichkeit, eine praktische Übung zu absolvieren, um dein Wissen zu festigen und deine Erfahrung zu erweitern.

Lerne die Datensatzverknüpfung bei der Datenbereinigung zu nutzen

Die Datensatzverknüpfung wird verwendet, um Datensätze zusammenzuführen, wenn die Werte Probleme wie Tippfehler oder unterschiedliche Schreibweisen aufweisen. Im letzten Kapitel lernst du diese nützliche Technik kennen und übst ihre Anwendung, indem du zwei Datensätze von Restaurantbewertungen zu einem einzigen Datensatz zusammenfügst.
Für Unternehmen

Trainierst du 2 oder mehr?

Verschaffen Sie Ihrem Team Zugriff auf die vollständige DataCamp-Plattform, einschließlich aller Funktionen.
DataCamp Für UnternehmenFür eine maßgeschneiderte Lösung buchen Sie eine Demo.

In den folgenden Tracks

Zertifizierung verfügbar

Associate Data Scientist in R

Gehe zu Track

Daten importieren und bereinigen mit R

Gehe zu Track
  1. 1

    Häufige Datenprobleme

    Kostenlos

    In diesem Kapitel erfährst du, wie du einige der häufigsten Probleme mit schmutzigen Daten lösen kannst. Du konvertierst Datentypen, wendest Bereichsbeschränkungen an, um zukünftige Datenpunkte zu entfernen, und entfernst doppelte Datenpunkte, um Doppelzählungen zu vermeiden.

    Kapitel Jetzt Abspielen
    Datentyp-Beschränkungen
    50 xp
    Gemeinsame Datentypen
    100 xp
    Datentypen umwandeln
    100 xp
    Schnüre trimmen
    100 xp
    Bereichseinschränkungen
    50 xp
    Einschränkungen bei der Fahrtdauer
    100 xp
    Zurück in die Zukunft
    100 xp
    Einzigartigkeitsbeschränkungen
    50 xp
    Vollständige Duplikate
    100 xp
    Entfernen von teilweisen Duplikaten
    100 xp
    Teilweise Duplikate zusammenfassen
    100 xp
  2. 2

    Kategoriale und Textdaten

    Kategoriale und Textdaten gehören oft zu den unübersichtlichsten Teilen eines Datensatzes, weil sie unstrukturiert sind. In diesem Kapitel erfährst du, wie du Unstimmigkeiten bei Leerzeichen und Großschreibung in Kategoriebeschriftungen behebst, mehrere Kategorien zu einer zusammenfasst und Zeichenketten neu formatierst, um die Konsistenz zu gewährleisten.

    Kapitel Jetzt Abspielen
  3. 3

    Erweiterte Datenprobleme

    In diesem Kapitel beschäftigst du dich mit fortgeschrittenen Datenbereinigungsproblemen, z. B. mit der Sicherstellung, dass alle Gewichte in Kilogramm statt in Pfund angegeben werden. Du erwirbst außerdem unschätzbare Fähigkeiten, mit denen du überprüfen kannst, ob die Werte korrekt hinzugefügt wurden und ob fehlende Werte deine Analysen nicht negativ beeinflussen.

    Kapitel Jetzt Abspielen
  4. 4

    Datensatzverknüpfung

    Die Datensatzverknüpfung ist eine leistungsstarke Technik, mit der mehrere Datensätze zusammengeführt werden können, wenn die Werte Tippfehler oder unterschiedliche Schreibweisen aufweisen. In diesem Kapitel lernst du, wie du Datensätze miteinander verknüpfst, indem du die Ähnlichkeit zwischen Zeichenketten berechnest - und dann deine neuen Kenntnisse einsetzt, um zwei Restaurantbewertungsdatensätze zu einem einzigen, sauberen Masterdatensatz zu verbinden.

    Kapitel Jetzt Abspielen
Für Unternehmen

Trainierst du 2 oder mehr?

Verschaffen Sie Ihrem Team Zugriff auf die vollständige DataCamp-Plattform, einschließlich aller Funktionen.

In den folgenden Tracks

Zertifizierung verfügbar

Associate Data Scientist in R

Gehe zu Track

Daten importieren und bereinigen mit R

Gehe zu Track

Datensätze

ZagatFodor'sBike SharingSFO Satisfaction SurveyCustomer Accounts

Mitwirkende

Collaborator's avatar
Amy Peterson
Collaborator's avatar
Adel Nehme
Collaborator's avatar
Richie Cotton
Maggie Matsui HeadshotMaggie Matsui

Curriculum Manager at DataCamp

Mehr Anzeigen

Was sagen andere Lernende?

Melden Sie sich an 15 Millionen Lernende und starten Sie Daten in R bereinigen Heute!

Kostenloses Konto erstellen

GoogleLinkedInFacebook

oder

Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.