Pular para o conteúdo principal
InícioPython

Aprendizado não supervisionado em Python

Aprenda a agrupar, transformar, visualizar e extrair insights de dados não rotulados com scikit-learn e scipy.

Comece O Curso Gratuitamente
4 horas13 vídeos52 exercícios145.976 aprendizesTrophyDeclaração de Realização

Crie sua conta gratuita

GoogleLinkedInFacebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.
Group

Treinar 2 ou mais pessoas?

Tentar DataCamp for Business

Amado por alunos de milhares de empresas


Descrição do Curso

Digamos que você tenha uma coleção de clientes com diversas características, como idade, local e histórico financeiro, e queira descobrir padrões e classificá-los em grupos. Ou talvez você tenha um conjunto de textos, como páginas da Wikipedia, e queira segmentá-los em categorias com base em seu conteúdo. Esse é o mundo do aprendizado não supervisionado, chamado assim porque você não está orientando ou supervisionando a descoberta de padrões por alguma tarefa de previsão, mas sim descobrindo a estrutura oculta de dados não rotulados. O aprendizado não supervisionado abrange uma variedade de técnicas de aprendizado de máquina, desde o agrupamento até a redução de dimensão e a fatoração de matriz. Neste curso, você aprenderá os fundamentos da aprendizagem não supervisionada e implementará os algoritmos essenciais usando o scikit-learn e o SciPy. Você aprenderá a agrupar, transformar, visualizar e extrair insights de conjuntos de dados não rotulados e terminará o curso criando um sistema de recomendação para recomendar artistas musicais populares.
Para Empresas

GroupTreinar 2 ou mais pessoas?

Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.
DataCamp Para EmpresasPara uma solução sob medida , agende uma demonstração.

Nas seguintes faixas

Certificação disponível

Cientista de dados associado em Python

Ir para a trilha

Engenheiro associado de IA para cientistas de dados

Ir para a trilha

Fundamentos de aprendizado de máquina em Python

Ir para a trilha
  1. 1

    Clustering para exploração de conjuntos de dados

    Gratuito

    Saiba como descobrir os grupos subjacentes (ou "clusters") em um conjunto de dados. Ao final deste capítulo, você estará agrupando empresas usando seus preços no mercado de ações e distinguindo espécies diferentes agrupando suas medidas.

    Reproduzir Capítulo Agora
    Aprendizagem não supervisionada
    50 xp
    Quantos clusters você tem?
    50 xp
    Agrupamento de pontos 2D
    100 xp
    Inspecione seu clustering
    100 xp
    Avaliação de um clustering
    50 xp
    Quantos cachos de grãos você tem?
    100 xp
    Avaliação do agrupamento de grãos
    100 xp
    Transformação de recursos para melhores agrupamentos
    50 xp
    Dimensionamento de dados de peixes para agrupamento
    100 xp
    Agrupamento dos dados de peixes
    100 xp
    Agrupamento de ações usando KMeans
    100 xp
    Quais ações se movem juntas?
    100 xp
  2. 2

    Visualização com agrupamento hierárquico e t-SNE

    Neste capítulo, você aprenderá sobre duas técnicas de aprendizado não supervisionado para visualização de dados, clustering hierárquico e t-SNE. O clustering hierárquico mescla as amostras de dados em clusters cada vez mais grossos, produzindo uma visualização em árvore da hierarquia de clusters resultante. t-SNE mapeia as amostras de dados no espaço 2d para que a proximidade das amostras entre si possa ser visualizada.

    Reproduzir Capítulo Agora
  3. 3

    Decorrelacionando seus dados e reduzindo a dimensão

    A redução de dimensão resume um conjunto de dados usando os padrões comuns que ocorrem. Neste capítulo, você aprenderá sobre a mais fundamental das técnicas de redução de dimensão, a "Análise de Componentes Principais" ("PCA"). PCA é frequentemente usado antes do aprendizado supervisionado para melhorar o desempenho e a generalização do modelo. Ele também pode ser útil para o aprendizado não supervisionado. Por exemplo, você empregará uma variante do PCA que permitirá agrupar artigos da Wikipédia por seu conteúdo!

    Reproduzir Capítulo Agora
  4. 4

    Descobrindo recursos interpretáveis

    Neste capítulo, você aprenderá sobre uma técnica de redução de dimensão chamada "Fatoração de matriz não negativa" ("NMF") que expressa amostras como combinações de partes interpretáveis. Por exemplo, ele expressa documentos como combinações de tópicos e imagens em termos de padrões visuais que ocorrem com frequência. Você também aprenderá a usar o NMF para criar sistemas de recomendação que podem encontrar artigos semelhantes para você ler ou artistas musicais que correspondam ao seu histórico de audição!

    Reproduzir Capítulo Agora
Para Empresas

GroupTreinar 2 ou mais pessoas?

Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.

Nas seguintes faixas

Certificação disponível

Cientista de dados associado em Python

Ir para a trilha

Engenheiro associado de IA para cientistas de dados

Ir para a trilha

Fundamentos de aprendizado de máquina em Python

Ir para a trilha

Em outras faixas

Cientista de aprendizado de máquina em Python

conjuntos de dados

Company stock price movementsEurovision 2016Fish measurementsGrainsLCD digitsMusical artistsWikipedia articlesWine

colaboradores

Collaborator's avatar
Yashas Roy
Collaborator's avatar
Hugo Bowne-Anderson
Benjamin Wilson HeadshotBenjamin Wilson

Director of Research at lateral.io

Ver Mais

O que os outros alunos têm a dizer?

Junte-se a mais de 15 milhões de alunos e comece Aprendizado não supervisionado em Python hoje mesmo!

Crie sua conta gratuita

GoogleLinkedInFacebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.