Aprendizado não supervisionado em Python
Aprenda a agrupar, transformar, visualizar e extrair insights de dados não rotulados com scikit-learn e scipy.
Comece O Curso Gratuitamente4 horas13 vídeos52 exercícios146.621 aprendizesDeclaração de Realização
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.Treinar 2 ou mais pessoas?
Tentar DataCamp for BusinessAmado por alunos de milhares de empresas
Descrição do Curso
Digamos que você tenha uma coleção de clientes com diversas características, como idade, local e histórico financeiro, e queira descobrir padrões e classificá-los em grupos. Ou talvez você tenha um conjunto de textos, como páginas da Wikipedia, e queira segmentá-los em categorias com base em seu conteúdo. Esse é o mundo do aprendizado não supervisionado, chamado assim porque você não está orientando ou supervisionando a descoberta de padrões por alguma tarefa de previsão, mas sim descobrindo a estrutura oculta de dados não rotulados. O aprendizado não supervisionado abrange uma variedade de técnicas de aprendizado de máquina, desde o agrupamento até a redução de dimensão e a fatoração de matriz. Neste curso, você aprenderá os fundamentos da aprendizagem não supervisionada e implementará os algoritmos essenciais usando o scikit-learn e o SciPy. Você aprenderá a agrupar, transformar, visualizar e extrair insights de conjuntos de dados não rotulados e terminará o curso criando um sistema de recomendação para recomendar artistas musicais populares.
Treinar 2 ou mais pessoas?
Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.Nas seguintes faixas
Engenheiro associado de IA para cientistas de dados
Ir para a trilhaFundamentos de aprendizado de máquina em Python
Ir para a trilha- 1
Clustering para exploração de conjuntos de dados
GratuitoSaiba como descobrir os grupos subjacentes (ou "clusters") em um conjunto de dados. Ao final deste capítulo, você estará agrupando empresas usando seus preços no mercado de ações e distinguindo espécies diferentes agrupando suas medidas.
Aprendizagem não supervisionada50 xpQuantos clusters você tem?50 xpAgrupamento de pontos 2D100 xpInspecione seu clustering100 xpAvaliação de um clustering50 xpQuantos cachos de grãos você tem?100 xpAvaliação do agrupamento de grãos100 xpTransformação de recursos para melhores agrupamentos50 xpDimensionamento de dados de peixes para agrupamento100 xpAgrupamento dos dados de peixes100 xpAgrupamento de ações usando KMeans100 xpQuais ações se movem juntas?100 xp - 2
Visualização com agrupamento hierárquico e t-SNE
Neste capítulo, você aprenderá sobre duas técnicas de aprendizado não supervisionado para visualização de dados, clustering hierárquico e t-SNE. O clustering hierárquico mescla as amostras de dados em clusters cada vez mais grossos, produzindo uma visualização em árvore da hierarquia de clusters resultante. t-SNE mapeia as amostras de dados no espaço 2d para que a proximidade das amostras entre si possa ser visualizada.
Visualização de hierarquias50 xpQuantas fusões você fez?50 xpAgrupamento hierárquico dos dados de grãos100 xpHierarquias de estoques100 xpRótulos de cluster em clustering hierárquico50 xpQuais clusters estão mais próximos?50 xpDiferentes vínculos, diferentes agrupamentos hierárquicos!100 xpAgrupamentos intermediários50 xpExtração dos rótulos de cluster100 xpt-SNE para mapas bidimensionais50 xpt-SNE visualização do conjunto de dados de grãos100 xpUm mapa t-SNE do mercado de ações100 xp - 3
Decorrelacionando seus dados e reduzindo a dimensão
A redução de dimensão resume um conjunto de dados usando os padrões comuns que ocorrem. Neste capítulo, você aprenderá sobre a mais fundamental das técnicas de redução de dimensão, a "Análise de Componentes Principais" ("PCA"). PCA é frequentemente usado antes do aprendizado supervisionado para melhorar o desempenho e a generalização do modelo. Ele também pode ser útil para o aprendizado não supervisionado. Por exemplo, você empregará uma variante do PCA que permitirá agrupar artigos da Wikipédia por seu conteúdo!
Visualizando a transformação PCA50 xpDados correlacionados na natureza100 xpDecorrelacionando as medições de grãos com PCA100 xpComponentes principais50 xpDimensão intrínseca50 xpO primeiro componente principal100 xpVariação dos recursos do site PCA100 xpDimensão intrínseca dos dados do peixe50 xpRedução da dimensão com PCA50 xpRedução da dimensão das medições de peixes100 xpUma matriz de frequência de palavras tf-idf100 xpAgrupamento da Wikipédia parte I100 xpAgrupamento de partes da Wikipédia II100 xp - 4
Descobrindo recursos interpretáveis
Neste capítulo, você aprenderá sobre uma técnica de redução de dimensão chamada "Fatoração de matriz não negativa" ("NMF") que expressa amostras como combinações de partes interpretáveis. Por exemplo, ele expressa documentos como combinações de tópicos e imagens em termos de padrões visuais que ocorrem com frequência. Você também aprenderá a usar o NMF para criar sistemas de recomendação que podem encontrar artigos semelhantes para você ler ou artistas musicais que correspondam ao seu histórico de audição!
Fatoração de matriz não negativa (NMF)50 xpDados não negativos50 xpNMF aplicado a artigos da Wikipédia100 xpNMF recursos dos artigos da Wikipédia100 xpNMF reconstrói amostras50 xpNMF aprende partes interpretáveis50 xpNMF aprende tópicos de documentos100 xpExplore o conjunto de dados de LED dígitos100 xpNMF aprende as partes das imagens100 xpPCA não aprende as partes100 xpCriação de sistemas de recomendação usando NMF50 xpQuais artigos são semelhantes a "Cristiano Ronaldo"?100 xpRecomendar artistas musicais - parte I100 xpRecomendar a parte de artistas musicais II100 xpConsiderações finais50 xp
Treinar 2 ou mais pessoas?
Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.Nas seguintes faixas
Engenheiro associado de IA para cientistas de dados
Ir para a trilhaFundamentos de aprendizado de máquina em Python
Ir para a trilhaEm outras faixas
Cientista de aprendizado de máquina em Pythonconjuntos de dados
Company stock price movementsEurovision 2016Fish measurementsGrainsLCD digitsMusical artistsWikipedia articlesWinecolaboradores
pré-requisitos
Supervised Learning with scikit-learnBenjamin Wilson
Ver MaisDirector of Research at lateral.io
O que os outros alunos têm a dizer?
Junte-se a mais de 15 milhões de alunos e comece Aprendizado não supervisionado em Python hoje mesmo!
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.