Pular para o conteúdo principal
InícioPython

Análise de cluster em Python

Neste curso, você aprenderá sobre aprendizado não supervisionado com técnicas de clustering usando SciPy.

Comece O Curso Gratuitamente
4 horas14 vídeos46 exercícios56.099 aprendizesTrophyDeclaração de Realização

Crie sua conta gratuita

GoogleLinkedInFacebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.
Group

Treinar 2 ou mais pessoas?

Tentar DataCamp for Business

Amado por alunos de milhares de empresas


Descrição do Curso

Você provavelmente já se deparou com o Google News, que agrupa automaticamente artigos de notícias semelhantes em um tópico. Você já se perguntou qual processo é executado em segundo plano para chegar a esses grupos? Neste curso, você será apresentado ao aprendizado não supervisionado por meio de agrupamento usando a biblioteca SciPy em Python. Este curso abrange o pré-processamento de dados e a aplicação de agrupamento hierárquico e k-means. No curso, você explorará as estatísticas dos jogadores de um jogo de futebol popular, o FIFA 18. Após concluir o curso, você será capaz de aplicar rapidamente vários algoritmos de agrupamento nos dados, visualizar os agrupamentos formados e analisar os resultados.
Para Empresas

GroupTreinar 2 ou mais pessoas?

Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.
DataCamp Para EmpresasPara uma solução sob medida , agende uma demonstração.

Nas seguintes faixas

Cientista de aprendizado de máquina em Python

Ir para a trilha
  1. 1

    Introdução ao clustering

    Gratuito

    Antes de estar pronto para classificar artigos de notícias, você precisa conhecer os conceitos básicos de clustering. Este capítulo o familiariza com uma classe de algoritmos de aprendizado de máquina chamada aprendizado não supervisionado e, em seguida, apresenta a você o agrupamento, um dos algoritmos populares de aprendizado não supervisionado. Você conhecerá duas técnicas de agrupamento populares: agrupamento hierárquico e agrupamento k-means. O capítulo termina com as etapas básicas de pré-processamento antes de você começar a clusterizar os dados.

    Reproduzir Capítulo Agora
    Aprendizado não supervisionado: noções básicas
    50 xp
    Aprendizagem não supervisionada no mundo real
    50 xp
    Avistamentos de Pokémon
    100 xp
    Noções básicas de análise de agrupamento
    50 xp
    Avistamentos de Pokémon: agrupamento hierárquico
    100 xp
    Avistamentos de Pokémon: agrupamento k-means
    100 xp
    Preparação de dados para análise de cluster
    50 xp
    Normalizar dados da lista básica
    100 xp
    Visualizar dados normalizados
    100 xp
    Normalização de números pequenos
    100 xp
    FIFA 18: Normalizar dados
    100 xp
  2. 2

    Agrupamento hierárquico

    Este capítulo se concentra em um algoritmo de agrupamento popular - o agrupamento hierárquico - e sua implementação no SciPy. Além do procedimento para executar o agrupamento hierárquico, ele tenta ajudar você a responder a uma pergunta importante: quantos agrupamentos estão presentes nos seus dados? O capítulo termina com uma discussão sobre as limitações do agrupamento hierárquico e discute as considerações ao usar o agrupamento hierárquico.

    Reproduzir Capítulo Agora
  3. 3

    Agrupamento K-Means

    Este capítulo apresenta um algoritmo de agrupamento diferente - o agrupamento k-means - e sua implementação no SciPy. O agrupamento K-means supera a maior desvantagem do agrupamento hierárquico que foi discutida no último capítulo. Como os dendrogramas são específicos do agrupamento hierárquico, este capítulo discute um método para encontrar o número de clusters antes de executar o agrupamento k-means. O capítulo termina com uma discussão sobre as limitações do k-means clustering e discute as considerações ao usar esse algoritmo.

    Reproduzir Capítulo Agora
  4. 4

    Clustering no mundo real

    Agora que você já conhece duas das técnicas de clustering mais populares, este capítulo o ajudará a aplicar esse conhecimento a problemas do mundo real. O capítulo primeiro discute o processo de encontrar cores dominantes em uma imagem, antes de passar para o problema discutido na introdução - agrupamento de artigos de notícias. O capítulo termina com uma discussão sobre clustering com várias variáveis, o que dificulta a visualização de todos os dados.

    Reproduzir Capítulo Agora
Para Empresas

GroupTreinar 2 ou mais pessoas?

Obtenha acesso à sua equipe à plataforma DataCamp completa, incluindo todos os recursos.

Nas seguintes faixas

Cientista de aprendizado de máquina em Python

Ir para a trilha

conjuntos de dados

FIFA sampleFIFAMovies

colaboradores

Collaborator's avatar
Hillary Green-Lerman
Collaborator's avatar
Sara Billen

pré-requisitos

Intermediate Python
Shaumik Daityari HeadshotShaumik Daityari

Business Analyst at American Express

Ver Mais

O que os outros alunos têm a dizer?

Junte-se a mais de 15 milhões de alunos e comece Análise de cluster em Python hoje mesmo!

Crie sua conta gratuita

GoogleLinkedInFacebook

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.