Aprendizaje no supervisado en Python
Aprende a agrupar, transformar, visualizar y extraer información de datos sin etiquetar con scikit-learn y scipy.
Comienza El Curso Gratis4 horas13 vídeos52 ejercicios146.621 aprendicesDeclaración de cumplimiento
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.¿Entrenar a 2 o más personas?
Probar DataCamp for BusinessPreferido por estudiantes en miles de empresas
Descripción del curso
Supongamos que tienes una colección de clientes con diversas características, como edad, ubicación e historial financiero, y deseas descubrir patrones y clasificarlos en grupos. O quizá tengas un conjunto de textos, como páginas de Wikipedia, y quieras segmentarlos en categorías en función de su contenido. Este es el mundo del aprendizaje no supervisado, llamado así porque no estás guiando, o supervisando, el descubrimiento de patrones mediante alguna tarea de predicción, sino descubriendo la estructura oculta a partir de datos no etiquetados. El aprendizaje no supervisado engloba diversas técnicas de machine learning, desde la agrupación hasta la reducción de dimensiones y la factorización de matrices. En este curso, aprenderás los fundamentos del aprendizaje no supervisado e implementarás los algoritmos esenciales utilizando scikit-learn y SciPy. Aprenderás a agrupar, transformar, visualizar y extraer información de conjuntos de datos no etiquetados, y terminarás el curso construyendo un sistema de recomendación de artistas musicales populares.
¿Entrenar a 2 o más personas?
Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.En las siguientes pistas
Ingeniero Asociado de IA para Científicos de Datos
Ir a la pistaFundamentos del aprendizaje automático en Python
Ir a la pista- 1
Agrupación para la exploración de conjuntos de datos
GratuitoAprende a descubrir los grupos subyacentes (o "clústeres") en un conjunto de datos. Al final de este capítulo, podrás agrupar empresas utilizando sus cotizaciones bursátiles, y distinguir diferentes especies agrupando sus medidas.
Aprendizaje no supervisado50 xp¿Cuántas agrupaciones?50 xpAgrupación de puntos 2D100 xpInspecciona tu agrupación100 xpEvaluar una agrupación50 xp¿Cuántos clústeres de grano?100 xpEvaluación de la agrupación de granos100 xpTransformación de rasgos para mejorar las agrupaciones50 xpEscala de datos de peces para la agrupación100 xpAgrupación de los datos de los peces100 xpAgrupación de acciones mediante KMeans100 xp¿Qué acciones se mueven juntas?100 xp - 2
Visualización con agrupación jerárquica y t-SNE
En este capítulo, conocerás dos técnicas de aprendizaje no supervisado para la visualización de datos, la agrupación jerárquica y t-SNE. La agrupación jerárquica fusiona las muestras de datos en clústeres cada vez más gruesos, dando lugar a una visualización en árbol de la jerarquía de clústeres resultante. t-SNE mapea las muestras de datos en un espacio 2d para poder visualizar la proximidad de las muestras entre sí.
Visualizar jerarquías50 xp¿Cuántas fusiones?50 xpAgrupación jerárquica de los datos de los granos100 xpJerarquías de acciones100 xpEtiquetas de clústeres en la agrupación jerárquica50 xp¿Qué grupos están más cerca?50 xp¡Vinculación diferente, agrupación jerárquica diferente!100 xpAgrupaciones intermedias50 xpExtraer las etiquetas de los clústeres100 xpt-SNE para mapas bidimensionales50 xpVisualización t-SNE del conjunto de datos de granos100 xpUn mapa t-SNE del mercado de valores100 xp - 3
Decorrelación de tus datos y reducción de dimensiones
La reducción dimensional resume un conjunto de datos utilizando sus patrones comunes. En este capítulo, conocerás la más fundamental de las técnicas de reducción de dimensiones, el "Análisis de Componentes Principales" ("PCA"). PCA se utiliza a menudo antes del aprendizaje supervisado para mejorar el rendimiento y la generalización de los modelos. También puede ser útil para el aprendizaje no supervisado. Por ejemplo, emplearás una variante de PCA ¡que te permitirá agrupar artículos de Wikipedia por su contenido!
Visualización de la transformación PCA50 xpDatos correlacionados en la naturaleza100 xpDecorrelación de las medidas de grano con PCA100 xpComponentes principales50 xpDimensión intrínseca50 xpEl primer componente principal100 xpVarianza de las características PCA100 xpDimensión intrínseca de los datos de los peces50 xpReducción de dimensiones con PCA50 xpReducción dimensional de las medidas de los peces100 xpUna matriz tf-idf de frecuencia de palabras100 xpAgrupación Wikipedia parte I100 xpAgrupación Wikipedia parte II100 xp - 4
Descubrir rasgos interpretables
En este capítulo, conocerás una técnica de reducción de dimensiones llamada "Factorización de matrices no negativas" ("NMF") que expresa las muestras como combinaciones de partes interpretables. Por ejemplo, expresa los documentos como combinaciones de temas, y las imágenes en términos de patrones visuales habituales. También aprenderás a utilizar NMF para construir sistemas de recomendación que puedan encontrarte artículos similares para leer, ¡o artistas musicales que coincidan con tu historial de escucha!
Factorización de matrices no negativas (NMF)50 xpDatos no negativos50 xpNMF aplicado a los artículos de Wikipedia100 xpNMF características de los artículos de Wikipedia100 xpNMF reconstruye muestras50 xpNMF aprende partes interpretables50 xpNMF aprende los temas de los documentos100 xpExplora el conjunto de datos LED dígitos100 xpNMF aprende las partes de las imágenes100 xpPCA no aprende las partes100 xpConstruir sistemas de recomendación utilizando NMF50 xp¿Qué artículos son similares a "Cristiano Ronaldo"?100 xpRecomienda artistas musicales parte I100 xpRecomienda artistas musicales parte II100 xpReflexiones finales50 xp
¿Entrenar a 2 o más personas?
Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.En las siguientes pistas
Ingeniero Asociado de IA para Científicos de Datos
Ir a la pistaFundamentos del aprendizaje automático en Python
Ir a la pistaEn otras pistas
Científico de machine learning en Pythonconjuntos de datos
Company stock price movementsEurovision 2016Fish measurementsGrainsLCD digitsMusical artistsWikipedia articlesWinecolaboradores
requisitos previos
Supervised Learning with scikit-learnBenjamin Wilson
Ver MásDirector of Research at lateral.io
¿Qué tienen que decir otros alumnos?
¡Únete a 15 millones de estudiantes y empieza Aprendizaje no supervisado en Python hoy mismo!
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.