Introducción al procesamiento de lenguaje natural en Python
Aprende técnicas fundamentales de procesamiento de lenguaje natural con Python y aplícalas a datos reales.
Comienza El Curso Gratis4 horas15 vídeos51 ejercicios124.622 aprendicesDeclaración de cumplimiento
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.¿Entrenar a 2 o más personas?
Probar DataCamp for BusinessPreferido por estudiantes en miles de empresas
Descripción del curso
En este curso, aprenderás los fundamentos del procesamiento del lenguaje natural (NLP), como identificar y separar palabras, extraer temas de un texto y construir tu propio clasificador de noticias falsas. También aprenderás a utilizar bibliotecas básicas como NLTK, junto con bibliotecas que utilizan el aprendizaje profundo para resolver problemas comunes de NLP. Este curso te dará las bases para procesar y analizar texto a medida que avances en tu aprendizaje de Python.
¿Entrenar a 2 o más personas?
Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.En las siguientes pistas
Científico de machine learning en Python
Ir a la pistaProcesamiento del Lenguaje Natural en Python
Ir a la pista- 1
Expresiones regulares y tokenización de palabras
GratuitoEste capítulo introducirá algunos conceptos básicos de NLP, como la tokenización de palabras y las expresiones regulares para ayudar a analizar el texto. También aprenderás a manejar texto no inglés y tokenización más difícil.
Introducción a las expresiones regulares50 xp¿Qué patrón?50 xpPráctica de expresiones regulares: re.split() y re.findall()100 xpIntroducción a la tokenización50 xpTokenización de palabras con NLTK100 xpMás regex con re.search()100 xpTokenización avanzada con NLTK y regex50 xpSelección de un tokenizador50 xpRegex con tokenización NLTK100 xpTokenización no ASCII100 xpTrazar la longitud de las palabras con NLTK50 xpPráctica de representación100 xp - 2
Identificación sencilla de temas
Este capítulo te presentará la identificación del tema, que podrás aplicar a cualquier texto que encuentres en la vida real. Utilizando los modelos básicos de NLP, identificarás los temas de los textos basándote en las frecuencias de los términos. Experimentarás y compararás dos métodos sencillos: bolsa de palabras y Tf-idf utilizando NLTK, y una nueva biblioteca Gensim.
Recuentos de palabras con bolsa de palabras50 xpSelector de bolsa de palabras50 xpCreación de un contador con bolsa de palabras100 xpPreprocesamiento de texto simple50 xpPasos del preprocesamiento de texto50 xpPráctica de preprocesamiento de texto100 xpIntroducción a Gensim50 xp¿Qué son los vectores de palabras?50 xpCreación y consulta de un corpus con Gensim100 xpBolsa de palabras Gensim100 xpTf-idf con Gensim50 xp¿Qué es tf-idf?50 xpTf-idf con Wikipedia100 xp - 3
Reconocimiento de entidades nombradas
Este capítulo presentará un tema algo más avanzado: el reconocimiento de entidades nombradas. Aprenderás a identificar el quién, el qué y el dónde de tus textos utilizando modelos preentrenados en textos ingleses y no ingleses. También aprenderás a utilizar algunas bibliotecas nuevas, polyglot y spaCy, para añadirlas a tu caja de herramientas de NLP.
Reconocimiento de entidades nombradas50 xpNER con NLTK100 xpPráctica de representación100 xpBiblioteca de Stanford con NLTK50 xpIntroducción a SpaCy50 xpComparar NLTK con spaCy NER100 xpspaCy NER Categorías50 xpMultilingüe NER con políglota50 xpFrancés NER con políglota I100 xpFrancés NER con políglota II100 xpEspañol NER con políglota100 xp - 4
Creación de un clasificador de noticias falsas
Aplicarás los elementos básicos aprendidos junto con algo de machine learning supervisado para construir un detector de noticias falsas. Empezarás aprendiendo las nociones básicas del machine learning supervisado y luego elegirás unas cuantas funciones importantes y probarás ideas para identificar y clasificar artículos de noticias falsas.
Clasificación de noticias falsas mediante aprendizaje supervisado con NLP50 xp¿Qué posibles características?50 xpEntrenamiento y pruebas50 xpCreación de vectores de recuento de palabras con scikit-learn50 xpCountVectorizer para la clasificación de textos100 xpTfidfVectorizador para la clasificación de textos100 xpInspección de los vectores100 xpEntrenamiento y pruebas de un modelo de clasificación con scikit-learn50 xpModelos de clasificación de textos50 xpEntrenamiento y pruebas del modelo de "noticias falsas" con CountVectorizer100 xpEntrenamiento y pruebas del modelo de "noticias falsas" con TfidfVectorizer100 xpSimple NLP, problemas complejos50 xpMejora del modelo50 xpMejora de tu modelo100 xpInspección de tu modelo100 xp
¿Entrenar a 2 o más personas?
Obtén a tu equipo acceso a la plataforma DataCamp completa, incluidas todas las funciones.En las siguientes pistas
Científico de machine learning en Python
Ir a la pistaProcesamiento del Lenguaje Natural en Python
Ir a la pistacolaboradores
requisitos previos
Python ToolboxKatharine Jarmul
Ver MásFounder, kjamistan
¿Qué tienen que decir otros alumnos?
¡Únete a 15 millones de estudiantes y empieza Introducción al procesamiento de lenguaje natural en Python hoy mismo!
Crea Tu Cuenta Gratuita
o
Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.