Discursos

Words, words, words.

Welcome to my first Machine-Learning-related project!

Voy a hacer un switch y escribir este proyecto enteramente en castellano. El tópico de este proyecto lo merece.

La motivación de este proyecto es doble: por un lado, siempre me interesaron los discursos políticos (lo que dicen, cómo lo dicen y lo que -aunque no dicen- dejan entrever); por el otro, hace mucho tiempo que vengo queriendo volcar mi interés en el procesamiento de lenguaje natural (NLP) y Machine Learning (ML).

Este proyecto es un viaje por los discursos presidenciales argentinos desde 2003 hasta hoy, analizados mezclando herramientas de NLP y ML.

La idea es ir mucho más allá de contar palabras (aunque eso lo hago, y mucho): voy a clasificar discursos reales vs. comunicados institucionales, detectar temas recurrentes, observar cómo evolucionan ciertas expresiones a lo largo del tiempo, y buscar patrones. Quiero incluir sentiment analysis, topic modeling y análisis de estilo. Todo esto (y más), con visualizaciones propias y un enfoque 100% reproducible.

Este proyecto es el primero de una serie -ojalá larga- de proyectos relacionados a NLP & ML que tengo en mente. Una especie de prueba piloto.

Obviamente, esto lleva tiempo…algo que me está faltando últimamente. Por eso, en el mientras tanto, podés ver esta viñeta de Mafalda.

El repositorio de GitHub continuará siendo privado por un tiempo, hasta que avance más con el proyecto.