CBOW
CBOW: Entendiendo la técnica Word2Vec Introducción CBOW (Continuous Bag-of-Words) es una técnica de Word Embeddings que forma parte de los algoritmos que componen Word2Vec. Este modelo fue propuesto por T. Mikolov et al. en 2013 y se ha con…
IA práctica para programadores: ChatGPT, LLM, RAG, agentes, evaluación y despliegue.
CBOW: Entendiendo la técnica Word2Vec Introducción CBOW (Continuous Bag-of-Words) es una técnica de Word Embeddings que forma parte de los algoritmos que componen Word2Vec. Este modelo fue propuesto por T. Mikolov et al. en 2013 y se ha con…
Ventajas frente a one-hot Introducción En el camino hacia la representación de texto como números, uno se encuentra con una variedad de técnicas. La representación one-hot es una técnica básica pero limitada que convierte cada palabra en un…
Información distribuida Introducción La representación de información en forma de vectores es un pilar fundamental para la comprensión y procesamiento del lenguaje natural. Cuando hablamos de representaciones distribuidas, nos referimos a m…
Representaciones distribuidas: La idea clave de embeddings Introducción En el camino hacia un entendimiento matemático y computacional del lenguaje, la representación distribuida es una pieza fundamental. Este concepto se centra en capturar…
Limitaciones graves: One-hot Encoding Introducción El one-hot encoding es una técnica fundamental para convertir palabras o tokens en representaciones numéricas, permitiendo a las máquinas "entender" el lenguaje. Sin embargo, este…
Alta dimensionalidad Introducción La alta dimensionalidad es un concepto clave que surgen cuando transformamos texto en vectores numéricos mediante técnicas como one-hot encoding. En este proceso, cada palabra se convierte en una dimensión …
Representación básica: One-hot encoding Introducción La representación de texto en formato numérico es una etapa crucial en la transformación del lenguaje a geometría, permitiendo que las máquinas interpreten y procesen información textual.…
Analogías vectoriales Introducción Las analogías vectoriales son una herramienta poderosa para comprender cómo los modelos de procesamiento del lenguaje (NLP) utilizan vectores para representar relaciones semánticas entre palabras. Esta téc…