Logo de CursoIA
CursoIA Curso de Inteligencia Artificial

Generación de texto con LLMs, Unidad 8 — Evaluación de texto generado, 8.2 — Evaluación humana ·

Coherencia

Coherencia

Introducción

La coherencia es un aspecto crucial a evaluar cuando se genera texto con modelos de lenguaje grandes (LLMs). Una salida incoherente puede resultar en contenido que no tiene sentido, contradice información previa o se desvía del propósito original. Esta falta de coherencia puede afectar significativamente la calidad y la confiabilidad del texto generado. En este artículo, exploraremos los aspectos clave de evaluar la coherencia en las salidas generadas por LLMs, identificamos errores comunes y proporcionamos un checklist práctico para asegurar una evaluación efectiva.

Explicación principal

La coherencia se refiere a que el texto generado mantenga consistencia y lógica con respecto al contexto previo. Por ejemplo, si un LLM genera texto sobre la historia de un personaje en una novela, debe mantener los detalles del personaje a lo largo de todo el texto para evitar inconsistencias.

Ejemplo

Supongamos que se le pide al modelo generar una secuencia de diálogos entre dos personajes. En el primer diálogo, uno de los personajes menciona haber encontrado un mapa en su casa. Si en el siguiente diálogo este personaje no tiene conocimiento del mapa ni hace referencia a él, la salida será incoherente.

# Ejemplo de diálogo incoherente
personaje1 = "Encontré un mapa antiguo en mi closet."
personaje2 = "No recuerdo nada sobre un mapa antiguo."

# Salida esperada (coherente)
personaje1 = "Encontré un mapa antiguo en mi closet."
personaje2 = "¡Es cierto! Ese día lo comentamos por teléfono."

Errores típicos / trampas

1. Dependencias largas

Un error común es que el modelo olvide detalles proporcionados en una oración o párrafo anterior, especialmente si hay muchas interrupciones entre la información relevante.

2. Repetición y bucles

El modelo puede repetir información innecesariamente o caer en patrones de lenguaje que no son coherentes con el contexto.

3. Falta de consistencia en el registro formal/informal

Un LLM puede cambiar abruptamente entre un estilo formal y uno informal, lo cual es confuso para los lectores.

Checklist accionable

Para evaluar la coherencia en las salidas generadas por LLMs, siga estos pasos:

  1. Revisar el contexto: Asegúrese de que el modelo ha tomado en cuenta todos los detalles proporcionados en el prompt.
  2. Verificar consistencia temporal y espacial: Compruebe si la información se mantiene coherente a lo largo del texto, sin saltos o contradicciones.
  3. Identificar y corregir repeticiones innecesarias: Busque áreas donde el modelo se repite sin necesidad y elimine estas redundancias.
  4. Revisar la consistencia en el registro: Verifique que el estilo del texto (formal/informal) esté consistentemente aplicado a lo largo de toda la salida.
  5. Evaluar el flujo narrativo: Si se trata de una historia o relato, asegúrese de que el flujo sea lógico y coherente.

Cierre

Siguientes pasos

  • Implementar técnicas de resumen intermedio: Use resúmenes cortos para mantener el hilo del texto.
  • Utilizar segmentación de tareas: Divida la generación en tareas más manejables y evalúe cada parte individualmente.
  • Ejecutar pruebas con diferentes prompts: Pruebe varios prompts para identificar errores comunes y ajustar los parámetros de generación.

La coherencia es fundamental para garantizar que las salidas generadas por LLMs sean útiles y confiables. Siguiendo estos pasos, podrá evaluar eficazmente la coherencia en sus salidas y mejorar continuamente el rendimiento de los modelos de lenguaje.

Contacto

Indica tu objetivo (ChatGPT, RAG, agentes, automatización) y tu stack (web/backend).