Prompt engineering avanzado, Unidad 12 — Mini-proyecto avanzado, 12.1 — Proyecto integral · 13/01/2026

Evaluación y mejora

Evaluación y mejora: Puesta en práctica de los conocimientos en prompt engineering

Introducción

La evaluación y mejora constante son fundamentales para asegurar que nuestros sistemas basados en LLMs (Modelos de Inteligencia Artificial Generativa) funcionen eficientemente y cumplan con las expectativas. En este artículo, exploraremos cómo aplicar estos conocimientos a través de un proyecto integral, analizando tanto el proceso como los posibles errores a evitar.

Explicación principal

Definición del sistema

Comenzamos definiendo claramente qué es lo que nuestro sistema debe lograr. Esto implica establecer objetivos claros y medibles para asegurarnos de que estemos en la dirección correcta. Por ejemplo, si estamos creando un asistente virtual, podríamos definir los siguientes objetivos:

Generar respuestas precisas a preguntas específicas.
Mantener una conversación coherente durante al menos 3 interacciones.

Diseño de arquitectura de prompts

Una vez que tenemos claros los objetivos del sistema, es el momento de diseñar la arquitectura de prompts. Esto incluye cómo estructurar nuestros prompts para maximizar su eficacia y minimizar los costes. Por ejemplo:

Prompt:

Instrucción: "Genera una respuesta a la pregunta siguiente."
Contexto: "[Historial de conversación]"
Datos de entrada: "[Pregunta específica]"

Implementación y pruebas

La implementación implica codificar nuestra arquitectura de prompts en código. Durante esta fase, es crucial realizar pruebas exhaustivas para asegurarnos de que el sistema funciona como esperamos.

Caso de prueba 1: Respuesta a preguntas básicas

def test_basic_question_response():
    prompt = "¿Cuál es la capital de España?"
    expected_answer = "La capital de España es Madrid."
    actual_answer = llm.generate_response(prompt)
    assert actual_answer == expected_answer, f"Expected {expected_answer}, got {actual_answer}"

Caso de prueba 2: Mantener una conversación coherente

def test_conversation_consistency():
    conversation_history = "Pregunta1: ¿Cuál es la capital de España? Respuesta1: La capital de España es Madrid. Pregunta2: ¿Cómo se llama el presidente actual?"
    expected_answer = "El presidente actual se refiere a Francisco Javier Pérez Sanchez."
    actual_answer = llm.generate_response(conversation_history, "¿Cómo se llama el presidente actual?")
    assert actual_answer == expected_answer, f"Expected {expected_answer}, got {actual_answer}"