Overfitting y underfitting, Unidad 3 — Diagnóstico con datos de entrenamiento y prueba, 3.1 — Comparar errores · 13/01/2026

Patrones típicos

Patrones típicos: Comparando errores en entrenamiento y prueba

Introducción

Cuando trabajamos con modelos de machine learning, es fundamental entender cómo están generalizando a través de la comparación entre los errores en datos de entrenamiento y prueba. Estas comparaciones nos permiten detectar problemas como overfitting o underfitting, ajustar nuestros modelos adecuadamente y mejorar nuestra capacidad para predecir de manera fiable en nuevos datos.

Explicación principal

La comparación entre el error en los datos de entrenamiento y el error en los datos de prueba es una herramienta crucial para evaluar la generalización del modelo. En un modelo bien ajustado, esperamos que ambos errores sean mínimos, pero con significativas diferencias entre ellos.

Ejemplo

Supongamos que estamos trabajando con un clasificador de imágenes basado en redes neuronales y estamos utilizando el conjunto de datos CIFAR-10 para entrenar nuestro modelo. Podemos visualizar cómo varían los errores a medida que aumenta la época durante el entrenamiento:

import matplotlib.pyplot as plt

# Ejemplo de código ficticio
def plot_training_vs_validation_error(training_errors, validation_errors):
    epochs = range(1, len(training_errors) + 1)
    
    plt.figure(figsize=(10, 6))
    plt.plot(epochs, training_errors, 'b', label='Error en entrenamiento')
    plt.plot(epochs, validation_errors, 'r', label='Error en validación')
    plt.title('Comparación de errores entre entrenamiento y prueba')
    plt.xlabel('Época')
    plt.ylabel('Errores')
    plt.legend()
    plt.show()

# Datos ficticios
training_errors = [0.15, 0.12, 0.09, 0.08, 0.07, 0.06, 0.05, 0.04, 0.03]
validation_errors = [0.20, 0.18, 0.16, 0.15, 0.14, 0.13, 0.12, 0.11, 0.10]

plot_training_vs_validation_error(training_errors, validation_errors)

En este ejemplo, podríamos observar que a medida que aumenta el número de épocas (epoca = ciclo completo sobre los datos de entrenamiento), tanto la curva del error en entrenamiento como la curva del error en validación disminuyen. Sin embargo, si la curva del error en entrenamiento sigue disminuyendo mientras la curva del error en validación no muestra una tendencia similar o empieza a aumentar, esto podría indicar overfitting.

Errores típicos / trampas

Ajuste al ruido: Este es uno de los problemas más comunes que se puede encontrar. Si el modelo intenta ajustarse demasiado a los datos de entrenamiento, incluso a los errores o variaciones aleatorias en los mismos (el "ruido"), podrás ver una curva del error en entrenamiento que sigue disminuyendo mientras que la curva del error en validación no lo hace.

Desbalanceo en el conjunto de datos: Si el conjunto de datos de entrenamiento y prueba están desbalanceados, esto puede distorsionar las comparaciones entre los errores. Por ejemplo, si hay muchos más ejemplos del mismo tipo en un conjunto que en otro, puede resultar en overfitting o underfitting no representativos.

Bajas muestras de datos: Con conjuntos de datos pequeños, es posible que el error en entrenamiento y validación sean similares porque no hay suficientes ejemplos para garantizar una evaluación precisa. Esto podría conducir a errores subestimados o sobreestimados.

Checklist accionable

Verifica la separación de datos: Asegúrate de que los datos de entrenamiento y prueba estén correctamente separados y no hay ningún dato cruzado.
Mantén un conjunto de validación independiente: Siempre tienes un conjunto de validación independiente para evaluar la capacidad del modelo a predecir nuevas muestras.
Utiliza validación cruzada: Esto te ayuda a obtener una medición más precisa del error en validación y evitar sesgos que podrían ocurre con solo usar un conjunto de datos de prueba.
Mide el error en diferentes periodos: Verifica cómo varían los errores en diferentes etapas del entrenamiento, no solo al final.
Analiza las métricas de error específicas para tu problema: Las métricas como accuracy, precision, recall, etc., pueden variar según la naturaleza del problema.

Cierre con "Siguientes pasos"

Siguientes pasos

Implementa validación cruzada: Asegúrate de que tus modelos estén generalizando bien utilizando validación cruzada.
Evalúa regularmente el desempeño: Realiza una evaluación constante del error en entrenamiento y prueba durante el entrenamiento para detectar signos de overfitting o underfitting temprano.
Ajusta el modelo según sea necesario: Utiliza técnicas como regularización, reducción del número de parámetros, o simplificación del modelo si se identifica overfitting.

Con estos pasos, podrás mejorar la generalización y el rendimiento de tus modelos de machine learning, garantizando que sean capaces de predecir correctamente en nuevas muestras.