Machine Learning clásico, Unidad 2 — Regresión: predecir valores numéricos, 2.3 — Regularización · 13/01/2026

Overfitting en regresión

Introducción

El overfitting es uno de los problemas más comunes y perjudiciales que puede afectar a la regresión, una técnica fundamental en Machine Learning clásico. Esta condición ocurre cuando un modelo se ajusta demasiado a su conjunto de entrenamiento, capturando incluso el ruido y las variaciones aleatorias del mismo, lo que resulta en un desempeño pobre en datos no vistos. En este artículo, exploraremos qué es el overfitting, cómo ocurre, los errores típicos a evitar, y proporcionaremos una lista accionable de pasos para prevenirlo.

Explicación principal

El overfitting en regresión se da cuando un modelo se ajusta demasiado al conjunto de entrenamiento, llegando incluso a memorizar los datos. Esto significa que el modelo no generaliza bien a nuevos conjuntos de datos y tiene una alta varianza. Por ejemplo, consideremos un modelo de regresión lineal simple:

import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

# Generar datos ficticios
np.random.seed(0)
X = np.random.rand(100, 1)
y = X.flatten() + 0.1 * np.random.randn(100)

# Entrenar modelo de regresión lineal
reg = LinearRegression()
reg.fit(X, y)

# Predecir en los mismos datos para evaluar overfitting
y_pred = reg.predict(X)
mse = mean_squared_error(y, y_pred)
print("MSE:", mse)

En este ejemplo, aunque el modelo de regresión lineal es simple, si aumentamos el número de características o ajustamos el modelo a un conjunto de datos más complejo, puede comenzar a overfitear. La gráfica resultante será muy precisa en los puntos de entrenamiento pero inadecuada para nuevos datos.

Errores típicos / trampas

Ajuste demasiado complejo: Aumentar el número de características o usar modelos con muchos parámetros sin justificación puede llevar a overfitting.
Falta de validación cruzada: No utilizar técnicas de validación cruzada para evaluar regularmente el rendimiento del modelo en conjuntos de datos no vistos puede resultar en un overfitting subestimado.
Sobreajuste intencional para mejorar el ajuste: Algunas veces, los modelos se pueden ajustar a la perfección al conjunto de entrenamiento con intención, lo que es una forma de overfitting deliberada.

Checklist accionable

Aquí tienes una lista de pasos prácticos y accionables para prevenir el overfitting en tu modelo de regresión:

Elija un modelo adecuado: No sobreajuste al elegir características o complejidad del modelo.
Use validación cruzada: Asegúrate de utilizar validación cruzada para evaluar regularmente el rendimiento del modelo.
Corte el overfitting con regularización: Implemente técnicas de regularización como Ridge, Lasso, o Elastic Net en tu modelo.
Muestreo adecuado: Muestra suficiente datos sin duplicados y asegúrate de que estén bien distribuidos para evitar overfitting.
Evite la sobreajuste intencional: Si ajusta a los datos para mejorar el rendimiento en el conjunto de entrenamiento, es posible que esté overfitting.
Métricas de validación realista: Utilice métricas de validación realistas y no subestime su overfitting al evaluar solo en conjuntos de entrenamiento.
Visualización del rendimiento: Use gráficos para visualizar el rendimiento de su modelo en diferentes conjuntos de datos.
Pruebas con nuevos datos: Siempre pruebe su modelo en un conjunto de datos nuevo y no visto antes para evaluar su generalización.

Cierre

El overfitting es una amenaza constante a la hora de implementar modelos de regresión, pero puede ser mitigado siguiendo prácticas efectivas. Asegúrate de elegir el modelo adecuado, usar validación cruzada, regularizar y probar tu modelo en nuevos datos para garantizar su robustez.

Siguientes pasos

Aprenda más sobre regresión: Explora diferentes tipos de modelos de regresión y cómo pueden utilizarse.
Experimente con validación cruzada: Implementa validación cruzada en varios conjuntos de datos y modelos para mejorar tu comprensión del overfitting.
Implemente regularización: Pruebe diferentes métodos de regularización en tus modelos para prevenir el overfitting.
Aplica a proyectos reales: Utiliza estos conocimientos en proyectos reales para mejorar la precisión y generalización de tus modelos.

Siguiendo estos pasos, podrás construir modelos de regresión más robustos y predecibles.

Overfitting en regresión

Overfitting en regresión

Introducción

Explicación principal

Errores típicos / trampas

Checklist accionable

Cierre

Siguientes pasos

Contacta e inscríbete

Contacto