Modelos de regresión, Unidad 4 — Evaluación de modelos de regresión, 4.2 — Coeficiente de determinación · 13/01/2026

R² ajustado

R² ajustado: Evaluando la calidad de los modelos de regresión

Introducción

El coeficiente de determinación \(R^2\) es una métrica ampliamente utilizada para evaluar la capacidad de un modelo de regresión lineal en predecir la variable dependiente. Sin embargo, el uso directo del \(R^2\) puede llevar a interpretaciones erróneas, especialmente cuando se comparan modelos con diferentes números de características o muestras. Por ello, el \(R^2\) ajustado es una versión corregida que penaliza la complejidad del modelo y proporciona una medida más precisa para evaluar su rendimiento.

Explicación principal

El \(R^2\) ajustado se define como:

\[ R^2_{\text{ajustado}} = 1 - \left( \frac{(N-1)}{(N-p-1)} \right) \cdot (1 - R^2) \]

donde:

\(N\) es el número de observaciones.
\(p\) es el número total de parámetros del modelo, incluyendo la intercepción.

Ejemplo práctico

Supongamos que estamos trabajando con un conjunto de datos y queremos evaluar dos modelos:

Modelo A: 5 parámetros (incluye intercepción).
Modelo B: 10 parámetros (incluye intercepción).

Si ambos modelos tienen el mismo \(R^2 = 0.7\), ¿cual será mejor?

# Ejemplo de cálculo en Python

def r2_ajustado(r2, n, p):
    return 1 - ((n-1)/(n-p-1)) * (1 - r2)

r2_a = 0.7
r2_b = 0.85
n = 100  # Número de observaciones
p_a = 5  # Parámetros del modelo A
p_b = 10  # Parámetros del modelo B

print(f"R² ajustado para Modelo A: {r2_ajustado(r2_a, n, p_a):.3f}")
print(f"R² ajustado para Modelo B: {r2_ajustado(r2_b, n, p_b):.3f}")

Este código calcula el \(R^2\) ajustado para ambos modelos y muestra que el modelo B tiene un mejor desempeño ajustado en comparación con el modelo A.

Errores típicos / trampas

Usar \(R^2\) ajustado solo para variables continuas: El \(R^2\) ajustado se aplica específicamente a modelos de regresión lineal y no es adecuado para clasificación o problemas con variables categóricas.

Ignorar la interpretación del \(R^2\) ajustado en grandes muestras: En muestras muy grandes, incluso un pequeño incremento en el número de parámetros puede disminuir significativamente el \(R^2\) ajustado, lo que puede llevar a la supresión injustificada de características relevantes.

No considerar los supuestos del modelo: El \(R^2\) ajustado no verifica si las suposiciones del modelo (como linealidad y homocedasticidad) están cumplidas. Es importante realizar análisis adicionales para validar estas suposiciones.

Checklist accionable

Valida el uso de \(R^2\) ajustado: Asegúrate de que estás usando \(R^2\) ajustado en modelos de regresión lineal.
Compara modelos equitativamente: Utiliza \(R^2\) ajustado para comparar modelos con diferentes complejidades y tamaños de muestra.
Analiza la intercepción del modelo: Verifica que el número de parámetros incluye la intercepción, ya que no está penalizado en el cálculo del \(R^2\) ajustado.
Realiza un análisis adicional: Utiliza \(R^2\) ajustado junto con otros métodos como la prueba F o análisis de residuos para validar el modelo.
Revisa supuestos del modelo: Asegúrate de que los datos cumplen con las suposiciones del modelo antes de interpretar \(R^2\) ajustado.

Cierre

El \(R^2\) ajustado es una herramienta valiosa en la evaluación de modelos de regresión lineal, pero debe usarse con cuidado para evitar errores comunes. Recuerda que no sustituye a otros métodos de validación y análisis, sino que debe complementarlos.

Siguientes pasos

Revisión de supuestos: Verifica que las suposiciones del modelo (como linealidad y homocedasticidad) se cumplen utilizando métodos como la prueba de Shapiro-Wilk.
Pruebas adicionales: Utiliza pruebas estadísticas como la prueba F o análisis de residuos para complementar tu evaluación.
Modelo en producción: Monitorea el desempeño del modelo en producción y realiza reentrenamientos regulares si los datos cambian significativamente.

Siguiendo estos pasos, podrás aplicar \(R^2\) ajustado de manera efectiva para mejorar la calidad de tus modelos de regresión.