Logo de CursoIA
CursoIA Curso de Inteligencia Artificial

Modelos de regresión, Unidad 4 — Evaluación de modelos de regresión, 4.2 — Coeficiente de determinación ·

R² ajustado

R² ajustado: Evaluando la calidad de los modelos de regresión

Introducción

El coeficiente de determinación \(R^2\) es una métrica ampliamente utilizada para evaluar la capacidad de un modelo de regresión lineal en predecir la variable dependiente. Sin embargo, el uso directo del \(R^2\) puede llevar a interpretaciones erróneas, especialmente cuando se comparan modelos con diferentes números de características o muestras. Por ello, el \(R^2\) ajustado es una versión corregida que penaliza la complejidad del modelo y proporciona una medida más precisa para evaluar su rendimiento.

Explicación principal

El \(R^2\) ajustado se define como:

\[ R^2_{\text{ajustado}} = 1 - \left( \frac{(N-1)}{(N-p-1)} \right) \cdot (1 - R^2) \]

donde:

  • \(N\) es el número de observaciones.
  • \(p\) es el número total de parámetros del modelo, incluyendo la intercepción.

Ejemplo práctico

Supongamos que estamos trabajando con un conjunto de datos y queremos evaluar dos modelos:

  1. Modelo A: 5 parámetros (incluye intercepción).
  2. Modelo B: 10 parámetros (incluye intercepción).

Si ambos modelos tienen el mismo \(R^2 = 0.7\), ¿cual será mejor?

# Ejemplo de cálculo en Python

def r2_ajustado(r2, n, p):
    return 1 - ((n-1)/(n-p-1)) * (1 - r2)

r2_a = 0.7
r2_b = 0.85
n = 100  # Número de observaciones
p_a = 5  # Parámetros del modelo A
p_b = 10  # Parámetros del modelo B

print(f"R² ajustado para Modelo A: {r2_ajustado(r2_a, n, p_a):.3f}")
print(f"R² ajustado para Modelo B: {r2_ajustado(r2_b, n, p_b):.3f}")

Este código calcula el \(R^2\) ajustado para ambos modelos y muestra que el modelo B tiene un mejor desempeño ajustado en comparación con el modelo A.

Errores típicos / trampas

  1. Usar \(R^2\) ajustado solo para variables continuas: El \(R^2\) ajustado se aplica específicamente a modelos de regresión lineal y no es adecuado para clasificación o problemas con variables categóricas.
  1. Ignorar la interpretación del \(R^2\) ajustado en grandes muestras: En muestras muy grandes, incluso un pequeño incremento en el número de parámetros puede disminuir significativamente el \(R^2\) ajustado, lo que puede llevar a la supresión injustificada de características relevantes.
  1. No considerar los supuestos del modelo: El \(R^2\) ajustado no verifica si las suposiciones del modelo (como linealidad y homocedasticidad) están cumplidas. Es importante realizar análisis adicionales para validar estas suposiciones.

Checklist accionable

  1. Valida el uso de \(R^2\) ajustado: Asegúrate de que estás usando \(R^2\) ajustado en modelos de regresión lineal.
  2. Compara modelos equitativamente: Utiliza \(R^2\) ajustado para comparar modelos con diferentes complejidades y tamaños de muestra.
  3. Analiza la intercepción del modelo: Verifica que el número de parámetros incluye la intercepción, ya que no está penalizado en el cálculo del \(R^2\) ajustado.
  4. Realiza un análisis adicional: Utiliza \(R^2\) ajustado junto con otros métodos como la prueba F o análisis de residuos para validar el modelo.
  5. Revisa supuestos del modelo: Asegúrate de que los datos cumplen con las suposiciones del modelo antes de interpretar \(R^2\) ajustado.

Cierre

El \(R^2\) ajustado es una herramienta valiosa en la evaluación de modelos de regresión lineal, pero debe usarse con cuidado para evitar errores comunes. Recuerda que no sustituye a otros métodos de validación y análisis, sino que debe complementarlos.

Siguientes pasos

  • Revisión de supuestos: Verifica que las suposiciones del modelo (como linealidad y homocedasticidad) se cumplen utilizando métodos como la prueba de Shapiro-Wilk.
  • Pruebas adicionales: Utiliza pruebas estadísticas como la prueba F o análisis de residuos para complementar tu evaluación.
  • Modelo en producción: Monitorea el desempeño del modelo en producción y realiza reentrenamientos regulares si los datos cambian significativamente.

Siguiendo estos pasos, podrás aplicar \(R^2\) ajustado de manera efectiva para mejorar la calidad de tus modelos de regresión.

Contacto

Indica tu objetivo (ChatGPT, RAG, agentes, automatización) y tu stack (web/backend).