Logo de CursoIA
CursoIA Curso de Inteligencia Artificial

Overfitting y underfitting, Unidad 2 — El compromiso bias–variance, 2.1 — Sesgo (bias) ·

Modelos demasiado simples

Modelos demasiado simples

Introducción

En el viaje de la ciencia de datos y el aprendizaje automático, es crucial comprender los desafíos que se presentan al entrenar modelos. Una de las condiciones más comunes que encontramos es cuando nuestros modelos son "demasiado simples", o en palabras más técnicas, tienen un alto sesgo (bias). Este sesgo nos lleva a subestimar la relación entre las variables predictivas y el resultado deseado. Es importante reconocer los signos de modelos demasiado simples para mejorar nuestras predicciones y asegurar que nuestros sistemas funcionen como se espera.

Explicación principal

Qué es un modelo con alto sesgo (high bias)

Un modelo con alto sesgo tiende a ignorar las relaciones más importantes en el conjunto de datos. Este tipo de modelo subestima la varianza del dato y puede resultar en predicciones que son demasiado generalizadas o inexactas.

Ejemplo práctico

Imagina un modelo simple que intenta predecir los precios de las casas basándose únicamente en el tamaño del terreno, sin considerar otros factores relevantes como la ubicación, el número de habitaciones y el estado de la casa. Este modelo podría producir predicciones muy generalistas que no reflejen la realidad, ya que ignora variables cruciales.

# Ejemplo simple en Python

import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

# Datos ficticios: tamaño del terreno (m²) y precio de las casas
size = np.array([100, 200, 300, 400, 500])
price = np.array([100000, 200000, 300000, 400000, 500000])

# Entrenamos un modelo simple de regresión lineal
model = LinearRegression()
model.fit(size.reshape(-1, 1), price)

# Predicción
predictions = model.predict(size.reshape(-1, 1))

# Calcular error cuadrático medio (MSE)
mse = mean_squared_error(price, predictions)
print(f"Error Cuadrático Medio: {mse}")

Análisis de los resultados

En este ejemplo, el modelo simple basado en solo el tamaño del terreno probablemente no proporcionará predicciones precisas. La salida del error cuadrático medio (MSE) se espera que sea alto debido a la ignorancia de las otras variables importantes.

Errores típicos / trampas

  1. Modelo demasiado simple: Ignorar variables relevantes en el conjunto de datos puede resultar en un modelo con alta sesgo.
  2. Supuestos erróneos: Adoptar modelos o supuestos que no reflejan la realidad del problema puede llevar a predicciones erróneas y una falta de generalización.
  3. Falta de exploración previa: No realizar análisis exploratorios adecuados para entender las relaciones en los datos puede resultar en modelos subestimados.

Checklist accionable

  1. Identificar variables relevantes: Realiza un análisis exhaustivo del conjunto de datos y asegúrate de incluir todas las variables que puedan influir en el resultado.
  2. Supuestos verificables: Verifica los supuestos clave del modelo antes de implementarlo para evitar errores basados en preconcepciones.
  3. Exploración previa: Investiga y analiza tus datos antes de modelar, asegurándote de que comprendes la relación entre las variables.
  4. Validación cruzada: Utiliza validación cruzada para evaluar el rendimiento del modelo en diferentes conjuntos de datos.
  5. Interpretación crítica: Analiza críticamente las predicciones y los resultados obtenidos para asegurarte de que no estás subestimando variables cruciales.

Cierre

Siguientes pasos

  • Investigación adicional: Explora más modelos y técnicas avanzadas para mejorar la precisión de tus predicciones.
  • Evaluación continua: Continúa evaluando y optimizando tu modelo, asegurándote de que refleja la realidad de los datos.
  • Aprendizaje constante: Mantente actualizado con las últimas tendencias en aprendizaje automático y ciencia de datos para mejorar tus habilidades.

Mediante el entendimiento y la mitigación de los modelos demasiado simples, puedes garantizar que tus modelos de aprendizaje automático sean lo suficientemente complejos como para capturar las relaciones relevantes en los datos, pero no tan complejos como para sobreajustarse.

Contacto

Indica tu objetivo (ChatGPT, RAG, agentes, automatización) y tu stack (web/backend).