TensorFlow desde cero, Unidad 5 — Entrenamiento de modelos en TensorFlow, 5.1 — Compilación del modelo · 13/01/2026

Métricas

Introducción

En el entrenamiento de modelos de Deep Learning, las métricas desempeñan un papel crucial para medir y evaluar la calidad del rendimiento del modelo. Estas métricas nos proporcionan una forma objetiva de entender cómo nuestro modelo está actuando durante el proceso de entrenamiento y validación. En TensorFlow, definir adecuadamente las métricas es fundamental para garantizar que estemos evaluando los aspectos correctos del rendimiento del modelo.

Explicación principal con ejemplos

Las métricas en TensorFlow se pueden definir tanto durante la compilación como durante el entrenamiento de un modelo. A continuación, veremos cómo definir y usar diferentes tipos de métricas en TensorFlow 2.x:

Definición de Métricas Durante Compilación

Una vez que hemos definido nuestras capas y nuestro optimizador, podemos especificar las métricas a través del parámetro metrics dentro del método compile().

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

model = Sequential([
    Dense(128, activation='relu', input_shape=(input_dim,)),
    Dense(64, activation='relu'),
    Dense(output_dim)
])

model.compile(optimizer='adam',
              loss='mse',
              metrics=['accuracy'])

En este ejemplo, hemos añadido accuracy como una métrica adicional al modelo. Sin embargo, es importante recordar que la precisión (accuracy) puede no ser apropiada para todos los tipos de problemas, especialmente en clasificaciones binarias o multi-clase.

Definición de Métricas Durante Entrenamiento

También podemos definir las métricas a través del método compile() y luego usarlas durante la fase de entrenamiento. Las métricas se registrarán automáticamente cada época.

history = model.fit(
    x_train, y_train,
    epochs=10,
    validation_data=(x_val, y_val),
    batch_size=32)

Ejemplos comunes de Métricas

Loss: Mide la pérdida o error del modelo en cada época.
Accuracy: Es una métrica común para problemas de clasificación binaria. Sin embargo, debe ser usada con cuidado para problemas multi-clase.
Precision y Recall: Estas son especialmente útiles para problemas de clasificación imbalanced.

Ejemplo de Uso

model.compile(optimizer='adam',
              loss='binary_crossentropy',
              metrics=['accuracy', 'precision', 'recall'])

history = model.fit(
    x_train, y_train,
    epochs=10,
    validation_data=(x_val, y_val))

Errores típicos / trampas

1. Usar métricas inapropiadas para el problema

Es fácil cometer este error al usar la precisión (accuracy) como métrica principal en problemas de clasificación multi-clase o imbalanced. En estos casos, precision y recall pueden proporcionar una visión más precisa del rendimiento del modelo.

2. No utilizar validación durante el entrenamiento

Es común no definir ninguna métrica durante la fase de validación. Es crucial asegurarse de que el modelo no esté sobreajustando al no tener una medición independiente del rendimiento en datos no vistos durante el entrenamiento.

3. No analizar las métricas a lo largo de todas las épocas

Las métricas pueden variar significativamente a lo largo del tiempo y pueden disminuir o aumentar después de ciertas épocas. Ignorar este aspecto puede llevar a la selección de un modelo con rendimiento subóptimo.

4. No interpretar las métricas en el contexto adecuado

Las métricas como la precisión (accuracy) pueden ser engañosas si no se consideran en el contexto del problema y el conjunto de datos. Por ejemplo, un modelo con alta precisión puede estar sobreajustando a los datos de entrenamiento.

5. Ignorar las métricas en la validación cruzada

No usar métricas durante la validación cruzada puede llevar a una selección errónea del mejor hiperparámetro o modelo.

Checklist accionable

Identificar el tipo de problema: Asegúrate de que has elegido las métricas adecuadas para tu tarea (clasificación, regresión, etc.).
Definir métricas durante la compilación del modelo: Usa model.compile() para incluir todas las métricas relevantes.
Usar validación durante el entrenamiento: Asegúrate de que estás utilizando los datos de validación para monitorizar el rendimiento.
Monitorear las métricas a lo largo del tiempo: Analiza cómo las métricas cambian con cada época y ajusta tu modelo si es necesario.
Interpretar las métricas en el contexto adecuado: Comprende que las métricas como la precisión (accuracy) pueden ser engañosas en algunos casos, especialmente para problemas imbalanced.

Cierre: Siguientes pasos

Explorar otras métricas relevantes: Asegúrate de explorar otros tipos de métricas según el tipo de problema y los datos.
Usar callbacks para monitorear la validación: Utiliza tf.keras.callbacks.ModelCheckpoint o EarlyStopping para asegurarte de que no estás sobreajustando tu modelo.
Optimizar hiperparámetros usando métricas: Asegúrate de usar las métricas correctas cuando estés ajustando hiperparámetros.

Siguiendo estos pasos, podrás garantizar una evaluación precisa y confiable del rendimiento de tus modelos de Deep Learning en TensorFlow.

Métricas

Métricas

Introducción

Explicación principal con ejemplos

Definición de Métricas Durante Compilación

Definición de Métricas Durante Entrenamiento

Ejemplos comunes de Métricas

Ejemplo de Uso

Errores típicos / trampas

1. Usar métricas inapropiadas para el problema

2. No utilizar validación durante el entrenamiento

3. No analizar las métricas a lo largo de todas las épocas

4. No interpretar las métricas en el contexto adecuado

5. Ignorar las métricas en la validación cruzada

Checklist accionable

Cierre: Siguientes pasos

Contacta e inscríbete

Contacto