Segmentación de imágenes, Unidad 8 — Funciones de pérdida para segmentación, 8.1 — Pérdidas por píxel · 13/01/2026

Cross-entropy

Cross-entropy: Una herramienta esencial para la segmentación de imágenes

Introducción

La segmentación de imágenes es una tarea compleja que implica dividir una imagen en regiones o máscaras correspondientes a objetos o clases predefinidas. En este proceso, elegir las funciones de pérdida adecuadas es crucial para lograr resultados precisos y confiables. La cross-entropy (entropía cruzada) se ha convertido en uno de los métodos más utilizados debido a su eficacia en clasificar píxeles en múltiples clases. En este artículo, exploraremos cómo funciona la cross-entropy, cuándo y por qué es útil, y cómo implementarla en el proceso de segmentación.

Explicación principal

La cross-entropy se utiliza para medir la diferencia entre las predicciones probables (salida del modelo) y los valores reales (etiquetas de entrenamiento). Es particularmente efectiva cuando se trabaja con problemas de clasificación multiclase, como en la segmentación de imágenes. La fórmula básica de cross-entropy para una sola muestra es:

\[ H(y, \hat{y}) = -\sum_{i} y_i \log(\hat{y}_i) \]

Donde:

\( y_i \) son las etiquetas reales.
\( \hat{y}_i \) son las predicciones del modelo.

En el contexto de la segmentación, consideramos cada píxel como una clase. Si nuestro modelo produce una probabilidad para cada clase (por ejemplo, 4 clases: fondo, objeto A, objeto B y objeto C), la cross-entropy nos permite evaluar cuánto se desvían esas probabilidades de las verdaderas etiquetas.

Ejemplo práctico

Supongamos que tenemos una imagen con tres píxeles (A, B, C) y tres clases: fondo, objeto A y objeto B. Las verdaderas etiquetas serían:

Píxel A: [0, 1, 0] (objetos A)
Píxel B: [0, 0, 1] (objeto B)
Píxel C: [1, 0, 0] (fondo)

Si nuestro modelo predice lo siguiente:

Píxel A: [0.2, 0.7, 0.1]
Píxel B: [0.1, 0.1, 0.8]
Píxel C: [0.9, 0.05, 0.05]

La cross-entropy se calcularía como sigue:

import numpy as np

def cross_entropy(y_true, y_pred):
    return -np.sum(y_true * np.log(y_pred))

# Ejemplo de etiquetas reales y predicciones
y_true = np.array([[0, 1, 0], [0, 0, 1], [1, 0, 0]])
y_pred = np.array([[0.2, 0.7, 0.1], [0.1, 0.1, 0.8], [0.9, 0.05, 0.05]])

# Cálculo de la cross-entropy
loss = cross_entropy(y_true, y_pred)
print(f"Loss: {loss}")

Errores típicos / trampas

Escalado impropio: La cross-entropy no es invariante a las escalas de los píxeles. Si una clase tiene un alto número de píxels en la imagen, el error de esa clase puede dominar la pérdida total.

Desbalanceo de clases: Si algunas clases son mucho más frecuentes que otras (desbalanceadas), la cross-entropy se vuelve sesgada hacia las clases menos representadas. Es importante normalizar o ponderar las pérdidas según la distribución de clases en el conjunto de datos.

Máscaras no binarias: Asegúrate de que tus etiquetas sean binarias (0 y 1) o probabilidad (0 a 1). Cualquier valor fuera de este rango puede distorsionar los cálculos de cross-entropy.

Checklist accionable

Verifica las etiquetas: Asegúrate de que tus etiquetas estén correctamente codificadas y no contengan valores erróneos.
Normaliza la distribución de clases: Usa técnicas como class weighting para equilibrar el impacto de cada clase en la pérdida total.
Pon atención a la escalabilidad: Ajusta el modelo para manejar imágenes de diferentes tamaños sin perder proporciones.
Implementa regularización: Considera aplicar regularización (como dropout) para evitar overfitting, especialmente con conjuntos de datos pequeños o desbalanceados.
Monitorea la convergencia: Monitorea los valores de pérdida durante el entrenamiento y ajusta parámetros como learning rate si es necesario.

Cierre: Siguientes pasos

Aprende a manejar problemas de clasificación multiclase más complejos.
Explora otros tipos de pérdidas: Aunque la cross-entropy es poderosa, puede ser útil combinarla con otras funciones como Dice loss para mejorar el rendimiento en ciertos casos.
Integra validación cruzada y cross-validation: Estas técnicas ayudarán a evaluar mejor el desempeño del modelo en datos no vistos.

La cross-entropy es una herramienta indispensable en la segmentación de imágenes, pero su uso efectivo requiere un entendimiento cuidadoso de sus limitaciones y trucos para manejarlos.