Redes convolucionales (CNN), Unidad 5 — Pooling y reducción espacial, 5.2 — Tipos de pooling · 13/01/2026

Average pooling

Introducción

En el campo de la visión por computador, las redes convolucionales (CNN) son una herramienta esencial para procesar y analizar imágenes. Una de las técnicas clave en estas arquitecturas es el pooling, que ayuda a reducir la dimensionalidad del tensor de características mientras mantienen la información más relevante. En esta unidad, nos enfocaremos en un tipo específico de pooling: average pooling.

Explicación principal con ejemplos

Qué es average pooling

Average pooling es una técnica de reducción espacial que calcula el promedio de los valores dentro de una ventana (o kernel) moviéndose a través del mapa de características. Esta operación se aplica en cada canal del tensor de entrada y se realiza con un paso definido (commonly referred to as the "stride").

Ejemplo práctico

Vamos a ilustrar cómo funciona average pooling con una simple representación numérica. Imagina que tenemos el siguiente mapa de características (tensor) 3x3:

Tensor = [[1, 2, 3],
          [4, 5, 6],
          [7, 8, 9]]

Si aplicamos average pooling con un kernel de 2x2 y stride de 2, el nuevo mapa de características se verá así:

Pooled Tensor = [[(1+4)/2, (3+6)/2],
                 [(7+10)/2, (9+12)/2]]

En este ejemplo, la operación es:

Promedio en la posición (0, 0): \((1 + 4) / 2 = 2.5\)
Promedio en la posición (0, 1): \((3 + 6) / 2 = 4.5\)
Y así sucesivamente.

Ejemplo de código

Aquí tienes un pequeño bloque de Python para ilustrar cómo se implementa average pooling:

import numpy as np

def average_pooling(input_tensor, kernel_size=(2, 2), stride=2):
    rows = len(input_tensor)
    cols = len(input_tensor[0])
    
    # Calculamos las nuevas dimensiones del tensor después de pooling
    new_rows = (rows - kernel_size[0]) // stride + 1
    new_cols = (cols - kernel_size[1]) // stride + 1
    
    pooled_tensor = np.zeros((new_rows, new_cols))
    
    for i in range(new_rows):
        for j in range(new_cols):
            # Calculamos el promedio del sub-tensor correspondiente
            start_row = i * stride
            end_row = start_row + kernel_size[0]
            start_col = j * stride
            end_col = start_col + kernel_size[1]
            
            pooled_tensor[i, j] = np.mean(input_tensor[start_row:end_row, start_col:end_col])
    
    return pooled_tensor

# Ejemplo de uso
input_tensor = np.array([[1, 2, 3],
                        [4, 5, 6],
                        [7, 8, 9]])

pooled_tensor = average_pooling(input_tensor)
print(pooled_tensor)

Errores típicos / trampas

Trampa #1: No entender la resolución después del pooling

Average pooling puede reducir drásticamente el tamaño de los mapas de características. Si no ajustas correctamente tu modelo o si no entiendes cómo afecta esta reducción en resolución a la capacidad de extracción de características, podrás tener problemas.

Trampa #2: Ignorar la sobreajuste al usar average pooling

Como cualquier técnica de agregación, average pooling puede conducir a la sobreajuste si no se usa con cuidado. Es importante balancear el grado de reducción espacial y la cantidad de detalles que quieres preservar.

Trampa #3: Usar tamaños de kernel inadecuados

Los tamaños del kernel deben ser seleccionados cuidadosamente para capturar los patrones adecuados en las imágenes. Un tamaño demasiado grande puede perder detalle, mientras que uno muy pequeño puede no reducir eficientemente la dimensionalidad.

Checklist accionable

Asegúrate de entender cómo funciona el promedio en términos numéricos.
Implementa average pooling usando un kernel y stride adecuados para tu tarea específica.
Valida tus implementaciones con varios ejemplos pequeños antes de usarlas en modelos más grandes.
Monitorea la resolución después del pooling para evitar reducciones excesivas.
Evaluas el balance entre reducción espacial y preservación de detalles en tu modelo.

Cierre

En conclusión, average pooling es una técnica poderosa pero con cuidados que deben considerarse al implementarla en arquitecturas CNN. Al comprender cómo funciona y cuándo utilizarlo correctamente, puedes mejorar significativamente la eficiencia de tus modelos sin perder información crítica.

Siguientes pasos

Explora diferentes tamaños de kernel y strides para ver qué mejoran tu modelo.
Experimenta con combinaciones de pooling (average + max) para obtener el balance perfecto.
Revisa los modelos preentrenados que utilizan average pooling y entiende cómo se ajustan a sus tareas específicas.

Average pooling

Average pooling

Introducción

Explicación principal con ejemplos

Qué es average pooling

Ejemplo práctico

Ejemplo de código

Errores típicos / trampas

Trampa #1: No entender la resolución después del pooling

Trampa #2: Ignorar la sobreajuste al usar average pooling

Trampa #3: Usar tamaños de kernel inadecuados

Checklist accionable

Cierre

Siguientes pasos

Contacta e inscríbete

Contacto