TensorFlow desde cero, Unidad 9 — Uso de TensorFlow con distintos tipos de datos, 9.2 — Introducción a imágenes y secuencias · 13/01/2026

Tensores 2D y 3D

Tensores 2D y 3D: Una Introducción a Imágenes y Secuencias en TensorFlow

Introducción

En el campo de la inteligencia artificial, especialmente en los modelos basados en redes neuronales para procesar imágenes y secuencias, entender cómo trabajar con tensores 2D (también conocidos como matrices) y 3D es fundamental. Estos tensores son una representación matemática que permite modelar las características de las imágenes y secuencias de datos en forma de matices o series temporales.

Las imágenes, por ejemplo, se pueden considerar como una matriz bidimensional donde cada píxel tiene valores correspondientes a sus canales (como rojo, verde y azul en un color RGB). De manera similar, las secuencias de datos, como las secuencias de caracteres o los tiempos series, también se representan usando tensores 2D. A menudo, estas secuencias pueden ser extendidas a tensores 3D para agregar una dimensión adicional (como en el caso de secuencias de imágenes).

Explicación principal con ejemplos

Tensores 2D: Imágenes

En TensorFlow, las imágenes se representan como tensores 3D. Cada píxel de la imagen es una dimensión adicional a la matriz bidimensional (altura x ancho). Si estamos trabajando con imágenes en color RGB, entonces nuestro tensor tendrá 3 canales adicionales (uno para cada color).

import tensorflow as tf

# Crear un tensor 2D de ejemplo: una imagen de 3x4 píxeles en escala de grises
imagen = tf.constant([
    [[10], [20], [30]],
    [[40], [50], [60]],
    [[70], [80], [90]]
])

# Mostrar el tensor
print(imagen)

Tensores 3D: Secuencias

Las secuencias de datos, como las secuencias de caracteres o series temporales, se representan normalmente con tensores 2D. En la caso de las secuencias de texto, donde cada caracter es una dimensión adicional a la matriz bidimensional (largo de la secuencia x tamaño del vocabulario).

# Crear un tensor 3D de ejemplo: una secuencia de 5 caracteres con 26 posibles valores para cada caracter (mayúsculas y minúsculas)
secuencia = tf.constant([
    [[0], [1], [2], [3], [4]]
])

# Mostrar el tensor
print(secuencia)

Ejemplo completo: Procesamiento de una imagen en TensorFlow

import tensorflow as tf

# Crear un ejemplo de imagen (Tensor 3D)
imagen = tf.constant([
    [[10, 20], [30, 40]],
    [[50, 60], [70, 80]]
])

# Mostrar la imagen en formato tensor
print(imagen)

# Procesar la imagen (por ejemplo, convolución)
convolucion = tf.nn.conv2d(
    input=imagen,
    filters=tf.constant([[[1., 1.], [1., 1.]], [[1., 1.], [1., 1.]]]),
    strides=[1, 1, 1, 1],
    padding='SAME'
)

# Mostrar el resultado de la convolución
print(convolucion)

Errores típicos / trampas

Dimensiones incorrectas: Asegúrate siempre de que las dimensiones del tensor estén correctas. Por ejemplo, si tienes una imagen en escala de grises (Tensor 2D), asegura que no intentes usarlo como Tensor 3D.

Operaciones incompatibles: Verifica que las operaciones a realizar sean compatibles con el tipo y dimensión del tensor. La convolución requiere tensores con la estructura correcta (Tensor 4D).

Uso incorrecto de funcionalidades Keras: Asegúrate de usar correctamente los métodos proporcionados por Keras para manejar secuencias, como tf.keras.preprocessing.sequence.pad_sequences o tf.keras.layers.Embedding.

Checklist accionable

Verifica las dimensiones del tensor: Antes de realizar cualquier operación, verifica que las dimensiones del tensor sean correctas.
Usa funciones adecuadas para secuencias: Si estás trabajando con secuencias, asegúrate de usar la función tf.keras.preprocessing.sequence.pad_sequences para ajustar todas tus secuencias a la misma longitud.
Maneja correctamente las convoluciones 2D: Asegúrate de que tus tensores tengan la estructura correcta (Tensor 4D) antes de realizar operaciones de convolución.
Normaliza tus datos adecuadamente: Normaliza las imágenes y secuencias para mejorar el rendimiento del modelo.
Usa callbacks para ajustar hiperparámetros: Utiliza tf.keras.callbacks.ModelCheckpoint o tf.keras.callbacks.ReduceLROnPlateau para monitorear y ajustar los hiperparámetros durante la entrenamiento.

Cierre: Siguientes pasos

Aplicación práctica: Prueba el uso de tensores 2D y 3D en proyectos prácticos, como clasificación de imágenes o procesamiento de lenguaje natural.
Explorar más profundamente: Investiga sobre convoluciones 3D para secuencias espaciales y temporales (como en redes RNN).
Optimización: Asegúrate de optimizar el uso de GPU y CPU para aprovechar al máximo tus recursos.

Siguiendo estos pasos, podrás trabajar eficazmente con tensores 2D y 3D en TensorFlow para procesar imágenes y secuencias de datos.