PyTorch desde cero, Unidad 5 — Construcción de modelos con torch.nn, 5.1 — Módulos y capas · 13/01/2026

Capas densas

Capas densas: Construcción de modelos con PyTorch

Introducción

Las capas densas, también conocidas como capas lineales, son fundamentales en la construcción de redes neuronales. En el contexto de PyTorch, nn.Linear es una clase que implementa estas capas. Las capas densas se utilizan para transformar tensores bidimensionales (matrices) a otros con un número diferente de columnas, lo cual es crucial en la mayoría de los modelos de aprendizaje profundo. Es importante entender cómo funcionan las capas densas y cómo implementarlas correctamente en PyTorch para construir modelos efectivos.

Explicación principal

En PyTorch, la clase nn.Linear se utiliza para crear una capa lineal o densa. Esta capa multiplica los tensores de entrada por un tensor de pesos (W) y luego suma un sesgo (b). La fórmula matemática para una capa lineal es:

\[ Y = X \times W + b \]

Donde:

\(X\) es el tensores de entrada.
\(Y\) es el tensores de salida.
\(W\) son los pesos.
\(b\) es el sesgo.

Veamos un ejemplo simple en PyTorch:

import torch

# Definir una capa lineal con 30 entradas y 15 salidas
linear_layer = nn.Linear(in_features=30, out_features=15)

# Crear un tensor de entrada de tamaño (2, 30)
input_tensor = torch.randn(2, 30)

# Pasar el tensores a la capa lineal
output_tensor = linear_layer(input_tensor)

print(output_tensor.shape)  # Salida: torch.Size([2, 15])

Errores típicos / trampas

Pesos no inicializados: No inicializar correctamente los pesos puede llevar a malentendidos en el entrenamiento del modelo. Es recomendable utilizar una distribución inicial uniforme o normal.

    # Ejemplo incorrecto de inicialización
    linear_layer = nn.Linear(in_features=30, out_features=15)
    
    # Ejemplo correcto con inicialización
    linear_layer = nn.Linear(in_features=30, out_features=15)
    linear_layer.weight.data.normal_(mean=0.0, std=0.02)  # Inicializar con una distribución normal

Dimensiones incorrectas: La dimensión del tensor de entrada debe coincidir con el parámetro in_features. Si no es así, obtendrás un error.

Sesgo inexistente o mal manejado: Asegúrate de que el sesgo esté presente y se maneje correctamente durante la propagación hacia adelante.

Checklist accionable

Verifica las dimensiones del tensor de entrada: Asegúrate de que coincidan con in_features en nn.Linear.
Inicializa los pesos apropiadamente: Utiliza una distribución inicial que sea adecuada para el problema.
Agrega un sesgo: Si estás usando una capa lineal, asegúrate de incluir un sesgo (b) en la fórmula.
Usa requires_grad=True si es necesario entrenar los pesos: Esto permite que los pesos se actualicen durante el entrenamiento.
Maneja correctamente las dimensiones del output: Verifica que los tensores de salida tienen las dimensiones esperadas.

Siguientes pasos

Explora la documentación oficial de PyTorch para entender más sobre nn.Linear y otras capas disponibles.
Implementa una capa densa en un modelo simple: Prueba a implementar una capa densa en un pequeño proyecto, como clasificar imágenes o predecir valores numéricos.
Expande tu conocimiento a través de la exploración de otros tipos de capas, como nn.Conv2d para convoluciones y nn.ReLU para funciones de activación.

Siguiendo estos pasos, podrás construir modelos más complejos y efectivos en PyTorch.