Redes neuronales desde cero, Unidad 2 — La neurona artificial, 2.2 — Funciones de activación · 13/01/2026

Sigmoid

Sigmoid: Una función de activación esencial en redes neuronales

Introducción

En la arquitectura de una red neuronal, las funciones de activación juegan un papel crucial en determinar cómo se procesa y transforman los datos a través de las capas. La sigmoid es una de las funciones de activación más utilizadas debido a su capacidad para convertir valores continuos en probabilidades entre 0 y 1. Sin embargo, también presenta desafíos y limitaciones que debemos entender para aplicarla correctamente.

Explicación principal

La función sigmoide tiene la siguiente forma matemática: \[ \sigma(x) = \frac{1}{1 + e^{-x}} \] donde \(e\) es la base de los números naturales. Esta función mapea cualquier valor real a un rango entre 0 y 1, lo que la hace especialmente útil en problemas de clasificación binaria.

Ejemplo práctico

Imagina una red neuronal usada para detectar si una imagen contiene un perro o no. En la última capa (capa de salida), podríamos usar la función sigmoide para obtener una probabilidad:

import numpy as np

def sigmoid(x):
    return 1 / (1 + np.exp(-x))

# Ejemplo: Salida de una neurona en la última capa
output = 0.8567
probability = sigmoid(output)
print(f"Probabilidad: {probability:.2f}")

Errores típicos / trampas

Aunque la función sigmoide es popular, también tiene desventajas y limitaciones que debemos considerar:

Degeneración en la retropropagación: La derivada de la sigmoid se vuelve muy pequeña cuando \(x\) es muy grande o muy pequeño (cercano a 0). Esto puede causar problemas durante el entrenamiento, especialmente con gradientes pequeños.

Máxima pérdida de información: La función sigmoide compresiona los valores en un rango limitado entre 0 y 1, lo que puede perder detalles importantes del dato original si estos valores están muy extensos.

Problemas con equilibrio desequilibrado: En problemas donde hay una proporción extremadamente desequilibrada de datos positivos e negativos (por ejemplo, 90% negativos y 10% positivos), la función sigmoide puede dar resultados sesgados.

Checklist accionable

Para implementar correctamente la función sigmoide en tus redes neuronales:

Verifica el rango de entrada: Asegúrate de normalizar los valores de entrada para evitar que los gradientes se reduzcan a cero.
Implementa la función y su derivada: Es importante tener tanto la función sigmoide como su derivada para realizar el descenso por gradiente durante el entrenamiento.
Monitorea el balance de datos: Si trabajas con problemas desequilibrados, considera técnicas adicionales como re-ponderación o oversampling.
Ejemplo de implementación:

    def sigmoid(x):
        return 1 / (1 + np.exp(-x))
    
    def sigmoid_derivative(x):
        return x * (1 - x)

Prueba con otros datos: Experimenta con diferentes tipos de problemas y conjuntos de datos para ver si la función sigmoide es adecuada.

Cierre: Siguientes pasos

Para profundizar en el uso efectivo de funciones de activación, considera:

Explorar otras funciones de activación: Aprende sobre ReLU, Softmax y Tanh.
Implementar Redes Neuronales con PyTorch o TensorFlow: Utiliza frameworks para simplificar la implementación y experimentar con diferentes arquitecturas.
Aplica conocimientos a un proyecto real: Desarrolla una red neuronal desde cero en Python, sin usar frameworks, para entender completamente su funcionamiento.

Siguiendo estos pasos, podrás aprovechar al máximo las capacidades de la función sigmoide y mejorar tus habilidades en la implementación de redes neuronales.