Logo de CursoIA
CursoIA Curso de Inteligencia Artificial

Probabilidad y estadística para IA, Unidad 4 — Estadística descriptiva para IA, 4.3 — Forma de la distribución ·

Curtosis

Curtosis: Medida de la forma asimétrica y aplatisamiento de una distribución

Introducción

La curtosis es una medida estadística que nos ayuda a entender la forma de una distribución, específicamente cuánto más "aplastada" o "aguda" es en comparación con la distribución normal (gaussiana). Es una parte crucial del análisis descriptivo de datos y es especialmente relevante en inteligencia artificial para comprender mejor los patrones en los datos. A través de esta medida, podemos identificar si una distribución tiene colas más largas o más cortas que la normal, lo cual puede indicar el grado de outliers (outliers) presentes en nuestros datos.

Explicación principal con ejemplos

La curtosis se calcula a partir del cuarto momento central de una distribución. Se define como:

\[ \gamma_2 = \frac{\mu_4}{\sigma^4} - 3 \]

Donde:

  • \(\mu_4\) es el cuarto momento central,
  • \(\sigma\) es la desviación estándar.

La fórmula se ajusta para que la curtosis de una distribución normal (gaussiana) sea igual a 0. Si la curtosis es mayor que cero, la distribución tiene colas más largas y más asimétricas en comparación con la gaussiana. Si es menor que cero, la distribución es menos apaisada.

Ejemplo: Calculando curtosis

Supongamos que tenemos una muestra de datos:

import numpy as np

# Generar una muestra de datos normalmente distribuidos
np.random.seed(0)
data = np.random.normal(loc=0, scale=1, size=1000)

# Calcular la curtosis usando scipy.stats.kurtosis
from scipy.stats import kurtosis
kurtosis_value = kurtosis(data, fisher=False)  # fisher=True ajusta a cero la curtosis de una distribución normal

print(f"Curtosis: {kurtosis_value}")

En este ejemplo, fisher=False implica que la curtosis se reporta en términos absolutos y no se ajusta para comparar con la gaussiana (si lo fuera, restaría 3).

Errores típicos / trampas

  1. Confundir curtosis con asimetría: La asimetría mide la simetria de una distribución, mientras que la curtosis mide su "aplastamiento" en comparación con la gaussiana. Ambas son medidas importantes pero diferentes.
  1. Interpretar la curvatura sin contexto: Es fácil confundirse sobre qué significa exactamente un valor de curtosis positivo o negativo sin referenciarlo a una distribución conocida o a los datos específicos del problema.
  1. Ignorar que la asimetría puede afectar la interpretación: Un alto grado de asimetría en combinación con curvatura extrema puede indicar datos anormales (outliers) y requiere un análisis adicional.

Checklist accionable

  • Asegúrate de entender qué significa una curtosis positiva o negativa.
  • Calcula la curtosis de varias distribuciones conocidas (como normal, binomial y Poisson).
  • Revisa los datos para identificar si hay outliers que puedan afectar la curvatura.
  • Analiza cómo la curtosis puede influir en el comportamiento de modelos predictivos.

Cierre con "Siguientes pasos"

Ahora que has aprendido sobre la curtosis, aquí tienes algunos próximos pasos:

  1. Practica más: Aplica el cálculo de curtosis a diferentes conjuntos de datos y observa cómo cambia en función del tipo de distribución.
  2. Analiza modelos: Considera cómo la curvatura afecta los modelos predictivos, especialmente en problemas donde la normalidad no es asumida (como regresión logística).
  3. Explora correlaciones: Comprueba si hay una relación entre la curtosis y otros parámetros estadísticos como la varianza o el coeficiente de asimetría.

Siguiendo estos pasos, podrás mejorar tu comprensión del comportamiento de los datos en aplicaciones de inteligencia artificial.

Contacto

Indica tu objetivo (ChatGPT, RAG, agentes, automatización) y tu stack (web/backend).