Probabilidad y estadística para IA, Unidad 6 — Inferencia estadística (sin formalismos), 6.2 — Hipótesis y contrastes · 13/01/2026

p-value (intuición real)

Introducción

En la inferencia estadística, el p-value es una medida crucial que nos ayuda a decidir si los datos de muestra son consistentes con un modelo hipotético. Es especialmente relevante en el análisis de modelos de machine learning y deep learning, donde es común contrastar hipótesis sobre las características o comportamientos de esos modelos.

La interpretación del p-value puede ser engañosa y a menudo se malentendida. Este artículo ofrece una explicación intuitiva del concepto, junto con ejemplos prácticos para ilustrar su uso y limitaciones. También identificaremos algunas de las trampas comunes que los científicos de datos pueden caer en cuando trabajan con p-values.

Explicación principal

¿Qué es un p-value?

Un p-value es la probabilidad de observar una estadística tan extrema o más extremada, bajo la suposición de que la hipótesis nula es verdadera. En otros términos, si la hipótesis nula es cierta, el p-value indica cuán rara sería obtener un resultado tan extremo.

Ejemplo práctico

Supongamos que estamos desarrollando un modelo de clasificación binaria y queremos contrastar si la tasa de acierto del modelo (por ejemplo, 80%) es significativamente diferente a 50% (la tasa esperada al azar).

from scipy.stats import chi2_contingency

# Supongamos que tenemos los siguientes datos de prueba y falsos positivos/negativos
test_pos = 100  # Número de pruebas correctas
test_neg = 50   # Número de pruebas incorrectas (falsos negativos)
false_pos = 20  # Número de falsos positivos
false_neg = 30  # Número de falsos negativos

# Creamos una tabla de contingencia
contingency_table = [[test_pos, test_neg], [false_pos, false_neg]]

# Calculamos el p-value utilizando chi-cuadrado
chi2, p_value, dof, expected = chi2_contingency(contingency_table)

print(f"p-value: {p_value}")

Si p-value es menor que un umbral de significancia (generalmente 0.05), se rechaza la hipótesis nula y concluimos que el modelo tiene una tasa de acierto diferente a 50%.

Trampas comunes

p-value no mide efectividad: Aunque un p-value bajo sugiere que los datos son rara vez observados, esto no implica que el modelo sea efectivo o útil. Un modelo con alta tasa de falsos positivos o negativos puede tener un p-value bajo.

Interpretación incorrecta del umbral de significancia: A menudo se asume que un p-value menor a 0.05 es suficiente para rechazar la hipótesis nula. Sin embargo, esto no garantiza que el modelo sea correcto o efectivo.

Error múltiple (multiple comparison): Si se realiza una gran cantidad de contrastes, incluso si cada p-value es menor a 0.05, hay un alto riesgo de falsos positivos. Por ejemplo, si realizas 100 contrastes, esperarías al menos 5 falsos positivos solo por azar.

Hipótesis nula incorrecta: En muchos casos, la hipótesis nula se formula como "no hay efecto" o "no hay diferencia". Esto puede ser engañoso y llevar a conclusiones erróneas si el efecto real es pequeño pero significativo.

p-value no mide tamaño de efecto: Un p-value bajo puede indicar una relación fuerte, pero no necesariamente significa que esa relación sea práctica o significativa en términos del problema real.

Checklist accionable

Revisar el contexto: Asegúrate de entender completamente la pregunta de investigación y la hipótesis nula.
Escoger el umbral de significancia cuidadosamente: Considera cuidadosamente qué umbral consideras adecuado para tu estudio, teniendo en cuenta el riesgo de falsos positivos.
Corregir por múltiples contrastes: Si realizas múltiples contrastes, asegúrate de corregir tus p-values utilizando técnicas como la corrección de Bonferroni o el método de control de error familiares (FWER).
Interpretar el tamaño del efecto: Evalúa no solo los p-values, sino también el tamaño del efecto para entender si los resultados son prácticos y significativos.
Validar hipótesis nula: Asegúrate de que la hipótesis nula esté bien definida y adecuada. Si es posible, considera contrastes alternativos.

Cierre: Siguientes pasos

Aprende más sobre p-values en estudios controlados: Utiliza ejemplos reales o simula escenarios para entender mejor cómo funcionan los p-values.
Aplica correcciones múltiples en tus proyectos: Asegúrate de considerar el error múltiple al realizar contrastes simultáneos.
Evaluación continua del modelo: Continúa monitoreando y evaluando tu modelo para asegurar que sigue siendo efectivo a medida que cambian los datos.

En resumen, aunque el p-value es una herramienta valiosa en la inferencia estadística, su interpretación debe ser cuidadosa y no debe tomarse como la única fuente de verdad.

p-value (intuición real)

p-value (intuición real)

Introducción

Explicación principal

¿Qué es un p-value?

Ejemplo práctico

Trampas comunes

Checklist accionable

Cierre: Siguientes pasos

Contacta e inscríbete

Contacto