Logo de CursoIA
CursoIA Curso de Inteligencia Artificial

Probabilidad y estadística para IA, Unidad 6 — Inferencia estadística (sin formalismos), 6.2 — Hipótesis y contrastes ·

Hipótesis nula y alternativa

Hipótesis nula y alternativa

Introducción

En la inferencia estadística, las hipótesis nula y alternativa son fundamentales para tomar decisiones basadas en datos. Estas herramientas permiten formular una pregunta de investigación o un problema a resolver, y luego probar si los datos proporcionan evidencia suficiente para respaldar esa afirmación.

Explicación principal

Definición de hipótesis nula (H₀)

La hipótesis nula es la afirmación que se hace sin base alguna. Representa el estado de affairs "sin efecto" o "ningún cambio". En términos de modelos estadísticos, H₀ a menudo significa que los datos no presentan una diferencia significativa entre grupos comparados.

Definición de hipótesis alternativa (H₁)

La hipótesis alternativa es la afirmación que se hace cuando se rechaza la hipótesis nula. Representa el estado de affairs "hay un efecto" o "existe una diferencia". H₁ sugiere que los datos presentan una diferencia significativa entre grupos comparados.

Estructura típica

La estructura básica para formular estas hipótesis es:

  • Hipótesis nula (H₀): No existe una diferenciación o relación estadísticamente significativa.
  • Hipótesis alternativa (H₁): Existe una diferenciación o relación.

Ejemplo práctico

Supongamos que estás desarrollando un nuevo algoritmo de clasificación para detectar imágenes de perros y gatos. Tu hipótesis podría ser:

  • Hipótesis nula (H₀): El algoritmo no tiene una precisión significativamente superior a la aleatoriedad.
  • Hipótesis alternativa (H₁): El algoritmo tiene una precisión significativamente superior a la aleatoriedad.

Ejemplo de código

import numpy as np
from scipy.stats import ttest_ind

# Datos ficticios para demostración
datos_aleatorio = np.random.rand(100)
precisión_nuevo_algoritmo = [0.85] * 100  # Suponiendo una precisión del algoritmo del 85%

t_stat, p_value = ttest_ind(precisión_nuevo_algoritmo, datos_aleatorio)

if p_value < 0.05:
    print("Rechazamos la hipótesis nula en favor de la alternativa")
else:
    print("No hay evidencia suficiente para rechazar la hipótesis nula")

Errores típicos / trampas

  1. Hipótesis de confirmación: Algunos investigadores pueden formular una hipótesis después de ver los datos, lo que puede llevar a sesgos. Es crucial establecer las hipótesis antes de recoger o analizar datos.
  1. Rechazo de la nula por error: Si H₀ es rechazada, no se puede concluir que H₁ es cierto. Simplemente significa que hay evidencia suficiente para sugerir que H₁ podría ser verdadero.
  1. Hipótesis uno-sided vs dos-sided: Las hipótesis one-sided asumen una dirección específica de la diferencia (por ejemplo, el algoritmo es mejor). Las hipótesis two-sided no hacen ninguna suposición sobre la dirección. Usar la dirección incorrecta puede llevar a conclusiones erróneas.

Checklist accionable

  1. Establece las hipótesis antes de recoger datos: Evita sesgos y asegura que la investigación sea objetiva.
  2. Verifica el nivel de significancia (α): Comprueba si los resultados son estadísticamente significativos con base en tus criterios.
  3. Evalúa el poder estadístico del test: Asegúrate de que tu prueba tiene una alta probabilidad de detectar un efecto real, si existe uno.
  4. Interpreta correctamente la p-value: Una p-value baja solo sugiere evidencia en contra de H₀; no confirma H₁.
  5. Considera los errores de tipo I y II: Un error de tipo I ocurre al rechazar una hipótesis nula verdadera (falso positivo), mientras que un error de tipo II es cuando se acepta una hipótesis nula falsa (falso negativo).

Cierre

Siguientes pasos

  1. Aprende más sobre los tipos de tests estadísticos: Conoce cómo diferentes pruebas (como t-test, ANOVA) funcionan y cuándo son apropiados.
  2. Practica la interpretación correcta de resultados: Asegúrate de que tus conclusiones estén respaldadas por datos significativos.
  3. Revisa el uso de hipótesis en tu trabajo actual: Aplica estos principios a proyectos actuales para mejorar la calidad y transparencia.

Siguiendo estas directrices, podrás utilizar eficazmente las hipótesis nula y alternativa para mejorar tus modelos predictivos e investigación.

Contacto

Indica tu objetivo (ChatGPT, RAG, agentes, automatización) y tu stack (web/backend).