Logo de CursoIA
CursoIA Curso de Inteligencia Artificial

SQL para ciencia de datos, Unidad 3 — Agregaciones y estadística básica, 3.1 — Funciones de agregación ·

COUNT

COUNT: Una herramienta esencial para la ciencia de datos

Introducción

En el mundo de la ciencia de datos, COUNT es una función de agregación fundamental que nos permite contar las filas en un conjunto de datos. Es esencial para entender y describir los datos a nivel basico. Aunque parece simple, su uso correcto puede hacer toda la diferencia en análisis complejos. En este artículo, exploraremos cómo usar COUNT, veremos algunos ejemplos prácticos y discutiremos errores comunes al usar esta función.

Explicación principal con ejemplos

¿Cuándo usar COUNT?

COUNT() es una función de agregación que se utiliza para contar el número total de filas en un conjunto de datos, o en una columna específica. Es especialmente útil cuando necesitas saber cuántos registros existen en una tabla, cuántos valores no están nulos en una columna particular, o cuántas veces aparece cierta categoría en tus datos.

Ejemplo práctico

Supongamos que tenemos una base de datos para un sistema de e-commerce llamado orders con las siguientes columnas: order_id, customer_id, product_id, y quantity.

SELECT COUNT(*) AS total_orders FROM orders;

Este comando nos devolverá el número total de órdenes en la tabla.

Si deseamos contar cuántos clientes únicos hay:

SELECT COUNT(DISTINCT customer_id) AS unique_customers FROM orders;

Este comando usará COUNT con DISTINCT, lo que significa que solo contará los valores únicos de customer_id.

Ejemplo de uso en combinación

Podemos combinar COUNT con otras funciones de agregación para obtener una visión más completa:

SELECT 
    product_id, 
    COUNT(*) AS total_orders,
    SUM(quantity) AS total_quantity_sold
FROM orders
GROUP BY product_id;

Este comando nos mostrará cuántas veces se ha vendido cada producto y la cantidad total de unidades vendidas.

Errores típicos / trampas

  1. **Olvidar usar COUNT(*) en una consulta sin agrupación**:
  • Error: SELECT * FROM orders;
  • Solución: Si no usas COUNT(*), deberías estar usando una cláusula GROUP BY o otra forma de agregación.
  1. No usar DISTINCT cuando se requiere contar valores únicos:
  • Error: SELECT COUNT(order_id) FROM orders;
  • Solución: Si deseas saber cuántos clientes diferentes compraron, usa COUNT(DISTINCT customer_id) en lugar de COUNT(order_id).
  1. Ignorar el uso del WHERE para filtrar antes de contar:
  • Error: SELECT COUNT(*) FROM orders;
  • Solución: Si solo quieres contar las órdenes que cumplen ciertas condiciones, usa una cláusula WHERE antes de aplicar COUNT.

Checklist accionable

  1. **Utiliza COUNT(*) en consultas sin agrupación**.
  2. Asegúrate de usar COUNT(DISTINCT) cuando necesites contar valores únicos.
  3. Incluye WHERE para filtrar los datos relevantes antes del conteo.
  4. Verifica que tus resultados sean coherentes con el negocio.
  5. Comprueba la sintaxis y las cláusulas utilizadas en tu consulta SQL.

Cierre

Siguientes pasos

  • Aprende a usar COUNT(DISTINCT) para contar valores únicos de una columna.
  • Practica con conjuntos de datos reales para entender mejor cómo funciona COUNT en diferentes contextos.
  • Expón tus consultas SQL a expertos o colegas para recibir feedback.

El uso correcto de COUNT es solo el principio. Con la práctica y el entendimiento adecuado, podrás aplicarlo en diversas situaciones de análisis de datos para obtener insights valiosos.

Contacto

Indica tu objetivo (ChatGPT, RAG, agentes, automatización) y tu stack (web/backend).