Logo de CursoIA
CursoIA Curso de Inteligencia Artificial

SQL para ciencia de datos, Unidad 2 — Fundamentos de SQL orientados a datos, 2.1 — SELECT como herramienta de análisis ·

Selección de columnas

Selección de columnas

Introducción

La selección de columnas es una operación fundamental en SQL que permite a los analistas de datos y científicos de datos trabajar con conjuntos de datos más pequeños y manejables. Esta operación se realiza a través del uso de la cláusula SELECT, lo cual puede optimizar el rendimiento al minimizar la cantidad de información que se procesa y transferencia. Es especialmente valioso en contextos donde los volúmenes de datos son grandes, ya que puede reducir la latencia y mejorar la eficiencia del análisis.

Explicación principal con ejemplos

La cláusula SELECT es utilizada para especificar las columnas que queremos extraer de una tabla. La sintaxis básica se ve así:

SELECT columna1, columna2, ...
FROM nombre_de_la_tabla;

Por ejemplo, si estamos trabajando con un conjunto de datos sobre ventas y solo necesitamos la información de los productos vendidos en cierta fecha, podemos escribir:

SELECT producto_id, nombre_producto, precio_unitario
FROM ventas
WHERE fecha = '2023-10-01';

En este ejemplo, estamos seleccionando las columnas producto_id, nombre_producto y precio_unitario del conjunto de datos ventas, solo para los registros donde la columna fecha es igual a '2023-10-01'.

Ejemplo avanzado

Imaginemos que tenemos una tabla llamada pedidos con varias columnas, incluyendo id_pedido, cliente_id, producto_id, cantidad, precio_unitario y fecha_pedido. Si queremos obtener un resumen financiero por producto para los pedidos realizados en el mes de octubre de 2023, podríamos escribir:

SELECT producto_id, SUM(cantidad * precio_unitario) AS valor_total_producto
FROM pedidos
WHERE MONTH(fecha_pedido) = 10 AND YEAR(fecha_pedido) = 2023
GROUP BY producto_id;

En este caso, estamos seleccionando la columna producto_id y calculando el valor total de cada producto vendido en octubre de 2023. La cláusula SUM(cantidad * precio_unitario) se utiliza para calcular el monto total de venta por cada producto.

Errores típicos / trampas

  1. Seleccionar todas las columnas: Una práctica común es seleccionar todas las columnas usando SELECT *. Sin embargo, esto puede llevar a problemas de rendimiento y seguridad, especialmente en tablas muy grandes o en sistemas donde se accede a los datos desde diferentes aplicaciones.
  1. No usar alias para nombres largos o complejos: Si una columna tiene un nombre largo o complejo que incluye espacios, es mejor darle un alias corto y descriptivo usando la cláusula AS. Esto no solo hace el código más legible, sino que también puede mejorar el rendimiento en algunos sistemas de gestión de bases de datos.
  1. No utilizar índices adecuadamente: Si las columnas seleccionadas son parte de un índice, asegúrate de que ese índice esté correctamente definido y actualizado para optimizar la consulta.

Checklist accionable

  1. Revisa las columnas necesarias: Antes de realizar una consulta, asegúrate de identificar con precisión cuáles son las columnas estrictamente necesarias.
  2. Usa alias adecuados: Si un nombre de columna es largo o complejo, considera usar un alias corto y descriptivo para mejorar la legibilidad del código.
  3. Optimiza el rendimiento: Verifica si los nombres de las columnas seleccionadas son parte de un índice existente en la tabla.
  4. **Evita SELECT ***: Solo selecciona las columnas que realmente necesitas.
  5. Comprueba tu consulta: Antes de ejecutar una consulta, revisa el código para asegurarte de que es correcto y no contiene errores comunes.

Cierre: Siguientes pasos

  • Profundiza en SELECT combinado con otras cláusulas: Aprende a combinar SELECT con otras cláusulas como WHERE, GROUP BY o JOIN para realizar análisis más complejos.
  • Practica con diferentes conjuntos de datos: Aplica lo aprendido a diferentes tipos de datos y bases de datos para mejorar tu habilidad en la selección de columnas.

SQL es una herramienta poderosa para analistas de datos y científicos de datos, pero su eficacia depende en gran medida del uso correcto. La selección adecuada de columnas puede hacer una enorme diferencia en el rendimiento y la claridad de tus consultas, así como en tu capacidad para obtener información valiosa a partir de grandes conjuntos de datos.


Notas adicionales: Este artículo se ha actualizado por última vez el 26 de diciembre de 2025.

Contacto

Indica tu objetivo (ChatGPT, RAG, agentes, automatización) y tu stack (web/backend).