Manipulación de datos con NumPy y Pandas, Unidad 2 — NumPy desde la práctica, 2.1 — Arrays NumPy · 13/01/2026

Tipos de datos numéricos

Introducción

En la manipulación de datos, NumPy es una herramienta fundamental para trabajar con arrays multidimensionales. Los tipos de datos numéricos son cruciales en NumPy ya que definen cómo se manejarán los valores en nuestros arrays y dataframes. En esta unidad, aprenderemos sobre diferentes tipos de datos numéricos en NumPy y cómo seleccionarlos adecuadamente para optimizar el rendimiento y evitar errores comunes.

Explicación principal con ejemplos

NumPy ofrece una variedad de tipos de datos numéricos que son más eficientes y precisos que los tipos de datos en Python estándar. Estos tipos están diseñados para manejar diferentes escalas y precisión, lo que es crucial cuando trabajamos con grandes cantidades de datos.

Tipos de datos numéricos básicos

NumPy proporciona una serie de tipos de datos numéricos que se clasifican en dos categorías principales: enteros (integers) y flotantes (floating-point numbers).

Enteros (Integers)

int8, int16, int32, int64: Estos son tipos de enteros con diferentes longitudes. Por ejemplo, int8 puede almacenar valores entre -128 y 127.

import numpy as np

# Crear un array de enteros int8
arr = np.array([100, 200, 300], dtype=np.int8)
print(arr)

Flotantes (Floating-Point Numbers)

float16, float32, float64: Estos son tipos de flotantes con diferentes longitudes. Los más comunes son float32 y float64. float64 es el estándar en NumPy para proporcionar una mayor precisión.

# Crear un array de flotantes float32
arr = np.array([100.5, 200.75, 300.9], dtype=np.float32)
print(arr)

El impacto de los tipos de datos en el rendimiento

Elegir los tipos de datos adecuados puede tener un gran impacto en la eficiencia y precisión del trabajo con NumPy. Por ejemplo, usar int8 en lugar de float32 para valores enteros puede reducir significativamente el uso de memoria.

Ejemplo práctico

Imaginemos que estamos trabajando con una imagen en escala de grises. Si la imagen tiene 10,000 x 10,000 píxeles, elegir int8 en lugar de float32 puede ahorrar hasta 75% del espacio en memoria.

# Crear un array grande con int8 para una imagen en escala de grises
image = np.random.randint(0, 256, (10000, 10000), dtype=np.uint8)
print(image.dtype)  # uint8

Errores típicos / trampas

1. Usar el tipo de dato incorrecto para operaciones complejas

Utilizar tipos de datos más grandes de lo necesario puede reducir la eficiencia del código sin necesidad.

# Error: Usando float64 cuando int32 es suficiente
arr = np.array([1, 2, 3], dtype=np.float64)
print(arr.dtype)  # float64

# Corrección: Usar int32 para este caso
arr_correcto = np.array([1, 2, 3], dtype=np.int32)

2. No inicializar con el tipo de dato adecuado

No especificar el tipo de dato al crear un array puede resultar en pérdida de precisión.

# Error: No especificar el tipo de dato al crear un array grande
large_array = np.random.rand(10000, 10000)
print(large_array.dtype)  # float64

# Corrección: Especificar el tipo de dato
large_array_correcto = np.random.rand(10000, 10000, dtype=np.float32)

3. Confundir `int8` con otros tipos

El uso incorrecto de int8 puede llevar a problemas de overflow o underflow.

# Error: Usar int8 cuando debería ser int16
arr = np.array([-100, -200], dtype=np.int8)
print(arr)  # Podría tener valores inesperados

# Corrección: Usar int16 para este caso
arr_correcto = np.array([-100, -200], dtype=np.int16)

Checklist accionable

Para asegurarte de elegir los tipos de datos adecuados:

Determina la escala y precisión necesarias: ¿Necesitas precisión adicional o es suficiente con enteros?
Evalúa el uso de memoria: ¿Cuánto espacio en memoria puede permitirse para un array grande?
Prueba con diferentes tipos: Utiliza dtype al crear arrays y compara el rendimiento.
Revisa los datos existentes: Si trabajas con datos existentes, verifica su tipo y considera si se puede optimizar.
Documenta tus decisiones: Mantén un registro de por qué se eligió cada tipo de dato para futuras referencias.

Siguientes pasos

Aprender más sobre NumPy: Explora la documentación oficial de NumPy para obtener una comprensión profunda de los tipos de datos y sus usos.
Práctica constante: Trabaja con diferentes conjuntos de datos y experimenta con diferentes tipos de datos.
Revisión y optimización: Revisa tus arrays frecuentemente y ajusta los tipos de datos según sea necesario.

¡Estos consejos te ayudarán a mejorar tu habilidad en la manipulación de datos numéricos con NumPy!

Tipos de datos numéricos

Tipos de datos numéricos

Introducción

Explicación principal con ejemplos

Tipos de datos numéricos básicos

Enteros (Integers)

Flotantes (Floating-Point Numbers)

El impacto de los tipos de datos en el rendimiento

Ejemplo práctico

Errores típicos / trampas

1. Usar el tipo de dato incorrecto para operaciones complejas

2. No inicializar con el tipo de dato adecuado

3. Confundir `int8` con otros tipos

Checklist accionable

Siguientes pasos

Contacta e inscríbete

Contacto

Tipos de datos numéricos

Introducción

Explicación principal con ejemplos

Tipos de datos numéricos básicos

Enteros (Integers)

Flotantes (Floating-Point Numbers)

El impacto de los tipos de datos en el rendimiento

Ejemplo práctico

Errores típicos / trampas

1. Usar el tipo de dato incorrecto para operaciones complejas

2. No inicializar con el tipo de dato adecuado

3. Confundir int8 con otros tipos

Checklist accionable

Siguientes pasos

Contacta e inscríbete

Contacto

3. Confundir `int8` con otros tipos