Logo de CursoIA
CursoIA Curso de Inteligencia Artificial

Manipulación de datos con NumPy y Pandas, Unidad 2 — NumPy desde la práctica, 2.1 — Arrays NumPy ·

Qué es un ndarray

Qué es un ndarray

Introducción

En la manipulación de datos, NumPy y Pandas son fundamentales para cualquier científico de datos. Sin embargo, al hablar específicamente sobre NumPy, los ndarray (n-dimensional array) son la estructura de base que soporta la mayoría de las operaciones numéricas. Un ndarray es una estructura de datos multidimensional y esencialmente un alias de Python para arrays C o Fortran. En este artículo, exploraremos en detalle qué es un ndarray, cómo se crean y cómo se utilizan.

Explicación principal con ejemplos

Un ndarray en NumPy es una estructura que almacena datos del mismo tipo (por ejemplo, enteros o flotantes) de manera eficiente. Cada ndarray tiene un eje (dimensiones), y cada elemento dentro de ese eje puede ser accedido a través de índices.

import numpy as np

# Crear un ndarray de una lista
arr = np.array([1, 2, 3])
print("Unidimensional:", arr)

# Crear un ndarray desde una lista anidada (matriz)
matrix = np.array([[1, 2], [3, 4]])
print("Bidimensional:", matrix)

# Crear un ndarray de ceros o unos
zeros = np.zeros((3, 3))
ones = np.ones((2, 2))
print("Matriz de ceros:\n", zeros)
print("Matriz de unos:\n", ones)

Errores típicos / trampas

  1. Confundir ndarray con listas: Aunque un ndarray puede parecerse a una lista, las operaciones sobre ellos son más eficientes y vectorizadas. Tratar de realizar operaciones en listas que podrían realizarse en ndarrays puede resultar en un rendimiento inferior.
  1. No utilizar el método correcto para conversiones: Si intenta convertir directamente una lista a un ndarray, asegúrese de usar el método correcto (np.array()) y no confunda los tipos de datos. Por ejemplo, arr = np.array([1, 2, '3']) generará un error.
  1. No utilizar índices correctamente: El uso incorrecto de índices puede llevar a errores en la estructura del ndarray. Por ejemplo, intentar acceder a una posición fuera del rango del array causará un error.

Checklist accionable

  1. Asegúrate de importar NumPy: Incluye siempre el import numpy as np al inicio de cualquier script que utilice arrays.
  2. Comprueba la dimensión del ndarray: Verifica siempre cuántas dimensiones tiene tu ndarray. Esto puede ser útil para asegurarte de que estás trabajando con la estructura correcta.
  3. Convierte tipos de datos correctamente: Usa el método .astype() para convertir los tipos de datos si es necesario.
  4. Utiliza métodos vectorizados: Para operaciones en arrays, siempre intenta usar métodos vectorizados (como np.add(), np.subtract()) en lugar de bucles explícitos.
  5. Verifica el uso correcto de índices y slices: Asegúrate de que estás utilizando los índices correctamente para evitar errores.

Cierre con "Siguientes pasos"

  • Aprender más sobre operaciones vectorizadas: Las operaciones vectorizadas son esenciales para cualquier científico de datos. Continúa aprendiendo acerca de funciones como np.sum(), np.mean(), y otros métodos.
  • Probar con diferentes tipos de arrays: Trata de crear arrays con diferentes tipos de datos (enteros, flotantes, cadenas) y experimenta con operaciones en ellos.
  • Utiliza la documentación oficial de NumPy: La documentación oficial es una excelente fuente para aprender más sobre ndarray y otros aspectos de NumPy.

En resumen, un ndarray es una estructura fundamental en NumPy que proporciona una forma eficiente y multidimensional de almacenar datos. Si dominas su uso, podrás mejorar significativamente tu flujo de trabajo en ciencia de datos.

Contacto

Indica tu objetivo (ChatGPT, RAG, agentes, automatización) y tu stack (web/backend).