DEV Community

Centro Turing
Centro Turing

Posted on

Creación y personalización de gráficos estadísticos con Seaborn

Creación y personalización de gráficos estadísticos con Seaborn

Seaborn es una potente biblioteca de visualización de datos en Python, construida sobre matplotlib. Ofrece una interfaz de alto nivel diseñada para crear gráficos estadísticos visualmente atractivos e informativos, simplificando el proceso de creación de gráficos complejos y permitiendo al usuario enfocarse en la interpretación de los datos.

Instalación de la biblioteca Seaborn

El primer paso para trabajar con Seaborn es instalar la biblioteca. Para ello, puedes utilizar pip, que es el instalador de paquetes de Python. En tu terminal o línea de comando, simplemente escribe:

pip install seaborn
Enter fullscreen mode Exit fullscreen mode

Este comando descargará e instalará Seaborn y todas las dependencias necesarias.

Importación de Seaborn a tu script

Una vez que Seaborn está instalado en tu ambiente de Python, debes importarlo a tu script para empezar a utilizarlo. Por convención, Seaborn se importa como 'sns':

import seaborn as sns
Enter fullscreen mode Exit fullscreen mode

Carga de un conjunto de datos con Seaborn

Antes de crear cualquier tipo de gráfico, necesitamos un conjunto de datos para visualizar. Seaborn viene con algunos conjuntos de datos incorporados para facilitar la práctica de la visualización de datos. En este caso, vamos a utilizar el conjunto de datos 'iris', que contiene mediciones de diferentes características de varias especies de la flor iris:

df = sns.load_dataset('iris')
Enter fullscreen mode Exit fullscreen mode

Creación de gráficos de dispersión

Un gráfico de dispersión es una visualización que muestra la relación entre dos variables numéricas, con cada punto de datos representado como un punto en el gráfico. En Seaborn, podemos utilizar el método scatterplot() para crear gráficos de dispersión:

sns.scatterplot(data=df, x='sepal_length', y='sepal_width', hue='species')
Enter fullscreen mode Exit fullscreen mode

En este ejemplo, los ejes x e y representan la longitud y el ancho del sépalo de las flores de iris, respectivamente, mientras que los colores representan diferentes especies de iris.

Creación de histogramas

Un histograma es un gráfico que muestra la distribución de un conjunto de datos numéricos mediante barras. La altura de cada barra representa la frecuencia de cada intervalo de valores. En Seaborn, utilizamos el método histplot() para crear histogramas:

sns.histplot(data=df, x='sepal_length', kde=True)
Enter fullscreen mode Exit fullscreen mode

En este caso, el histograma muestra la distribución de la longitud del sépalo. La opción 'kde' añade una estimación de la densidad de kernel al histograma, que es una suave curva que se ajusta a la distribución de los datos.

Creación de gráficos de caja (Box plots)

Un gráfico de caja es una manera eficiente de visualizar la distribución de los datos a través de sus cuartiles. Muestra el valor mínimo, el primer cuartil (Q1), la mediana (Q2), el tercer cuartil (Q3) y el valor máximo dentro de un rango. Los gráficos de caja también pueden mostrar valores atípicos:

sns.boxplot(data=df, x='species', y='sepal_length')
Enter fullscreen mode Exit fullscreen mode

En este ejemplo, estamos mostrando la

distribución de la longitud del sépalo para cada especie de iris.

Creación de gráficos de violín

Los gráficos de violín combinan la información de un gráfico de caja con un gráfico de densidad de kernel. Esto nos da una visión más detallada de la distribución de los datos:

sns.violinplot(data=df, x='species', y='sepal_length')
Enter fullscreen mode Exit fullscreen mode

De nuevo, estamos mostrando la distribución de la longitud del sépalo para cada especie de iris, pero esta vez utilizando un gráfico de violín.

Creación de gráficos de pares (Pair plots)

Los gráficos de pares son una gran herramienta para explorar visualmente las relaciones entre múltiples variables en un conjunto de datos:

sns.pairplot(df, hue='species')
Enter fullscreen mode Exit fullscreen mode

Este gráfico crea una matriz de diagramas de dispersión, mostrando la relación entre cada par de variables en el conjunto de datos. Además, los histogramas en la diagonal permiten visualizar la distribución de una sola variable.

¡Felicidades! Ahora tienes una buena introducción sobre cómo crear y personalizar gráficos estadísticos con Seaborn. La visualización de datos es una habilidad esencial en el campo de la ciencia de datos y te recomendamos seguir explorando y experimentando con Seaborn y otras bibliotecas de visualización en Python.

Top comments (0)