5 tipos de librerías en Python para Analizar tus Datos como un ninja

En este artículo verás un pequeño tour por las librerías clave de Python y cómo se cargan en tu Notebook. Son 7 librerías de Python imprescindibles para analizar tus datos.

En este artículo vas a vera agrupadas las librerías en:

  • Manipulación datos: numpy, pandas
  • Gráficos: matplotlib, seaborn, plotly
  • Estadística: statsmodels, pingouin-stats
  • Manipulación time series: scipy
  • Machine learning: scikit-learn
  • Deep learning: keras

Primero. ¿Cómo instalar librerías en Python?

Para trabajar con Python necesitas instalar librerías para poder aprovechar su gran potencial.

Y para ello te recomiendo que te instales Python y Jupyter Notebook en tu PC o usar directamente Google Colab.

Para importar cada una de las librerías, primero habrá que instalarlas si es necesario.

Muchas de ellas ya están por defecto en una instalación de Python pero por si a caso te muestro cómo instalarlas.

Este es el código:

pip install nombrelibería

Una vez instaladas tienes cargar la librerías.

Durante el artículo te muestro las librerías de Python para Analizar Datos y también cómo cargarlas.

Librerías para Manipulación de datos (matrices de datos o vectores)

Permite crear matrices, vectores de una fila, de una columna… todo lo que tenga que ver con vectores. 

Un “panda” es una estructura que reparte los datos en filas y columnas. Esta librería permite la manipulación de estas estructuras. Permite por ejemplo seleccionar una variable, varias, generar nuevas, calcular estadísticos, filtrar en base a una variable, etc.

¿Cómo importar estas libras?

Utilizaremos la estructura de siempre para cargar librerías en Python:

import nombre de la librería as nickname de la librería

En este caso:

import numpy as np

import pandas as pd

Librerías para crear gráficos en Python

Gráficos estadísticos con vectores. Puedes crear grandes gráficos, pero muy a “pico pala”. Los códigos suelen ser largos y suelen necesitar muchas especificaciones. Los gráficos recuerdan bastante a los que ofrece Matlab, R, etc. 

Para importar esta librería:

import matplotlib as plt

Gráficos a partir de data frames. El código es mucho más pequeño y es mucho más simple de utilizar. Una vez se entiende la dinámica es una herramienta muy eficaz. 

Para importar esta librería:

import seaborn as sns

Gráficos interactivos que permiten hacer zooms, mostrar información de cada observación, etc. Existen dos tipos: (1) los plotly normales, donde se generan códigos más complejos que requieren de múltiples especificaciones (tipo matplotlib) y (2) los plotly express, que son gráficos más sencillos y cortos (tipo seaborn). 

Para importar esta librería:

import plotly.express  as px

Dentro de plotly se encuentra dash (https://dash.gallery/Portal/) que permite generar aplicaciones interactivas con los gráficos, como botones para modificar lo que se muestra en la gráfica. Existen un montón de opciones para crear pequeñas aplicaciones o dashboardsIcono

Descripción generada automáticamente

Esto es muy útil para cuando se están recibiendo datos online de manera constante. Los gráficos se van refrescando y actualizando con nuevos datos, lo cual permite visualizar la evolución de la variable en tiempo real e incluso la modificación de algunos parámetros.  

Librerías para aplicar Estadística inferencial en Python

Permite hacer todo tipo de modelos inferenciales. ANOVAs, regresiones logísticas, chi-cuadrados, etc.  

Para importar esta librería:

import pingouin as pg

Permite hacer modelos estadísticos causales, regresiones, clasificaciones, etc. Hay muchísimas opciones en esta librería. Logotipo

Descripción generada automáticamente

Para importar esta librería:

import statsmodels.api as sm

Librerías de Machine Learning en Python

Es la librería de machine learning por excelencia. Permite hacer clasificaciones, regresiones, clustering, reducción dimensional, selección de modelos, preprocesamiento de los datos incluyendo feature selection, etc.

Esta librería es algo particular en cuanto a la importación. Se sigue un patrón parecido, pero en vez de la librería, importaremos directamente las funciones que necesitemos. Un ejemplo es:

from sklearn.ensemble import RandomForestClassifier

Librería Deep Learning en Python

Sirve para clasificar imágenes, redes neuronales convolucionales y este tipo de aplicaciones tan potentes. 

Para importar esta librería y algunas de las funciones más tipicas:

import tensorflow as tf

from tensorflow import keras

from tensorflow.keras import layers

Estas son algunas de las librerías imprescindibles de Python para analizar tus datos, tanto para leer, manipular datos, gráficos, aplicar estadística e inteligencia artificial.

Estas librerías las muestro en mi curso de R y Python por si necesitas profundizar en su uso y en cómo se aplica en término de ciencia de datos.
Si necesitas asentar las bases estadísticas y así poder sacar mejor provecho de tus datos puedes acceder al training gratuito de estadística de Analiza tus Datos.

Scroll al inicio