serie temporal

Descubre qué es una serie temporal y cómo interpretarla

serie temporal

¿Alguna vez has visto en las noticias el típico gráfico de la evolución de la bolsa en los últimos 12 meses?

O quizá en el periódico, ¿un grafiquito donde puedes ver cómo evoluciona el crecimiento económico del país en los últimos años?

O mejor aún, ¿la evolución de las temperaturas promedio durante los doce meses del año en el país de tus próximas vacaciones?

Me atrevo a afirmar sin ninguna probabilidad de fallo que has visto alguno de estos gráficos.

Todos ellos son series temporales. Pero supongo que no eras muy consciente de ello.

Te doy una pista: es una variable numérica (es decir, son números) presentada a lo largo del tiempo. Te habrás quedado casi igual.

Tranquilo. En este post te voy a explicar más en detalle las series temporales y qué conceptos necesitas entender para poder interpretarlas 🙂

Venga.

¡Let’s go!

Qué es una serie temporal y por qué es interesante

Como te decía una serie temporal es una variable numérica (es decir, son números) presentada a lo largo del tiempo.

El tiempo tiene escala. Y esta escala está ordenada.

Puede estar en meses, días, horas, segundos, años, décadas, semanas, trimestres. Lo que quieras.

Por ejemplo: Valor de la bolsa por días en el último año. Tienes 365 valores. Estos valores los pones uno seguido de otro ordenados por días y tienes una serie temporal. ¡Et voilà!

Si escoges días, tTendrás un valor de la variable numérica por cada día. Si son meses, solo tendrás un valor por mes. ¿Sí?

Dependiendo de la escala de tiempo tendrás más detalle de tu variable o no.

  • No es lo mismo tener 1 observación de la temperatura por mes. En un año tienes 12 observaciones de temperatura.
  • Que 30 observaciones por mes. Una por día. 365 observaciones al año. ¿Se entiende?

La resolución es precisamente la cantidad de puntos que tienes para un período fijado. Cuantos más puntos u observaciones tengas más resolución tendrá tu serie temporal. Y más información tendrás.

Te voy a poner unos cuantos ejemplos para que puedas ver cómo se presentan las series temporales en la práctica:

La típica gráfica del índice bursátil. En este caso he utilizado el índice Ibex35 durante los últimos 5 años. Este índice indica «la salud bursátil» de España. Aprovecho este gráfico para presentarte la tendencia de una serie temporal.

La tendencia es lo que dibujarías con el lápiz sin tener en cuenta los cambios rápidos. Sin los sube y bajo tan repentinos que ves. Te lo he dibujado en rojo a mano para que me entiendas.

Hay técnicas matemáticas para calcular esta tendencia. En futuros artículos te voy a mostrar cómo hacerlo 😉

La tendencia es una manera muy buena de entender cómo está subiendo y bajando tu variable numérica en el tiempo.

Otro ejemplo es el de la serie temporal del PIB (producto interior bruto de un país). Dicen que indica «la salud económica» de un país. En este gráfico he querido mostrar cómo evolucionó durante el siglo XX el PIB de países como Japón, USA y UK.

Si te fijas en el PIB de Japón (en rojo) puedes ver la subida bestial entre los años 50 y 70 ( después de la segunda guerra mundial). ¿Increíble, verdad? Si quieres saber más sobre este período puedes consultar este artículo que habla sobre el milagro japonés.

Una de las gracias de las series temporales es poder entender qué ha pasado con la ayuda del histórico de datos del pasado. Y ver la evolución y tendencia en el tiempo. Este es un ejemplo muy interesante.

Otro ejemplo «más cercano». En el gráfico puedes ver las visitas diarias que tengo en mi blog.

En este caso te pongo los valores de las visitas del blog C2 durante un período de 31 días. Del 1 al 31 de Julio de 2017.

Este gráfico me va perfecto para explicarte un punto importante. Aunque la serie temporal se representa con una línea, en realidad, lo que tienes son observaciones por cada día.

Los puntos que ves en el gráfico son los datos. Que son las visitas correspondientes a cada día.

Quiero que entiendas que una serie temporal es como una variable numérica. Es una serie de números ordenados por tiempo. O una serie de puntos en el tiempo 😉 Después te muestro este ejemplo más en detalle con números para que entiendas un poco mejor este aspecto.

Por último, te voy a poner un ejemplo un poco más complicado. En este caso es la serie temporal de las temperaturas medias anuales desde el año 1200 al año 2000. Este gráfico causó mucha polémica entre políticos y científicos. Se llama el Hockey Stick graph.

Es un trabajo de investigación muy interesante para justificar el calentamiento global debido al efecto invernadero. Los datos históricos se han obtenido gracias a árboles milenarios. Y se han utilizado el radio de los aros de los troncos como medida de temperatura. Puedes leer este artículo si tienes curiosidad sobre esto.

Si te fijas hay un área sombreada, en azul clarito. Este es el error de medición. Ya que se están midiendo los datos con árboles por falta de observaciones con termómetro. Y el error puede ser alto.

Fíjate que el error cada vez es menor porque ya existen datos históricos y los valores son más precisos.

La gracia de este estudio es la subida exponencial de los últimos 30 años hasta el 2000.

Y en rojo se ha calculado la predicción hasta el 2030.

¡Houston tenemos un problema…! Pero se ve que no somos conscientes aunque los datos nos lo digan 🙁

Como ves, una serie temporal es capaz de aportar mucha información y es la gracia que tiene.

  1. Puedes entender el pasado. Su evolución en el tiempo e intuir la tendencia.
  2. Entender la situación actual viendo lo que ha pasado.
  3. Y predecir el futuro con un error de predicción según el histórico de datos.

Éstas serían las 3 aplicaciones principales de las series temporales.

# Qué elementos son interesantes que conozcas de una serie temporal

Hasta ahora tienes una foto global de qué es una serie temporal y para qué te puede servir.

Básicamente es una variable numérica vista en el tiempo. Vas viendo los valores de la variable numérica «históricamente». Ordenaditos.

Esto te sirve para ver la evolución en números de esta variable. Y puedes observar la tendencia en diferentes períodos según la escala de tiempo que tengas. ¡Vas bien!

Ahora quiero darte un poco más de detalle. Y te mostraré los elementos de una serie temporal con un ejemplo.

Sigo con el ejemplo de las visitas de mi blog. Fíjate en la tabla. Tengo dos variables:

  • La primera es la escala de tiempo. En este caso días.
  • En la segunda columna: la variable numérica (la que quieres estudiar).

A cada día le corresponde una observación de la variable numérica. ¡Et voilà! Esto es la serie temporal.

Puedes dibujar los puntos de la serie temporal en un gráfico, tipo scatter plot (primer gráfico).

O puedes unir los puntos con una línea para visualizar la tendencia histórica de la variable.

Fíjate que uniendo los puntos del scatterplot puedes crear un gráfico donde visualizas mucho mejor cómo sube y baja la variable numérica en el tiempo.

Esto es una serie temporal. Y el gráfico es un time series plot.

Pero quiero que te quedes con la idea de que en realidad los datos que tienes son los que ves en la tabla. Es decir los puntos del gráfico.

Lo juntos que están los puntos depende de la escala de tiempo que tengas.

En este caso tengo días. Es decir, por cada día tengo una observación. Si tuviera datos cada hora tendría muchas más observaciones y tendría muchos más detalles de la evolución de la variable numérica. Incluso el time series plot sería diferente. ¿Se entiende?

Lo siguiente es entender la frecuencia o paso de tiempo.

El paso de tiempo es el tiempo que pasa entre dos observaciones. Es el famoso delta del tiempo.

Como te decía, en este caso es sencillo: 1 día

Las observaciones se dan cada día.

El inverso del intervalo de tiempo es la frecuencia. En otro post te explicaré más sobre esto cuando veas la transformada de Fourier 😉

# Las herramientas estadísticas para poder interpretar una serie temporal sin gastar mucho tiempo

Lo primero que hay que hacer es entender la serie temporal como una variable numérica.

Puedes utilizar las mismas herramientas como si se tratase de una variable numérica sola.

Puedes utilizar los gráficos para entender la distribución. Personalmente utilizo el histograma y el boxplot

  • Histograma
  • Boxplot
  • Qqplot

Y calcular el resumen numérico

  • Media
  • Desviación estándar
  • Mediana
  • Rango Intercuartílico
  • Máximo
  • Mínimo

Aunque no es perfecto normalmente utilizo la media y la desviación estándar. Para el caso del ejemplo he calculado el resumen numérico para que veas los valores:

Además siempre me gusta calcular dónde se encuentra el 95% de los datos. Utilizo la regla de las 2 desviaciones estándar. Puedes repasarla aquí.

Entonces lo dibujo en el mismo gráfico. Algo así:

Se podría dibujar un área sombreada entre la línea amarilla y gris para indicar dónde está la zona del 95% de los datos.

De esta manera me doy cuenta en qué región se encuentran el 95% de los valores de esta serie temporal de manera rápida.

Y también, centro la serie temporal. Encuentro el valor promedio de esta serie y lo fijo en el gráfico. (linea naranja)

Como en el ejemplo del PIB que te mostraba al principio. Las series temporales son muy interesantes para compararlas entre sí.

En este ejemplo he decidido comparar 4 semanas consecutivas de lunes a viernes del mes de Junio y el mes de Julio. Son dos series temporales distintas puestas en un mismo gráfico.

¡Fíjate qué gráfico más sencillo de visualizar!

  1. En este caso veo 4 valles de dos días que son los fines de semana. Mi blog es un blog para currantes y tiene mayor actividad en los días laborables.
  2. Se puede ver también que en Julio los valores en general son más altos. Sobre todo en los días entre semana (laborables).
  3. También se intuye una ligera tendencia a la alza en las dos series temporales. Eso es señal de que el blog va creciendo en visitas.

Mira cuanta información hemos sacado con un simple gráfico. No está nada mal, ¿verdad?

# La formalidad matemática de la serie temporal

Un poquito de notación matemática te vendrá bastante bien para este caso. Quiero presentarte cómo se escribe formalmente la serie temporal.

La variable se escribe con la letra X

Las observaciones se escriben con el subíndice.

  • La observación número 1 es X1
  • La observación número 2 es X2
  • La observación número k es la Xk

Normalmente una serie temporal en notación matemática se escribe así:

  • X1, X2,… Xn
  • {Xk} de k = 1… n

n es el número total de observaciones de la variable. En el ejemplo de las visitas es n = 31. 31 días del mes de Julio.

Quedaría algo así:

# ¿Qué más puedes hacer con la serie temporal?

¡Mucho más! Calcular la transformada de Fourier y ver los períodos de la serie temporal.

Calcular la tendencia con filtros tipo media móvil u otro tipo.

Modelar la serie temporal con modelos tipo ARMA para predecir los valores futuros con un error de predicción.

En resumen yo diría que tienes las siguientes técnicas:

  • Modelar la serie temporal con un modelo de predicción para predecir valores futuros
  • Entender la dinámica de la serie temporal con la tranformada de Fourier. Es decir entender los períodos.
  • Encontrar la tendencia de la serie temporal con filtros tipos media móvil o modelos polinómicos.

En próximos artículos te explicaré más sobre las técnicas que te he citado. Las series temporales son como un mundo aparte y personalmente ¡me molan mucho!

Y tú, ¿qué dudas e inquietudes tienes acerca de las series temporales? Soy todo oídos 😉

Acerca del autor

Jordi Olle Sanchez

Autor de ConceptosClaros.com. Ayuda a investigadores apasionados a aplicar estadística y análisis de datos en sus proyectos para catapultar su carrera investigadora y adaptarse a la era de los datos. Accede a los recursos gratuitos para aplicar estadística en tus datos

Interacciones del lector

Comentarios

  1. Hola Jordi,
    Gracias por la información, está excelente, me parece que está bastante claro 😉
    Me gustaría saber que es la transformada de Fourier y los modelos tipo ARMA, así que estaré al tanto por si publicas algo acerca de esto. Saludos!!

    • Hola Fabián!

      Fantástico!
      Los modelos tipo ARMA son modelos autoregresivos. Como si se trate de una regresión lineal con tiempos pasados. (lo explicaré con calma)
      Son muy eficaces para entender la dinámica e incluso predecir valores futuros.

      La transformada de Fourier o espectro en frecuencia te permite obtener información en una nueva dimensión. La de frecuencias. De esta manera puedes entender mucho mejor la información dinámica de tu serie temporal.
      Repito que, en próximos artículos explicaré más sobre ello 🙂

      Un abrazo y gracias por pasarte 🙂

  2. Me ha gustado mucho y me ha aportado incluso alguna visión desconocida para mi en el campo que nos ocupa.
    La verdad es que estoy impaciente por ver algo mas acerca de este tema, como bien veo que le ha pasado a Fabian… los modelos tipo ARMA y la transformada de Fourier… estoy analizando los accidentes de trabajo con baja laboral acontecidos desde 2007, aunque los mensuales los tengo registrados desde 2014, es decir, los últimos 4 años solo, pero me gustaría hacer un buen análisis de estos datos e incluso porque no llegar a predecir algún y ver el error o los errores asociados, a ver si pudiese encontrar algún modelo que se ajuste, ya que me da con los registran con cierta parcialidad según el partido político de turno en el poder.
    Un saludo,

    • Hola Victor!
      Escribiré otro artículo relacionado con los modelos ARMA y la transformada de Fourier. Aplicaciones para que las podais entender y aplicar con vuestros datos.
      Primero de todo. Pinta estos datos por meses y mira la dinámica de la señal. Es decir, cómo fluctúa en el tiempo.
      Estas variaciones te darán mucha información.

      Los modelos arma te pueden venir bien para predecir valores futuros.
      Pronto escribiré algúna rtículo más 🙂

      gracias por pasarte!

  3. El tema está bien explícito y me gustaría saber de los artículos para explicar las técnicas.

    • Hola! Cuando tenga algo de tiempo seguiré con esta serie de las series temporales que es una rama apasionante del análisis de datos 😉
      Gracias por escribir!

  4. Muyyyy interesante tu aporte. Explicas demasiado bien, cualquiera podría entender. Soy un estudiante de universidad y tu aporte me ayudo mucho para ir armando mi trabajo de estadística. Muchas gracias, sigue así aportando. Hoy me ayudaste a mi, mañana puedes ayudar a muchos más!!! Saludos.


Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

  Acepto la política de privacidad

Responsable del fichero: Jordi Ollé Sánchez
Finalidad; envío de mis publicaciones así como correos comerciales.
La Legitimación; es gracias a tu consentimiento.
Destinatarios:Como usuario e interesado te informo que los datos que me facilitas estarán ubicados en los servidores de Webempresa (proveedor de hosting de Conceptos claros) dentro de la UE. Ver política de privacidad de Webempresa
Podrás ejercer Tus Derechos de Acceso, Rectificación, Limitación o Suprimir tus datos enviando un email a jordi @ conceptosclaros.com o ante la Autoridad de Control
Encontrarás más información en política de privacidad
Pro-statistics-Mockup-presentacion

Reserva tu plaza para el Training Gratuito y descubre los pasos exactos para convertir tus datos en resultados de impacto en tu proyecto