Ha llegado el momento. No lo dejes para otro día. No procrastines más lo inevitable. Es momento de empezar a usar el potente software de Esdatística: R. Es el momento que te tires a la piscina. En este post te muestro el tutorial para principiantes de R.
Para empezar a usar R es obligatorio empezar también con RStudio. No te asustes es el mismo software: R es el corazón, es la máquina de cálculo, es la calculadora. RStudio es el cuerpo, es la interfaz, es el vestido, el traje.
La curva de aprendizaje es pronunciada. No te voy a engañar, pero puedes sacar mucho provecho de esta herramienta.
Seguro que has oído hablar de este software porque es el más famoso para el análisis de datos y uso de la estadística. La verdad es que tiene mucho potencial. Pero sino es así te hago una breve explicación del software.
Es gratuito.
Es open source (de código libre).
Aquí tienes la web de R.
Es la continuación del lenguaje S. Lenguaje estadístico de hace ya unos años.
Se utiliza principalmente para aplicaciones estadísticas. Es un Minitab sin la interfaz. Tu creas el código a tu medida. Por ello es tan potente. Te adaptes a tu problema. El tema es que tienes que programar.
Yo lo he utilizado para crear herramientas de automatización de lectura y escritura de ficheros haciendo análisis simples y es eficiente. También he creado interfaz de usuarios muy interesantes mediante código html. (¡El package R Shiny es brutal!) y mucho más.
¡Ah si! R viene por defecto con unas funciones básicas pero tiene una serie de packages de funciones que te puedes descargar te forma gratuita. Todo el mundo puede contribuir a crear packages. ¡Es aquí la grandeza del software libre!
Estos paquetes son módulos que te permiten hacer muchas más cosas que el software a pelo. Los packages son funciones y herramientas que se han diseñado para hacer determinados cálculos según la disciplina estadística. Te dejo la lista de package.
Como puedes ver existen infinidad de paquetes de herramientas y lo cierto es que R está creciendo día día.
El corazón: R
Cómo te he dicho R es el corazón y la calculadora. Instalar R es muy sencillo. Simplemente ves al link de descarga de R y escoje el archivo apropiado para tu sistema operativo.
Tienes instrucciones de instalación y información extra si quieres.
El cuerpo: RStudio
La user inferface de R es lamentable. Por eso nació RStudio. Es muy parecida a Matlab y muy intuitiva, la verdad. Sin RStudio no creo que hubiese usada R.
Lo cierto es que R es el corazón y RStudio es el cuerpo.
Vamos a instalar RStudio:
Esta es la página de RStudio. Puedes descargarte RStudio y algunos de las packages más comerciales de R como RShiny (para crear user interface con html).
Puedes ver en el link de descarga dos tipos de productos:
- RStudio desktop, para trabajar con RStudio en un tu PC. (Hoy te hablo de este.)
- RStudio server , para tener RStudio en tu servidor.
Para RStudio vamos a ir a la opción gratuita. La licencia es AGPL v3.
Mini-tutorial de instalación de R y RStudio
Lo de instalar es muy fácil pero quiero que veas como se organiza R en tu PC y que cosas importantes hay que tener en cuenta cuando estamos utilizando RStudio.
Te hago un resumen de lo que te cuento en el vídeo:
- Te enseño a instalar (muy fácil).
- Te muestro en que carpetas se instalan R y RStudio en tu PC.
- Importante: dónde se ubican los packages que vas instalando.
Ejecuta tu primer script de R
Te dejo otro vídeo con los consejos para que ejecutes tu primer código de R . (Lo típico que no te dice nadie y que es super útil)
Estos son los truquitos que te enseño:
- Comprobar en que fichero estás trabajando.
- Mirar que todos los packages que estés utilizando los tengas instalados y cargados.
- Para ejecutar lineas de código desde el RScript estan fácil como seleccionar la línea. Una vez seleccionada pulsa Ctrl + Enter.
- Te enseño a instalar y cargar packages.
Te dejo el script para instalar y cargar los paquetes que vas a utilizar en un tú código de manera automática. Sólo tienes que cambiar el vector .packages = c(«nombrePackage1″,»nombrePackage2″,»nombrePackage3″,…). Puedes instalar y/o cargar los paquetes que nombres en esta variable.
[sourcecode lang=»r»]
#********************************************************************
# 1.1 INSTALAR PAQUETES DE FUNCIONES
#********************************************************************
# Lista de paquetes de funciones a instalar
.packages = c(«ggplot2», «plotly», «xlsx»,»scales»)
# Instala los paquetes sinó los tienes instalados
.inst <- .packages %in% installed.packages()
if(length(.packages[!.inst]) > 0) install.packages(.packages[!.inst])
#********************************************************************
# 1.2 CARGAR PAQUETES O CREAR FUNCIONES
#********************************************************************
# Carga los paquetes sinó los tienes cargados
lapply(.packages, require, character.only=TRUE)
[/sourcecode]
[thrive_leads id=’2153′]
Mini-tutorial de la user interface RStudio
Otro vídeo donde te explico como es la user interface de RStudio y lo que me hubiera gustado saber antes de empezar:
Estas son las partes que component la user interface
- Comandos de R: puedes ver lo que vas escribiendo y ejecutando cada vez.
- R scripts: podràs ver el archivo de R que tienes abiertos y los podrás editar aquí.
- El workspace: verás las variables que has generado y los objetivos específicos que vas creando según vayas ejecutando lineas de tus archivos. ¡Esto son tus tablas de datos!
- Dataviewer: tienes también la posibilidad de ver tus datos en forma de tabla.
- Command history: el historial de los comandos que vas ejecutando. Muy útil si se pierdes un archivo y quieres recuperar lo que habías escrito.
- Zona mixta: aquí podrás ver los gráficos, buscar en el help, descargarte y instalar los packages.
Hasta aquí el tutorial de R para principiantes. Espero que te haya servido.
Si quieres profundizar en el uso de RStudio y cómo usarlo para analizar los datos de tus proyectos te invito a que des un vistazo al programa Analiza tus Datos. En él aprenderás a usar R de forma práctica y entender la estadística con la ayuda de vídeo tutoriales clic a clic y un repositorio de más de 200 códigos listos para que los puedas usar en tus datos.
Te espero dentro de Analiza tus Datos para seguir aprendiendo RStudio 🙂
Respecto a análisis multivariado tengo una duda.
¿Se verá PCA y regresión multilineal?
¿Y cómo entiendo y aplico los vectores del PCA y si con ellos puedo realizar el modelo multilineal?
Con esta última parte tengo problemas.
Desde ya gracias.
Hola Alfredo!
En el curso Analiza tu Estudio explico la técnica de Principal Component con ejemplos en R.
Tengo pensado publicar un artículo sobre esta técnica.
Pero tiempo al tiempo! 😉
Un abrazo!
la explicación es muy clara y precisa, gracias por todo estoy aprendiendo bastante
Gracias Julio!
Es de lo que se trata!
Saludos!
Buen video Jordi… muy didactico, gracias por tu aporte al conocimiento…
Me interesa seguir aprendiendo «R»… seguiré los pasos.
Gracias Jaime!
Era de los primeros… ahora lo haría mucho mejor 😉
Hola Jordi! Lo primero, enhorabuena! Muy didáctico. He tenido un problema a la hora de ejecutar el código, parece que no encuentra el paquete histograma, puede ser? Gracias!!
Error in ggplotly(histogram + scale_x_continuous(breaks = round(seq(min(pg$data[[1]]$xmin), :
objeto ‘histogram’ no encontrado
Hola Bárbara! En R la clave está en tener todos los paquetes cargados e instalados.
En este caso histogram no es un paquete de funciones. Deberías instalar y cargar los paquetes ggplot2 y plotly 🙂
Abrazos!
Hola, gracias por los vídeos están muy buenos pero como no soy programador hay cosas que en verdad no son tan fáciles de entre leer por ejemplo como saber que paquete usar para el tema de los graficos, o cual es la diferencia entre escribir en el cuadro de abajo o el de arriba.
hola, cuando quiero ejecutar Rstudio despues de instalarlo me sale el mensaje de error: EL PROGRAMA NO PUEDE INICIARSE PORQUE FALTA: api-ms-win-runtime-[1-10-0.dll
q puedo hacer?
gracias
Hola Jordi, muchas gracias por el aporte, a mí me vienen estupendos tus vídeos sobre R, estoy estudiando Matemáticas y para la asignatura de Estadística me requieren aprender a programar con R. Si puedes indicarme dónde conseguir más vídeos y detalles sobre R te lo agradecería también.
Un saludo, y a cuidarse mucho.