No pierdas el foco y estructura tu código con 5 apartados muy sencillos

No pierdas el foco y estructura tu código con 5 apartados muy sencillos

No pierdas el foco y estructura tu código con 5 apartados muy sencillos

¿Estás listo para empezar a usar un software para el análisis de datos como R, Matlab, Phyton? ¿Te vas a poner a aprender alguno de estos lenguajes y “picar” código? ¿Quieres aprender como es su interfaz y empezar a manejarlos? ¡Stop! Antes de esto te propongo algo más inteligente: estructura tu código científico con 5 apartados muy sencillos. En su día nadie me lo enseño y creo que te va a ser muy útil.

Como ya sabes cuando utilizas este tipo de softwares trabajas mediante la creación de código y programación. Es muy importante saber escribir en el lenguaje y más aún saberlo estructurar. Porque cuando creas un código lo haces para responder alguna pregunta y sacar conclusiones.

Me va muy bien pensar que mi código es una pequeña fábrica capaz de convertir un montón de hilos en maravillosos jerseys. Es aquí cuando aparecen los 5 puntos que debes cumplir:

  1. Lo primero: tener las máquinas a punto con el correcto funcionamiento, que todo este limpio y preparado para la fabricación (inicialización).
  2. Disponer de la materia prima. Principalmente hilo de diferentes colores y matices (importar datos).
  3. Configurar las máquinas para fabricar exactamente los jerseys que estamos pensando. Una serie de consignas de entrada (inputs) en la maquinaria condicionaran las propiedades de los tejidos que se fabriquen.
  4. Es momento de convertir un montón de hilos en tejidos preciosos (procesado de datos)
  5. Finalmente combinar los tejidos para crear maravillosos jerseys (output).

En relación a este símil de la fabrica de jerseys puedes enunciar los 5 apartados muy sencillos para aportar la estructura de tu código (mira el puente de Brooklyn 🙂 )

  1. Declarar variables o cargar paquetes de funciones (inicialización)
  2. Importar/leer los datos (datos)
  3. Configurar las variables de entrada (inputs)
  4. Transformar tus datos
  5. Extraer los resultados (outputs)

1. Declarar variables o cargar paquetes de funciones (inicialización)

Lo primero es tener a punto la fábrica. Tener las máquinas en perfecto estado. Aquí vas a hacer principalmente dos cosas:

  1. Cargar los paquetes de funciones que vas a utilizar en el procesado de datos. Muchos softwares tienen el programa base dónde se encuentran las funciones principales. Además de estas puedes añadir paquetes de funcionalidades que deben ser cargados o instalados antes de utilizarlos.
  2. Inicializar las variables que después vas a utilizar. Poner a cero las matrices, vectores con las dimensiones correctas. Este punto es dinámico. A medida que vas diseñando tu procesado de datos irás dándote te cuenta de nuevas variables que vas a necesitar. Estas las inicializarás aquí. Es importante tenerlas iniciadas en un solo apartado y poner comentarios al lado para explicar para que van a ser utilizadas.

2. Importar/leer datos

Vas a conseguir el hilo para fabricar jerseys. Sin mi materia prima estoy jodido, está claro. Además es importante saber cómo son: su grosor, el color, la calidad etc.

No hay código de procesado de datos sin los datos. En este punto es importante saber en que formato tienes los datos de partida y saber leerlos. Es un punto crítico y a veces se pierda mucho tiempo en leer datos correctamente porque hay miles de formatos de datos.

El formato que se utiliza normalmente es ASCII. Son archivos de datos expresados con caracteres. Yo te aconsejo que utilices Notepad++ para visualizar estos archivos.

3. Configurar las variables de entrada (inputs)

Los operarios configuran las maquinaria para convertir montones de hilos en preciosos tejidos. Para ello ajustarán los parámetros de las máquinas.

Eso es, piensa que inputs necesitas para tu metodología de procesado de datos y que valores son los más apropiados.

Como antes, en el punto de inicializar variables: es dinámico. Te vas a dar cuenta de nuevas variables que servirán para configurar tu metodología. Si agrupas los inputs en este aparatado te será mucho más fácil tener tu maquinaria controlada y en perfecto estado.

4. Transformar los datos

Por si sola la materia prima no es nada. Convertir un montón de hilos en preciosos tejidos debe ser tu obsesión.

Pasa lo mismo con los datos. Aquí los datos de partida los transformas en otros mucho más valiosos que te van a permitir responder a las preguntas de tu problema.

Cómo transformarlos dependerá del objetivo de tu código y a que preguntas quieres responder. La metodología de procesado de los datos es consecuencia directa del fin de tu fábrica.

Con esto claro tienes la oportunidad perfecta para demostrar lo que vales. Aplica los mejores conocimientos de mates y estadística para transformar tus datos de partida en otros más valiosos.

5. Extraer los resultados (outputs)

Es el momento más esperado… Convertir los preciosos tejidos en maravillosos jerseys. Convertir los datos transformados en maravillosos gráficos.

Puedes hacer dos cosas:

  1. Crear tu mejores gráficos. La estadística descriptiva juega un gran papel y te viene genial para poder crear los gráficos que mejor representen lo que quieras decir.
  2. Grabar tus datos en el formato que después puedas releer. Graba los datos en el formato que mejor te vaya para después poderlos recuperar.

Para que lo veas más claro te dejo un ejemplo dónde te muestro en la práctica como quedan los puntos que te acabo de presentar. Además si sabes utilizar R podrás usarlo para tu proyecto.

Y ahora tu turno. Te propongo que utilices este esquema.

¿Crees que falta algún punto de los que te he comentado?

Acerca del autor

Jordi Olle Sanchez

Autor de ConceptosClaros.com. Ayuda a investigadores apasionados a aplicar estadística y análisis de datos en sus proyectos para catapultar su carrera investigadora y adaptarse a la era de los datos. Accede a los recursos gratuitos para aplicar estadística en tus datos

Interacciones del lector

Si te ha servido puedes comentar aquí ;)

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

  Acepto la política de privacidad

Responsable del fichero: Jordi Ollé Sánchez
Finalidad; envío de mis publicaciones así como correos comerciales.
La Legitimación; es gracias a tu consentimiento.
Destinatarios:Como usuario e interesado te informo que los datos que me facilitas estarán ubicados en los servidores de Webempresa (proveedor de hosting de Conceptos claros) dentro de la UE. Ver política de privacidad de Webempresa
Podrás ejercer Tus Derechos de Acceso, Rectificación, Limitación o Suprimir tus datos enviando un email a jordi @ conceptosclaros.com o ante la Autoridad de Control
Encontrarás más información en política de privacidad
Pro-statistics-Mockup-presentacion

Descárgate los recursos gratuitos y empieza a construir las bases para analizar los datos de tus proyectos de investigación