Cómo estructurar tu código con 5 apartados muy sencillos

¿Estás listo para empezar a usar un software para el análisis de datos como R, Matlab, Phyton? ¿Te vas a poner a aprender alguno de estos lenguajes y «picar» código? ¿Quieres aprender como es su interfaz y empezar a manejarlos? ¡Stop! Antes de esto te propongo algo más inteligente: estructura tu código científico con 5 apartados muy sencillos. En su día nadie me lo enseño y creo que te va a ser muy útil.

Como ya sabes cuando utilizas este tipo de softwares trabajas mediante la creación de código y programación. Es muy importante saber escribir en el lenguaje y más aún saberlo estructurar. Porque cuando creas un código lo haces para responder alguna pregunta y sacar conclusiones.

Me va muy bien pensar que mi código es una pequeña fábrica capaz de convertir un montón de hilos en maravillosos jerseys. Es aquí cuando aparecen los 5 puntos que debes cumplir:

Lo primero: tener las máquinas a punto con el correcto funcionamiento, que todo este limpio y preparado para la fabricación (inicialización).
Disponer de la materia prima. Principalmente hilo de diferentes colores y matices (importar datos).
Configurar las máquinas para fabricar exactamente los jerseys que estamos pensando. Una serie de consignas de entrada (inputs) en la maquinaria condicionaran las propiedades de los tejidos que se fabriquen.
Es momento de convertir un montón de hilos en tejidos preciosos (procesado de datos)
Finalmente combinar los tejidos para crear maravillosos jerseys (output).

En relación a este símil de la fabrica de jerseys puedes enunciar los 5 apartados muy sencillos para aportar la estructura de tu código (mira el puente de Brooklyn 🙂 )

Declarar variables o cargar paquetes de funciones (inicialización)
Importar/leer los datos (datos)
Configurar las variables de entrada (inputs)
Transformar tus datos
Extraer los resultados (outputs)

1. Declarar variables o cargar paquetes de funciones (inicialización)

Lo primero es tener a punto la fábrica. Tener las máquinas en perfecto estado. Aquí vas a hacer principalmente dos cosas:

Cargar los paquetes de funciones que vas a utilizar en el procesado de datos. Muchos softwares tienen el programa base dónde se encuentran las funciones principales. Además de estas puedes añadir paquetes de funcionalidades que deben ser cargados o instalados antes de utilizarlos.
Inicializar las variables que después vas a utilizar. Poner a cero las matrices, vectores con las dimensiones correctas. Este punto es dinámico. A medida que vas diseñando tu procesado de datos irás dándote te cuenta de nuevas variables que vas a necesitar. Estas las inicializarás aquí. Es importante tenerlas iniciadas en un solo apartado y poner comentarios al lado para explicar para que van a ser utilizadas.

2. Importar/leer datos

Vas a conseguir el hilo para fabricar jerseys. Sin mi materia prima estoy jodido, está claro. Además es importante saber cómo son: su grosor, el color, la calidad etc.

No hay código de procesado de datos sin los datos. En este punto es importante saber en que formato tienes los datos de partida y saber leerlos. Es un punto crítico y a veces se pierda mucho tiempo en leer datos correctamente porque hay miles de formatos de datos.

El formato que se utiliza normalmente es ASCII. Son archivos de datos expresados con caracteres. Yo te aconsejo que utilices Notepad++ para visualizar estos archivos.

3. Configurar las variables de entrada (inputs)

Los operarios configuran las maquinaria para convertir montones de hilos en preciosos tejidos. Para ello ajustarán los parámetros de las máquinas.

Eso es, piensa que inputs necesitas para tu metodología de procesado de datos y que valores son los más apropiados.

Como antes, en el punto de inicializar variables: es dinámico. Te vas a dar cuenta de nuevas variables que servirán para configurar tu metodología. Si agrupas los inputs en este aparatado te será mucho más fácil tener tu maquinaria controlada y en perfecto estado.

4. Transformar los datos

Por si sola la materia prima no es nada. Convertir un montón de hilos en preciosos tejidos debe ser tu obsesión.

Pasa lo mismo con los datos. Aquí los datos de partida los transformas en otros mucho más valiosos que te van a permitir responder a las preguntas de tu problema.

Cómo transformarlos dependerá del objetivo de tu código y a que preguntas quieres responder. La metodología de procesado de los datos es consecuencia directa del fin de tu fábrica.

Con esto claro tienes la oportunidad perfecta para demostrar lo que vales. Aplica los mejores conocimientos de mates y estadística para transformar tus datos de partida en otros más valiosos.

5. Extraer los resultados (outputs)

Es el momento más esperado… Convertir los preciosos tejidos en maravillosos jerseys. Convertir los datos transformados en maravillosos gráficos.

Puedes hacer dos cosas:

Crear tu mejores gráficos. La estadística descriptiva juega un gran papel y te viene genial para poder crear los gráficos que mejor representen lo que quieras decir.
Grabar tus datos en el formato que después puedas releer. Graba los datos en el formato que mejor te vaya para después poderlos recuperar.

[thrive_leads id=’629′]

Para que lo veas más claro te dejo un ejemplo dónde te muestro en la práctica como quedan los puntos que te acabo de presentar. Además si sabes utilizar R podrás usarlo para tu proyecto.

Y ahora tu turno. Te propongo que utilices este esquema.

¿Crees que falta algún punto de los que te he comentado?

No pierdas el foco y estructura tu código con 5 apartados muy sencillos

1. Declarar variables o cargar paquetes de funciones (inicialización)

2. Importar/leer datos

3. Configurar las variables de entrada (inputs)

4. Transformar los datos

5. Extraer los resultados (outputs)

[thrive_leads id=’629′]

Artículos relacionados.

No puedes analizar datos que no están ordenados: del caos al insight en Excel

5 tipos de librerías en Python para Analizar tus Datos como un ninja

Las 7 enseñanzas top de Ciencia de Datos en 2023 que he compartido con mis alumnos de AD

Sobre el autor

Jordi Ollé

2 comentarios en “No pierdas el foco y estructura tu código con 5 apartados muy sencillos”

Sesión Gratuita de 45 minutos para descubrir los pasos claves para avanzar en tu carrera en Análisis de Datos:

Cómo aplicar y dominar la ciencia de datos directamente en proyectos reales.

Trainings de estadística

Servicios para empresas

GRATUITOS

CONCEPTOS CLAROS