Estas son mis 12 lecciones aprendidas de ciencia de datos cuando llevas a cabo proyectos de principio a fin.
Este artículo te va a ayudar si te estás adentrando en el mundo de la ciencia de datos y eres novato con el tema o llevas poco tiempo.
Te ayudará también, si llevas a cabo un proyecto en tu empresa o proyecto de investigación donde los datos son parte súper importante.
Aplica todas estas enseñanzas y estoy seguro que llegarás a aportar mucho valor en tu sector a través de los datos.
¡A por ello!
El vídeo resumen del artículo: 12 Lecciones aprendidas de ciencia de datos
Aquí el vídeo de la lección por si prefieres el formato audiovisual.
A continuación el artículo con todo el contenido explicado con detalle y cómo llevarlo a la práctica.
1. Pregunta y empatiza
Pregunta.
Escucha.
Vuelve a preguntar.
Vuelve a escuchar.
Y sobre todo escucha.
Para entender el objetivo del proyecto y el problema a resolver es importante preguntar tus dudas y empatizar y escuchar.
No hay nada peor que invertir muchas horas picando código o limpiando datos y volver a empezar porque no tiene sentido lo que has hecho.
Me ha pasado muchas veces.
Después de muchos proyectos queriendo terminarlos bien y rápido me he dado cuenta de que es un gran error. Las prisas son malas consejeras.
Lo mejor es invertir tiempo en comprender qué quiere tu cliente (o qué quieres tú para tu proyecto o investigación etc) para después ser mucho más enfocado al trabajar los datos.
Por ello es importante empatizar con el cliente, con las personas que estás colaborando.
Comprender su lenguaje y el problema que quieres resolver.
A veces le tienes que decir que no se puede resolver lo que plantea y es momento de ofrecerle nuevas maneras de atacar el problema.
Nuevas alternativas y definir varias etapas para llegar dónde quiere llegar.
En la práctica:
- Después de preguntar, entender bien el objetivo práctico y el problema a resolver, escríbelo con palabras sencillas en un documento word.
- Imprímelo y trabajo con este documento al lado.
2. No hay prisa
Sé que quieres terminar el proyecto.
Tener resultados y tomar decisiones con esos resultados.
O incluso quieres una herramienta que te permita estimar que va a pasar. Crear una herramienta predictiva es el objetivo final y la quieres, si puede ser, mañana.
Todos lo queremos pero no hay prisa. Todo proyecto tiene su proceso y es importante respetarlo.
No hay prisa por tener resultados.
Primero: entiende los datos, el significado de las variables antes de diseñar un plan.
Piensa cuáles de ellas son importantes y cuáles no.
¿Qué información no puedes obtener variables?
Todo ello te ayudará a diseñar después una estrategia ganadora.
En la práctica:
El análisis de datos sigue las siguientes etapas:
- Exploración
- Modelo de datos
- Reconocer patrones
- Crear herramientas predictivas
Analiza los datos siguiendo estas etapas o mejor aún diseña tu estrategia pensando en estas etapas. Diseña primero la estrategia y después a la práctica. Poco a poco.
3. Utiliza papel y boli para diseñar tu estrategia. Piensa primero
Siguiendo con el punto anterior.
Utiliza un papel y un boli para diseñar la estrategia. O una pizarra electrónica. Me da igual.
Más que nada que puedas borrar y volver a pintar.
Cuando lo veas claro ponte manos a la obra.
Pinta los gráficos y las tablas que quieres obtener.
Borra si no te gusta.
Ajusta.
Encuentra esa manera de plantear el proyecto dibujando en un papel.
Este pequeño ejercicio te dará la claridad más que necesaria para plantear tus proyectos.
Si no sabes muy bien cómo enfocar la estrategia es importante hablar con tu mentor o mentora. Te ayudará a diseñar bien qué pasos tienes que seguir.
Diseñar muy bien la estrategia para enfocarnos desde el inicio es de vital importancia. Evidentemente a medida que vas avanzado esta estrategia puede variar y ser reenfocarla en función de lo que vamos encontrando, no te preocupes. Los proyectos de análisis de datos son difíciles de prever pero si que es posible definir esa guía para enfocarlo con éxito des del inicio.
Siempre parte de algo con sentido: tu estrategia.
4. Descubre y disfruta de los datos pero no pierdas mucho el tiempo en lo mismo
Disfruta descubriendo de tus datos pero no des muchas vueltas a la misma cosa. Si tienes la sensación que llevas mucho tiempo pensando en lo mismo, para y revisa tu plan y objetivo de tu proyecto.
Por ejemplo: a mi me ha pasado de estar invirtiendo demasiado tiempo en crear el gráfico perfecto cuando en realidad no es la información más importante para el cliente.
En la práctica:
- Mi recomendación es que te apuntes en un post-it el objetivo y el problema a resolver de tu proyecto.
- Cuando veas que divagas y no avanzaslee el post-it y piensa que todas las acciones deberían ir alineadas a resolver ese problema.
5. Aprende a buscar en Google
Google tiene TODAS las respuestas técnicas que estás buscando. Pero es importante saber buscar y dónde. Lista tus webs de referencia.
Un ejemplo de mis webs de referencia en ciencia de datos:
- cienciadedatos.net
- analyticsvidhya.com
- statmethods.net
- sthda.com
- machinelearningmastery.com
- stackoverflow.com
Entre otras muchas.
En la práctica:
- Guarda las páginas en marcadores del explorador web y te va a ahorrar miles de horas al buscar información.
6. Necesitas feedback
Feedback.
Necesitas saber el feedback de otros compañeros, clientes etc… Esto te dará mucha claridad para ver si estás avanzando en la dirección correcta. Reúnete con los clientes, colaboradores, con tu tutor de tesis, da igual. Habla de lo que has encontrado y pide su impresión y feedback. Estos proyectos de análisis de datos son colaborativos.
Sobre todo en la parte de exploración necesitas mostrar tus resultados y que el experto en el tema te de feedback para que analice lo que has encontrado.
Te dará ideas para seguir avanzando en la dirección ideal y ahorrarte tiempo.
En la práctica:
- Cuando termines con la exploración explícala a tu compañero, a tu clientes o a tu tutor de tesis.
- Reporta esos resultados y te dará una claridad increíble.
7. Si estás empezando apóyate de un mentor/a
Apóyate de un mentor o mentora. Te darán la visión de experiencia que te falta.
Cuando empecé tenía un mentor de referencia y aún sigue siendo mi mentor.
Es Raúl Benítez que hace poquito nos impartió un curso de machine learning y deep learning en python dentro del programa beta el Científico Libre. ¡Fue incríble!
Encontrarlo no es fácil pero cuando lo encuentras puedes avanzar mucho más rápido y disfrutando del camino junto a él o ella.
En la práctica:
- Busca un referente en LinkedIn, en blogs, en tu empresa. Y sigue sus pasos. Apóyate de su experiencia.
- Si te gusta lo que hace contacta con él/ella e intenta colaborar o ser alumnos de sus programas formativos
8. Lo simple funciona mejor
Simplifica.
Las técnicas y estrategias más simples son las que suelen funcionar.
No te compliques demasiado.
Einstein nos lo mostró hace unos cuántos años:
“Todo debe hacerse tan simple como sea posible, pero no más”
Einstein
Por experiencia lo que mejor funciona en la práctica es lo simple.
¿Por qué?
- Porque es más fácil de controlar.
- De entender.
- Hay menos probabilidad de que falle.
- Se puede replicar de forma más fácil.
En la práctica:
- Una vez veas una manera de resolver el problema piensa en otra alternativa más simple. Seguro que encuentras una. Empieza por esta.
9. Disfruta del proceso
Esta lección es sencilla pero muy difícil.
Disfruta del proceso. Déjate llevar por el investigador que llevas dentro. Sé curioso y aprende como un niño.
Enfócate en el proceso no en el resultado.
10. Aprende y sigue aprendiendo
Sigue aprendiendo.
La ciencia de datos, como indica el nombre, es una ciencia. Y no pararas nunca de aprender. Es lo bonito.
La sensación de no saber suficiente te va acompañar el resto de tu vida.
Tener todo controlado no podrás tenerlo.
Tampoco aprenderás todo.
Y ni sabrás todas las técnicas que existen y su uso.
No hace falta.
Lo importante es tener unas bases suficientemente asentadas para aprender rápido y de forma eficaz a medida que van apareciendo nuevos retos.
Tómatelo como un camino que vas recorriendo con pasitos de bebé.
Baby steps como dicen los americanos.
11. Comparte con tu tribu
Encuentra tu tribu. Necesitas comunicarte con otros que hablan tu mismo lenguaje de datos. Esto te ayudará a avanzar.
También a hablar el idioma de tu temática. Necesitas las dos cosas:
- Conocer el tema de tus datos.
- Y conocer de datos.
De esta manera puedes juntar te sector con los datos y ser un profesional distinto. Imparable.
Por ello es importante que tengas dos tribus para compartir 🙂
12. Utiliza un sistema seguro
Descubre un sistema, un método para trabajar tus datos. Esto te ahorrará muchas horas y dolores de cabeza.
Además te dará la claridad suficiente para seguir aprendiendo de forma mucho más efectiva y rápida.
[thrive_leads id=’20703′]
Nota: para crear este post me he inspirado en esta publicación de linkedin. Mil gracias por compartir estas enseñanzas en LinkedIn 🙂
—
Espero que te haya ayudado este listado de lecciones aprendidas después de unos cuántos años trabajando con proyectos, ayudando a alumnos en sus investigaciones y pasarlo pipa con los datos.
1 abrazo y te espero en la clase gratuita Analiza tus Datos dónde vas a descubrir un sistema para analizar los datos.