¿Sabes qué es un científico de datos?
¿Conoces los perfiles profesionales entorno a los datos? y ¿dónde se sitúa el científico de datos?
En este post quiero acercarte la figura del científico de datos y comprendas la filosofía de trabajo que hay detrás de la ciencia de los datos.
Con la ayuda de dos expertos (Martí y Dani) que nos van a hablar de la revolución profesional entorno a los datos y por supuesto: qué es un científico de datos
¡Espero que este artículo te ayude a acercarte un poco más la disciplina de los datos!
Los perfiles profesionales entorno a los datos y dónde se encuentra el científico de datos
Antes de desvelarte qué es un científico de datos me gustaría mostrate distintos perfiles que están relacionados con los datos y que seguramente puedas algún día cubrir este tipo de huecos profesionales.
Ahora mismo la demanda de profesionales de datos es creciente y puede ser de gran oportunidad para tu futuro profesional.
¿Qué perfiles profesionales puedes encontrar en el mundo de los datos?
- El innovador: es un estado. No es una profesión. Es el perfil de aquellas personas que se interesan por los datos y muchas veces se les ocurren ideas para innovar aprovechando los datos en su día a día.
Si estás en este estado la clave es formarte para descubrir las maneras de utilizar los datos. Puedes ver un artículo sobre cómo analizar datos.
- El analista de datos (data analyst): es un profesional que se dedica, principalmente, al reporting: a ordenar y describir datos. Uno de los campos en auge es el BI (business intelligence). Un gran ejemplo es Salvador Ramos de elfuturodelosdatos.com
- El científico de datos (data scientist): se dedica a resolver problemas mediante los datos. Es conocer de algoritmos de modelización, predicción y reconocimiento de patrones. (ahora hablaremos un poco más de ello)
- El arquitecto o ingeniero de datos (data engineer o data architect): se encarga del antes de describir o analizar datos. Se trata del trabajo duro de diseño de la estructura de los datos. Es decir:los procesos de extracción, transformación y carga de los datos.
- El consultor de datos: es conocedor de todos los perfiles. No de los detalles pero sí de la visión global. Es capaz de liderar proyectos de datos y asesorar a clientes y sus colaboradores.
Ahora ya estás un poco más situado en los perfiles profesionales entorno a los datos.
¡Esto está muy bien!
Ahora voy a compartir un poco más de información acerca de qué es un científico de datos.
Los tres ingredientes del científico de datos
Uno de los objetivos de Conceptos Claros es ayudarte a ser mejor profesional y utilizar los datos para resolver problemas y mejorar en tu día a día.
En el fondo te quiero ayudar a convertirte en un científico de datos.
Que seas capaz de resolver problemas a través de los datos. (sin darme cuenta te acabo de definir un científico de datos :P)
¿Qué te parece?
Para ello necesitas ser conocedor de varios aspectos. O varios ingredientes de conocimiento. Estos son:
- Tu temática: los datos siempre son respecto a una temática en particular. Y esta temática te tiene que gustar y tienes que ser conocer de ella.
- Pasión: es el siguiente ingrediente. Si o si te tiene que motivar los problemas que quieres resolver con los datos. Tienes que ser curioso. Sino… ¿para qué ponerte a innovar o investigar?
- Ciencia de la computación – uso de programación y herramientas: ¡claro! los datos son sinónimo de cálculos. De uso de software y calculadoras para transformar datos en conclusiones y respuestas. (al final del artículo tienes algo más de información)
- Estadística aplicada: son las herramientas matemáticas para transformar datos. Si o si, necesitas las bases estadísticas para resolver problemas. Con esto te puedo ayudar ¡mucho!
Datos + tu temática + pasión = profesional imparable
Esta es la fórmula que trato de incentivar dentro de Conceptos Claros 🙂
Una profesión colaborativa: qué es el científico de datos – mitos y revolución industrial
Ahora que ya intuyes más o menos qué es un científico de datos y qué ingredientes necesitas conocer para convertirte en uno de ellos.
Es momento de mostrarte con más detalle qué es esta figura del científico de datos. Para ello te traigo una entrevista que difundimos el pasado congreso InvestigaconDatos2019 con dos súper expertos en la materia.
En esta charla con Dani y Martí hablaremos sobre los mitos y el auge de la ciencia de los datos. Y evidentemente, sobre la figura del científico de datos.
¡Es muy enriquecedor hablar con expertos como Dani y Martí que viven con pasión esta disciplina.
Nos ayudan a ver la importancia de la estadística dentro de un proyecto con datos!
DESCARGA MATERIAL DE LA CHARLA
A continuación te comparto más información sobre los dos ponentes a la charla del pasado congreso Investigacondatos2019:
- Martí Casals Toquero es doctor en Estadística. Trabaja como profesor e investigador en el grupo Sport Performance Analysis Research Group (SPARG) del Centro de Estudios en el Deporte y Actividad Física (CEEAF) en la Universitat de Vic – Universitat Central de Catalunya UVic-UCC (UVic-UCC) y en la Escuela Universitaria de la Salud y el Deporte (EUSES, Girona). También colabora con el centro del conocimiento y la innovación deportiva Barça Innovation Hub – Universitas.
Dani Fernández, doctor e investigador senior en bioestadística en el centro de investigación Sant Joan de Déu (parque sanitario), es profesor en la universidad de Barcelona, la UIC, la UOC y varias business Schools (EU y GBS). Es un experto en datos categóricos, especialmente, respuestas ordinals y en técnicas de unsupervised learning, en particular clustering
La estadística es el alma del científico de datos
Después de esta entrevista me doy cuenta de dos cosas:
La importancia de la Estadística – saber hablar con los datos es clave. Lo cual la estadística es una pata fundamental para poder entenderte con tus datos y resolver problemas reales.
Y eso es precisamente lo que logramos con el programa Analiza tus Datos. Aprender una habilidad para transformar datos en conclusiones y respuestas para tu día a día.
No sólo conocer la estadística des del punto de vista práctico sino des del punto de vista de las etapas de transformación de datos:
Otro aspecto importante es: la colaboración. La ciencia de datos no es una guerra entre perfiles profesionales: informáticos, estadísticos, ingenieros, científicos …
Aquí se trata de colaborar todos entre todos y resolver problemas con la ayuda de los datos.
Eso es increíblemente potente.
La clave está en la colaboración entre perfiles profesionales para resolver problemas y hacer de este mundo: un mundo mejor.
Bonus: las tres herramientas más importantes en la ciencia de datos
Estas son las herramientas más utilizadas en el mundo de la ciencia de datos y machine learning:
- R
- Python
- SQL
- RapidMiner
R – es el lenguaje estadístico por excelencia y lo usan los científicos de datos con un perfil más científico que no técnico.
Python – dicen los expertos que python será el lenguaje de los científicos de datos por excelencia pero yo creo que pueden convivir todas las herramientas colaborativas. R es más estadístico y Python más machine learning por decirlo rápido.
RapidMiner – es un software muy interesante, fácil de utilizar, sin programar y da resultados de forma muy rápida.
SQL – es un lenguaje de programación diseñado para administrar y recuperar información de sistemas de gestión de bases de datos. Es muy necesario ya que muchas (casi todas) las bases de datos provienen de internet / servidores.
…
Después de este post ya has visto una visión más global del científico de datos y cómo expertos del sector que llevan trabajando muchos años hablan sobre esta profesión tan bonita y tan colaborativa.
La energía de la entrevista me encantó con Martí Casals y Dani … 🙂
¡Espero que te haya gustado mucho!