Qué buscan las empresas al contratar científicos de datos

Para llegar a ser un científico de datos de éxito se necesita algo más que conocimientos de programación de primera categoría. También es importante la capacidad de ver el panorama general y presentar la historia de los datos.

Big Data - Análisis de datos
Científico de datos – Consejos y trucos para el proceso de contratación

Hoy en día, la ciencia de los datos está en el corazón de casi todas las empresas y organizaciones. La creciente necesidad no solo de recopilar datos, sino también de cribarlos y analizarlos para tomar decisiones ha provocado una enorme demanda de científicos de datos cualificados.

Una carrera como científico de datos es muy atractiva para aquellos que buscan no solo un puesto de trabajo en demanda, sino uno que ofrece un alto potencial de ingresos y satisfacción laboral. En Glassdoor, se sitúa como el mejor trabajo para 2019 en Estados Unidos con un salario base medio de 108.000 dólares y una valoración de satisfacción laboral de 4,3 sobre 5.

Para aclarar las diferencias entre un científico de datos y un analista de datos, vea el siguiente vídeo:

¿Qué se necesita para ser un científico de datos? Evidentemente, son esenciales unas sólidas competencias técnicas. Pero la pregunta es: ¿qué habilidades específicas hay que dominar para seguir esta carrera en particular?

Las habilidades indispensables

La respuesta a la pregunta sobre las habilidades esenciales para los científicos de datos sigue cambiando y evolucionando, como demuestra un artículo muy citado de KD Nuggets sobre el tema: 9 habilidades imprescindibles para convertirse en un científico de datos, actualizado. El “actualizado” se añadió al título porque el número de competencias de la lista ha crecido con los años.

En el momento de escribir este artículo, las siguientes 13 habilidades están en la lista de los KD Nuggets:

Aunque algunas de las habilidades no son sorprendentes, ya que se espera que un científico de datos domine los lenguajes y las habilidades técnicas utilizadas en la ciencia de datos, algunos de los puntos son un poco más generales. Y es que la ciencia de los datos no consiste en extraer números de memoria, sino en darles sentido en el contexto de los objetivos empresariales.

No es sólo una ciencia, sino un arte

Por eso Venture Beat sugirió hace unos años que “artista de los datos” podría ser un título laboral más preciso: “Quizá estos científicos no sean los Einsteins y Edisons, sino los Van Goghs y Picassos de la revolución del Big Data.” Se trata de reconocer que los científicos de datos no se limitan a observar y cuantificar, sino que desarrollan enfoques creativos para obtener conocimientos y valor de los datos.

Un científico de datos de éxito no es sólo alguien que ha marcado la lista de habilidades duras. Debe tener la capacidad de pensar en cómo enfocar un problema de una manera nueva que abra el camino a una solución, y luego comunicar eficazmente lo que funcionó y por qué. El científico de datos que tiene éxito es mucho más que un cuantificador, es un pensador creativo y un solucionador de problemas con conocimiento del dominio.

La prueba de la entrevista de habilidades duras y blandas

Esta mezcla de habilidades proviene de la lista presentada por Roger Huang en Every Data Science Interview Boiled Down To Five Basic Questions. Estas cinco preguntas se componen de un 60% de habilidades duras, un 20% de habilidades blandas y un 20% de capacidad para aplicar los conocimientos a la situación.

Las habilidades duras suponen tres de las preguntas: una sobre matemáticas, otra sobre codificación y otra sobre estadística. Las habilidades blandas entran en juego cuando se trata de responder a lo que Huang denomina preguntas “de comportamiento” que evalúan la adecuación del candidato a la cultura de la empresa. Luego está lo que él llama la “pregunta del escenario”, que pide al solicitante que demuestre su capacidad de aplicar lo que ha aprendido a una situación específica y que esboce un enfoque que podría funcionar.

Ver el panorama general

Dado que una de las características distintivas del científico de datos es la curiosidad intelectual que impulsa a la persona a buscar la comprensión genuina, se espera que la persona haga algo más que crujir números. Según un artículo del Wall Street Journal, “un científico de datos eficaz… Tiene la capacidad de ver cómo ciertos subconjuntos de datos son más útiles que otros y qué conclusiones se pueden extraer de ellos”.

También es importante interesarse por el panorama general de la organización y por los resultados que son relevantes para sus objetivos. Esto coincide con lo que el Dr. John Maiden, un científico de datos de la Inteligencia Digital de JP Morgan Chase, describió en un blog de la Academia de Ciencia de Datos de Nueva York .

Una de las cosas más importantes que buscan en la empresa financiera es la capacidad de “aplicar soluciones a grandes y complicados problemas del mundo real”. Lo explica diciendo que el trabajo tiene menos que ver con el “simple análisis de datos” y más con “lidiar con conjuntos de datos desordenados para llegar a ideas procesables”.

Las Cs son la clave

En el siguiente vídeo, Bernard Ong, AVP, Lead Data Scientist, Advanced Analytics en Lincoln Financial Group, habla de su propia trayectoria profesional y de lo que busca en los candidatos cuando los contrata para su equipo. Además de conocimientos de programación y matemáticas, dice, quiere candidatos que posean lo que él llama las “3 C”. Estos representan la curiosidad, la creatividad y el pensamiento crítico.

Ong explicó por qué un buen científico de datos debe tener estas habilidades para “entender no sólo el modelado y el análisis predictivo, sino qué tipo de retos empresariales estamos tratando de abordar”. Aquí es donde es importante pensar en cómo encajan las cosas.

“Empieza por hacer las preguntas correctas que surgen de la curiosidad. Continúa con el pensamiento crítico para evaluar el problema, y sigue con la creatividad para encontrar soluciones innovadoras y comunicar la visión a la parte empresarial en términos que entiendan”, añade Ong.

Cuente la historia de los datos que impulsa las decisiones

Cuando se trata de comunicar esta visión, los “términos técnicos” simplemente no son suficientes. Más bien, “hay que ser capaz de contar la historia que hay detrás de los datos”, subraya Ong.

Hacer este tipo de movimientos dentro de una organización ciertamente requiere el uso de habilidades blandas, pero también son críticas para aquellos que permanecen en el rol de Científico de Datos. Maiden subraya la importancia de saber comunicar bien “para dar consejos prácticos para la toma de decisiones”. Esto requiere no sólo la comunicación verbal y escrita, sino también la visualización de los datos, encontrando los cuadros y gráficos adecuados para contar la historia de los datos de una manera que pueda ser entendida por aquellos que no tienen formación en el análisis de datos.

Dado que las personas responden con fuerza a las pruebas visuales, la representación gráfica de las correlaciones y causalidades descubiertas por el análisis de datos transmite las relaciones de forma mucho más convincente que el mero texto.  La visualización de datos es el lugar donde la cuantificación matemática y el arte creativo se unen para impulsar las decisiones basadas en datos.

KD Nuggets toca el mismo punto, haciendo hincapié en la importancia de desarrollar “una sólida comprensión de los fundamentos de la industria y los objetivos de la empresa” para que el científico de datos pueda “utilizar las habilidades técnicas para hacer una diferencia a largo plazo.” Esto es aún más interesante para los científicos de datos cuyas aspiraciones profesionales incluyen pasar a desempeñar un papel dentro de la C-suite.

Los enfoques creativos resuelven los problemas de datos

En la misma línea, Ong dice que hay que entender el contexto más amplio para estar seguro de que se trabaja con los datos necesarios para resolver el problema:

“Uno de los retos es conseguir los datos adecuados para encontrar las respuestas que se necesitan. Se pueden recopilar grandes cantidades de datos y aun así descubrir que no proporcionan la información que se busca”.

Aquí es donde entra el pensamiento creativo para elaborar la “fusión de datos”. Este enfoque consiste en “combinar diferentes fuentes de datos en nuevas combinaciones que podrían proporcionar el tipo de datos adecuado”.

“Aquí es donde la creatividad ayuda al científico de datos a hacer nuevos descubrimientos y a idear soluciones”, explica Ong.

En definitiva, trabajar eficazmente con Big Data requiere el uso de la creatividad y los procesos metodológicos en una combinación ideal que Einstein describió como el ideal de la ciencia:

“La mera formulación de un problema es mucho más esencial que su solución, que sólo puede ser cuestión de habilidad matemática o experimental. Plantear nuevas preguntas, nuevas formas de ver los viejos problemas desde un nuevo ángulo, requiere imaginación creativa y marca el verdadero progreso de la ciencia”.