Worauf Unternehmen bei der Einstellung von Data Scientists achten

Um ein erfolgreicher Data Scientist zu werden, braucht es mehr als erstklassige Programmierkenntnisse. Die Fähigkeit, das größere Bild zu sehen und die Datengeschichte zu präsentieren, ist ebenfalls wichtig.

Big Data - Datenanalyse
Data Scientist – Tipps und Tricks beim Einstellungsverfahren

Heutzutage ist Data Science das Herzstück von fast jedem Unternehmen und jeder Organisation. Die wachsende Notwendigkeit, Daten nicht nur zu sammeln, sondern auch zu sichten und zu analysieren, um Entscheidungen zu treffen, hat zu einer großen Nachfrage nach qualifizierten Data Scientists geführt.

Eine Karriere als Datenwissenschaftler ist sehr attraktiv für diejenigen, die nicht nur eine gefragte Position suchen, sondern auch eine, die ein hohes Verdienstpotenzial und eine hohe Arbeitszufriedenheit bietet. Auf Glassdoor rangiert er als bester Job für 2019 in Amerika mit einem mittleren Grundgehalt von 108.000 $ und einer Bewertung von 4,3 von 5 für die Arbeitszufriedenheit.

Um Klarheit über die Unterschiede zwischen einem Data Scientist und einem Datenanalysten zu erhalten, sehen Sie sich das folgende Video an:

Was braucht man, um ein Datenwissenschaftler zu sein? Offensichtlich sind starke technische Fähigkeiten unerlässlich. Aber die Frage ist, welche spezifischen Fähigkeiten muss man beherrschen, um diesen speziellen Karriereweg einzuschlagen?

Die unverzichtbaren Fähigkeiten

Die Antwort auf die Frage nach essenziellen Fähigkeiten für Data Scientists ändert und entwickelt sich weiter, wie ein viel zitierter Artikel von KD Nuggets zu diesem Thema zeigt: 9 Must-have-Fähigkeiten, die Sie brauchen, um Data Scientist zu werden, aktualisiert. Das „updated“ wurde dem Titel hinzugefügt, weil die Anzahl der Fähigkeiten auf der Liste im Laufe der Jahre gewachsen ist.

Zum jetzigen Zeitpunkt sind die folgenden 13 Fähigkeiten auf der Liste der KD Nuggets:

Während einige der Fähigkeiten nicht überraschen, da man von einem Data Scientist erwarten würde, dass er die in der Datenwissenschaft verwendeten Sprachen und technischen Fähigkeiten beherrscht, sind einige der Punkte etwas allgemeiner. Und das liegt daran, dass es in der Datenwissenschaft nicht um die bloße auswendige Extraktion von Zahlen geht, sondern darum, dem Ganzen im Kontext der Geschäftsziele einen Sinn zu geben.

Nicht nur eine Wissenschaft, sondern eine Kunst

Aus diesem Grund schlug Venture Beat vor einigen Jahren vor, dass „Datenkünstler“ vielleicht eine genauere Berufsbezeichnung wäre: „Vielleicht sind diese Wissenschaftler nicht die Einsteins und Edisons, sondern die Van Goghs und Picassos der Big-Data-Revolution.“ Es geht darum, zu erkennen, dass Datenwissenschaftler nicht nur beobachten und quantifizieren, sondern kreative Ansätze entwickeln, um Erkenntnisse und Werte aus Daten zu gewinnen.

Ein erfolgreicher Data Scientist ist nicht nur jemand, der die Liste der Hard Skills abgehakt hat. Er oder sie muss die Fähigkeit besitzen, darüber nachzudenken, wie man ein Problem auf eine neue Art und Weise angehen kann, die den Weg zu einer Lösung eröffnet, und dann effektiv zu kommunizieren, was funktioniert hat und warum. Der erfolgreiche Data Scientist ist weit mehr als nur ein Quant, er ist ein kreativer Denker und Problemlöser mit Domänenverständnis.

Der Interviewnachweis von Hard- und Soft Skills

Diese Mischung aus Fähigkeiten ergibt sich aus der Liste, die Roger Huang in Every Data Science Interview Boiled Down To Five Basic Questions vorstellt. Diese fünf Fragen setzen sich zusammen aus 60 % Hard Skills, 20 % Soft Skills und 20 % der Fähigkeit, Wissen auf die Situation anzuwenden.

Die Hard Skills machen drei der Fragen aus: eine zur Mathematik, eine zur Codierung und eine zur Statistik. Die Soft Skills kommen ins Spiel, wenn es um die Beantwortung von Fragen geht, die Huang als „Verhaltensfragen“ bezeichnet und die die Eignung des Bewerbers für die Unternehmenskultur bewerten. Dann gibt es noch das, was er die „Szenariofrage“ nennt, die den Bewerber auffordert, seine Fähigkeit zu demonstrieren, das Gelernte auf eine bestimmte Situation anzuwenden und einen Ansatz zu skizzieren, der funktionieren könnte.

Das große Ganze sehen

Da eines der Unterscheidungsmerkmale des Datenwissenschaftlers die intellektuelle Neugier ist, die eine Person dazu veranlasst, nach echtem Verständnis zu streben, wird erwartet, dass die Person mehr tut, als nur Zahlen zu crunchen. In einem Artikel des Wall Street Journal heißt es: „Ein effektiver Data Scientist … hat die Fähigkeit zu erkennen, wie bestimmte Teilmengen von Daten nützlicher sind als andere und welche Schlussfolgerungen daraus gezogen werden können.“

Es ist auch wichtig, sich für das Gesamtbild der Organisation zu interessieren und dafür, welche Ergebnisse für ihre Ziele relevant sind. Das deckt sich mit dem, was Dr. John Maiden, ein Datenwissenschaftler bei JP Morgan Chase’s Digital Intelligence, in einem NYC Data Science Academy Blog beschrieben hat.

Eines der wichtigsten Dinge, nach denen sie bei der Finanzfirma suchen, ist die Fähigkeit, „Lösungen für große, unübersichtliche Probleme der realen Welt anzuwenden“. Er erklärt das damit, dass der Job weniger mit „einfacher Datenanalyse“ zu tun hat, als mit dem „Umgang mit unübersichtlichen Datensätzen, um verwertbare Erkenntnisse zu gewinnen“.

Die Cs sind der Schlüssel

Im folgenden Video spricht Bernard Ong, AVP, Lead Data Scientist, Advanced Analytics bei der Lincoln Financial Group, über seinen eigenen Karriereweg und darüber, worauf er bei Kandidaten achtet, wenn er sie für sein Team einstellt. Zusätzlich zu den Programmier- und Mathematikkenntnissen, sagt er, möchte er Kandidaten, die das besitzen, was er die „3 Cs“ nennt. Diese stehen für Neugierde, Kreativität und kritisches Denken.

Ong erklärte, warum ein guter Datenwissenschaftler diese Fähigkeiten haben muss, um „nicht nur die Modellierung und prädiktive Analyse zu verstehen, sondern auch, welche Art von geschäftlichen Herausforderungen wir versuchen zu adressieren.“ Hier ist es wichtig, darüber nachzudenken, wie die Dinge zusammenpassen.

„Es beginnt damit, die richtigen Fragen zu stellen, die aus der Neugier entstehen. Es geht weiter mit kritischem Denken, um das Problem zu bewerten, und es geht weiter mit Kreativität, um innovative Lösungen zu finden und die Vision an die Geschäftsseite in Begriffen zu kommunizieren, die sie verstehen“, fügt Ong hinzu.

Erzählen Sie die Datengeschichte, die Entscheidungen vorantreibt

Wenn es darum geht, diese Vision zu kommunizieren, reichen „technische Begriffe“ einfach nicht aus. Vielmehr „muss man die Geschichte hinter den Daten erzählen können“, betont Ong.

Um solche Bewegungen innerhalb eines Unternehmens zu vollziehen, ist es sicherlich notwendig, die Soft Skills zu nutzen, aber sie sind auch für diejenigen entscheidend, die in der Rolle des Data Scientist bleiben. Maiden betont, wie wichtig es ist, gut kommunizieren zu können, „um umsetzbare Ratschläge für die Entscheidungsfindung zu geben.“ Das erfordert nicht nur mündliche und schriftliche Kommunikation, sondern auch Datenvisualisierung, das Finden der richtigen Diagramme und Graphen, um die Datengeschichte so zu erzählen, dass sie auch für diejenigen verständlich ist, die keine Ausbildung in Datenanalyse haben.

Da Menschen stark auf visuelle Beweise reagieren, vermittelt die grafische Darstellung der durch die Datenanalyse aufgedeckten Korrelationen und Kausalitäten die Beziehungen auf eine viel überzeugendere Weise als bloßer Text.  Datenvisualisierung ist der Ort, an dem mathematische Quantifizierung und kreative Kunstfertigkeit zusammenkommen, um datengestützte Entscheidungen zu fördern.

KD Nuggets berührt den gleichen Punkt, indem es betont, wie wichtig es ist, „ein solides Verständnis der Grundlagen der Branche und der Ziele des Unternehmens“ zu entwickeln, damit der Datenwissenschaftler „technische Fähigkeiten nutzen kann, um langfristig etwas zu bewirken.“ Dies ist von noch größerem Interesse für Data Scientists, deren Karrierewunsch einen Wechsel in eine Rolle innerhalb der C-Suite beinhaltet.

Kreative Ansätze lösen Datenprobleme

Im gleichen Sinne sagt Ong, dass man ein Verständnis für den größeren Kontext haben muss, um sicher zu sein, dass man mit den Daten arbeitet, die zur Lösung des Problems erforderlich sind:

„Eine der Herausforderungen ist es, die richtigen Daten zu bekommen, um die benötigten Antworten zu finden. Man kann große Datenmengen kuratieren und trotzdem feststellen, dass sie nicht die Informationen liefern, die man sucht.“

Hier kommt kreatives Denken ins Spiel, um „Datenfusion“ zu erarbeiten. Dieser Ansatz besteht darin, „verschiedene Datenquellen zu neuen Kombinationen zu verbinden, die die richtige Art von Daten liefern könnten.“

„Hier hilft die Kreativität dem Datenwissenschaftler, neue Entdeckungen zu machen und Lösungen zu erarbeiten“, erklärt Ong.

Letztlich erfordert die effektive Arbeit mit Big Data die Nutzung von Kreativität und methodischen Prozessen in einer idealen Kombination, die Einstein als das Ideal der Wissenschaft beschrieben hat:

„Die bloße Formulierung eines Problems ist weitaus wesentlicher als seine Lösung, die nur eine Frage der mathematischen oder experimentellen Fähigkeiten sein kann. Neue Fragen aufzuwerfen, neue Möglichkeiten, alte Probleme aus einem neuen Blickwinkel zu betrachten, erfordert schöpferische Phantasie und markiert echte Fortschritte in der Wissenschaft.“