Dienstag, 19. März 2024

Archiv

Trendberuf Data Scientist
Jonglieren mit Datenmengen

Die Spezialität von Data Scientists ist es, große Informationsmengen aus verschiedenen Perspektiven zu untersuchen - daher ist diese Berufsgruppe in entsprechend vielen Einsatzbereichen gefragt. Mittlerweile gibt es sogar eigene Bachelorstudiengänge in „Data and Information Science“.

Von Friederike Müllender | 10.02.2020
Kopf einer Frau mit digitalen Daten
Neben dem Bachelorstudium "Data and Information Science" gibt es auch Masterstudiengänge und Fortbildungen, mit denen man sich zum Data Scientist qualifizieren kann (imago / Nanette Hoogslag)
Der Tag beginnt für Daniel Trabold morgens um neun. Mit dem Fahrrad geht es für ihn zum Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme in der Nähe von Bonn. In seinem schlicht eingerichteten Büro steht nicht viel rum, was ihn ablenken könnte. Auf dem aufgeräumten Schreibtisch stehen zwei Bildschirme und ein Laptop. Mehr braucht der Data Scientist Daniel Trabold nicht:
"Wenn man versucht, diesen Begriff des Data Scientist irgendwie zu definieren, dann hat man im Prinzip drei Sachen, die da zusammenspielen. Das eine ist fundiertes mathematisches Wissen, aus dem man herleiten kann, ob das, was man da macht, mathematisch-stochastisch fundiert ist. Das andere ist: Man hat die Fähigkeit zu programmieren, und das ist, was ich im Alltag eben häufig mache, dass ich irgendeinen Programmcode schreibe. Und dann brauche ich eigentlich noch eine Fachexpertise in irgendeiner Domäne."
Data Scientist sind echte "Problemlöser"
Der 39-Jährige ist vor allem eines, ein Problemlöser. Und die sind ziemlich gefragt, weiß Professorin Ragna Seidler-de Alwis. Sie leitet den noch jungen Bachelor-Studiengang "Data and Information Science" an der TH Köln:
"Die Digitalisierung hat diesen Beruf zutage gefördert und möglich gemacht. Weil wir so viele Daten haben, die digital vorliegen, können wir jetzt diese Daten auch über verschiedenen Mechanismen analysieren. Man muss sagen, dazu gehört noch eine ganze Menge mehr, nämlich solche Punkte wie, damit Fake News nicht entstehen, muss ich mir sehr wohl überlegen, aus welchen Quellen kommen, denn die Daten, sind die Daten korrekt, sind die valide, sind die reputabel, objektiv."
Die Fähigkeit mit genau diesen Daten richtig umzugehen, lassen sich viele Unternehmen auch einiges kosten. In der freien Wirtschaft können Data Scientists gerne mal zwischen 70 und 100 tausend Euro brutto im Jahr verdienen. So völlig neu ist die "Data and Information Science" aber eigentlich nicht:
"Das ist eigentlich eine Weiterentwicklung gewesen. Wir hatten früher die Informationswirtschaft, dann sind wir übergegangen zur angewandten Informationswissenschaft und das war jetzt ein Name, der die Leute nicht so angezogen hat, die aber auf dem Markt ganz stark gebraucht wurden."
Verschiedene Einsatzbereiche
An sechs Hochschulen in Deutschland kann man mittlerweile einen Bachelor in "Data and Information Science" machen. Zudem gibt es Masterstudiengänge und Fortbildungen, um in diesem Bereich zu arbeiten. Die Einsatzbereiche für einen Data Scientist sind dabei nahezu unbegrenzt.
So arbeitet Daniel Trabold mit seinem Team zum Beispiel seit Jahren an der Optimierung einer Bank-Software. Diese soll kriminelle Handlungen wie beispielsweise Kreditkartenbetrug anhand von abweichenden Daten automatisch erkennen. Ein anderes Arbeitsfeld für Data Scientists kann aber auch sein: Kunden davon abhalten, ihren Mobilfunkvertrag zu kündigen:
"Der Mobilfunkanbieter könnte daran gehen und sagen: ‚Ja, ich identifizierte zunächst einmal Kunden, die in den nächsten drei Monaten kündigen werden und darüber hinaus kündigen werden, weil ich sage, okay, die Kunden, die in naher Zeit kündigen werden, die möchte ich gezielt angehen.‘ Man kann sich auch die Frage stellen: ‚Will ich eigentlich jeden Kunden halten, oder haben Kunden unterschiedlichen Wert für mich?‘ Gibt's Kunden, die einen hohen Umsatz haben, die ich eher halten will als Kunden, wo ich sage okay, der kündigt zwar, aber ist in Ordnung.‘ Da geht es zunächst darum, zu identifizieren."
Auf Spurensuche wie ein Detektiv
Mit Hilfe von Daten, die Daniel Trabold in Tabellen, Algorithmen und Grafiken übersetzt, sucht er nach Lösungen. Dafür schaut er sich seine Datenmengen immer und immer wieder aus verschiedenen Perspektiven an. Stundenlang vor dem Rechner zu sitzen macht ihm dabei nichts aus, denn ihn fasziniert das Detektivische daran. Manchmal spielen Faktoren eine Rolle, an die er zunächst überhaupt nicht gedacht hat. Wie etwa, als er sich für ein Logistikunternehmen anschaute, wie viele Pakete eigentlich an einem Tag von A nach B transportiert werden:
"Wenn das Wetter schlecht war, mehrere Tage und plötzlich die Sonne scheint, dann wird auch weniger Fracht benötigt in den nächsten Tagen. Und woran liegt das? Das liegt daran, dass die Leute sagen, wenn das Wetter schön ist, gehen wir raus. Dann bestellt keiner online und das sieht man dann in den Daten. Das sind so Effekte, die alltäglich sind, die wir uns aber nicht unbedingt bewusst machen, die dann in den Daten zum Vorschein kommen. Und das ist natürlich immer auch schön und überraschend."
Je nach Projekt jongliert der studierte Informatiker mit riesengroßen Datenmengen. Um sie zu bewältigen, gibt es am Fraunhofer-Institut, wo er arbeitet, ein eigenes Rechenzentrum, das er nutzen kann:
"Wenn ich Jobs habe, die hochgradig parallel laufen müssen, das heißt auf vielen Rechnern verteilt -häufig kann ich Analysen dadurch beschleunigen und dann habe ich hier die Möglichkeit, das auf Hunderte von Rechnern zu verteilen, sodass ich Jobs, die bei mir, wenn ich sie auf einem Computer laufen lassen würde, von mir aus ein ganzes Jahr lang laufen würden. Da kann ich in einem Tag durchrechnen lassen und mir am nächsten Tag das Ergebnis anschauen."
Daten und vor allem die Erkenntnisse, die sich daraus ziehen lassen, faszinieren und begeistern den Data Scientist. Er weiß aber auch, wie sensibel sie sein können und schützt sie entsprechend.