Data Science @STARTPLATZ - STARTPLATZ

Data Science @STARTPLATZ

3. November 2015, 12:30 :: Allgemein

Autor: Victoria Blechman

Autor: Kirill Pomogajko, @pomogajko

Es scheint so als wäre der Data Science Hype nun endlich auch in Deutschland angekommen. In den USA ist das schon der heißeste, sexieste und gefragteste Job – der nebenbei bemerkt auch die beste Work-Life-Balance bietet. Doch was macht diesen Job aus und warum ist er so begehrt? Analysten und Statistiker gab es es schon vorher, doch mit dem Aufkommen von Big Data und den neuen Werkzeugen um mit Daten umzugehen, wie pandas, dplyr, Spark, NoSQL, d3, shiny, scikit-learn, caffe… sind die Anforderungen an die Datenjongleure gewachsen. Es reicht nicht mehr Daten in Excel hin-und-her zu wälzen oder mit einem traditionellen BI Tool ein paar Dashboards zusammen zu klicken.

Der moderne Data Scientist ist in der Lage unstrukturierte Daten zu nehmen (oder über APIs, Web Mining, etc. zu besorgen), relevante Information zu extrahieren, strukturiert abzulegen und aus den strukturierten Daten (interaktive) Visualisierungen, Reports und Ad-hoc-Analysen zu erstellen und diesen ganzen Prozess am besten auch zu automatisieren und zu dokumentieren. Somit braucht ein Data Scientist Kenntnisse in Skriptsprachen, Visualisierungsframeworks, Webtechnologie, sowie Datenbanken (SQL, NoSQL, Big Data), und muss mit dem Umgang mit Standard-Entwicklertools wie bash, Linux, git, docker, regex, etc. vertraut sein. Kurzum braucht es einen Experten der das Thema Daten komplett, von der Datensammlung bis zum Endprodukt, also der konkreten Handlungsempfehlung auf Basis der Daten, überschauen kann. Dafür muss ein Data Scientist besser programmieren können als ein Statistiker und besser Statistik beherrschen als ein Programmierer. Idealerweise fängt seine Arbeit an, bevor Daten überhaupt gesammelt werden.

Er berät wie die Daten strukturiert werden müssen, damit man das meiste aus Ihnen rausholen kann, wie die Daten erhoben werden, damit sie statistisch möglichst unverfälscht sind und wie sie abgelegt werden müssen, so dass das Format möglichst sauber ist. Danach ist er zuständig für alle möglichen Fragen über diese Daten aus allen Abteilungen. Das Marketing möchte wissen wie ihre Kampagnen performen und wo die Zielgruppen sind, außerdem muss Marketing bei A/B Tests unterstützt werden, die Entwickler und Designer möchten wissen, ob man aus den Daten auf Bugs in der Software oder Designverbesserungen für eine bessere User Experience (Stichwort Retention) schließen kann. Die PR-Abteilung möchte die Websitenbesuche verstehen und mit Social Media Daten anreichern. Das Management möchte wissen wie die Produkte performen und wo die Monetarisierungspotentiale sind. Die Produkte eines Data Scientist haben in einem Unternehmen die meisten Stakeholder. Deswegen muss er die Domäne, in der er arbeitet, gut verstehen, mit Business und Development kommunizieren können (oft ist er die Schnittstelle zwischen beiden Bereichen) und sich in die Bedürfnisse aller Abteilungen einfühlen können. Für die meisten Mitarbeiter ist das Thema Daten zu komplex, zu abstrakt, dass sie nicht wissen was sie von einem Data Scientist erwarten können. Da muss er sie an der Hand nehmen und proaktiv zeigen, welche Möglichkeiten in Daten stecken und idealerweise vor seinen Kollegen wissen, was sie eigentlich haben wollen und brauchen.

Wir vom STARTPLATZ möchten Data Scientists eine Plattform bieten, auf der sie sich austauschen können. Deshalb haben wir das Data Science Meetup Cologne ins Leben gerufen. Das erste Meetup findet am Freitag, den 6. November um 18 Uhr statt. Alle Infos gibt es hier: meetup.com/de/datasciencecgn/events/226232690/

Für alle, die weiter an dem Thema Data interessiert sind, eignet sich zudem unsere Big Data Konferenz am 8. Dezember. Alle Infos und die Tickets gibt es hier: startplatz.de/event/big-data-konferenz-volume-2



Kommende Events

  • Thursday, 02.12.21, 18:00 - 20:00 Uhr
  • STARTPLATZ, Im Mediapark 5, 50670 Köln

  • Friday, 03.12.21, 12:00 - 13:00 Uhr
  • Remote per zoom call,
  • STARTPLATZ

  • Tuesday, 07.12.21, 14:00 - 17:00 Uhr
  • STARTPLATZ, Remote

Neueste Beiträge

Latest tweets

STARTPLATZ