Adacor - Leadership

Wie Scrum in Data Science Teams funktioniert

22. Juli 2020 von Charaf Ouladali

Design Thinking, Design Sprint, Lean Startup, Scrum, Business Model Canvas – agile Arbeitsmethoden sind längst nicht mehr den Softwareentwicklern vorbehalten. Bei Adacor optimieren auch die Teams im Marketing, Vertrieb oder in der Buchhaltung ihre Workflows mit agilen Methoden. Aber wie ist das Thema in der Datenwissenschaft gelagert? Data Science ist ein interdisziplinäres Wissenschaftsfeld, keine flexible Arbeitseinheit. Wie passt das mit Scrum zusammen? Unser Artikel gibt Antworten.

Schlagworte wie Big Data, Smart Data, Data Mining, Data Engineering oder Predictive Analytics sind in aller Munde. Man verliert schnell den Überblick und wer weiß schon genau, was sich hinter all diesen Ausdrücken verbirgt. Die Experten heißen Data Scientists oder Datenwissenschaftler. Sie wissen, welche Wege erfolgreich durch den Datendschungel führen. Data Science ist eine wissenschaftlich fundierte Methode, mit der Prozesse, Algorithmen und Systeme analysiert werden. Aus den strukturierten und unstrukturierten Daten lassen sich Erkenntnisse über Muster gewinnen, die auf die Ableitung einer marktorientierten Unternehmensführung abzielen.

Adacor Stellenmarkt

Lust die digitale Welt zu verbessern?
Bewirb dich jetzt!

Konkret sieht das so aus: Jeder von uns hinterlässt digitale Spuren im privaten sowie professionellen Umfeld. Beispiele sind Verlaufsprofile, Blog-Posts, Kommentare in sozialen Netzwerken, Kaufhistorien, Fitnessdaten oder Gesundheitsaufzeichnungen. Im Internet werden Daten zunehmend automatisch erzeugt. Die Techniken, Daten zu verknüpfen und auszuwerten verfeinern sich stetig. Etliche Wissenschaftsbereiche beschäftigen sich mit der Analyse und Verwertung großer, heterogener Datenbestände. Was lange Zeit isoliert voneinander stattgefunden hat, führt die Disziplin der Datenwissenschaft zusammen.

Aufgrund der wissenschaftlichen Methodik liegt die Vermutung nahe, dass Data-Science-Teams auf traditionelle Projektabläufe setzen, auf ein Vorgehen nach dem Wasserfallmodell mit aufeinander folgenden Projektphasen. Die Ergebnisse der einzelnen Phasen gelten als bindende Vorgaben für die nächsttiefere Phase. Das gesamte Projekt wird schrittweise realisiert. Bei Adacor arbeiten wir nicht nach dem Modell, wir organisieren uns agil mit dem Scrum Framework.

Was ist Scrum?

Scrum (auf Deutsch „Gedränge“, ein Spielzug aus dem Rugby) ist ein Projektframework, das einen schnellen, iterativen und produktiven Workflow ermöglicht. Ursprünglich stammt Scrum aus der Softwareentwicklung. Inzwischen wenden es viele andere Unternehmensbereiche an. Die Praxis basiert auf drei Kategorien: Rollen, Artefakte und Aktivitäten (alternativ als Timeboxen bezeichnet).

Die Rollen:
Der Product Owner entwickelt die Vision für ein neues Produkt, erstellt die fachlichen Anforderungen und setzt Prioritäten für den Projektverlauf. Das Entwicklungsteam arbeitet die spezifischen Produktanforderungen ab und organisiert sich selbst. Der Scrum Master – nicht zu verwechseln mit einem Projektleiter – übernimmt eine Moderatorenrolle. Er vermittelt zwischen Team und Product Owner, steuert den Ablauf von Meetings und hält Störungen durch Zusatzaufgaben von außen ab. In den Prozess eingebunden sind außerdem die Stakeholder, die das fertige Produkt später verwenden, und das Management, das für die Rahmenbedingungen wie Räume, Maschinen und Ressourcen sorgt.

Die Artefakte:
Alle Produktanforderungen werden im Product Backlog gesammelt. Diese Sammlung wird ständig weiterentwickelt und vom Product Owner gepflegt. Die Anforderungen werden priorisiert und es wird festgelegt, welche davon innerhalb eines Sprints bearbeitet werden sollen. Am Ende eines Sprints steht ein funktionsfähiges Teilprodukt – das Produktinkrement.

Die Aktivitäten:
Im Sprint Planning wird die nächste Projektetappe geplant. Aus den jeweiligen Anforderungen werden konkrete Aufgaben generiert. Zu Beginn eines Arbeitstages trifft sich das Team zum Daily Scrum, einem kurzen Meeting. Was wurde bisher erledigt? Welche Aufgaben stehen an? Sind Hindernisse aufgetaucht? Muss der Scrum Master informiert werden? Am Ende eines jeden Sprints trifft sich das Entwicklungsteam zur Sprint Review. Dabei werden das Teilprodukt überprüft sowie Rücksprachen mit Product Owner und Stakeholdern gehalten. Eine weitere Feedback-Schleife bildet die Retrospektive, die sich der Zusammenarbeit im Projektteam widmet, um diese kontinuierlich zu verbessern.

Scrum im Data-Science-Team von Adacor

Die Abteilung Analytics existiert bei Adacor seit 2017. Gestartet sind wir voller Elan, mit vielen Ideen und unserer fachlich fundierten Intuition folgend. Wir haben wie freie Kunstschaffende gearbeitet und eine Menge experimenteller Ergebnisse produziert. Diese haben nützliche Erkenntnisse gebracht, bargen aber die Gefahr, sich „zu verirren“. Aus diesem Grund sind wir dazu übergegangen, unsere „Experimente“ systematisch zu strukturieren und zu kontrollieren. Das Scrum-Modell schafft für diese Prozesse einen hervorragenden Rahmen. Wir sind gefordert, in Form von Bausteinen zu denken. Mit dem Vorteil, dass wir zur richtigen Zeit die richtigen Fragen stellen, die schneller von den Experten aus den unterschiedlichen Teams beantwortet werden. Damit werden Bottlenecks vermieden, Fehlentwicklungen identifizieren wir frühzeitig. Der Workflow beinhaltet einen kontinuierlichen Austausch mit Entwicklern, Anwendern und dem Vertrieb. Hinzu kommt das Filtern von Daten, das Durchsuchen relevanter Daten, das Erstellen von Arbeitsmodellen sowie das Kommunizieren der Ergebnisse. Unser Data-Science-Team ist an die Development-Abteilung angebunden. Das passt thematisch optimal zusammen. Die Sprints im Zwei-Wochen-Zyklus zeigen, dass unsere Analyseergebnisse die Arbeit der Developer positiv vorantreiben. Im Gegenzug erhalten wir wertvolle Hinweise aus der Entwicklungsabteilung.

Aufgaben der Data Scientists

Die Analyseergebnisse dienen der Optimierung interner Prozesse sowie der kontinuierlichen Verbesserung der Kundenorientierung. Die verschiedenen Teams liefern zum Beispiel Leistungskennzahlen. Wir wiederum analysieren, wie schnell und mit welchen Workflows die Zielvorgaben erreicht werden. Unsere Reports dienen dem Kundensupport dazu ihre eigene Performance zu messen und zu evaluieren.

In Hinblick auf den direkten Kundennutzen fokussieren wir uns auf Predictive Analytics bezüglich der Serverstabilität. Zum Thema „Predictive Monitoring“ haben wir ein KI-Projekt aufgesetzt. Zusammen mit Kolleginnen und Kollegen aus dem Development und der IT-Administration untersuchen wir, inwiefern sich Ausfälle und Einschränkungen bei Server-Infrastrukturen vorhersagen und durch gezielte Wartungen verhindern lassen. Unser Ziel ist die Erschaffung einer künstlichen Intelligenz, die in Echtzeit Datenströme analysiert und Beeinträchtigungen von IT-Systemen frühzeitig vorhersagen kann. Damit wird es in Zukunft möglich sein, Ausfälle vor ihrem Eintreten zu behandeln und die Verfügbarkeit von Systemen erheblich zu erhöhen. Unsere Kunden profitieren von den Entwicklungen in vielfacher Hinsicht. So steigt nicht nur die Hochverfügbarkeit ihrer Systeme, auch die Notwendigkeit von Redundanz sinkt und die damit verbundenen Kosten werden eingespart. Das innovative Projekt wird von der Europäischen Union: Investition in Ihre Zukunft im Rahmen des Europäischen Fonds für regionale Entwicklung (EFRE) gefördert.

Darüber hinaus erstellen wir für das Management und unser Sales-Team Reports, welche Auswertungen zum Status einzelner Kunden beinhalten. Das ermöglicht eine proaktive Kundenpflege: Unsere Kundenbetreuer können zum Beispiel gezielt auf nützliche Neuerungen oder notwendige Produkterweiterungen aufmerksam machen.

Scrum und Data Science – eine Empfehlung

Es wird deutlich, dass die Implementierung von Scrum das Workflow-Management eines Data-Science-Teams rationalisiert und die Produktivität verbessert. Jedes Unternehmen hat mit Datenflüssen zu tun. Der Einsatz ausgebildeter Fachleute, welche diese „lesen“ und verstehen sowie in nutzbare Daten umwandeln, macht deshalb Sinn.

Wie Fachleute anderer Unternehmensbereiche folgen Datenwissenschaftler Prozessen in ihrem Workflow: eine Fragestellung, die Datenerfassung, die Analyse, das Erstellen von Modellen, Tests zu den Ergebnissen. Das Erfassen und Filtern von Daten zur Analyse ist ein zeitaufwändiger Prozess. Deshalb steigert es die Effizienz, wenn jeder Prozessschritt in eine separate Aufgabe oder Rolle unterteilt wird. Fehlannahmen werden so zu Treibern im Projekt, permanentes Lernen ist Teil des Plans. Data Science wird ständig weiterentwickelt. Es gibt kein Handbuch, dass für die nächsten zwanzig Jahre gültig sein wird. Mit Scrum fließen neue Erkenntnisse, Methoden und Technologien sofort in den Arbeitsprozess ein. Data Scientists müssen die Offenheit mitbringen, zu erkennen, dass sie erst im Laufe eines Projekts herausfinden, wie Analysen funktionieren und welche Bedeutung die daraus abgeleiteten Erkenntnisse für das Unternehmen haben.

Ausblick: Scrum macht Data Science effektiver

Durch Scrum ist die Arbeit in unserem Team effektiver geworden. Projektpläne und Budgets berücksichtigen zunehmend die „Lernkurve“, die im Lauf des Projekts auftritt. Das Framework liefert uns ein Korsett, das nicht einengt, sondern stützt. So bleibt genügend Freiraum, experimentell tätig zu sein. Durch Scrum arbeiten unsere Teams eigenverantwortlich und stehen gleichzeitig in enger Verbindung mit den Experten aus der Fachabteilung. Alle verfügen über einen transparenten Überblick über den jeweiligen Status in den aktuellen Projekten.

Sie möchten mehr Informationen zum Thema Agiles Arbeiten mit Scrum?

Dann haben wir weitere spannende Artikel im Blog für Sie zum Lesen! Unser Scrum-Master Olaf Rind verrät Ihnen, wie Sie Scrum erfolgreich in Ihren Unternehmensalltag integrieren. Von unserem Softwareentwickler Sebastian Helfmann erfahren Sie alles Wissenswerte zu dem richtigen Wording, den Abläufen und Rollen, die das Scrum-Framework umfasst.

Verwandte Artikel