GeoWerkstatt-Projekt des Monats April 2022
Projekt: Bike-Sharing aus neuer Perspektive – was die Daten uns verraten
Forschende: Andreas Piter
Projektidee: Mit einem Big Data-Ansatz das Nutzerverhalten von Fahrradleihsystemen besser verstehen und verbessern
Eigentlich hatte ich alles perfekt geplant: Um 8.30 Uhr das Haus verlassen, den Zug um 8:50 Uhr nehmen und dann um 9:15 Uhr bei traumhaftem Sonnenschein ab Helsinkis Hauptbahnhof mit dem Leihrad zur Universität fahren, um ganz entspannt zur Vorlesung um 9.30 Uhr einzutreffen. Doch an der Fahrradstation am Bahnhof stand leider kein Leihfahrrad mehr und mein Plan ging nicht auf. Das stationsgebundene Fahrradleihsystem in der finnischen Hauptstadt habe ich während meines Auslandssemesters gerne genutzt. Auch wenn die Betreiber versuchen, die Leihfahrräder vorausschauend auf die Stationen zu verteilen, kann man auch einmal Pech haben und vor einer leeren Station stehen. Als Student der Geodäsie und Geoinformatik habe ich überlegt: Wie könnte ich wissenschaftlich zur Verbesserung des Fahrradleihsystems beitragen? Im Rahmen meiner Masterarbeit am Lehrstuhl für Big Geospatial Data des Instituts für Kartographie und Geoinformatik (IKG) der Leibniz Universität Hannover (LUH) konnte ich dieser Frage nachgehen.
Je besser die Betreiber verstehen, wie das Fahrradleihsystems genutzt wird, desto gezielter können sie Fahrräder von vollen zu leeren Fahrradstationen transportieren. In Helsinki steht ihnen grundsätzlich dafür Nutzungsdaten in großer Menge zur Verfügung. Denn jedes Jahr werden es mehr Fahrräder, mehr Fahrradstationen und immer mehr Radfahrende – und dann gibt es noch den finnischen Hobbydatenwissenschaftler Markus Kainuu: Während der Fahrradfahrsaison 2017 speicherte Kainuu alle fünf Minuten die Anzahl der verfügbaren Fahrräder an allen 140 Fahrradstationen der Stadt Helsinki in einer privaten Datenbank und veröffentlichte diese Daten über das Internet. Dabei handelt es sich um über 7 Millionen Zahleneinträge. In der Statistik werden solche komplexen und großen Datenmengen als "Big Data" bezeichnet. Die Kunst ist es, aus diesen einzelnen Daten die richtigen Informationen zu ziehen.
Weil es nicht viele Auswertemethoden gibt, die den Datensatz in seiner gesamten Komplexität erfassen können, wurden in bisherigen wissenschaftlichen Arbeiten zum Thema Bike-Sharing häufig die riesige Datenmenge reduziert. Um dennoch zu Erkenntnissen zu gelangen, lag der Fokus auf einzelnen Aspekten eines Bike-Sharing- Datensatzes, zum Beispiel nur auf einer Uhrzeit oder nur auf einzelnen Fahrradstationen. Aber eigentlich sind gerade die Zusammenhänge interessant: Die Anzahl der Fahrräder an einer Fahrradstation um 12:00 Uhr hängt offensichtlich von der Anzahl der Fahrräder um 11:55 Uhr ab und die wiederum von der Anzahl der Fahrräder um 11:50 Uhr, zumindest zu einem gewissen Grad. Und wenn an einer Fahrradstation gerade kein Fahrrad verfügbar sein sollte, dann geht man zur nächstgelegenen Fahrradstation. Es gibt bei der Nutzung des Fahrradleihsystems also zeitliche und räumliche Zusammenhänge. In der Geostatistik spricht man von räumlich-zeitlicher Abhängigkeit, die sich sowohl mathematisch berücksichtigen, als auch aus den Daten selbst bestimmt lässt.
Für die Untersuchungen im Rahmen meiner Masterarbeit am IKG konnte ich ein neues, statistisches Modell, das ursprünglich zur Untersuchung und Modellierung der Luftqualität über Europa entwickelt wurde, nutzen. Damit ließ sich Nutzung des Fahrradleihsystems modellieren und dabei auch die zeitlichen Zusammenhänge im Laufe eines Tages und einer Woche sowie die räumlichen Abhängigkeiten zwischen den Fahrradstationen berücksichtigen. Doch selbst mit den Hochleistungsrechnern der Leibniz Universität Hannover war es nicht möglich, die Daten aller 140 Fahrradstationen auf einmal in die Modellberechnung einzubeziehen. Deshalb griffen wir zu einem Trick: Wir wählten zufällig 40 der 140 Fahrradstationen und bestimmten mit deren Daten die Parameter des Modells. Das haben wir dann 1000-mal wiederholt, jedes Mal mit 40 zufällig ausgewählten Stationen. Das Mittel der 1000-mal bestimmten Parameter spiegelte gut wieder, wie die Parameter aussehen müssten, wenn wir alle 140 Fahrradstationen auf einmal zur Modellberechnung verwendet hätten.
Doch welche Erkenntnisse konnten wir mit der Modellierung nun aus den Daten ziehen? Zum einen konnten wir die Fahrradstationen in zwei Gruppen einteilen: Fahrradstationen in Wohngegenden sowie Fahrradstationen in Stadtteilzentren und in der Nähe von Bürogebäuden. Zu dieser zweiten Gruppe zählt die Station Itämerentori. Wie Abbildung 2 zeigt, stehen hier jeden Morgen zunächst nur wenige Fahrräder, im Laufe des Vormittags werden innerhalb von ein bis zwei Stunden viele Fahrräder abgestellt. Am Nachmittag werden wieder mehr Fahrräder entnommen. Das deutet darauf hin, dass das Fahrradleihsystem hauptsächlich für den Arbeitsweg verwendet wird. Am Wochenende ist dieser Verlauf nicht so stark ausgeprägt. Während die Kurve für Stationen in Stadtteilzentren und in der Nähe von Bürogebäuden eine Hügelform aufweist – wenige Räder am Morgen und Abend, viele tagsüber - ist der Effekt in Wohngegenden umgekehrt und wird durch eine Kurve mit Badewannenform beschrieben.
Aber welche Faktoren beeinflussen die Nutzung des Fahrradleihsystems noch? Beim Fahrradfahren denkt man natürlich gleich an das Wetter oder die Nähe zu einer Bus- oder Bahnstation. Diese Vermutungen haben wir mit dem Datensatz aus Helsinki überprüft. Tatsächlich waren im Sommer 2017 im Mittel bei wenig Wind und warmen Temperaturen mehr Radfahrende unterwegs. Andere Zusammenhänge waren hingegen nicht so leicht zu entdecken und zu interpretieren z. B. Warum befanden sich umso weniger Fahrräder an einer Fahrradstation, je höher sie gelegen ist? Am Nachmittag sogar noch weniger Räder als am Vormittag. Sind die Radfahrenden in ihrer Freizeit am Nachmittag lieber bergab unterwegs? Erstaunlicherweise zeigten die Daten auch nicht, dass die Menschen in Helsinki nicht gern bei Regen Fahrrad fahren. Möglicherweise hat es dafür in Helsinki im Sommer 2017 aber einfach nicht häufig genug geregnet, um einen Zusammenhang in den Daten zu erkennen. So wird deutlich: Mit statistischen Modellen können wir zwar Zusammenhänge in den Daten finden (Korrelation), aber in welcher Beziehung sie zueinander stehen, also Ursache und Wirkung (Kausalität), kennen wir nicht.
Zumindest ist diese neue Herangehensweise geeignet, die Anzahl der verfügbaren Fahrräder an einer Fahrradstation in Helsinki zu bestimmten Bedingungen vorherzusagen. Der Vorteil zu bisherigen Studien ist, dass diese Prognose auch in Abhängigkeit von der Uhrzeit und dem Wochentag möglich ist. Hätte ich also diese Methode bereits während meines Auslandssemesters zur Verfügung gehabt, hätte ich mir vielleicht ausrechnen können, dass die Chancen schlecht stehen, an der Fahrradstation an Helsinkis Hauptbahnhof für Montagmorgen um 9:15 Uhr bei Sonnenschein, 23 °C und keinem Niederschlag ein Leihrad zu bekommen.
Grundsätzlich können die zeitlich differenzierten Vorhersagen zur Verbesserung und zum Ausbau von Fahrradleihsystemen beitragen. Damit unterstützt das gewonnene Wissen den Weg hin zu flexibler Mobilität in modernen Großstädten.
Walter-Großmann-Preis
Andreas Piter wurde für seine Masterarbeit mit dem Walter-Großmann-Preis 2021 ausgezeichnet. Zur Bewerbung auf diesen Preis gehört ein allgemeinverständlicher, öffentlichkeitswirksamer Artikel des Forschungsthemas.
Publikation
Piter, A., Otto, P. & Alkhatib, H. (2022): The Helsinki bike-sharing system—Insights gained from a spatiotemporal functional model. Journal of the Royal Statistical Society: Series A (Statistics in Society), 1–25. Available from: https://rss.onlinelibrary.wiley.com/doi/10.1111/rssa.12834