Logistics & Transport - Moderne Fahrgaststatistik-Plattform für die Berliner Verkehrsbetriebe
Die Berliner Verkehrsbetriebe (BVG) sind das Rückgrat der Mobilität in der deutschen Hauptstadt. Gegründet im Jahr 1928 durch den Zusammenschluss mehrerer privater und öffentlicher Verkehrsunternehmen, blickt das Unternehmen auf eine fast 100-jährige Geschichte zurück, die untrennbar mit der Entwicklung Berlins verbunden ist.
Heute ist die BVG das größte Nahverkehrsunternehmen im deutschsprachigen Raum und befördert mit U‑Bahn, Straßenbahn, Bus und Fähre jährlich über eine Milliarde Fahrgäste sicher und zuverlässig.
Um dieses Netz datenbasiert zu steuern und weiterzuentwickeln, braucht die BVG eine verlässliche Datenbasis – für jede Linie, jeden Haltepunkt, jede Stunde des Tages.
Niko Stäger
„synvert ist seit über zwei Jahren ein entscheidender Begleiter bei der Neuausrichtung unserer Datenarchitektur, um die Mobilität der Zukunft datenbasiert steuern zu können. Um diese Anforderungen zu erfüllen, arbeiteten das Fachgebiet Verkehrsstatistik, die konzerneigene IT der BVG und synvert von Beginn an eng zusammen.»
Ausgangslage
Das bestehende System zur Fahrgaststatistik war über viele Jahre kontinuierlich erweitert worden und bildete die Grundlage etablierter fachlicher Prozesse.
Mit wachsendem Datenvolumen und steigenden Anforderungen an Detailtiefe, Aktualität und Auswertungsbreite nahm der operative Aufwand jedoch spürbar zu.
Die strukturierte Einbindung zusätzlicher Datenquellen sowie die Verknüpfung mit neuen analytischen Anforderungen ließen sich nur mit erhöhtem manuellem Aufwand umsetzen. Vor diesem Hintergrund entstand das Ziel, die Datenaufbereitung durch Erweiterung, Automatisierung und Bündelung in einem zentralen System zu konsolidieren. Dadurch können interne und externe Anfragen zukünftig schneller und transparenter bearbeitet werden und es wird zunehmend möglich, datenbasierte Handlungsempfehlungen auch proaktiv abzuleiten.
Ziele und Herausforderungen
Komplexität
Die eigentliche Herausforderung lag nicht im technischen Ersatz, sondern in der fachlichen Tiefe des Systems. Für eine vollständige Fahrgaststatistik müssen hochkomplexe Datenquellen nahtlos zusammengeführt werden. Dazu gehören tagesbasierte Fahrplandaten, die automatischen Zähldaten der Fahrzeuge sowie geografische Informationen wie Haltestellen und Tarifbereiche. Erst durch diese Verknüpfung entsteht ein präzises und auswertbares Gesamtbild.
Hinzu kommt: Nicht alle Fahrzeuge im BVG-Netz sind mit automatischen Zählgeräten ausgestattet. Für Fahrten ohne Zähldaten müssen Hochrechnungen aus vergleichbaren, gezählten Fahrten abgeleitet werden – ein statistisch anspruchsvolles Kernstück der Plattform. Die Hochrechnungslogik basiert auf einer speziell entwickelten fachlichen Abbildung komplexer Linienzusammenhänge.
Die Zielsetzung
Die Migration des Altsystems war bewusst als Chance begriffen worden: nicht als 1:1‑Ablösung, sondern als Grundsteinlegung für eine zukunftsfähige, erweiterbare Analytics-Plattform. Die Kernziele:
- Vollständige Ablösung des Legacy-Systems ohne Datenverlust und ohne Betriebsunterbrechung
- Aufbau einer cloud-nativen Datenplattform auf Basis moderner Architekturprinzipien
- Hochgranulare KPI-Bereitstellung: Einsteiger, Aussteiger, Auslastung, Personenkilometer – auf Linien‑, Fahrt‑, Haltestellen- und Stundenebene
- Eigenständig bedienbarer Freigabe-Workflow für Hochrechnungsergebnisse und offizielle Berichte
- Skalierbare Grundlage für zukünftige Anwendungsfälle wie Takt- und Angebotsoptimierung
Die Architektur
Die Plattform wurde gemeinsam mit der BVG-IT vollständig cloud-nativ auf Microsoft Azure aufgebaut und folgt einer klar strukturierten Medallion-Architektur im Data Lakehouse-Ansatz. Architekturentscheidungen wurden eng zwischen BVG-IT, Fachgebiet und synvert abgestimmt und stützen sich auf fachliches sowie IT-seitiges BVG-Know-how.
Ingestion & Verarbeitung
Eine verteilte Compute-Schicht übernimmt die vollautomatisierte Anbindung aller Quellsysteme und die stufenweise Transformation der Daten. Jede Transformation ist nachvollziehbar, jeder Verarbeitungsschritt isoliert und eigenständig skalierbar. Die Orchestrierung der Pipelines erfolgt über einen dedizierten Workflow-Layer.
Datenspeicherung: Bronze → Silver → Gold → Gold-Result
- Bronze: Rohdaten landen unverändert in der Landing Zone – vollständig rekonstruierbar
- Silver: Bereinigung, Normalisierung und Harmonisierung über alle Quellsysteme
- Gold: Hochrechnung, KPI-Berechnung und fachliche Aggregationen
- Gold-Result: Freigegebene, publizierbare Ergebnisse für Reporting und externe Kommunikation
Freigabe & Analyse
Eine eigens entwickelte Web-Applikation (Plotly Dash) gibt den Fachanwendern vollständige Kontrolle über Hochrechnungsparameter, Qualitätsprüfungen und die Freigabe von Ergebnissen für offizielle Kanäle – ohne IT-Abhängigkeit. Power BI stellt die freigegebenen Kennzahlen für die konzerninterne Nutzung bereit.
Services von synvert a GlobalLogic company
End-to-End aus einer Hand
synvert hat die Umsetzung der Plattform über alle Schichten hinweg mitgestaltet und in Zusammenarbeit mit der BVG realisiert – von der Cloud-Provisionierung bis zur KPI-Bereitstellung im Dashboard:
- Provisionierung der Azure-Infrastruktur: Blob Storage, App Service, SQL-Server-Datenbank
- Anbindung und Historisierung aller Quellsysteme
- Aufbau der Medallion-Architektur im Data Lakehouse
- Implementierung & Orchestrierung der Prozesse zwischen den einzelnen Schichten
- Implementierungsunterstützung bei der fachlichen Hochrechnungslogik und KPI-Definitionen
- BI-Support: Entwicklung der Business-Logiken und KPI-Delivery via Power BI
- Entwurf und Implementierung der Dash-Web-Applikation für Konfiguration, Qualitätsprüfung und Freigabe
Umgang mit historisch gewachsenen Systemen
Die Fachlogik des Vorgängersystems wurde von der BVG‑IT im engen Schulterschluss mit dem Fachgebiet Verkehrsstatistik durch systematisches Reverse Engineering rekonstruiert und neu umgesetzt – mit synvert als architektonischem Sparringpartner und zusätzlicher Umsetzungskapazität. Der laufende Betrieb der Fahrgaststatistik blieb dabei durchgehend gewährleistet.
Fachliche Tiefe, nicht nur Technik
Die Hochrechnungslogik, die statistische Ableitung für Fahrten ohne Zähldaten, die Definition der KPI-Hierarchien: synvert hat nicht nur einfach entwickelt, sondern das fachliche Modell aktiv mitgestaltet.
Lieferung / Abschluss
Die Zahlen
XML-Abzug aus Quellsystem: 4 Stunden → ~15 Minuten
Datenverarbeitung zu Tabellen: 2,5 Stunden → ~60 Minuten
Fahrgasthochrechnung: 4 Tage → ~30 Minuten
Freigabeaufwand: manueller Protokollpflege-Prozess → webbasiert automatisiert, mit systemgestützter Empfehlung und manueller Freigabe
Entwicklerabhängigkeit: 1 Person → skalierbares Team
Was das bedeutet
Was die Verkehrsstatistik der BVG heute auszeichnet, ist nicht allein die Fähigkeit, Fahrgaststatistiken zu berechnen – das konnte das alte System grundsätzlich auch. Der Unterschied liegt in der Geschwindigkeit und Flexibilität. Wie viele Menschen sind am Montag, dem 14. April 2025, zwischen 7 und 8 Uhr morgens mit der U5 vom Alexanderplatz zur Schillingstraße gefahren? Durch welche Tür sind sie ein- und ausgestiegen? Wie hoch war die Auslastung des verwendeten Fahrzeugs? Solche Fragestellungen lassen sich zukünftig deutlich schneller und einfacher beantworten – täglich aktualisiert und dynamisch abrufbar.
Ausblick
Die Architektur ist bewusst offen konzipiert. Sie ermöglicht einen einfachen und kontrollierten Zugriff auf Daten für unterschiedliche interne und externe Nutzergruppen. Gleichzeitig kann die Plattform flexibel um weitere Datenquellen erweitert, für Data-Science-Anwendungen genutzt und das Dashboard bedarfsgerecht ausgebaut werden. Die Grundlage dafür ist gelegt.
