Lesedauer ca. 4 Minuten

Lärmkarten, Umweltdaten, Bevölkerungsstatistik, Wahlergebnisse sowie die Standorte sämtlicher Spielplätze in den Ballungsräumen: Zahlreiche Karten und Verwaltungsdaten sind öffentlich frei zugänglich und können bei Bedarf eingesehen sowie für die eigenen Zwecke genutzt werden. „Für die Auswertung der öffentlichen Daten braucht es aber oftmals gewisse Vorkenntnisse.

Und die einzelnen Datensätze im Internet zu finden, ist ebenfalls kein einfaches Unterfangen“, weiß Andreas Abecker. Zur einfacheren Nutzung von öffentlichen Datensätzen hat der Projektentwickler des Karlsruher Softwareunternehmens Disy Informationssysteme GmbH gemeinsam mit dem Forschungszentrum Informatik (FZI) das Projekt „Werkzeuge für die einfache Berechnung komplexer Vergleichsindizes (WEKOVI)“ ins Leben gerufen.

Disy
Zur technischen Umsetzung des WEKOVI-Prototypen kommen moderne Technologien für Big Data, Smart Data und Geodatenverarbeitung zum Einsatz. (Bild: Disy Informationssysteme GmbH)

Vom Bundesministerium für Verkehr und Infrastruktur wird das auf zwei Jahre angelegte Projekt bis Juli 2019 mit insgesamt 800 000 Euro gefördert. „Das Interesse der Bundesregierung an einer übersichtlichen Aufarbeitung öffentlicher Daten ist sehr groß“, sagt Abecker. Allerdings fehlte der öffentlichen Hand bislang neben den finanziellen Mitteln vor allem das notwendige Expertenwissen und deshalb wurden im Rahmen des bundesweiten Forschungsinitiative mFUND großzügig Mittel an Wissenschaft und Wirtschaft zur Entwicklung von digitalen Lösungsansätzen verteilt.

Suche nach dem wirtschaftlichen Potenzial läuft auf Hochtouren

Nach zehn Monaten Vorbereitungszeit befindet sich das Projekt allerdings noch im Anfangsstadium. Zunächst einmal müssten die einzelnen Daten eingelesen und in ein „virtuelles Warenhaus“ gestellt werden, skizziert Abecker die ersten Schritte des Verfahrens. Anschließend muss noch eine Plattform für den zielgerichteten Zugriff auf die Daten programmiert werden. Dabei kommen dann auch die in der Projektbeschreibung genannten „komplexen Vergleichsindizes“ ins Spiel.

„Bei der Suche nach einer geeigneten Wohnimmobilie spielen bei jungen Familien Faktoren wie die Nähe zu Schulen und Kindergärten sowie eine möglichst geringe Luftverschmutzung die wichtigste Rolle. Senioren wollen einen Arzt um die Ecke und einen Nahversorger in fußläufiger Entfernung haben“, beschreibt Abecker einige der unterschiedlichen Suchkriterien. Größere Immobiliengesellschaften oder Pflegeheimbetreiber könnten aus der intelligenten Nutzung öffentlicher Daten auch wirtschaftlich Profit schlagen, so Abecker. „Vielleicht können wir die Plattform deshalb später auch einmal gewinnbringend vermarkten.“

Nutzer sollen sich in die Weiterentwicklung der Plattform einbringen

Zahlreiche öffentliche Daten wie die Standorte von Wochenmärkten, Apotheken oder Schulen sind laut Abecker zwar schon heute leicht einsehbar und auch durch die Nutzung des frei zugänglichen Straßenkartenprojekts OpenStreetMap können durchaus nützliche Rückschlüsse auf die Struktur von Wohn- oder Gewerbegebieten gezogen werden. „Aber solche Visualisierungen hängen oft vom ehrenamtlichen Engagement der Nutzer ab und sind selten komplett“, betont Adecker. Und auch Faktoren wie Durchschnittsalter, Wahlergebnisse oder Ausländeranteil könnten schließlich wichtige Rückschlüsse über die Beschaffenheit eines Wohnviertels liefern.

Bei der Entwicklung der Plattform wollen sich Abecker und seine Mistreiter zunächst auf den Raum Karlsruhe beschränken und das Projekt gegebenenfalls auf die Metropolregion Rhein-Neckar ausweiten. „Eine deutschlandweite Suchmaschine im Stile von Google oder Wikipedia können wir in der kurzen Zeit sicherlich nicht liefern“, sagt Abecker. Allerdings sollen sich die künftigen Nutzer später einmal ähnlich wie bei Wikipedia aktiv in die Weiterentwicklung mit einbringen dürfen. Am Ende könnte die Auswertung sämtlicher öffentlicher Daten sogar Informationen über die Wirtschaftlichkeit und Strahlkraft von ganzen Metropolenregionen liefern. „Bislang fehlen für den Vergleich ganzer Regionen noch die notwendigen Daten“, sagt Abecker. „Und genau diese Lücke wollen wir mit unserem Projekt schließen“.

Technische Umsetzung durch Einsatz von zahlreichen Technologien

Zur technischen Umsetzung des WEKOVI-Prototypen kommen moderne Technologien für Big Data, Smart Data und Geodatenverarbeitung zum Einsatz, wie die Disy GeoSpatial Integration für Talend zur Umsetzung einer Geo-ETL-Pipeline für das Integrieren und Harmonisieren von Geodaten, Elasticsearch für verteilte Datenhaltung und Suche, Apache Flink für die verteilte Datenstromverarbeitung, Apache Kafka als Message-Broker, RDF4J zur Verwaltung semantischer Metadaten und das FZI-Werkzeug StreamPipes zur intelligenten Anbindung heterogener Datenströme und für die KVI-Berechnung.

Die Architektur basiert auf dem Prinzip der Microservices. Diese Dienste setzten sich in den vergangenen Jahren zunehmend als Software-Architekturmuster durch, um gut wartbare und automatisch skalierbare Softwarelösungen aus vielen überschaubaren, unabhängigen Prozessen zusammenzusetzen.

Für Disy gehört intelligente Datenauswertung zum Alltagsgeschäft

Für Disy gehört die intelligente Auswertung von Daten zum täglichen Geschäft und auch bei der Software Cadenza werden vorhandene Geodaten für die Erstellung von Lärmkarten genutzt. „Ein Projekt wie Wekovi passt deshalb sehr gut zu uns“, sagt Marketing-Leiter Wassilios Kasakos.

Dank des großen Expertenwissens könne Disy durchaus Vorreiter bei der Entwicklung eines neuen Standards für die Nutzung von öffentlichen Daten werden. Vor rund 20 Jahren wurde Disy als klassisches Spin-Off aus der Karlsruher Forschungslandschaft aus der Taufe gehoben. Mittlerweile beschäftigt die Softwareschmiede mit dem Geschäftssitz in der Ludwig-Erhard-Allee 90 Mitarbeiter und der Jahresumsatz beläuft sich nach firmeneigenen Angaben auf rund 9 Millionen Euro.