Big-Data ist für viele das IT-Buzzword schlechthin. Aber was ist dran an Big-Data? Welche Möglichkeiten eröffnet mir die Masse an Daten? Um das herauszufinden, stand mir Dunja Riehemann, Director Marketing bei der Blue Yonder GmbH aus Karlsruhe, Rede und Antwort. Eines darf ich schon mal vorweg nehmen: Der Spezialist für Softwareentwicklung mit integrierter Data-Science spielt in einer anderen Liga und kann tatsächlich wissenschaftlich begründet Entscheidungen anhand von Big-Data treffen.
Erst kürzlich konnte ich über das IT-Buzzword Big Data lesen, dass mittlerweile über reelle Anwendungen in der Industrie nachgedacht wird. Diese sogar zum Teil schon Realität sind. Wie sehen diese sogenannten Analysen in der Praxis aus? Immerhin sprechen wir beispielsweise bei einem Flugzeugtriebwerk von mehreren Terabyte in wenigen Stunden; bei Windkrafträdern von Millionen Datenschnipseln pro Sekunde.
In der Tat ist die größte Herausforderung die Unterscheidung zwischen relevanten und nicht relevanten Daten. Blue Yonder kommt aus der Teilchenphysik und ist vor allem für seine Zusammenarbeit mit der Europäischen Organisation für Kernforschung (CERN) bekannt. Dort haben unsere Algorithmen beispielsweise dazu beigetragen, dass aus den für Menschen fast unvorstellbar großen Datenmengen, die der bekannte „Large Hadron Collider“ (LHC) vor Ort produziert, sogenannte „Beauty-Quarks“ zu identifizieren. Das sind winzige, extrem seltene Teilchen, die zudem nur für den Bruchteil von Millisekunden in Erscheinung treten bevor sie wieder zerfallen. Wenn sie das schaffen, bereitet Ihnen das Datenvolumen wie beispielsweise von Flugzeugtriebwerke kein größeres Kopfzerbrechen.
Wie werden bei Blue Yonder diese Art Analysen praktiziert? Ich weiß, dass ihr beispielsweise mit wissenschaftlich fundierten Algorithmen werbt. Sogar automatisierte Entscheidungen anbietet – sprechen wir hierbei von Simulationen auf Hochleistungsrechner?
Wir entwickeln sogenannte „Predictive Applications“. Das sind Algorithmen, die automatisierte Entscheidungen auf Basis aktueller und historischer Daten treffen, um Geschäftsprozesse effizienter zu gestalten. Das Interessante daran ist, das diese Algorithmen selbstlernend sind, weshalb die Schnelligkeit und Präzision der mit ihrer Hilfe erstellten Prognosen permanent optimiert werden. Der Disponent im Supermarkt muss sich nicht mehr jeden Tag fragen, wie viele Äpfel er bestellen muss, um einerseits den täglichen Bedarf der Kunden zu decken und andererseits möglichst wenig Abschriften zu produzieren.
Wo steht eigentlich Euer Rechenzentrum? Wie sieht es mit dem Datenschutz aus?
Alle Applikationen der Blue Yonder Plattform werden in Rechenzentren in Deutschland gehostet. Kundendaten werden sicher in einer für Machine Learning und Predictive Applications optimierten Infrastruktur gespeichert und durch die strengen deutschen Gesetze zum Datenschutz sowie Achtung der Privatsphäre geschützt.
Big-Data ist mittlerweile auch zu einem Alarm-Wording in der Medienwelt mutiert. Warum haftet der Branche hinsichtlich des Datenschutzes so ein schlechter Ruf an? Was unternimmt speziell Blue Yonder dagegen?
Bereits im Jahr 2000 hat die Forscherin Latanya Sweeney herausgefunden, dass im Zeitalter von Big-Data, wo Analyse-Software Zusammenhänge zwischen unterschiedlichsten Faktoren erkennen kann, 87 Prozent aller Amerikaner mit nur drei kleinen Dingen eindeutig identifiziert werden können: Geschlecht, Geburtsdatum und Postleitzahl.
Wir haben es hier im Grunde mit einem Spannungsfeld aus Erkenntnisinteresse der Datenforscher und dem Selbstbestimmungsrecht des Einzelnen zu tun. In einer zunehmend digitalisierten Welt ist es nur logisch, dass immer mehr Daten innerhalb kurzer Zeiträume angehäuft werden. Für verlässliche Prognosen eignen sich auch unspezifische Daten. Der Bezug zu individuellen Personen ist für viele Anwendungsgebiete nicht relevant. Außerdem reichen auch beispielsweise zur örtlichen Eingrenzung oft bereits die ersten beiden Ziffern einer Postleitzahl.
Eine steile aber gute These hat Hans Wieser, Data Insights Lead Microsoft, gegenüber com! Professionell geäußert: „Big-Data frisst Strom, Speicher, Arbeitskräfte und Zeit in der Integration. Erst mit den richtigen Fragen und Assoziationen erwachen Daten zum leben.“ Wie sehen Sie das? Wird Small Data wieder ein Thema sein?
Ich hätte es nicht besser ausdrücken können! Die Daten, die Millionen vernetzter Autos oder andere digitalisierte Gerätschaften produzieren, sind im Grunde nichts weiter als Unmengen an winzigen Datenschnipseln – Small Data, wenn Sie so wollen –, die für sich genommen keinen Wert besitzen. Erst gefiltert, sortiert, kategorisiert und analysiert erhalten sie einen Mehrwert. Insofern erwacht Big-Data in der Tat erst zum Leben, wenn daraus die richtigen Schlüsse gezogen werden.
Um 22 Prozent soll die Datenmenge in Unternehmen 2012 auf 2013 zugenommen haben. 2014 auf 2015 wird sich die Menge womöglich verdoppeln. Wie sehen die Einsatz-Szenerien von Big Data in Zukunft aus?
Die Einsatzmöglichkeiten von Big-Data sind buchstäblich grenzenlos. Wie gesagt kommt es aber entscheidend darauf an, was Unternehmen mit den Daten, die sie tagtäglich generieren, machen. Sinnvoll eingesetzt kann Big-Data so beispielsweise zur Reduktion von Streuverlusten in Werbung und Marketing beitragen, zu erheblichen Einsparungen im Bereich Logistik verhelfen oder in Online-Shops die Customer-Intelligence in Form von Produktempfehlungen erhöhen. Mit der Lösung Forward Demand begegnet Blue Yonder bereits heute der größten Herausforderung in Industrie und Handel: Kundenbedürfnisse zu kennen und damit den voraussichtlichen Absatz eines Artikels oder Bedarf von Services frühzeitig vorherzusagen. Nur wer die künftige Nachfrage gut kennt, kann seine Produktverfügbarkeit, den Mitarbeitereinsatz, die Lagerhaltung sowie die Logistik genau planen, um hohe Kapitalbindung und Out-of-Stock-Situationen zu vermeiden.
Big-Data ist nicht nur Big weil viele Daten gesammelt und ausgewertet werden. Was bedeuten etwa die drei V innerhalb der Big-Data-Analyse?
In Zusammenhang mit Big-Data ist oft von Volume, Variety und Velocity, also von Menge, Struktur und Geschwindigkeit die Rede. Das sind die drei Dimensionen, die Big-Data letztendlich definieren: Die Datenmenge, die unterschiedlichen Datentypen und die Geschwindigkeit, mit der Daten verarbeitet werden können. Die Idee hinter dem so genannten 3V-Modell ist, dass das Management von Big-Data nicht nur durch die schiere Menge an Daten bestimmt oder erschwert wird, sondern vor allem durch die kontinuierliche Expansion aller genannten Dimensionen. Anschaulicher ausgedrückt: Vor sehr langer Zeit hatten Sie es vielleicht mit Daten aus einfachen Tabellen (Variety) im Megabyte-Bereich (Volume) zu tun, die sich wöchentlich veränderten (Velocity). Heute stehen uns Daten aus so verschiedenen Bereichen wie Photo, Web, Audio, Video, Social Media und Mobile im Petabyte-Bereich zur Verfügung, die sich in Echtzeit verändern. Sie können sich sicher vorstellen, wie der Vergleich in fünf Jahren aussehen wird.
Und zum Schluss noch einen Blick in die Glaskugel. Wie sieht die Zukunft von Big Data aus? Was ist das nächste große Ding bei Euch?
Wenn Sie so wollen, stehen wir gerade erst am Anfang der Zukunft von Big-Data. Das oben genannte 3V-Modell taugt schon heute nur noch bedingt, um das Phänomen Big-Data zu fassen. Vielmehr müssen wir uns in Zukunft fragen, wie wir Big-Data nutzen, um Prozesse stärker zu automatisieren, denn die Automatisierung von Entscheidungen ermöglicht Unternehmen enorme Effizienzsteigerungen. Erste erfolgreiche Pilotprojekte finden Sie bereits im Einzelhandel, wo mittels Predictive Analytics die Warendisposition anhand automatisierter Entscheidungen permanent neu am Bedarf der Kunden ausgerichtet wird. Unternehmen wie Tengelmann können so kostspielige Über- oder Unterbestände verhindern sowie die Warendisposition pro Filiale weiter optimieren. Zusammenfassend ist festzuhalten, dass datengetriebenes Entscheidungsmanagement und die Automatisierung von Massenentscheidungen auf einer Plattform die wichtigsten Erfolgsschlüssel für die Wirtschaft werden.
Weitere Informationen zu Big-Data und Datenschutz.