Lesedauer ca. 5 Minuten

Big Data und Fußball? Wer Fußball im TV guckt, kann den Eindruck gewinnen, es ginge nur um Wille und Mut. Die Reporter beurteilen Spieler anhand der “Körpersprache”, legen nahe, man müsse “sich ein Herz fassen” oder “alles raushauen”. Nur hin und wieder, wenn Livestatistiken zitiert werden, vom Packing-Wert über die gelaufenen Kilometer, bekommt man eine Ahnung davon, dass der moderne Fußball in Sachen KPI-Analysen eCommerce-Firmen nichts nachsteht.

Geld schießt keine Tore, heißt es. Aber das stimmt natürlich nicht: Wenn man in der Bundesliga die Etats der Vereine mit der Abschlusstabelle vergleicht, sind viele Mannschaften auf den erwarteten Plätzen. Ausnahmen gibt es immer, klar, aber sie werden seltener, obwohl Fußball eine Sportart ist, in der Zufall eine große Rolle spielt.

Big Data im Fußball, so funktioniert’s:

Wenn man also über-performen will, also besser abschneiden als der Finanzstatus es hergibt, dann muss man Moneyball spielen: Der Begriff kommt aus dem Baseball, wurde bekannt durch das Buch Moneyball: The Art of Winning an Unfair Game (einen Film gibt’s auch dazu) und besagt im Grunde folgendes:

1. Mithilfe von objektiver statistischer Bewertung soll die Erfolgswahrscheinlichkeit von Entscheidungen gesteigert werden.
2. Es sollen “unfaire” Vor- oder Nachteile entdeckt und ausgenutzt werden. Beispielsweise im Scouting von Spielern: Sind bestimmte Spielertypen über- oder unterbewertet, kann man Schnäppchen machen?
3. Es soll der Zufall wo immer möglich eliminiert werden, wenigstens in der Bewertung von Aktionen.

Oder, laut abgewandelt, in den Prinzipien des dänischen Clubs FC Midtjylland, der unter seinem Besitzer Matthew Benham seit 2014 konsequent Moneyball spielt und als Posterchild der Szene gilt:

1. Jede Entscheidung, egal ob lang- oder kurzfristig, wird aufgrund von Statistiken und Wahrscheinlichkeiten gefällt.
2. Keiner soll auf seinen Bauch hören.

Benham kommt selber aus dem Wettgeschäft und hat sich der Legende nach dem Profi-Fußball zugewandt, weil er die meisten Wettquoten so irrational fand und da ein Geschäft witterte.

Das spiegelt im Grunde den gleichen Umbruch wieder, wie es ihn in vielen Branchen gibt: In den Medien geht es vom bauchgefühligen Blattmacher zum zahlenorientierten Content Manager: im Handel ersetzen personalisierte Angebote die zentralen, auf Erfahrungswerten basierenden Rabattaktionen.

Um den angestrebten Erfolg zu erreichen, braucht man, neben dem Willen sowie der Expertise zur Analyse und der Infrastruktur zur Umsetzung, vor allem eins: Daten. Diverse Anbieter haben es sich zur Aufgabe gemacht, den Fußball zu vermessen: Vor allem die Spieler selber, aber auch die Aktionen und den Fluss des Spiels.

Die marktführende Datenbank Opta etwa bietet Daten in mehreren Bereichen an: Scouting von Spielern, taktische Analysewerte, Training. Konkurrent Instat tut Ähnliches. Kunden sind Profivereine, Medien wie Sky, Anbieter von Fußballvideospielen und professionelle Wetter sowie Wettanbieter. Arsenal London hat sich mit StatDNA 2012 gar direkt einen Anbieter gekauft.

Die Vermessung des Sportlers

Die Spiele und Spieler werden gefilmt und vermessen. Jedes Spiel beobachten Dutzende Kameras. Jede Aktion, jeder Laufweg wird notiert und in Datenbanken eingepflegt. Der Prozess ist weniger automatisiert als man denken könnte: Während Kameras in der Lage sind, Spieler- und Ballbewegungen zu tracken, müssen Aktionen immer noch von Menschen erkannt, bewertet und gespeichert werden. Beispiel: Die Interpretation, was ein Zweikampf ist und wer ihn gewonnen hat, obliegt stets einem Datenanalysten, der das Spiel beobachtet und live “mitschreibt”. Analysten gibt es aber nicht nur bei den Datenbanken, auch die Vereine beschäftigen Mitarbeiter, die versuchen, aus den Daten kompetitive Vorteile zu erarbeiten. Einen schönen Einblick gibt dieses Interview mit Nikos Overheul, der als Analyst für Brentfort und Midtjylland gearbeitet hat.

So sieht das dann aus:

Auszug aus der Intstat-Datenbank.
Auszug aus der Intstat-Datenbank. (Bild: Instant-Datenbank)

Die Spielbeobachtung ist natürlich nicht alles, das ist eigentlich der Definition nach noch nicht einmal Big Data, weil die Daten zum nicht unwesentlichen Teil ja von Menschen erhoben und ausgewertet werden. Ein anderes Feld im Profisport ist die Professionalisierung des Trainings, wo die Sportwissenschaft in den letzten Jahren große Fortschritte gemacht hat und zunehmend Körperdaten erhoben werden: Bei der WM 2014 etwa setzte die deutsche Nationalmannschaft erstmals eine Version von Adidas MiCoach-System ein, um bessere Informationen über den Trainingserfolg in Echtzeit zu erhalten. Marktführer auf diesem Feld ist Catapult Sports, deren patentierte Wearables von Hunderten von Sportvereinen weltweit eingesetzt werden.

Hier eine kleine Video-Einführung in Big Data im Fußball. (Video: Catapult Sports)

Die Fußball-Nerdblogger

Kurzer Exkurs: Neben den Profi-Tools ist ein beträchtlicher Teil dieser Daten öffentlich zugänglich, zumeist in den Medien als Service für Taktikfreunde oder als PR-Sample der großen Datenbankanbieter. Wer sich damit beschäftigen will, findet ein endloses Betätigungsfeld auf globalen Statistikangeboten (Bundesliga.de, Whoscored oder Squawka). Interessanter als die reinen Daten ist aber die Analyseseite, hier hat sich eine Nerd-Szene entwickelt, die Daten-gestützt oder durch Spielbeobachtungen ausufernde Analysen fährt, von eigenen Rechenmodellen bis zu Interpretationen von Spielsituationen und Performance von Trainerns und Spielern. Anspieltipps: Statsbomb, Spielverlagerung, Zonal Marking. Zum Einsteig interessant: Niemals Allein mit einer Einführung in die Fußballstatistik und SBNation mit einer Erklärung des ExpG-Modells, das zu berechnen versucht, wie viele Tore in einem Spiel hätten fallen müssen.

Die Nerdszene ist deshalb so interessant, weil mit der Verfügbarkeit von Daten eine Art Demokratisierung einher geht: Während die Nerds relativ frei vom Fansein versuchen, das Spiel zu objektivieren, herrschen in vielen Vereinen und bei vielen Sportreportern immer noch das Bauchgefühl und die Küchenpsychologie als als Interpretationsgrundlage des Spielgeschehens vor. Aber die Professionalisierung geht rasant voran und immer mehr Vereine stellen Datenanalysten ein. In Deutschland sind die oft als Retortenvereine beschimpften Red-Bull-Clubs sowie Hoffenheim vorne mit dabei, was sicher auch damit zu tun hat, dass dort weniger Besitzstandswahrer unterwegs sind und der Wille, sich mit modernen Methoden einen Vorteil zu verschaffen, stärker ausgeprägt ist.

Allerdings steht wie in anderen Bereichen steht auch im Fußball der Einsatz von Big Data noch am Anfang: Die relevanten Daten werden allenthalben umfassend erhoben, eine Ausnahme sind die bislang zumeist nur ungenügend erfassten Off-the-Ball-Daten, also Laufwege und Spieleraktionen abseits des Kampfes um den Ball. bei der Analyse ist man noch nicht überall so weit, auch weil es an Menschen mangelt, welche die Sportart und die statistische Mustererkennung gleichermaßen beherrschen. Aber dort, wo Big Data gezielt eingesetzt wird, sind die Erfolge von außen sichtbar: Der oben erwähnte FC Midtjylland etwa wurde 2014/2015 dänischer Meister, obwohl die etablierten Clubs FC Kopenhagen und IF Bröndby deutlich teurere Mannschaften ins Rennen schickten.