Labels

(Cartoon: Kim)

Een voetbalclub runnen op basis van buikgevoel, veel trainen en een konijnenpoot? Vergeet het. Wie in de 21e eeuw hoge ogen wil gooien in de voetballerij, moet aan de slag met keiharde cijfers. Het Deense FC Midtjylland baant zich zelfs op de vleugels van de statistiek een weg naar de titel. En de Belgische clubs? "We hebben nog een flinke kloof te dichten." (24 april '15)


Weinig voetbalclubs zijn momenteel fascinerender dan het Deense FC Midtjylland. Op een aantal ereplaatsen in beker en competitie na, braken de Wolven in hun 16-jarige geschiedenis nooit veel potten. Maar nu, op vijf wedstrijden van het seizoenseinde, stevenen ze met 11 punten voorsprong op FC Kopenhagen vlot op de titel af. En dat ondanks een veel kleiner budget. Hun geheim? Een quasi blind vertrouwen op statistieken.

Voorzitter Matthew Benham en technisch directeur Rasmus Ankersen zijn de gekke professoren met de sleutels tot het cijferlaboratorium. Zij zijn ervan overtuigd dat hun nadruk op data-analyse een voordeel moet opleveren tegen tegenstanders die rijker zijn, maar zich nog steeds laten leiden door irrationele, subjectieve en emotionele beslissingen.

Vooral Benham weet waarover hij spreekt. De Brit vergaarde een fortuin als professioneel gokker dankzij een uitgebreid systeem van wiskundige modellen dat hem hielp om te voorspellen wie een wedstrijd zou winnen, en met hoeveel doelpunten verschil. Van dat vermogen investeerde Benham in juli 6,2 miljoen pond in het toen zieltogende Midtjylland, waardoor hij prompt meerderheidsaandeelhouder werd. Het was niet zijn eerste club - in 2012 had hij het Britse Brentford gekocht, dat onder zijn voorzitterschap intussen van derde naar tweede klasse steeg - maar het werd wel de plaats waar hij eindelijk zijn theorieën over het belang van statistieken in de praktijk kon omzetten.

Samen met Ankersen, een ex-speler van de Wolven, tekende hij een plan uit waarbij Midtjylland geen spelers meer zou kopen op aanraden van een scout of makelaar, maar op basis van algoritmen die hen vertelden of de spelers ondergewaardeerd waren. Vrije trappen moesten een wetenschappelijk project worden, en tactische coaching moest meer op statistiek gebaseerd worden dan op buikgevoel. En voor de nietsvermoedende Denen die het niet begrepen hadden op die vernieuwende aanpak, had hij één boodschap: als zijn modellen niet werkten, zou hij de club nooit kunnen kopen hebben.

 Moneyball 

Benham en Ankersen zijn niet de eersten die een sportclub runnen op basis van data-analyse. Wat zij doen gaat eigenlijk op het beleid dat de Amerikaan Billy Beane al jaren voert als manager van baseballclub Oakland Athletics. Beane lette nooit op spelersreputaties of traditionele prestatiedata, maar zocht op basis van complexere statistieken naar spelers die chronisch ondergewaardeerd werden. Liever dan één dure topspeler, investeerde hij dus in een analyticus die hem twee goedkope toppers kon vinden. Met succes, want de A's flirten al jaren met de top vijf in de baseball-liga, terwijl ze twintig van de dertig teams qua salarismassa moeten laten voorgaan.

Over Beanes aanpak werd in 2003 het boek Moneyball geschreven, dat in 2011 verfilmd werd met Brad Pitt in de hoofdrol. Het geldt nu als dé bijbel voor statistische analyse in alle sporten, en komt neer op het idee dat werken met gigantische hoeveelheden ruwe data inzichten oplevert die het menselijk oog, hoe ervaren ook, hoe dan ook zal missen.

Beanes datarevolutie maakte snel opgang in basketbal, American football, zwemmen, atletiek en zelfs in het wielrennen. Maar het voetbal hield lange tijd stand als de minst statistische van alle sporten. Met reden, want voetbal bestaat uit een complex samenspel van factoren en niet uit een reeks aparte acties, zoals dat bij baseball - balletje gooien, balletje wegmeppen - wel het geval is. Statistieken in het voetbal bleven dan ook lange tijd beperkt tot het aantal doelpunten en assists, en met een beetje geluk het aantal schoten op doel. Maar daar komt stilaan verandering in.

Grote clubs als Real Madrid, Chelsea, Arsenal en Manchester City gingen de voorbije jaren in zee met privébedrijven als Amisco Prozone en Opta. Hun service: zij filmen elke wedstrijd met camera's op de middenlijn die elk hoekje van het veld registeren, en coderen elke actie in die wedstrijden. Iedere baltoets, pass, tackle, interceptie, geslaagde dribbel, sprint of redding wordt opgetekend - een gemiddelde wedstrijd is zo goed voor 2.500 acties - en gelinkt aan videobeelden. Clubs die ervoor betalen krijgen dan toegang tot die rijke databank, die ze kunnen gebruiken voor hun eigen coaching.

Dat doet ook Midtjylland. Met succes: zij stelden bijvoorbeeld vast dat corners die naar het doel toe draaien vaker tot doelpunten leiden dan zogenaamde outswingers. Dergelijke werkpunten brachten het team zelfs tot een gemiddelde van 0,88 doelpunten uit stilstaande fases per wedstrijd. Een gemiddelde dat in Europa enkel verbeterd wordt door verliezend Champions League-finalist Atletico Madrid: zij draaien aan 1,04 per wedstrijd.

 En in België? 

Eigenlijk had Benhams datarevolutie evengoed in ons land kunnen plaatsvinden. "Toen ik een club wou kopen, keek ik eigenlijk eerst naar België," zei hij in een recent interview met magazine These Football Times. "Daar kan je snel Europese paspoorten krijgen voor exotische spelers. Maar wat ik leuk vond aan Denemarken is dat het een van de minst corrupte landen ter wereld is: spelersmakelaars spelen er een minder belangrijke rol, en het is ook gewoon een gemakkelijke plaats om zaken te doen."

In afwachting van een andere cijfermecenas wordt in België voorlopig weinig met ruwe data gewerkt, zegt Jan Van Haaren, die als doctoraatsstudent in de Computerwetenschappen bij de KU Leuven werkt aan statistische rapporten over de Belgische voetbalcompetitie. "In Duitsland, Engeland en Amerika analyseren clubs al op grote schaal data, zowel van trainingen als van wedstrijden. In België gebeurt dat voorlopig amper. Met onze vakgroep proberen wij clubs te doen inzien dat die gegevens nochtans enorm nuttig kunnen zijn: een coach kan op basis van statistieken perfect zijn trainingen aanpassen tot op de individuele speler."

Maar dat is voorlopig geen sinecure. "In België werkt slechts een handvol topclubs met dataleveranciers. Ik merk een zekere conservatieve houding tegenover cijfermateriaal: als er academische conferenties zijn rond sportdata wemelt het er bijvoorbeeld van de Duitsers, Engelsen en Nederlanders, maar een vertegenwoordiger van een Belgische club ben ik er nog nooit tegengekomen. Er is dus nog wel een flinke kloof te dichten, want ik denk dat je het belang van data in de toekomst van de voetballerij nauwelijks kan overschatten."

Eén van die topclubs waar data toch een plaats krijgen, is landskampioen Anderlecht, dat samenwerkt met dataverzamelaar Amisco Prozone. Als analist vormt Bart Meert de brug tussen de statistieken en hoofdcoach Besnik Hasi. "De Prozonecamera's brengen niet alleen de posities van de spelers ten allen tijde in kaart, maar ook duels, passes en fysieke data zoals hoeveel kilometer een speler aflegt of hoeveel sprints van boven de 24 kilometer per uur hij trekt."

Dat levert na elke wedstrijd een behoorlijke boterham aan cijfermateriaal op, zegt Meert. "Die data gebruiken we dan om spelers na de wedstrijd feedback te geven. Van op de bank zie je soms dat er niet genoeg aansluiting is tussen verdediging en middenveld, maar met de beelden van Prozone kunnen we dat ook onderbouwen. Dat maakt onze job toch gemakkelijker."

Dat data-analyse in België nog niet verder doorgedrongen is, ligt volgens Meert aan de kostprijs. "Systemen als Prozone kosten heel veel geld. En je weet hoe het gaat in de voetballerij: er gaat heel veel geld naar spelers, maar investeren in systemen is altijd een grote stap." En dan is er nog geen garantie dat het systeem ook gebruikt wordt. "Bij ons was het Franky Vercauteren die acht seizoenen geleden Prozone binnenhaalde. Maar niet elke coach werkte er evenveel mee: John Van den Brom was bijvoorbeeld iets minder wetenschappelijk bezig. Besnik Hasi besteedt dan weer veel aandacht aan statistieken. Ze zijn niet zaligmakend - een speler die twaalf kilometer loopt heeft daarom geen goeie wedstrijd gespeeld - maar ze vertellen ons wel hoeveel kopduels spelers winnen, in welke posities ze ballen recupereren, of ze druk zetten waar we gevraagd hebben… En dat is voor ons erg belangrijk."

 Kostprijs: een sportwagen 

Ook Club Brugge doet een beroep op Prozone. "De keuze voor Prozone was een logisch gevolg van de professionalisering die Verhaeghe en Mannaert binnen heel Club hebben geïnstalleerd," weet performance coach en Club-cijferman van dienst Siebe Hannosset. "Zonder het warm water opnieuw te willen uitvinden, zijn we onder meer te rade gegaan bij de grote clubs uit de Premier League."

En dus mag Club voor de prijs van een mooie sportwagen genieten van level 7, het hoogste niveau van het Prozonesysteem waarmee een uitgebreide analyse van het technische, tactische en fysieke aspect gemaakt wordt. Met andere woorden: het systeem maakt van atleten van vlees en bloed rennende en springende tabellen en grafieken. Hannosset: "Hoeveel sprints Thomas Meunier trekt, het aantal intercepties dat Timmy Simons doet, de geslaagde passes naar de zone van de waarheid die Victor Vazquez geeft, op welke plek op het veld dat de meeste balrecuperaties gebeuren… Dat halen wij allemaal uit die cijfers van Prozone. Dat helpt ons op een andere manier naar een wedstrijd kijken. Soms heb je bijvoorbeeld als toeschouwer de indruk dat een wedstrijd erg op en af gaat, maar als je naar de data kijkt stel je dan vast dat vooral de bal zijn werk heeft gedaan, en de ploeg als blok schoof."

"De data laat ons vooral te om snel een analyse te maken van een wedstrijd, en de spelers zwart op wit te tonen wat er goed was en wat niet. Spelers als Simons en Ruud Vormer leren bijvoorbeeld graag bij op basis van die dat, want ze worden er gewoon beter door. En ook Michel Preud'homme wil niet liever dan zich omringen door mensen die zijn beslissingen zo gemakkelijk mogelijk maken. Je moet hem niet overladen met data, want dat werkt verlammend, maar op de gepaste momenten gaat hij er toch mee aan de slag."

De statistieken helpen niet alleen bij de nabespreking, zegt Hannosset. "Ook de tactische coaching voor de match steunt tegenwoordig op data. Het is altijd interessant als je vooraf kan zeggen: deze ploeg slikt 25 procent van hun tegendoelpunten in het laatste kwartier. Dan kan je de spelers waarschuwen: die ploeg kan heftig starten, maar heb geduld, want er komen mogelijkheden op het einde van de wedstrijd. Zo gaan spelers misschien iets minder snel panikeren."

Toch houdt Hannosset ook een slag om de arm. "Ik geloof niet dat we naar een tijdperk gaan waarin data alles in het voetbal zal overheersen. Het is en blijft een volkssport die drijft op karakter, emotie en op het goeie moment het juiste buikgevoel hebben waardoor je een wedstrijd naar je hand kan zetten. Data kunnen beslissingen wel gemakkelijker maken, maar uiteindelijk komt het op details aan: een bal die net binnen of buiten valt, heeft niets met data te maken, maar met geluk."

Wat opvalt: naast titelkandidaten Club Brugge en Anderlecht zijn er maar twee Belgische clubs die met Prozone werken: Standard Luik en… degradatiekandidaat Lierse. "We zijn natuurlijk maar een kleine club tegenover die kleppers," weet Ben Bruynseels, woordvoerder van de Pallieters. "Maar voorzitter Maged Samy wou toch per se investeren in het systeem, in het kader van onze jeugdopleiding. Met die data kunnen we onze jonge spelers beter maken." Het levert soms zelfs verrassingen op. "Zonder in detail te treden: soms verdenkt een trainer een speler ervan een luilak te zijn, tot op basis van de statistieken blijkt dat hij toch enorme inspanningen levert. Zo hebben we ons beeld over sommige spelers toch al moeten bijstellen."

 Weg met de scouts 

De Moneyball-aanpak werpt dus vruchten af als het gaat om spelers beter te maken, maar hij komt pas echt tot zijn recht op een ander domein: de rekrutering van spelers. Ook daar wordt een batterij scouts steeds meer vervangen door statistieken. En dan gaat het zelden om de klassiekers als doelpunten, assists of tackles. De cruciale vraag bij data-analyse in het voetbal is namelijk: welke statistieken zijn relevant?

Er zit namelijk veel ruis op de cijfers. De legendarische Manchester United-manager Alex Ferguson stelde bijvoorbeeld ooit vast dat zijn Nederlandse stopper, Jaap Stam elk seizoen minder tackles liet optekenen. "Die is op de terugweg," dacht Sir Alex, en hij verpatste Stam aan Lazio Roma… Waar hij nog jaren op topniveau speelde. Pas later besefte Ferguson dat Stam alleen maar minder tackelde omdat zijn positiespel zoveel beter was geworden. Tackles zijn dus een slechte waardemeter voor verdedigers.

In feite laten de meeste simpele statistieken, zoals schoten op doel, vaak te wensen over. Een speler met tien schoten binnen het kader oogt bijvoorbeeld statistisch interessant, maar als dat tien makkelijke vangballetjes voor de keeper zijn, heb je meer aan een spits die negen keer naast trapt en de bal één keer in de winkelhaak ramt.

Bij Midtjylland focussen ze dan ook op "key performance indicators": op welke plek op het veld recupereert een speler het vaakst de bal, welk percentage van zijn passes gaat naar voor, welk percentage van zijn schoten resulteert effectief in een doelpunt… Zo kwam Ankersen terecht bij de speler die hij zelf de ultieme exponent van het Midtjylland-verhaal noemt: Tim Spärv. "Onze andere verdedigende middenvelder, Izunna, is een opvallende speler," schetste Ankersen in een gesprek met nieuwswebsite De Correspondent. "Hij is erg sterk, atletisch, en doet veel spectaculaire tackles. Spärv valt daarentegen zelden op, maar toch draait het team beter als hij speelt. Dat is omdat zijn positiespel zo goed is: hij ziet problemen voor ze ontstaan."

Ook in de Lage Landen wordt er steeds meer op basis van data gescout. SciSports, het bedrijf van de Nederlander Giels Brouwer, verzamelt bijvoorbeeld data van ruim 300.000 voetballers. Brouwer omschrijft het zelf als "een wetenschappelijk headhuntersbureau voor de voetballerij". Hij helpt clubs bij het zoeken naar de naald in de hooiberg, de speler die perfect in hun systeem past. Op die manier verlicht hij de taak van de clubs. Mits een tegenprestatie: als de club de speler later met een meerwaarde verkoopt, krijgt SciSports een bonus van een half maandsalaris van de speler.

"In Nederland zijn de scoutingmiddelen beperkt," weet Brouwer. "Clubs kunnen het zich niet permitteren om scouts naar elke uithoek van de wereld te sturen. Een club als Heerenveen kiest dan bijvoorbeeld voor een focus op scouting in Scandinavië. En voor de rest van de wereld kunnen ze een beroep doen op ons." Op die manier evolueren we misschien naar een wereld zonder scouts aan de zijlijn. Al zal dat nog even duren: een jaar na de oprichting werkt SciSports al samen met elf Nederlandse clubs en verschillende buitenlandse teams, maar in België hebben ze vooralsnog geen voet aan de grond gekregen.

Ook SciSports kijkt verder dan de traditionele voetbalstatistieken, zegt Brouwer. "We kijken bijvoorbeeld niet naar het aantal assists van een speler, maar naar zijn 'verwachte assists': het aantal passes dat zó goed is dat er in normale omstandigheden een doelpunt van komt. Zo maak je de voorzetter niet meer afhankelijk van een klungelende spits. We hanteren een gelijkaardig systeem voor spitsen: 'verwachte doelpunten' geeft aan hoe groot de kansen zijn die hij krijgt. Een schot van 20 meter uit een hoek van 30 graden tegenover het doel is bijvoorbeeld 0,16 doelpunt waard, omdat het zelden lukt. Maar op basis daarvan kunnen we zeggen of iemand de statistieken verslaat of niet, en bijvoorbeeld inschatten of hij goed is als afstandsschutter."

Een voorbeeld van een SciSports-succesje is de Nederlander Wout Weghorst. Die was reservespits bij tweedeklasser FC Emmen, tot SciSports opmerkte dat Weghorst een hoog doelpuntengemiddelde had per 90 minuten dat hij op het veld stond - en dat hij daar opmerkelijk weinig kansen voor nodig had. SciSports tipte Weghorst bij Eredivisieclub Heracles, waar hij nu aan 8 doelpunten en 6 assists in 27 wedstrijden zit - niet mis voor een staartclub.

 De rangschikking liegt 

Maar clubs kunnen hun scoutingpotentieel ook op andere manieren ontgrendelen. Bijvoorbeeld met… computerspelletjes. Steeds meer topteams gebruiken Football Manager - een spel waarbij de speler in de huid kruipt van de manager van een voetbalclub en waar wereldwijd al meer dan 20 miljoen exemplaren van over de toonbank gingen - als een scoutingtool. Meer zelfs: Prozone ging in zee met Sports Interactive, de makers van het spel, om zijn data nog completer te maken.

Football Manager is dan ook geen gewoon computerspel: om de simulatie zo waarheidsgetrouw mogelijk te laten aanvoelen bouwt Sports Interactive al 22 jaar aan een eigen scoutingnetwerk. Liefst 1.300 scouts - doorgaans toegewijde FM-fans - gaan in 51 landen naar wedstrijden en trainingen en bezorgen SI doorwrochte rapporten van spelers en clubs. Het resultaat: een gedetailleerde databank van 300.000 spelers, voor de prijs van een computerspelletje.

Bij Anderlecht kunnen ze zich wel vinden in die evolutie, zegt Bart Meert. "Dankzij ons contract met Prozone kunnen wij ook in hun databank zoeken naar spelers. Stel dat deze zomer Steven Defour vertrekt, kunnen we bij Prozone eenzelfde profiel van speler vinden in andere competities. Dat wil zeggen: een speler die in een bepaalde zone veel recupereert, zes ballen op tien vooruit speelt… Zij zoeken dat erg nauwkeurig uit. Dan kan je al grote stappen zet vooraleer je op het vliegtuig stapt om te gaan scouten."

Ook Jan Van Haaren van de KU Leuven voorspelt dat data alleen maar belangrijker zal worden voor scouting. "Maar het heeft ook een keerzijde: Belgische clubs zijn nu nog in staat om hier en daar een talentje te ontdekken dat door andere clubs nog niet gevonden is. Maar zodra alle clubs over veel data beschikken, is het gedaan met de pret: dan wordt het veel gemakkelijker voor de grootste clubs om de beste spelers op te sporen. En dan kan de kloof tussen topploegen en Belgische clubs nog groter worden."

Dat lijkt het dubbel vreemd te maken dat verschillende clubs in zee gaan met hetzelfde scoutingbedrijf - het zou zomaar tot een discussie kunnen leiden over wie het nieuwste Braziliaanse wonderkind doorgespeeld krijgt. Dat ziet Giels Brouwer anders. "Wij gaan erg specifiek op posities in: we hebben bijvoorbeeld zeven verschillende types van linksbuiten. Als je dat dan koppelt aan de verschillende normen, waarden, selecties en budgetten van clubs, komen er voor dezelfde positie vaak heel verschillende spelers naar voren."

Bovendien tipt SciSports nooit één speler, zegt Brouwer. "We bezorgen clubs altijd een rapport met profielen van vijf tot tien spelers. Die kunnen ze dan zelf intensief scouten, voor ze definitief tot aankoop overgaan. Dat menselijke aspect is en blijft belangrijk, want statistiek is louter een ondersteuning voor het beslissingsproces. Pas als de statistieken 100 procent accuraat zijn, kan je er volledig op vertrouwen. Maar dat ze dat nog lang niet zijn, hebben we geleerd uit de economische crisis: daar vertrouwde iedereen ook op cijfertjes toen de boel kopje onder ging."

Toch lijken voetbalcoaches er alle belang bij te hebben om bij hun clubs te pleiten voor een focus op statistieken. Niet alleen omdat het hun leven gemakkelijker maakt, maar ook met oog op hun eigen lijfsbehoud. Dat blijkt uit de aanpak van Midtjylland: daar heeft het bestuur plechtig gezworen om nooit nog een coach te ontslaan op basis van de competitietabel.

Het enige dat telt is het wiskundige model. Dat verschilt soms van de resultaten in de tabel, wat Ankersen graag toeschrijft aan… geluk. Stel dat zijn team veel kansen creëert, maar op een beresterke doelman stuit, en aan de andere kant een haast onmogelijk afstandsschot en een owngoal incasseert: dan levert dat in het wiskundige model nog altijd een goeie score op. Want dan wordt het gezien als een goeie wedstrijd, die door pech verloren wordt. Maar of die regel ook gevolgd wordt als een van de Belgische topclubs aan het eind van de play-offs nog naast de titel grijpt, valt natuurlijk nog te bezien.