La data au service de la performance sportive

Passionnés de Data et de sport, avons-nous conscience de l’apport de l’analyse des données dans l’amélioration des performances ?

Lincoln, société experte en Data Science pour répondre à des problématiques Métiers, développe pour ses clients des solutions permettant de monétiser ses données.

Confiez nous vos données et vous trouverez des nouveaux leviers de performance !

Voici quelques exemples concrets de tendances dans le sport :

Alors que les fans de football sont habitués aux statistiques de possession de balle ou de nombre de tirs depuis de nombreuses années, les téléspectateurs de la BBC ont vu apparaître un nouvel indicateur dans les analyses post-match depuis l’été dernier : l’Expected Goal.

Très populaire en Football Analytics, ce terme se traduit littéralement en « but attendu » et est défini comme la probabilité pour chaque tir d’être transformé en but.

Dans un sport où le score final ne reflète pas toujours la physionomie du match, les Expected Goals permettent de quantifier le danger porté sur le but adverse durant un match. Les différents paramètres pris en compte dans ses modèles de calcul sont la position (distance et angle) du tireur par rapport au but au moment de la frappe, la partie du corps utilisée pour frapper la balle, la manière dont le ballon est reçu par le tireur avant la frappe ou encore la présence d’autres joueurs entre le tireur et le but.

Pour faire simple, un tir du pied plein axe à 4 mètres du but à la suite d’une frappe repoussée par le gardien adverse aura une probabilité élevée d’être convertie en but. À l’inverse, un tir excentré de la tête à 30 mètres du but à la suite d’un centre en hauteur avec 3 joueurs sur la trajectoire du tir aura une probabilité très faible d’être convertie en but.

Sur le graphique plus bas, on visualise les Expected Goals de la demi-finale entre la France et la Belgique lors de la dernière Coupe du Monde. À l’issue du match remporté 1-0 par les Bleus, nos voisins belges ont estimé qu’ils auraient davantage mérité de se qualifier.

Si l’on se fie à la possession de balle (63,6% en faveur des Diables Rouges), on peut effectivement penser que la domination a été belge. Mais en regardant les Expected Goals, on voit que les 9 tirs belges n’ont généré qu’un total de 0,5 buts attendus contre 1,8 pour les 18 tirs français. Les Français ont d’ailleurs raté deux occasions où la probabilité de marquer était élevée et le score aurait donc pu ne pas se limiter au seul but de Samuel Umtiti.

Très utilisés dans les analyses de match, les Expected Goals le sont également dans la mesure des performances individuelles des joueurs : la comparaison avec le nombre de buts réels est un bon indicateur de l’efficacité des attaquants et des gardiens (en se limitant aux tirs cadrés pour ces derniers). Pour les milieux de terrains et autre joueurs offensifs, des modélisations similaires évaluent la probabilité de chaque passe d’être décisive, on parle alors d’Expected Assist.

Outre ces indicateurs, les statistiques sont plus globalement utilisées dans le processus de recrutement, dans le suivi des performances physiques des joueurs ou encore dans l’analyse de l’adversaire.

On peut citer en exemple le petit club danois du FC Midtjylland, qui suite aux investissements d’un nouvel actionnaire majoritaire Matthew Benham dans la data analysis, est passé d’une situation proche de la faillite à un titre de champion du Danemark en 2015. Erik Sviatchenko, joueur de l’équipe, évoque ainsi l’impact de cette évolution : « Matthew est le facteur X, son utilisation des statistiques et des mathématiques est le truc en plus qui nous donne l’avantage. C’est comme dans Moneyball. »

Le défenseur danois fait ici référence au livre de Michael Lewis, adapté au cinéma en 2011 (Le Stratège en VF). Ce film retrace l’histoire de Billy Beane (incarné par Brad Pitt), directeur général de l’équipe de baseball des Athletics d’Aukland ayant connu des résultats retentissants grâce à un recrutement basé sur une approche statistique baptisée sabermétrie.

Autre sport de plus en plus data-driven aux États-Unis, le basket a vu l’intégration progressive des analystes au sein des staffs des équipes NBA. Ceux-ci ne sont d’ailleurs pas étrangers à la forte hausse du nombre de tirs à 3 points constatée ces dernières années (18,1 tirs à 3 points en moyenne par match lors de la saison 2007-2008 contre 29 la saison dernière) et un hackathon est organisé chaque année par la NBA pour déceler de nouveaux talents.

La saison régulière de NBA comptant 82 matchs en 6 mois, le risque de blessure des joueurs constitue un enjeu important et est souvent modélisé afin de mettre les joueurs au repos au moment opportun. L’état de fatigue des joueurs est surveillé de près grâce à des caméras placées autour de chaque terrain depuis 2009 et des appareils mesurant la qualité du sommeil des joueurs ou encore l’acidité de leur salive sont également utilisés.

De même que pour les Expected Goals sur la BBC, le RPM (Real Plus Minus) est aujourd’hui diffusé auprès du grand public sur la chaîne américaine ESPN pour estimer l’impact de chaque joueur sur le score lorsqu’il est présent sur le parquet.

Bien que plus répandue dans les sports collectifs, la data est désormais très présente dans certains sports individuels. C’est le cas du tennis féminin où a été autorisée en 2009 l’intervention des coachs pendant les matchs du circuit WTA (hors tournois du Grand Chelem) puis l’utilisation de tablettes numériques par ceux-ci en 2015.

L’application SAP Tennis Analytics a donc fait son apparition sur les cours à l’été 2015 et permet aux entraîneurs d’appuyer leurs interventions avec les statistiques du match en cours. La joueuse allemande Angelique Kerber, ancienne numéro 1 mondiale et vainqueur de 3 tournois du Grand Chelem depuis 2016, est notamment une grande adepte de l’application.

Charly V.