Economia Digitale
Un algoritmo per l’azienda calcio: valutare un giocatore come se fosse un’azione
di Guido Romeo
Img Description

Comprare Salah per 42 milioni di euro dalla Roma è stato forse il migliore affare del Liverpool degli ultimi anni. I big data mostrano che “Momo” nel corso degli scorsi due anni ha registrato performance che lo collocano al livello dei mostri sacri come Messi e Ronaldo. Mentre è vero che i due campioni indiscussi si attestano su valori altissimi da anni, Salah è protagonista di una crescita con pochi precedenti, che nell’ultima stagione, lo ha portato ai livelli dei top player mondiali. Il Liverpool, ha fatto dunque un ottimo affare, approfittando della necessità della Roma di monetizzare per non avere problemi di bilancio.

L’analisi arriva dal lavoro di PlayeRank, la startup pisana lanciata da Paolo Cintia, ricercatore dell’Università di Pisa, Luca Pappalardo dell’Isti-Cnr di Pisa insieme a Dino Pedreschi, co-direttore del Kdd Lab dellì’ateneo pisano, e da Paolo Ferragina, professore presso la stessa istituzione. Grazie allla collaborazione con l’italiana Wyscout, una delle aziende leader nella raccolta dei dati delle partite che ha messo a disposizione un database di 10mila incontri degli ultimi tre anni dei campionati italiano, francese, tedesco e spagnolo, i ricercatori pisani hanno mappato le migliaia di interazioni che avvengono tra i 22 giocatori in campo.

Il risultato è un sistema di intelligenza artificiale basato su un algoritmo open source per la valutazione automatica delle performance dei calciatori in grado di valutare le decine di milioni di eventi delle partite osservate: da ogni interazione tra calciatori e palla viene registrata, includendo il tipo di evento (passaggio, tiro, dribbling, ...), all’istante e alla posizione del campo in cui è avvenuto. L’output dell’algoritmo PlayeRank è un “indice di performance” per ogni calciatore che varia tra -1 e +1 su una serie di partite e che può poi essere utilizzato per stilare una classifica dei calciatori oppure per capire come le prestazioni di un calciatore stanno evolvendo nel tempo.

L’innovazione di PlayeRank sta proprio qui. Capire quali eventi sono cruciali nella valutazione della performance può essere intuitivo, ma stimare quanto “pesano” non è banale. PlayeRank analizza tutto ciò che è accaduto nelle partite a disposizione e impara con tecniche di machine learning quali sono gli eventi di gioco che caratterizzano le squadre vincitrici di ogni partita. Alla fine, ottenuto il valore di ogni evento, sia esso positivo o negativo, PlayeRank riesce a riassumere in un singolo numero le prestazioni di tutti i calciatori.

Due prestazioni facilmente confrontabili, sono altrettanto facilmente ordinabili: per questo il ranking dei calciatori diventa più semplice una volta definito il valore delle loro azioni sul campo. Esprimere il valore di ogni singola prestazione in un singolo numero è la base per lo sviluppo di un ulteriore livello di analisi. Ad esempio, si può osservare come varia la prestazione di un calciatore nel tempo e valutarlo come un titolo azionario. Oppure si può studiare come si sviluppa un talento, identificare quali sono i segnali predittivi di crescita per capire su quali giovani investire come avveniva nel film “Moneyball” o, più semplicemente, come è recentemente capitato anche ai ricercatori pisani, sfidare gli amici al Fantacalcio pur non sapendo nulla del campionato.

Con questo approccio guidato dai dati la valutazione dei giocatori si avvicina molto a quelle dei titoli di borsa anche se sull’analisi tecnica, nel calcio, c’è ancora molto da scoprire. L’analisi dell’evoluzione dei calciatori è la nuova frontiera che la startup PlayeRank e il Kdd Lab, all’interno del progetto europeo SoBigData, stanno percorrendo. Di PlayeRank e de “Il futuro del calcio, il calcio del futuro” si parlerà il prossimo 29 settembre in un workshop che si svolgerà a Pisa nell’ambito del Festival della robotica. Inoltre, il 12-13 ottobre è in programma la prima edizione di Soccer Data challenge (soccerchallenge.sobigdata.eu): una “maratona” di 30 ore, dedicata allo sviluppo di nuove soluzioni per l’analisi dei dati calcistici. Le squadre di appassionati avranno a disposizione tutti i dati relativi ad una stagione calcistica, oltre 500 mila record riguardanti più di 500 calciatori. La scadenza per le iscrizioni, aperte a tutti, è il 15 settembre. E chissà che dall’esplorazione intensiva di un dataset simile non emerga il prossimo Cristiano Ronaldo.

Hai raggiunto il limite di 10 articoli gratuiti disponibili questo mese.
Abbonati a Il Sole 24 Ore Mobile per avere accedere illimitatamente a tutti i contenuti del sito mobile
Inserisci il tuo numero di cellulare per attivare l'offerta o, se sei già abbonato, per continuare a leggere.
Altre informazioni