• fabio salaro

Tra il dire ed il correre ci sono di mezzo i dati


Quante volte ci capita di darci degli obiettivi, come ad esempio preparare una maratona ad una determinata velocità, che sulla carta sembrano totalmente fattibili ma poi non riusciamo a reggere gli allenamenti e rischiamo degli infortuni?


Ma soprattutto come calcoliamo questi obiettivi?


Tutti noi avremmo sentito almeno una volta dire che il tempo utile per correre la maratona è calcolato utilizzando il tempo sulla nostra mezza maratona moltiplicato per due a cui poi vanno aggiunti sei o dieci minuti per tenersi larghi con la stima.


Ma se invece vi dicessi che è possibile predire esattamente il tempo sulla maratona analizzando semplicemente i dati degli allenamenti precedenti?

Ebbene si, come scritto nell’articolo “Correre al tempo dei dati”, avendo a disposizione una buona mole di dati dei nostri allenamenti tra le tante cose è possibile anche avere una stima di quanto si potrà correre una determinata distanza, come per esempio la maratona.


Per trovare la formula che stimi il tempo finale per correre una determinata distanza utilizzeremo la tecnica statistica della regressione lineare ovvero una funzione che formalizza e risolve il problema di una relazione funzionale tra variabili misurate sulla base di dati campionari estratti da una banca dati.

Fondamentale nell'analisi è anche la nostra esperienza maturata nell’ambito di questa disciplina, che ci permette di individuare le variabili essenziali da valutare durante una corsa.


Personalmente trovo indispensabili le seguenti varaibili:

  • Frequenza cardiaca

tale variabile, se opportunamente monitorata con strumenti affidabili (utilizzando una fascia cardiaca toracica oppure una fascia ottica da braccio, io ad esempio ho una fascia POLAR Verity Sense) fornisce una buona indicazione dell'intensità con cui si corrono determinate distanze.

Solitamente, su fisici allenati, frequenze cardiache alte determinano andature elevate e viceversa;


  • Pendenza

ovviamente correre in discesa è più semplice che correre in salita. Quindi la nostra prestazione dovrà ovviamente tener conto di un’ipotetica pendenza media del percorso;


  • Distanza

il tempo finale dovrà senz’altro tener conto della distanza percorsa.


La regressione lineare non farà nient’altro che osservare i dati passati per trovare la relazione, se esiste, tra le varaibili sopra definite dalla nostra esperienza.

Analizzando il mio dataset di Strava, emerge che i tre parametri individuati più il tempo finale sono perfettamente correlati, infatti mettendole in relazione vediamo che il software statistico utilizzato (R) afferma che l’indice che misura il legame tra la variabilità dei dati e la correttezza del modello statistico utilizzato è del 95%.

Riporto puramente a titolo illustrativo il risultato del modello di regressione lineare:



Per esempio, a posteriori, ho analizzato con questa funzione i miei allenamenti preparatori della Firenze marathon del 24/11/2019 e il risultato è stato il seguente:


2h 40’ 12’’


Sapete quanto è stato il mio tempo quel giorno?


Può succedere che il risultato finale dell'algoritmo sia maggiore rispetto a quello che avevamo sperato: amici runner non dovete assolutamente scoraggiarvi! Forzare il proprio fisico o cercare di correre basandosi sulla media a km a cui si corre una 10km ci porterebbe solo ad infortuni e magari abbandonare l’ambizione di correre una maratona perché troppo faticosa, rischiando di perdersi o arrivando ad odiare una distanza che secondo me ogni runner dovrebbe provare almeno una volta a correre perché è l’essenza stessa della corsa.


Consideriamo anche che per quanto questi strumenti ci sono di grande aiuto, l'essere umano è definito da più di semplici formule matematiche: in una gara podistica il pubblico che ci incita, l’essere nelle prime posizioni, avere la proprio persona amata al traguardo che ci attende o altro, permettono di avere un maggior numero di endorfine che possono migliorare la nostra prestazione!


La stima ottenuta dalla formula infatti sarà solo un punto di partenza, perché credo fortemente che la dedizione e la costanza nel running (ma non solo) possono portare qualsiasi persona a superare i propri limiti. Per esempio se l’algoritmo darà come risultato un tempo X, quello che possiamo fare è impostare degli allenamenti leggermente più veloci a livello di media a km per correre la distanza in X meno qualche minuto.


Possiamo utilizzare inoltre questo algoritmo non solo nel momento preparatorio di una corsa ma anche durante una preparazione già in corso, aiutandoci a determinare se gli allenamenti stanno realmente producendo il risultato previsto.


Capisco che tali argomentazioni possano suscitare interesse e voglia di testare, ecco perché nelle prossime settimane cercherò di realizzare una semplice interfaccia dove potete caricare il vostro dataset di Strava e visionare ciò che in questo e nel precedente post Correre al tempo dei dati” si è parlato.

Buon allenamento!

75 visualizzazioni0 commenti

Post recenti

Mostra tutti