Passie kan niet worden opgelegd, maar alleen blootgelegd

Binnen Team 4 Mijl zijn er veel atleten die sport en studie combineren. Sommige atleten doen zelfs onderzoek naar de sport binnen hun studie. In deze column zoomen we in op een serie sportgerelateerde onderzoeken van atleten binnen Team 4 Mijl. Sofie Lovdal heeft tijdens haar master informatica een artikel gepubliceerd over de ontwikkeling van een computermodel dat voorspellingen doet over het ontstaan van een blessure. 

Tijdens het eerste jaar van mijn master informatica heb ik een onderzoeks internship gedaan en ik was blij dat ik dit kon combineren met mijn passie voor hardlopen. Ik had het geluk de beschikking te hebben over een grote hoeveelheid trainingsdata van wedstrijdatleten en ik was benieuwd of ik patronen kon vinden in de trainingsbelasting die het risico op blessures verhogen. 

De data heb ik geanalyseerd door gebruik te maken van ‘machine learning’, dit is een techniek om voorspellende modellen voor grote hoeveelheden data te maken. In dit geval heb ik in een algoritme vele trainingsopzetten ingevoerd die een blessure tot gevolg hadden. Ook heb ik het tegenovergestelde ingevoerd; trainingsopzetten met een gezonde uitkomst. Door elk voorbeeld dat het algoritme ziet worden de interne parameters van het model een heel klein beetje bijgesteld, men zegt dat het algoritme op deze manier ‘leert’. Als het model genoeg voorbeelden heeft gezien is het in staat om onderscheid te maken tussen trainingsopzetten die leiden tot een blessure en deze die dat niet doen. Hoewel ‘machine learning’ dicht tegen statistiek aanzit, is het meer datagestuurd, want de afstelling van het model is alleen gebaseerd op de beschikbare data. Dit is ook de reden waarom ‘machine learning’ potentieel erg complexe patronen uit data kan halen. Ook bij sportblessures is dit het geval, omdat er zelden één specifieke reden is voor de blessure. 

We hebben het model geleerd om te voorspellen of tijdens de trainingsopzet van de volgende dag een blessure zal ontstaan, aan de hand van de trainingsdata van de voorgaande dagen of weken: hoeveel kilometer heeft een atleet gelopen, op welke intensiteit, hoeveel kracht heeft de atleet gedaan, is er alternatief getraind, hoe goed de trainingen zijn gegaan en nog andere gegevens. Het model is ontwikkeld aan de hand van het ene deel van de data en getest op het andere deel, zodat het testen plaatsvindt door middel van nog niet geziene data. De resultaten waren erg interessant: als je bijvoorbeeld honderd trainingsopzetten die tot blessures hebben geleid en honderd trainingsopzetten die daar niet toe hebben geleid vergelijkt, kan je met hoge mate van nauwkeurigheid voorspellen welke trainingsopzetten leiden tot een blessure. Het probleem in de praktijk is natuurlijk dat blessures tamelijk zeldzaam zijn in vergelijking met alle trainingen die zonder problemen gaan. Het voorspellen van blessures wordt hierdoor vergelijkbaar met het zoeken naar een speld in een hooiberg. Desondanks leverde het testen van het model op data, waarin de verhouding was één trainingsopzet die een blessure veroorzaakt versus zeventig trainingsopzetten met een gezonde uitkomst, een nauwkeurigheid op van 78% bij het voorspellen of de volgende training tot een blessure zal leiden of niet. 

Het model is nog niet perfect, want er zijn natuurlijk meer factoren van invloed op het ontstaan van een blessure, zoals de biomechanica van een atleet, zijn schoeisel en slaapkwaliteit. Je zou kunnen zeggen dat we halverwege zijn om het probleem van het voorspellen van blessures op te lossen en verder onderzoek in dit gebied zou erg interessant zijn. 

Dit onderzoek heeft geleid tot een artikel dat via de volgende link beschikbaar is: https://www.researchgate.net/publication/349589910_Injury_Prediction_in_Competitive_Runners_with_Machine_Learning. Hierin kan je ook de technische details van het model vinden.    

Omslagfoto Ejam Maail