Het binnenbocht/buitenbocht onderzoek

Discussie in 'Lange baan' gestart door dedeut, 6 feb 2010.

  1. dedeut

    dedeut Well-Known Member

    Bedankt dat je me hier op wijst GoDennyGo:

    De verschillen voor Fabris en Wennemars (alleen die twee) zijn wel significant, en zelfs met een alpha van 0.05. We kunnen dus met recht zeggen dat Wennemars significant sneller is (was) met een laatste binnenbocht en dat Fabris significant sneller is met een laatste buitenbocht. Wie herinnert zich niet de mooie rit tussen Wennemars en Fabris waarin ze tegelijk de laatste bochten in reden en Fabris meeliep in de buitenbocht en alsnog won!!

    En dan speciaal voor GoDennyGo (als bedankje):

    Morrison (n=28)
    I: 1.45.72
    O: 1.46.93

    Geen significant verschil overigens.

    ps. Mijn conclusie aangepast
  2. dedeut

    dedeut Well-Known Member

    De overige verschillen zijn inderdaad niet significant vanwege uitschieters die het gemiddelde van de binnen- of buitenbaan omhoog of omlaag halen. Gelukkig is de statistische toetsing die ik gebruik (independent Samples T-Test) gevoelig voor dat soort uitschieters. Vandaar dat de verschillen bij de meesten ook niet significant zijn.
  3. Sabine

    Sabine Well-Known Member

    Erg leuk dedeut, mijn complimenten. Het blijkt dus wel mee te vallen allemaal. Ik snap alleen niet waarom je m.b.t. de eerste deelvraag niet gewoon een alpha van 0,05 aanhoudt. Van 0,1 heb ik nog nooit gehoord :p
  4. dedeut

    dedeut Well-Known Member

    Nou, ik wilde laten zien dat ondanks dat er geen significant resultaat is met een alpha van 0,05 er wel toch wel een significant resultaat is met een alpha van 0,1 (ik heb oorspronkelijk natuurlijk getoetst met 0,05). Een beetje in het kader: beter iets dan niets.
  5. nino

    nino Member

    Bedankt voor dit mooie onderzoek; ik verheug me op je activiteiten in de toekomst!
  6. Passion-for-Skating

    Passion-for-Skating Well-Known Member

    owh bedankt! dus ondanks dat het wiskundig niet significant is, hoop ik dan maar dat Morrison in de binnenbocht rijdt op de OS!

    nu de 1000 meters nog ;-)
  7. SkateMind

    SkateMind New Member

    Het verschil tussen de "tijdenanalyse" en de "plaatsingsanalyse" (1500, 3 wissels) zou wel eens met het uit de wind rijden op de kruising te maken kunnen hebben. Iemand wint een wedstrijd omdat hij uit de wind heeft kunnen rijden, maar gemiddeld over meerdere tijden wordt dat effect dan kleiner..... Zeker op de 500m (maar 1 wissel) moet je hier eigenlijk rekening mee houden.

    Het gaat waarschijnlijk niet alleen om het voordeel van binnen/buitenbocht, maar misschien wel meer om de kans om achter iemand aan te kunnen rijden.
  8. arsimo

    arsimo Active Member

    Mooi werk deneut! Jammer dat niet het parenvergelijk er bij kon, maar kan me dat wel voorstellen. Succes met toekomstige onderzoeken!
  9. dedeut

    dedeut Well-Known Member

    ik heb de 500 en 1000 niet gedaan omdat die al door de universiteit Groningen onderzocht zijn (zie mijn berichten op de vorige pagina's).
  10. Mike

    Mike Member

    Hallo allemaal,

    Ik volg dit forum al een tijdje, de laatste weken zelfs dagelijks, maar heb nog bijna nooit de moeite genomen een berichtje te posten.
    Dit topic is echter zo interessant dat ik ook wat wil bijdragen...

    Ik heb bij mijn werk vaak te maken met statistische discussies en statistische testen zoals deze. Toen ik de resultaten van dit interessante onderzoekje las, kreeg ik toch een paar ideeen.

    Eerst een paar opmerkingen (niet zo interessant voor degenen die niet statistisch geinteresseerd zijn):
    Een "significant" verschil is nog niet hetzelfde als een "bewijs". Je getallen in je database zeggen dat de laatste binnenbocht bij laaglandbanen sneller is dan de buitenbocht. Bij jouw alfa level van 0,10, betekent dit dat de kans 90% is dat dit in werkelijkheid ook echt zo is. Echter, de kans is ook nog steeds 10% dat het in werkelijkheid toch niet waar is, en dat de getallen puur op toeval berusten. Je hebt dus 90% bewijs geleverd, en geen 100% bewijs (100% bewijs bestaat bijna niet in de statistiek, maar 90% bewijs is weer wat zwakjes om echt een "bewijs" te noemen..).

    Dan nog iets. Als je een alfa level gebruikt van 0.05, dan heb je voor iedere keer dat je zo'n verschil uitrekent ook weer 5% kans om puur per toeval een significant verschil te vinden. Als je 13 schaatsers test, dan heb je al 13 maal die 5% kans dat je bij een van je schaatsers een significant verschil vindt. Het was dus al bijna te verwachten dat er wel 1 of 2 spelers een significant verschil moesten hebben. Als de alfa waarden van Fabris en Wennemars maar net onder de 0.05 lagen, dan heb je een grote kans dat dit toeval geweest was (toeval = Wennemars was misschien net wat beter in vorm op de dagen dat hij de binnenbocht geloot kreeg, of Fabris had een paar keer een van zijn offdays toen hij de binnenbocht geloot kreeg).

    Dan een suggestie om je analyse sterker te maken, en meer kans te krijgen op een significant verschil:

    Voor zover ik kan zien heb je alleen maar de pure eindtijden ingevoerd, en dan een t-test toegepast op die eindtijden. Nadeel hiervan is echter dat de tijden erg verschillend kunnen zijn per baan, en dat je daarom grote tijdsverschillen krijgt (het gemiddelde van de binnenbochtgroep was misschien 1.51.46, maar de spreiding van die tijden lag misschien wel tussen 1.41.00 en 2.01.00 of zoiets). Doordat je grote aantallen tijden hebt gebruikt, middelen deze verschillen zich misschien nog wel wat uit, maar het blijft toch lastig om tussen zulke grote verschillen nog een verschil van enkele honderdsten te kunnen aantonen.
    Het kan het volgens mij beter, door deze methode te gebruiken:
    - bereken voor iedere gereden wedstrijd de gemiddeld gereden tijd van die wedstrijd
    - bereken voor iedere gereden individuele tijd in je database, hoeveel seconden sneller of langzamer die tijd was dan het gemiddelde van die wedstrijd (de "verschiltijd")
    - maak een extra kolom in je database waarin je al die "verschiltijden" neerzet (dit kan automatisch met de meeste database programma's)
    - pas vervolgens je t-testen toe op die verschiltijden.

    De verschiltijden zullen een kleinere spreiding hebben dan de pure eindtijden. Of je nu naar het snelle SLC kijkt, naar indoor heerenveen onder goede omstandigheden, of naar een trage buitenbaan: de verschiltijden zullen steeds een spreiding hebben van rond de -5 seconden tot +5 seconden tussen winnaar en verliezer. En nog beter: als je de gemiddelde verschiltijd berekent voor de hele groep binnen en buitenbocht in zo'n toernooi, dan krijg je waarschijnlijk steeds twee getallen die heel dicht bij de 0 liggen (bijvoorbeeld -0,04 seconden binnenbocht en +0,05 seconden buitenbocht). Je kunt die getallen van alle toernooien bij elkaar optellen zonder dat je nog last hebt van de verschillen in baanomstandigheden. En vervolgens kun je kijken wat er dan uit je t-toets komt.

    Je kunt als je wilt ook nog een overzicht maken hoe die verschiltijden zijn per wedstrijd. Echter dan moet je weer voorzichtig zijn dat je niet te veel testen doet, en dat je niet per toeval significanties gaat vinden die niet reeel zijn.
    Je kunt ook nog je berekening over Fabris, Wennemars, etc opnieuw doen, maar dan gebaseerd op de verschiltijden.

    Het is misschien niet zo heel interessant meer nu de hoofdconclusie al duidelijk lijkt. Echter, als je met deze methoden nog een verschil aantoont, zullen je alfa waardes denk ik een stuk lager en dus overtuigender zijn. Als er met deze methode niks meer uitkomt, dan heb je mooi aangetoond dat het allemaal niks uitmaakt op de 1500 meter.


    PS: ik zie net dat ik er 4 jaar over gedaan heb, om na mijn 1e bericht op dit forum een 2e bericht te posten. Dus ik spreek jullie weer in februari 2014! :lol:
  11. Mike

    Mike Member

    Hmm, ik zie nog 1 kwetsbaar puntje in deze analyse:
    Je hebt alleen de top 15 tijden ingevoerd per toernooi. Echter als de binnenbocht sneller is dan de buitenbocht, dan zullen er meer binnenbochtrijders in de top15 eindigen en worden er een baar buitenbochtrijders uit de top15 verdrongen. Bijvoorbeeld 6 buitenbochtrijders en 9 binnenbochtrijders in de top15. Dan wordt in jouw analyse dus een vergelijking gemaakt van de top-6-buitenbochtrijders versus top-9-binnenbochtrijders. Dan zijn de binnenbochtrijders dus in het nadeel omdat ze 3 zwakkere rijders in hun groep hebben!
    Je zou eigenlijk de tijden van alle schaatsers in een toernooi mee moeten laten tellen. Of je kan overwegen de top 10 binnenbocht en de top 10 buitenbocht te selecteren per toernooi.
    Maar ja, je kan natuurlijk niet aan het invoeren blijven... Ik ben wel benieuwd of je je bestaande analyse nog kan doen, maar dan gebaseerd op verschiltijden.
  12. dedeut

    dedeut Well-Known Member

    Even kort mijn reactie:
    - Ik ben bekend met hoe je significantie moet interpreteren. Ik heb zelfs les gegeven in statistiek. Ik geef echter toe, nu ik het teruglees, dat ik niet heel duidelijk heb opgeschreven. Dank voor de duidelijke uitleg in ieder geval.
    - Fabris en Wennemars waren zelfs bijna significant bij een alpha van 0.01, dus de kans is denk ik best groot dat de significantie geen toeval is.
    - Je voorstel om het onderzoek te verbeteren vind ik zeer sterk (en ik zal het gebruiken bij mijn onderzoek naar vrouwen op de 1500 als ik dat nog ga doen en het zit net op het randje). Zoals je zegt is het bij de mannen echter dusdanig onsignificant dat verder onderzoek niet heel interessant is.
    - ik schreef inderdaad eerst dat ik top 15 tijden zou gebruiken, ik heb echter toch alle tijden genomen..
  13. Mike

    Mike Member

    Ja, dan is de kans inderdaad wel groot. En het klopt ook mooi met het gevoel dat we bij deze schaatsers hebben.

    Is het heel moeilijk om nog te doen bij mannen denk je? Het berekenen van die 2568 verschiltijden kan in sommige programma's met 1 commando. Maar ja, het berekenen van de gemiddelde tijd in die meer dan 100 toernooien kost misschien wat meer tijd..

    Ah, dat is mooi! Dan is dat inderdaad geen probleem meer.
  14. SprintMaster

    SprintMaster aangepast Medewerker

    Als je een fatsoenlijke database gebruikt en je tabellen slim hebt gekozen kun je het er met SQL zo uithalen. :mrgreen:
  15. Nogevendit

    Nogevendit Well-Known Member

    Ik was toch niet zo tevreden met mijn eerste reactie op dit overigens interessante onderzoek.
    Waar ik meteen aan moest denken, is hierboven door Skatemind goed opgeschreven.

    Onderzoek: is de start in de binnenbaan of de buitenbaan sneller ?
    resultaat: een klein verschil, ik ben er zeker van dat bij meer gegevens dit ook wel significant zal worden,
    maar de vraag is vervolgens waar dat aan ligt.
    Vooral op de 1500, en tegenwoordig op de 500, komt dat door profiteren van de tegenstander.
    Als er al een verschil is in buiten of binnen starten, dan is dit m.i. niet zo heel groot.
    Het profiteren van de tegenstander, die net 0.5 sec achter ligt, is denk ik groter.
    Maar dit heeft weer zijn weerslag op de gevonden tijden binnen/buiten.

    Door nu alleen te kijken naar eindtijden, denk je het binnen.buiten effect te meten, maar kom je veel 'vervuiling' van profiteren van je tegenstander tegen.
    De gevonden waarden van Fabris en Wennemars: de laatste start(te) altijd hard, dan kun je dus beter buiten starten.
    Dan zit je twee keer achter je tegenstander.
    Fabris eindigt graag snel, begint traag. Dan start je liever binnen.

    De opmerking over econometristen was ook met name tegen de Groninger groep die wel meer met sportprestaties doet.
    o.a voorspellen ze ook iedere twee jaar de voetbalpoule op een groot toernooi, of het ideal elftal, of het ideale traptempo.
    (bij bijv fietsen). Omdat ze in al deze onderzoeken belangrijke variabelen niet meenemen, zijn hun conclusies consequent 'te kort door de bocht'. Mijns inziens dan, maar ik ben tot discussie bereid.
  16. dedeut

    dedeut Well-Known Member

    @ nogevendit: Tsja, misschien heb je gelijk maar mijn database bevat geen rondetijden en ze toevoegen zou ongeveer 3x zoveel tijd kosten als het aanleggen van de eerste database. Dus het zit er niet in helaas.

    Verder wilde ik onderzoeken of er een significant verschil bestond en niet waarom er een significant verschil zou kunnen bestaan. Als ik een significant verschil zou hebben gevonden dan had ik in vervolgonderzoek hypotheses kunnen testen over het waarom (en jouw hypothese zou er een van zijn)..

    @Mike: het kan inderdaad vrij gemakkelijk, ik zal het binnenkort eens doen..
  17. Zavo

    Zavo New Member

    Leuk leesvoer dit.

    Wat ik me afvraag is waar het eventuele voordeel precies in zit. Men zegt altijd "laatste binnenbocht geeft voordeel", maar misschien is het eerder het feit dat er een extra binnenbocht gereden wordt, omdat het aantal bochten oneven is. Misschien kan er in de binnenbocht meer snelheid gemaakt worden, zou mij niet verbazen. Om dit te onderzoeken zou je ook doorkomsttijden (200m, 600m, 300m, 700m, 1100m) moeten onderzoeken, maar dit lijkt me erg veel werk.
  18. Nogevendit

    Nogevendit Well-Known Member

    Van Ritsma kan ik me nog wel deze uitspraak herinneren:
    Buiten starten betekent dat je het snelste rondje binnen moet rijden. Vooral de grote zware mannen hebben hier moeite mee. Dus of ze zwaaien de bocht wat uit, of ze moeten teveel knijpen.
    Ik denk dat het verschil 'm met name hierin zit. Op de 1000 m dan.
    De 500 kent een vergelijkbaar verschil, maar tegenwoordig kan men de bocht wel houden (shorttracktraining, bending),
    en zie je wel meer de snelste 500 binnen eindigend, vanwege de 'tow' op het rechte eind.
    op 1500 m en verder ligt het met name aan de 'gunstige kruisingen'
    Ik kan me van met name de generatie Ben vd Burg/Veldkamp en de Hilbert-tijden nog herinneren dat het tactisch strijdplan, ten opzichte van de tegenstander, constant hierop gericht was.
  19. Tjark

    Tjark Active Member

    Voor mij persoonlijk vind ik het idd fijner om op de 1000 binnen te starten: je bent nog niet helemaal op snelheid als je die 1e bocht in gaat: dan rij ik liever een binnenbocht om die goed door te versnellen dan een ruime buitenbocht. Aan het einde ligt je snelheid weer wat lager (moe :) ) en heb je weer mindere snelheid en vind ik 't dus fijner om die binnenbocht door te komen dan die buitenbocht.

    Op de 1500m heb ik liever een buitenbochtstart: de (bijna) 100 meter rechtuit is voldoende om snelheid te maken voor die 1e buitenbocht en je hebt aan het einde nog de laatste binnenbocht als je moet bent.
  20. Nogevendit

    Nogevendit Well-Known Member

    Ik had vroeger ook altijd het idee dat bij gelijke sterkte de binnenstarter voor lag. Vooral op de 5k was dit het geval.
    (ik spreek van vroeger toen we nog met name allroundtoernooien keken). Dan zou je ook moeten nagaan hoe het precies zit met de exacte afstand: wordt die niet gemeten via 50 cm uit de bocht blijven ?
    Wel moet ik zeggen dat het verschil op de 1000 duidelijker is dan op de 1500.
    maar bij grote aantallen in de computer gooien zou je kunnen kijken naar alleen de openingstijden op de 1000 en 5000m.
    hoe verschillen deze ? Waar vind ik die tijden ?

Deel Deze Pagina