(Acest articol a fost publicat pentru prima dată pe R – DataWookieși a contribuit cu drag la R-Bloggers). (Puteți raporta problema despre conținutul de pe această pagină aici)
Doriți să vă împărtășiți conținutul pe R-Bloggers? Faceți clic aici dacă aveți un blog sau aici dacă nu.
Distanțele curselor de caiac Hasler pentru diverse divizii sunt nominal 4, 8 și 12 mile. Cu toate acestea, distanțele reale variază la o anumită măsură de la un loc de curse la altul. Acest lucru face dificilă compararea timpilor de curse pe diferite curse. Folosind date de la Paddle UK încerc să estimez distanțele reale.
Fundal
În cursele Hasler, paddler -urile sunt grupate în funcție de diviziune. Diviziunile variază de la 9 (cel mai mic) la 1 (cel mai mare) și reflectă capacitatea paddler (K1) sau paddlers (K2). Distanța cursei depinde de divizie:
- 4 mile (diviziuni 7, 8 și 9)
- 8 mile (diviziuni 4, 5 și 6) și
- 12 mile (diviziuni 1, 2 și 3).
Acestea sunt nominal distanțe. În practică, distanțele pot fi ceva mai lungi sau mai scurte de la un loc la altul.
În plus față de paddling mai departe, paddler -urile din diviziuni superioare trebuie, de asemenea, să se confrunte cu una (diviziuni 4, 5 și 6) sau două (diviziuni 1, 2 și 3) portaje.
Datele
Datele utilizate în acest post au fost răzuite din Paddle UK. Datele răzuite sunt disponibile aici. Întâmplător, aceste date au fost menționate în datele sunt buletin informativ plural la 30 aprilie 2025.
Wrangling
Am importat versiunea JSON a datelor și apoi am făcut următoarele:
- Selecționate doar rezultatele pentru cursele Hasler;
- a transformat timpul cursei în zecimale;
- adăugat a
type
Câmp (K1 sau K2) pe baza categoriei de curse; şi - Fuzionat într -o coloană pentru distanța de cursă.
Iată un eșantion aleatoriu de 10 rânduri din datele rezultate.
race type division time distance 1 Pangbourne K1 7 0.6197222 4 2 Cambridge K2 9 0.6466667 4 3 Bishop's Stortford K1 6 1.3344444 8 4 Wey K1 6 1.3500000 8 5 Banbury K2 7 0.6836111 4 6 Chelmer K2 7 0.6677778 4 7 Maidstone K1 7 0.8783333 4 8 Leighton Buzzard K2 7 0.7105556 4 9 Pangbourne K1 6 1.4230556 8 10 Pangbourne K1 5 1.3394444 8
Prima înregistrare, de exemplu, reflectă un timp de finalizare de aproximativ 0,6 ore (aproape 37 de minute pentru a fi mai precis) pentru un K1 care concurează în divizia 7 la Pangbourne Hasler. Distanța nominală peste care a alergat acest paddler a fost de 4 mile.
Distanțe corectate
Pentru a estima corecția distanței, am făcut următoarele:
- Calculați timpul mediu de cursă pe cursă și distanță nominală. Acest pas agregat rezultă din mai mulți ani. De exemplu, timpurile pentru Pangbourne Hasler în 2022, 2023 și 2024 au fost incluse în aceeași medie. Acest lucru a presupus că cursul de curse de la Pangbourne a rămas același în acei trei ani și că alți factori (cum ar fi vremea sau debitul din zi) nu au avut un impact substanțial asupra timpului cursei. Mă voi referi la această medie ca la Timp de cursă.
- Calculați timpul mediu de cursă pe distanță. Acest lucru este similar cu pasul anterior, dar ignoră rasele individuale, presupunând efectiv că distanțele sunt consistente între locuri. Mă voi referi la această medie ca la Timp global.
- Calculați factorii de corecție ca raporturi ale timpului de curse la perioadele globale.
Factorii de corecție au fost apoi folosiți pentru a genera distanțe corectate pentru fiecare dintre rase prin scalarea distanțelor nominale. Graficul de mai jos arată distanțele corectate (de -a lungul axei verticale) defalcate de cursă (de -a lungul axei orizontale) și distanța nominală (cele trei panouri).
Viteze necorectate
Motivul principal pentru estimarea distanțelor corectate a fost că viteza calculată folosind timpii de curse și distanțele nominale nu păreau realiste. Distribuția vitezei reprezentate mai jos ar trebui să contribuie la ilustrarea problemei. Am fost obligat să mă transform de la kilometri la km pentru a calcula viteza în unități sensibile (metrice!).
Vitezele cresc de la Divizia 9 la Divizia 1, așa cum era de așteptat. Iar pentru orice divizie dată, viteza K2 sunt în general mai mari decât viteza K1 corespunzătoare (de asemenea, așa cum era de așteptat!). Cu toate acestea, dispersia vitezei este mult mai mare decât se preconiza. M -aș fi gândit că în orice divizie va exista o grupare mult mai restrânsă a vitezei. Creșterea dispersiei se datorează diferitelor distanțe între locuri.
Viteze corectate
Dar, deoarece am calculat distanțele corectate, putem calcula și viteza corectată.
Acum viteza este mai strâns grupată. Acest lucru este în concordanță cu așteptările mele intestinale pentru viteza din fiecare divizie.
Este important să rețineți că viteza a fost utilizată implicit în calcularea distanțelor corectate. Cu toate acestea, având în vedere că a existat o medie agresivă în calculul acestor distanțe, nu sunt prea preocupat de prejudecăți. Poate că subestimez impactul potențial? În ciuda acestei îngrijorări, cred că acestea sunt rezultate interesante.