stats19 v4.0.0: 45 de ani de date privind accidentele rutiere din Marea Britanie, unificate

URMĂREȘTE-NE
16,065FaniÎmi place
1,142CititoriConectați-vă

(Acest articol a fost publicat pentru prima dată pe R | Robin Lovelaceși cu amabilitate a contribuit la R-bloggeri). (Puteți raporta problema legată de conținutul acestei pagini aici)


Doriți să vă distribuiți conținutul pe R-bloggeri? dați clic aici dacă aveți un blog, sau aici dacă nu aveți.

Pachetul stats19 R a fost actualizat la versiunea 4.0.0. Principala modificare este o schemă de coloane unificată care vă permite să lucrați cu 45 de ani de date privind accidentele rutiere din Regatul Unit (1979 – 2024) fără a întâlni nume de coloane nepotrivite.

Schemă unificată

Fișierele de date mai vechi au coloane precum carriageway_hazards_historic în timp ce cele mai noi folosesc carriageway_hazards. v4.0.0 detectează aceste variante, le îmbină în denumirile moderne și elimină coloanele redundante.

library(stats19)
crashes = get_stats19(year = 1979:2024, type = "crashes")

Remedieri de analiză

read_stats19() acum creează un parser personalizat din antetul CSV, care elimină avertismentele despre coloanele nepotrivite care au apărut în versiunile anterioare. De asemenea, am remediat o eroare în care valorile de latitudine și longitudine 2024 au fost trunchiate în numere întregi.

Valori lipsă

Coduri ca -1„Cod depreciat” și „Date lipsă sau în afara intervalului” sunt acum standardizate la NA în timpul formatării, deci is.na() functioneaza constant.

Performanţă

Pachetul folosește acum readr Edition 2 în mod implicit, care acceptă analizarea cu mai multe fire. Încărcarea fișierelor mari este vizibil mai rapidă.

Funcții noi

  • match_tag() se alătură estimărilor de costuri TAG guvernamentale (RAS4001) la datele de coliziune
  • clean_make(), clean_model()și clean_make_model() standardizați cele peste 2.400 de șiruri brute din setul de date vehicul

Descărcări pe mai mulți ani

Intervalele de ani descarcă acum fișierele istorice în bloc o dată și filtrează eficient. Fișierul din 1979 este, de asemenea, gestionat corect (obișnuia să fie returnat ca un catch-all pentru orice an mai vechi).

Se dorește feedback

Intenționăm să ne trimitem la CRAN în curând. Instalați, testați și raportați orice problemă:

pak::pak("ropensci/stats19")

Probleme: github.com/ropensci/stats19/issues

Mulțumiri

Contribuții de la David Ranzolin și Adam Sparks (recenzia rOpenSci), Malcolm Morgan, Layik Hama și Blaise Kelly. Finanțare de la Fundația RAC.

Dominic Botezariu
Dominic Botezariuhttps://www.noobz.ro/
Creator de site și redactor-șef.

Cele mai noi știri

Pe același subiect

LĂSAȚI UN MESAJ

Vă rugăm să introduceți comentariul dvs.!
Introduceți aici numele dvs.