(Acest articol a fost publicat pentru prima dată pe R | Robin Lovelaceși cu amabilitate a contribuit la R-bloggeri). (Puteți raporta problema legată de conținutul acestei pagini aici)
Doriți să vă distribuiți conținutul pe R-bloggeri? dați clic aici dacă aveți un blog, sau aici dacă nu aveți.
Pachetul stats19 R a fost actualizat la versiunea 4.0.0. Principala modificare este o schemă de coloane unificată care vă permite să lucrați cu 45 de ani de date privind accidentele rutiere din Regatul Unit (1979 – 2024) fără a întâlni nume de coloane nepotrivite.
Schemă unificată
Fișierele de date mai vechi au coloane precum carriageway_hazards_historic în timp ce cele mai noi folosesc carriageway_hazards. v4.0.0 detectează aceste variante, le îmbină în denumirile moderne și elimină coloanele redundante.
library(stats19) crashes = get_stats19(year = 1979:2024, type = "crashes")
Remedieri de analiză
read_stats19() acum creează un parser personalizat din antetul CSV, care elimină avertismentele despre coloanele nepotrivite care au apărut în versiunile anterioare. De asemenea, am remediat o eroare în care valorile de latitudine și longitudine 2024 au fost trunchiate în numere întregi.
Valori lipsă
Coduri ca -1„Cod depreciat” și „Date lipsă sau în afara intervalului” sunt acum standardizate la NA în timpul formatării, deci is.na() functioneaza constant.
Performanţă
Pachetul folosește acum readr Edition 2 în mod implicit, care acceptă analizarea cu mai multe fire. Încărcarea fișierelor mari este vizibil mai rapidă.
Funcții noi
match_tag()se alătură estimărilor de costuri TAG guvernamentale (RAS4001) la datele de coliziuneclean_make(),clean_model()șiclean_make_model()standardizați cele peste 2.400 de șiruri brute din setul de date vehicul
Descărcări pe mai mulți ani
Intervalele de ani descarcă acum fișierele istorice în bloc o dată și filtrează eficient. Fișierul din 1979 este, de asemenea, gestionat corect (obișnuia să fie returnat ca un catch-all pentru orice an mai vechi).
Se dorește feedback
Intenționăm să ne trimitem la CRAN în curând. Instalați, testați și raportați orice problemă:
pak::pak("ropensci/stats19")
Probleme: github.com/ropensci/stats19/issues
Mulțumiri
Contribuții de la David Ranzolin și Adam Sparks (recenzia rOpenSci), Malcolm Morgan, Layik Hama și Blaise Kelly. Finanțare de la Fundația RAC.
Legături
