CDCPLACES 1.2.0 | R-bloggeri

URMĂREȘTE-NE
16,065FaniÎmi place
1,142CititoriConectați-vă

(Acest articol a fost publicat pentru prima dată pe bsși cu amabilitate a contribuit la R-bloggeri). (Puteți raporta problema legată de conținutul acestei pagini aici)


Doriți să vă distribuiți conținutul pe R-bloggeri? dați clic aici dacă aveți un blog, sau aici dacă nu aveți.

Sunt bucuros să anunț lansarea CDCPLACES 1.2.0. Acest pachet vă permite să interogați API-ul CDC pentru analiză la nivel de populație și estimări ale comunității (PLACES) direct de la R, returnând estimări ale măsurilor de sănătate pentru județe, secții de recensământ, ZCTA și, nou în această versiune, locuri (orașe, orașe și locuri desemnate de recensământ).

Îl puteți instala din CRAN cu:

install.packages("CDCPLACES")
devtools::install_github("brendensm/CDCPLACES")

Această postare trece prin cele mai importante momente. Jurnalul complet al modificărilor se află în fișierul NEWS.

Geografia locului

Cel mai mare plus în 1.2.0 este suportul pentru la nivel de loc date. PLACES a publicat întotdeauna estimări pentru locurile încorporate și locurile desemnate de recensământ, dar pachetul a acceptat numai interogări de județ, tract și ZCTA. Acum puteți extrage date la nivel de loc pentru toți anii de lansare (2020–2025):

get_places(geography = "place", state = "MI", measure = "SLEEP")

Geografia locului sprijină și geometry şi age_adjust argumente, astfel încât să puteți mapa estimările la nivel de oraș la fel de ușor ca și județele:

get_places(geography = "place", state = "MI", measure = "SLEEP", geometry = TRUE)

Date de lansare din 2025

Pachetul este acum implicit la Anul lansării 2025care este cel mai recent disponibil de la CDC. Toate cele patru zone geografice — județ, tract, ZCTA și loc — sunt acceptate pentru 2025.

# 2025 is now the default
get_places(geography = "county", state = "OH", measure = "ACCESS2")

Puteți încă să interogați orice an anterior până în 2020, setând release argument.

Interogări API mai inteligente

Sub capotă, modul în care sunt construite interogările a fost rescris. Pachetul acum construiește SQL IN operatori în loc de înlănţuire LIKE/OR clauze, care produce cereri API mai scurte și mai eficiente.

Mai important, Interogările ZCTA sunt acum grupate automat. Unele state au mii de ZCTA (numai Texasul are aproximativ 2.000), iar abordarea anterioară ar putea depăși limita de lungime URL a Socratei și ar putea eșua în tăcere. Pachetul detectează acum când o interogare ar fi prea lungă și o împarte în mai multe cereri mai mici în culise.

Schimbări de rupere

Câteva lucruri de care trebuie să fiți atenți când faceți upgrade:

  • geography = "census" a fost eliminat. Utilizare "tract" în schimb. Valoarea veche produce acum un mesaj de eroare clar care vă indică remedierea.
  • Anul de lansare implicit este acum "2025". Dacă codul dvs. s-a bazat pe valoarea implicită anterioară, treceți release în mod explicit pentru a obține aceleași rezultate.
  • Versiunea R minimă este 4.1.0necesar pentru conducta de bază (|>).

Îmbunătățiri ale fiabilității

Această versiune remediază o serie de erori marginale care ar putea cauza erori confuze sau rezultate greșite în tăcere:

  • geometry = TRUE folosește acum recensământul corect. LOCAȚII a schimbat geografiile recensământului din 2010 în 2020 începând cu lansarea din 2024, astfel încât GEOID-urile tractului și ZCTA ar putea să nu se alăture în tăcere. Pachetul alege acum fișierele de formă potrivite pe baza release an.
  • Filtrarea județelor nu mai face distincție între majuscule și minuscule. Anterior, county = "ST. LOUIS" nu s-ar potrivi cu titlul API-ului "St. Louis".
  • Funcțiile care indică suprapunerea județelor nu se mai blochează în sesiunile non-interactive (Shiny, knitr, CI). Acum includ implicit toate potrivirile cu un mesaj.
  • Erorile la nivel de conexiune (eșecuri DNS, timeouts) nu se mai blochează cu un opac $ operator is invalid for atomic vectors eroare.

Descoperirea setului de date este acum automatizată

Tabelul intern al punctelor finale API era întreținut manual. În 1.2.0, data-raw/DATASET.R interogează API-ul Socrata Discovery pentru a găsi în mod programatic fiecare set de date PLACES, ceea ce face simplă adăugarea de noi ani de lansare pe măsură ce CDC îi publică.

Alte note

Dicționarul de date de bază pentru întreaga gamă de măsuri și variabile de date PLACES disponibile nu a fost încă actualizat de echipa PLACES. Aceasta înseamnă că nu există informații suplimentare incluse pentru ediția 2025 în acest cadru de date (acesta este cadrul de date interogat la rulare get_dictionary).

Datele la nivel ZCTA pentru lansarea din 2024 a PLACES sunt momentan indisponibile. Acesta nu este postat ca set de date publice (chiar dacă este prezent pentru alți ani de lansare). Cred că acest lucru se poate datora unei greșeli în timpul lansării din 2025.

Pentru ambele probleme, am contactat PLACES pentru a vedea dacă se vor face actualizări. Voi actualiza pachetul și această postare pe blog în consecință.

Mulțumiri

Am vrut să recunosc că multe dintre aceste actualizări au fost posibile de Claude Code. Aș dori să-i mulțumesc lui Garrick Aden-Buie de la Posit pentru împărtășirea acestor abilități Claude, care au ajutat enorm la testarea și revizuirea acestei actualizări de pachet.

Dominic Botezariu
Dominic Botezariuhttps://www.noobz.ro/
Creator de site și redactor-șef.

Cele mai noi știri

Pe același subiect

LĂSAȚI UN MESAJ

Vă rugăm să introduceți comentariul dvs.!
Introduceți aici numele dvs.