Citiți -l în: Español.
A face parte din programul Ropensci Champions a fost o experiență Creșterea profesională și o oportunitate de a contribui la comunitatea Ropensci. Am aflat despre dezvoltarea pachetelor R în timp ce lucram la un instrument pentru a facilita accesul la datele de recensământ din Argentina.
În acest blog, vreau să împărtășesc cum această experiență Am deschis noi oportunități, m -a conectat cu oameni și comunități și m -a determinat să fac parte din proiecte noi, consolidându -mi angajamentul de a deschide accesul la date.
Proiectul meu în program
De la început, obiectivul meu a fost să dezvolt un pachet în R care să permită accesul structurat la datele recensământului din Argentina. Ideea a apărut din nevoia de a avea informații istorice organizate și gata de a fi utilizate în proiecte de analiză și cercetare statistică. Munca mea ca analist de statistică a populației m -a determinat să identific importanța de a avea un instrument care să faciliteze procesarea acestor date. În recensământul istoric, aceste date sunt împrăștiate în diferite formate (cărți, PDF, foi de calcul și redatam), ceea ce face dificilă accesul și utilizarea.

Colaj cu copertele recensământului național din Argentina din 1970 până în 2022.
În timpul programului, am lucrat la organizarea și standardizarea datelor, confruntat cu provocări precum structurarea informațiilor (date ordonate) și crearea de funcții eficiente pentru manipularea acesteia. Unul dintre cele mai îmbogățitoare aspecte ale programului au fost sesiunile de instruire oferite de Ropensci (mulțumiri speciale Maëlle și Yani pentru toată răbdarea și învățarea) și discuția continuă a proiectelor cu ceilalți campioni din program.
Așteptare vs. realitate Ilustrație de Allison Horst
Pe măsură ce am progresat în dezvoltarea pachetului, m -am confruntat cu o provocare cheie: structura datelor. Pe măsură ce am încorporat informații din diferiți ani de recensământ, mi -am dat seama că fiecare recensământ a adus cu acesta mii de fișiere Excel în formate diferite, ceea ce face dificilă automatizarea și făcând transformarea una câte una, ceea ce a făcut ca sarcina de standardizare să fie și mai complexă. Atunci am decis să invităm Emanuel Ciardullo Pentru a se alătura proiectului. Am format un duo din punctele noastre de vedere complementare – eu din sociologie, el de la statistici – pentru a face față acestei prime faze a pachetului. Această alianță a fost esențială pentru regândirea abordării și împărtășirea lucrărilor tehnice și conceptuale.
Intenția mea a fost să acopăr toți anii de recensământ din pachet, dar de -a lungul timpului mi -am dat seama că va dura mai mult timp decât estimasem. Nu a fost doar o chestiune de organizare a datelor, ci și de a proiecta o structură care să permită integrarea informațiilor într -un mod scalabil și reutilizabil în viitor.
Cu un volum de muncă deja efectuat și o strategie mai clară, am reordonat conturul proiectului, am definit o foaie de parcurs pentru diferitele faze ale disponibilității datelor și apoi am putut să ne concentrăm pe finalizarea datelor pe care le -am structurat deja. În cele din urmă, am creat documentația și am dezvoltat primele funcții: get_census()
, check_repository()
şi arcenso()
.
Arcenso Hex de la
arcenso
Pachet, creat ca parte a programului Ropensci Champions.
În mijlocul acestor reflecții și provocări tehnice, s -a născut Arcenso. Acest proiect, cu pachetul Arcenso, nu numai că încearcă să faciliteze accesul la datele recensământului, dar și să promoveze utilizarea acestuia între cercetători, sectorul public și cetățeni, în general, prin intermediul unor instrumente software gratuite. Posibilitatea de a contribui cu un instrument util, deschis și orientat către comunitate a fost unul dintre cele mai importante motivații ale acestui proces.
Proiectul este în prima sa etapă: puteți instala deja pachetul folosind remotes
și explorați primii ani de recensământ disponibili, 1970 și 1980. Scopul este de a continua dezvoltarea, astfel încât Arcenso să devină mai robust, să sufere Ropensci Peer Review și, în cele din urmă, să devină disponibil pe CRAN. Programul Campionilor a fost punctul de plecare, dar dezvoltarea pachetului continuă, deoarece potențialul de a facilita accesul la datele cheie într -un mod deschis și reutilizabil este enorm.
Comunitatea
O bursă, o conferință și o comunitate globală
Am avut ocazia să primesc bursa pentru a participa la Posit :: Conf, una dintre cele mai importante conferințe internaționale din ecosistemul R. A fost o experiență transformatoare: am învățat multe, am întâlnit oameni pe care i -am admirat și am experimentat de prima dată ce înseamnă să fac parte dintr -o comunitate globală care se angajează să gratuit software, acces deschis și dezvoltare colaborativă. În plus, a fost foarte special să ne întâlnim în persoană cu o parte din echipa Ropensci și alte persoane care fac parte din această comunitate. Schimbul m -a ajutat să regândesc aspectele cheie ale lui Arcenso, de la structura sa până la potențialul său de a atrage colaborarea deschisă. Am venit cu idei noi, inspirație și o rețea de oameni cu care să continui să cresc.


Momente cheie ale turului: întâlnirea cu comunitatea Ropensci la POSIT :: Conf și Arcenso Prezentare la Latinr.
Latinr
În noiembrie 2024, am prezentat Arcenso la Latinr, Conferința latino -americană privind utilizarea R în cercetare și dezvoltare. Împreună cu Emanuel, am împărtășit munca depusă în timpul programului și modul în care am lucrat împreună pentru a construi această primă fază a proiectului. A fost un moment foarte special pentru a arăta comunității regionale ce am obținut și pentru a primi feedback -ul și sprijinul lor în timpul grupului pentru procesul de dezvoltare a pachetelor.
R în rețea
Și pentru a închide acest mare 2024, de la organizația „R în Buenos Aires”, împreună cu R-Ladies Buenos Aires, am oferit o prezentare locală a pachetului. Ca parte a echipei de organizare a R în Buenos Aires, am coordonat această activitate cu scopul de a împărtăși proiectul cu comunitatea, arătând ceea ce construiam și invităm mai mulți oameni să -l cunoască. Această instanță a fost foarte bună, deoarece nu numai că am primit feedback valoros din partea comunității, dar am putut, de asemenea, să mă conectez cu alte persoane care s -au confruntat cu probleme similare. De asemenea, am profitat de ocazie pentru a răspândi cuvântul despre programul Campionilor Ropensci, în speranța că mai multe persoane din regiunea noastră vor fi încurajați să solicite următoarea cohortă.


Prezentare în capitolele locale ale R-Ladies și R în Buenos Aires din pachetul Arcenso: comunitate, funcții și în spatele scenei lucrării din Dupla.
Prezentarea proiectului și discutarea acestuia cu comunitatea mi-a permis să reafirm importanța creării de instrumente accesibile și bine documentate. De asemenea, a fost un memento că nu am fost singuri în acest proces: comunitatea R este un spațiu în care cunoștințele sunt construite colectiv și participarea activ la acesta a fost fundamentală pentru a merge mai departe cu pachetul.
Ce rămâne după impuls
Participarea la programul Ropensci Champions a fost punctul de plecare pentru a crea ceva ce nu știam că pot construi. M -a încurajat să trec de la utilizarea R la dezvoltarea unui pachet în R și de la haosul datelor la proiectarea unui instrument destinat ca alți oameni să lucreze mai bine. Dar, mai presus de toate, m -a conectat cu o comunitate care crede în a împărtăși ceea ce știe, în a se însoți reciproc în proces și în deschiderea căilor pentru cei care vin după. Astăzi, Arcenso continuă să crească, la fel și eu: cu idei noi, noi provocări și dorința de a continua construirea în comunitate și pentru comunitate.