Cum să evaluați utilizarea pachetului dvs

URMĂREȘTE-NE
16,065FaniÎmi place
1,142CititoriConectați-vă

În calitate de întreținător de pachete, s-ar putea să doriți să obțineți câteva cifre sau impresii despre utilizarea pachetului dvs. din diverse motive: obținerea unei confirmări că munca dvs. este utilă, prioritizarea dezvoltării pe anumite caracteristici ale software-ului dvs., ajutând la justificarea unei cereri de finanțare. Nu-ți pune speranțele prea mari: nu există nici o soluție perfectă, nici o măsură. Cu toate acestea, vom împărtăși câteva surse de informații utile în această postare – multe dintre ele deja folosite și afișate de R-Universe!

Descărcări

Puteți obține date de descărcare pentru pachetul dvs. pe CRAN sau Bioconductor, pe care le puteți vedea aproximativ ca „număr de instalări”. Chiar și cu unele eforturi de corectare, aceste date sunt pline, deoarece includ, de exemplu, descărcări pentru verificări privind integrarea continuă.

Dependențe inverse

Dacă pachetul dvs. nu este o interfață de nivel înalt, poate că alte pachete îl importă. Dacă multe pachete depind de pachetul dvs., atunci pachetul dvs. este în mod clar crucial.

De exemplu, iată o modalitate de a număra direct și indirect greu dependențe (Imports) din pachetul curl pe CRAN.

Putem număra numărul de dependențe directe (nerecursive) cu pkgcache::meta_cache_revdeps() şi recursive = FALSE.

(direct <- length(
 unique(
 pkgcache::meta_cache_revdeps(
 "curl",
 recursive = FALSE,
 dependencies = "imports"
 )$package
 )
))
#> (1) 436

Putem calcula apoi numărul total de dependențe utilizând recursive = TRUE.

(total <- length(
 unique(
 pkgcache::meta_cache_revdeps(
 "curl",
 recursive = TRUE,
 dependencies = "imports"
 )$package
 )
))
#> (1) 5277

Și numărul de dependențe indirecte prin scăderea celor două.

(indirect <- total - direct)
#> (1) 4841

Paginile R-universe pentru pachete individuale, cum ar fi curl, includ o insignă cu numărul de dependențe indirecte hard și soft (Imports şi Suggests).

Mențiuni de cod

Citate

Dacă pachetul dvs. este utilizat într-o lucrare științifică ai cărei autori citează pachete, este posibil să puteți recupera utilizarea prin căutare bibliometrică.

Pentru citările unui pachet înainte de 2022, puteți explora baza de date a citărilor rOpenSci.

R-universe afișează câteva date despre citări, din setul de date din lucrările experimentale ale ecosistem.s. Vedeți din nou pagina lui Curl, cu o insignă care trimite la ecosyste.ms.

Acestea sunt din nou informații parțiale, care ar putea totuși să ajute la sublinierea utilității software-ului dumneavoastră pentru eforturile științifice.

Măsuri de popularitate: aprecieri

Sondajele

Dacă aveți o idee bună despre care este baza potențială de utilizatori a pachetului dvs. sau o modalitate de a ajunge la o proporție bună de utilizatori actuali, poate ați putea rula un sondaj pentru a întreba despre pachetele și funcțiile cele mai utilizate și despre caracteristicile ratate cel mai mult?

Cineva a menționat această idee la conferința uRos (Utilizarea lui R în statisticile oficiale) 2025 în discursul său. Pentru mine, ca un străin al acelei comunități, mi s-a părut o idee perfectă: Institutele Naționale de Statistică au cazuri de utilizare similare pentru software și… știu să desfășoare sondaje!

Contribuții la depozit

Sau, metrica pe care am putea-o numi logodnă în limbajul influencerilor. 😇

Dacă vă dezvoltați pachetul în mod deschis, utilizatorii ar putea contribui la el. Simpla deschidere a unei probleme de către o persoană externă înseamnă că a găsit și a folosit pachetul dvs.! În plus, utilizatorii înșiși îți pot spune ce nu funcționează, ce lipsește, ce le place la pachetul tău… și bineînțeles să te ajute să menții pachetul. Cu atât mai multe motive pentru a promova o comunitate în jurul pachetului tău.

Pe baza aceleiași idei, dacă vă întrebați dacă o funcție este utilizată, puteți încerca să o eliminați sau să începeți să o eliminați folosind deprecierea adecvată și vedeți dacă cineva se plânge. La fel, și mai dramatic, s-ar putea să auziți de la utilizatori dacă pachetul dvs. este arhivat în CRAN, de exemplu. 😅

La nivel de organizație, puteți folosi noul nostru tablou de bord experimental pentru a obține o vedere generală a activității depozitului.

Rapoarte de cazuri de utilizare

La rOpenSci colectăm cazuri de utilizare ale pachetelor. Ai putea avea un bilet dedicat primirii de marturii utilizatori, ca in depozitul quanteda. Documentația pachetului dvs. ar putea indica locul în care doriți să aflați de la utilizatori, fie pentru a vă ajuta să planificați evoluțiile viitoare, fie pentru a vă menține motivația!

Beneficiul este adunarea de exemple de utilizare autentică și, de asemenea, obținerea unui impuls motivațional din știi că cineva vă folosește instrumentul.

Telemetrie

De fapt, măsurarea utilizării la sursă este foarte rară în pachetele R, dar ceva pe care, de exemplu, întreținerii duckplyr au încercat să îl implementeze, pentru a informa prioritățile de dezvoltare. Acest comportament poate fi controlat și dezactivat de către utilizatori. Informarea utilizatorilor cu privire la telemetrie este crucială.

Ne putem întreba, de asemenea, despre datele colectate de Copilot și prieteni, la care tu, în calitate de întreținător de pachete, nu ai acces la: cele mai frecvente întrebări despre pachetul tău, codul revizuit sau sugerat de LLM-uri etc. Ne putem întreba dacă astfel de date ar putea fi utile pentru întreținerii de software?

Concluzie

În această postare, am oferit o privire de ansamblu rapidă asupra unor mijloace de evaluare a utilizării pachetului dvs., inclusiv multe valori deja prezentate pe paginile pachetelor R-universe. Din păcate, nu există niciun glonț de argint, dar cu siguranță mai mult decât numărarea descărcărilor.

Dominic Botezariu
Dominic Botezariuhttps://www.noobz.ro/
Creator de site și redactor-șef.

Cele mai noi știri

Pe același subiect

LĂSAȚI UN MESAJ

Vă rugăm să introduceți comentariul dvs.!
Introduceți aici numele dvs.