(Acest articol a fost publicat pentru prima dată pe R Funcționeazăși cu amabilitate a contribuit la R-bloggeri). (Puteți raporta problema legată de conținutul acestei pagini aici)
Doriți să vă distribuiți conținutul pe R-bloggeri? dați clic aici dacă aveți un blog, sau aici dacă nu aveți.
Dacă citiți această postare pe R-bloggeri, probabil veți ști că am publicat selecția mea de „Top 40” noi pachete R pe CRAN de ceva timp. Am făcut acest lucru mai întâi ca parte a muncii mele la Revolution Analytics, apoi pe R Views pentru RStudio și Posit, iar acum aici pe R Works. Pentru a selecta patruzeci de pachete interesante, era nevoie de aproximativ o zi de muncă plăcută, repartizată pe o lună. Pentru aproximativ o sută de pachete, am putut să mă uit la toate paginile web ale pachetelor, să le descarc și să mă joc cu un număr mic de ele. Acum, „Top 40” a devenit un adevărat proiect de hamster pe roată. Următorul diagramă arată numărul meu de pachete noi pentru a ajunge la CRAN de când am început să public pe R Works.
Afișați codul parcelei
library(tidyverse)
file_path <- "new-cran-pkgs.csv"
if (!file.exists(file_path)) {
stop(paste("File not found! Please check the path:", file_path))
}
# Read text and numbers safely
raw_data <- read.csv(file_path, colClasses = c("character", "numeric"), stringsAsFactors = FALSE)
plot_data <- raw_data |> mutate(Date = my(Month)) |>
arrange(Date)
new_pkg <- ggplot(plot_data, aes(x = Date, y = Num_pkgs, group = 1)) +
geom_line(color = "#1f77b4", size = 1) +
geom_point(color = "#d62728", size = 1.2) +
labs(
title = "Monthly Volume of New CRAN Packages",
x = "Date",
y = "Number of Packages",
caption = "Source: R Works monthly Top 40 posts"
) +
theme(
plot.title = element_text(face = "bold"),
panel.grid.minor = element_blank(),
axis.text.x = element_text(angle = 45, hjust = 1)
)
new_pkg

De ce creșterea bruscă? Ce s-ar putea întâmpla? Ei bine, am o presupunere. Se pare că acum este prea ușor să împachetezi un cod și să-l expediezi la CRAN. Este de înțeles: este prea ușor să scrii și să implementezi orice fel de software. Următorul complot pe care John Burn-Murdoch l-a publicat recent în Financial Times, pe baza cercetărilor NBER, arată explozia de aplicații în era noastră Agentic AI.


Complotul indică, de asemenea, că noile aplicații nu pot aduce o contribuție pozitivă la viața oamenilor sau la profiturile corporative. Se pare că nu sunt folosite, revizuite sau chiar descoperite.
Deci, să punem aceleași tipuri de întrebări despre noile pachete R. Cei mai mulți dintre ei chiar contribuie la R și la Comunitatea R? Contribuie ei cu noi metode statistice, extind acoperirea R în noi domenii de aplicație, oferă cod eficient de înaltă performanță sau fac altceva care ar putea aduce beneficii comunității R?
Impresia mea de diletant angajat este nu: majoritatea pachetelor noi R nu aduc o contribuție. Un indicator evident al calității este documentația. Un număr semnificativ de pachete R noi nu oferă documentație suficientă pentru a explica ceea ce oferă. De exemplu, în mai, 40 din cele 323 de pachete CRAN noi nu aveau niciun fișier README, nici viniete și nicio adresă URL care să facă legătura cu un depozit. După modul meu de gândire, cu posibilele excepții ale pachetelor care au un fel de documentație care poate fi descoperită în afara benzii (de exemplu, o publicație de jurnal) sau nu sunt menite să fie apelate de utilizatorii finali, deoarece sunt infrastructură pentru o suită de pachete, pachetele care nu descriu ce, de ce și cum funcționează nu sunt contribuții.
