Repost: R 4.5.0 și Bioconductor 3.21

URMĂREȘTE-NE
16,065FaniÎmi place
1,142CititoriConectați-vă

Instalare mai rapidă a pachetului, importă numai funcțiile pe care le doriți cu utilizarea (), datele Palmer Pinguins încorporate, scurtarea valorilor GREP și o mulțime de pachete de bioinformatice noi în bioconductor

R 4.5.0 a fost lansat săptămâna trecută, iar Bioconductor 3.21 a venit câteva zile mai târziu. Puteți citi R Note de eliberare aici și Anunțul bioconductor 3.21 aici. Aici voi evidenția câteva lucruri pentru care merită actualizate.

Puteți citi R Note de eliberare aici sau doar folosiți news().

De fiecare dată când versiunea minoră se modifică (de exemplu, 4.4.x la 4.5.x), va trebui să reinstalați din nou toate pachetele. Care acum va fi mult mai rapid datorită modificărilor sub capotă install.packages() care descarcă pachetele în paralel:

install.packages() şi download.packages() descărcați pachetele simultan folosind libcurlreducerea semnificativă a timpilor de descărcare la instalarea sau descărcarea mai multor pachete.

Nu am niciun punct de referință de arătat, dar vă pot spune reinstalarea tuturor pachetelor mele de acces mult mai rapid decât cu upgrade -urile și reinstalații anterioare.

Setul de date Iris încorporat lasă ceva de dorit. Este suprautilizat și nu este foarte antrenant pentru elevii sau publicul care au văzut -o în mod repetat. Este mic (150 de rânduri), curat (fără date care lipsesc) și nu prezintă provocări pentru a face față unor valorile și mai multe etichete categorice. Și, dacă te uiți la ajutor pentru ?irisvei vedea că a fost Publicat de Ronald Fisher în Analele eugenicilornu ceva pe care mi -ar părea să -l citez.

În 2020, Allison Horst a publicat Pachet Palmerpenguins – Un pachet de date menit să ofere un set de date excelent pentru explorarea și vizualizarea datelor ca o alternativă la iris. Anterior trebuia să instalezi pachetul pentru a utiliza datele, dar acum penguins datele sunt încorporate, la fel ca și cele mai puțin curate penguins_raw Date care pot fi utilizate pentru predarea curățării și manipulării datelor.

library(ggplot2)
ggplot(penguins, aes(bill_len, bill_dep)) + 
  geom_point(aes(col=species, size=body_mass, shape=island)) + 
  theme_classic()

Și dacă ați scris tutoriale folosind pachetul PalmerPenguins, știți că numele coloanelor diferă între versiunile PalmerPenguins și Base R. S -ar putea să consultați noul basepentenguins pachet (documentare) Acest pachet vă oferă funcții pentru a converti tot codul dvs. pentru a utiliza versiunea de bază.

Dacă veniți de la Python, sunteți obișnuit să puteți importa doar ceea ce aveți nevoie din pachetele instalate. De exemplu:

from numpy import array, mean
from pathlib import Path

Cu R Dacă doriți să apelați o funcție dintr-un pachet fără a încărca întregul spațiu de nume, puteți utiliza întotdeauna dublu colon, de exemplu dplyr::select(). Cu R 4.5.0 puteți importa doar funcțiile pe care le doriți de la orice pachet.

use("dplyr", c("filter", "count"))
penguins |>
  filter(island=="Torgersen" & year==2007) |> 
  count(sex)
     sex n
1 female 8
2   male 7
3    5

Totuși, există o gotcha aici. După cum afirmă documentația, use() este un ambalaj simplu în jur library care folosește întotdeauna attach.required=FALSE. Asta înseamnă odată ce suni use() Prima dată, trebuie să importați toate funcțiile pe care poate doriți să le importați. Dacă suni use() din nou sau chiar library()încă nu veți avea acces la celelalte funcții.

În realitate cred că voi folosi în continuare package::function() Sintaxa când nu vreau să încărc biblioteca completă, dar este plăcut să am această opțiune. Vezi și cutie şi conflict pachete.

## This works
use("dplyr", c("filter", "count"))
penguins |>
  filter(island=="Torgersen" & year==2007) |> 
  count(sex)

## This fails!
library(dplyr)
penguins |>
  mutate(ratio=bill_len/bill_dep)
Error in mutate(penguins, ratio = bill_len/bill_dep) : 
  could not find function "mutate"

O îmbunătățire a vieții foarte mici a vieții. Dacă utilizați grep()obțineți indicii vectorului care se potrivesc cu modelul dvs. Pentru a obține valorile potrivite, puteți adăuga value=TRUEsau folosiți doar noul grepv() Funcția în schimb.

x <- c("apple", "banana", "whatsapp")

grep("app", x)
#> (1) 1 3

grepv("app", x)
#> (1) "apple"    "whatsapp"

Puteți citi complet Anunțul bioconductor 3.21 aici. Îl puteți instala cu:

if (!require("BiocManager", quietly = TRUE))
    install.packages("BiocManager")
BiocManager::install(version = "3.21")

Există 72 de pachete software noi în această versiune de Bioconductor, aducând totalul 2341 pachete software, 432 pachete de date experimentale, 928 pachete de adnotare, 30 de fluxuri de lucru și 5 cărți. Această versiune introduce o gamă largă de instrumente și pachete noi în genomică, transcriptomică, proteomică, metabolomică și analiza omicilor spațiali. Adăugările notabile includ noi cadre pentru transcriptomice spațiale (cum ar fi clustsignal, Serasterși Cardpa), utilități îmbunătățite pentru analizarea datelor cu o singură celulă (Splindedv, aburi, Dandelionr) și metode de ultimă oră pentru integrarea și vizualizarea seturilor de date multi-OMICS (Rflomics, traseu, Metabodinamică) De asemenea, versiunea prezintă abordări statistice și de învățare automată, cum ar fi Limrotii, Cpsmși Xaitestpentru o inferență îmbunătățită și modelarea predictivă. Mai multe instrumente îmbunătățesc vizualizarea, accesibilitatea și reproductibilitatea, inclusiv aplicații bazate pe GUI (gheizer, Miadash, Shinydsp) și pachetele s -au concentrat pe optimizarea performanței sau interoperabilității (de exemplu, Rbowtiecuda, Reducerxperiment, Rigraflib)

De asemenea, poate doriți să degresați prin Note de eliberare Pentru a analiza actualizările la pachetele existente pe care le utilizați deja.

Dominic Botezariu
Dominic Botezariuhttps://www.noobz.ro/
Creator de site și redactor-șef.

Cele mai noi știri

Pe același subiect

LĂSAȚI UN MESAJ

Vă rugăm să introduceți comentariul dvs.!
Introduceți aici numele dvs.