DIVINE: un nou pachet R pentru lucrul cu o cohortă clinică COVID-19 din lumea reală

URMĂREȘTE-NE
16,065FaniÎmi place
1,142CititoriConectați-vă

(Acest articol a fost publicat pentru prima dată pe R-posts.comși cu amabilitate a contribuit la R-bloggeri). (Puteți raporta problema legată de conținutul acestei pagini aici)


Doriți să vă distribuiți conținutul pe R-bloggeri? dați clic aici dacă aveți un blog, sau aici dacă nu aveți.

Datele clinice sunt rareori la fel de curate, compacte sau convenabile ca exemplele pe care le folosim adesea când predăm statistici sau R. Seturile de date reale ale spitalelor sunt de obicei distribuite în mai multe tabele, includ valori lipsă, conțin structuri repetate și necesită o documentare atentă înainte de a putea fi reutilizate.

Noul pachet R DIVINE este interesant tocmai pentru că aduce acea realitate în ecosistemul R într-un mod accesibil. Disponibil pe CRAN, DIVINE prevedeeste o colecție organizată de seturi de date dintr-o cohortă multicentrică de pacienți spitalizați cu COVID-19 în zona metropolitană de sud a Barcelonei. Pachetul este însoțit de o publicație recentă în Date științificecare descrie baza de date, structura acesteia, procesul de colectare a datelor și potențiala reutilizare pentru epidemiologie clinică, predare și cercetare metodologică.

Un set de date clinice împachetat pentru R

Pachetul include 14 seturi de date care acoperă diferite domenii clinice, cum ar fi date demografice, comorbidități, simptome, semne vitale, scoruri de severitate, informații UTI, tratamente, complicații, vaccinare și date de sfârșit de urmărire.

Această structură relațională este unul dintre cele mai valoroase aspecte ale pachetului. În loc să furnizați un singur fișier de analiză pre-combinat, DIVINE păstrează logica unei baze de date clinice reale, în care informațiile sunt distribuite pe mai multe tabele legate. Acest lucru îl face deosebit de util pentru predarea aplicată și pentru demonstrarea fluxurilor de lucru realiste de gestionare a datelor în R.

De exemplu:

install.packages("DIVINE")
library(DIVINE)

data(package = "DIVINE")

Seturile de date pot fi apoi încărcate în modul obișnuit:

data("demographic")
data("vital_signs")
data("scores")

Identificatorii comuni permit utilizatorilor să combine informații în tabele și să construiască seturi de date de analiză în funcție de întrebarea de cercetare.

Mai mult decât un pachet de date

Deși seturile de date reprezintă principala contribuție, DIVINE include, de asemenea, funcții de ajutor pentru fluxurile de lucru comune de date epidemiologice. Acestea includ:

data_overview()
multi_join()
stats_table()
multi_plot()
impute_missing()
export_data()

Aceste funcții nu sunt menite să înlocuiască ecosistemul R mai larg, dar fac pachetul mai ușor de utilizat în predare, analiză exploratorie și exemple reproductibile.

Un flux de lucru minim ar putea arăta astfel:

library(DIVINE)

data("demographic")
data("vital_signs")
data("scores")

baseline <- multi_join(
  list(demographic, vital_signs, scores),
  key = c("record_id", "covid_wave", "center"),
  join_type = "left"
)

data_overview(baseline)

stats_table(
  baseline,
  vars = c("age", "sex"),
  by = "covid_wave",
  statistic_type = "median_iqr",
  pvalue = TRUE
)

Acest exemplu ilustrează deja câteva aspecte importante ale analizei datelor clinice: înțelegerea structurii tabelului, unirea seturilor de date aferente, verificarea variabilelor și producerea de rezumate descriptive.

De ce este util pentru utilizatorii R

Pentru un public R specializat, valoarea de DIVINE nu este doar faptul că furnizează date despre COVID-19. Principalul său interes este că oferă o bază de date clinică realistă, documentată și reutilizabilă într-un flux de lucru R familiar.

Pachetul poate fi util pentru:

  • predarea managementului datelor cu seturi de date clinice relaționale;

  • pregătirea de exemple pentru cursuri de biostatistică sau epidemiologie;

  • demonstrarea analizelor clinice descriptive;

  • explorarea datelor lipsă și a disponibilității variabilelor;

  • dezvoltarea exemplelor de modelare prognostică;

  • validarea modelelor de predicție;

  • crearea de fluxuri de lucru reproductibile folosind date de sănătate din lumea reală.

Acest lucru face DIVINE deosebit de atractiv pentru biostatisticienii aplicați, epidemiologii, cercetătorii clinici și instructorii R care doresc să treacă dincolo de seturile de date despre jucării.


DIVINE: un nou pachet R pentru lucrul cu o cohortă clinică COVID-19 din lumea reală a fost postat pentru prima dată pe 18 iunie 2026 la 5:08 am.

Dominic Botezariu
Dominic Botezariuhttps://www.noobz.ro/
Creator de site și redactor-șef.

Cele mai noi știri

Pe același subiect

LĂSAȚI UN MESAJ

Vă rugăm să introduceți comentariul dvs.!
Introduceți aici numele dvs.