Explorarea științei deschise, pachetelor R și dezvoltării de software de cercetare la CSIDNET AGM 2025

URMĂREȘTE-NE
16,065FaniÎmi place
1,142CititoriConectați-vă

Rețeaua „Boala infecțioasă sensibilă la climă” (CSID) arată să conecteze o comunitate globală de actori care contribuie la instrumente software CSID impactante și să stabilească comunități CSID localizate care pot lega problemele și inițiativele existente la sol la dezvoltarea și întreținerea instrumentelor CSID.

Pe 21 iulie, în cadrul Adunării Generale anuale din 2025 a CSIDNET, Yanina Bellini Saibene și Samuel Schildhauer au co-conducă o sesiune intitulată „Știință deschisă, pachete R și dezvoltare de software de cercetare”. Sesiunea a fost concepută nu numai pentru a introduce participanții la instrumente și practici în știința deschisă cu R, ci și pentru a încuraja reflecția activă și discuțiile despre propriile fluxuri de lucru și provocările cu care se confruntă.

Kicking Things Off: Barometrul uman

Pentru a sparge gheața și a face ca oamenii să se miște și să creadă că folosim o metodă documentată de la un Ropensci Neconf, numit barometru uman. Participanții s-au poziționat fizic de-a lungul unei linii ca răspuns la o serie de prompturi cu inimă ușoară și provocatoare de gândire, cum ar fi:

  1. Pisici sau câini?
  2. Practic știința deschisă în activitatea mea.
  3. Folosesc R în cercetarea mea.

Participanții au discutat apoi pozițiile lor și au încercat să -l convingă pe celălalt grup să se răzgândească. Această abordare dinamică nu numai că a adus energie în cameră, dar a oferit și o privire rapidă asupra practicilor și perspectivelor comunității, oferind participanților șansa de a deveni cunoscuți în mod interactiv.

Două grupuri de oameni în picioare care se ocupă între ei

Participanții care împărtășesc de ce sunt în acel grup atunci când sunt întrebați: „Folosesc r în cercetarea mea”. Fotografie de Yanina Bellini Saibene.

Cartografierea instrumentelor noastre: fluxuri de lucru pentru știința datelor în practică

Prima discuție structurată s -a concentrat pe instrumentele pe care le folosesc participanții în fluxurile de lucru ale științei datelor. Folosind cadrul cunoscut R4DS Science (R4DS), participanții au fost invitați să plaseze note post-it în fiecare etapă a procesului de procesare, ordonat, transformat, vizualizat, modelează și comunică-indicarea pe care instrumente sau pachete se bazează.

Yanina, Sam și unii dintre participanți vorbesc și pun în diagramă note de culoare lipicioasăYanina, Sam și unii dintre participanți vorbesc și pun în diagramă note de culoare lipicioasă

Yanina și Sam ghidează conversația despre instrumentele utilizate de participanți la fluxurile de lucru ale științei datelor și ale participanților care vorbesc și pun în diagramă note de culoare lipicioase. Fotografii de: Natthaphon Sakulvanaporn (Bangkokvdo)

Acest exercițiu a stârnit conversații bogate despre diversitatea instrumentelor pe care oamenii le folosesc, zonele cu sprijin puternic (cum ar fi vizualizarea datelor) și pașii în care participanții se luptă adesea pentru a găsi instrumentele potrivite. De asemenea, s -a remarcat că instrumente precum săgeata, care permit gestionarea unor cantități mari de date în R, iar țintele, care permit lucrările cu conducte, nu au fost menționate printre instrumente. Exercițiul a deschis ușa pentru a discuta lacunele de instrumente – obișnuite pentru dezvoltarea viitoare sau colaborare, cum ar fi instrumente de mapare mai ușoare și bucăți de cod partajate între diferite caiete din R.

Tabelul rezumă instrumentele pe care participanții le -au împărtășit pentru fiecare dintre etapele procesului.

Descoperirea barierelor: o discuție despre cretă despre obstacole

Cea de -a doua discuție a îndreptat atenția către obstacolele cu care se confruntă participanții atunci când încearcă să se angajeze în dezvoltarea de științe deschise și de cercetare. Într-un format de discuții despre cretă, participanții și-au notat gândurile în trei categorii codate de culori:

  • Obstacole de expertiză (de exemplu, lipsa de pregătire, curbe de învățare abrupte)
  • Obstacole lingvistice (de exemplu, lipsa documentației în limbile locale)
  • Obstacole pentru infrastructură (de exemplu, acces limitat la hardware sau internet)
Participanții la sesiune în jurul unei reflecții de masă și împărtășind despre bariere și obstacole pentru a se angaja pentru dezvoltarea de software de știință și cercetareParticipanții la sesiune în jurul unei reflecții de masă și împărtășind despre bariere și obstacole pentru a se angaja pentru dezvoltarea de software de știință și cercetare

Participanții la sesiune și gazdă în timpul discuției despre discuții despre cretă. Fotografii de: Natthaphon Sakulvanaporn (Bangkokvdo)

Acest schimb deschis și onest a dezvăluit o gamă largă de bariere. De asemenea, a subliniat importanța inițiativelor care abordează echitatea și accesul în infrastructura de cercetare.

  • Obstacole de expertiză: Cunoștințe de expertiză, documentație rea/fără actualizare, neștiind ce este acolo (evitați reinventarea roții), pachetele care nu mai sunt acceptate, ce pachete/funcții de utilizat, lipsa unei foi de parcurs de învățare, fotografiere cu probleme pentru pachete mai puțin utilizate, traduceri între diferite câmpuri de câmpuri

  • Obstacole lingvistice: Limbajul uman (disponibilitatea materială), documentația multilingvă, instruirea și documentele în limbile native, documentația prea complexă, nu exemple clare de utilizare, necesitatea unei înțelegeri prealabile

  • Obstacole de infrastructură: Echipamente, resurse de procesare, capacitate de stocare, acces HPC la distanță, găzduire pentru aplicații, dezvoltare de software de finanțare

Soluții de partajare: Prezentări în cazuri de utilizare

Pentru a pune la bază discuția în exemple din lumea reală, probul și Yani au prezentat fiecare un caz de utilizare:

Serodinamică: Dezvoltare colaborativă a pachetului R

SAM face parte din grupul de cercetare seroepidemiologie (SERG) de la UC Davis, condus de Dr. Kristen Aiemjoy și Dr. Ezra Morrison. Sam a oferit o prezentare subliniind dezvoltarea echipei sale de un pachet R numit Serodinamics.

Pachetul implementează o tehnică inovatoare care folosește date din cohorte serologice longitudinale pentru a modela seroredele cinetice anticorp pentru o anumită infecție. Aceste informații pot fi apoi aplicate la serosurveys în secțiune transversală pentru a estima incidența și timpul bolii de la infecție folosind un alt pachet pe care echipa a dezvoltat-o ​​numită serocalculator. Pachetul folosește un cadru Bayesian (RunJags) pentru a estima concentrația inițială de anticorpi (Y0), concentrația maximă (Y1), timpul până la vârf (T1), rata de descompunere (α) și forma de descompunere (R). Echipa SERG speră să aibă serodinamică gata de utilizare în anul următor.

O diagramă conceptuală cu două panouri: (a) prezintă loturi de puncte ale nivelurilor de anticorpi (unități ELISA, scară de jurnal) pentru populații cu pornire ridicată și cu un nivel scăzut, cu valori mai mari în grupul de înaltă transformare; (B) Afișează nivelurile de anticorpi modelate de -a lungul timpului de la debutul febrei, ilustrând o creștere și o scădere treptată, cu săgeți orizontale care leagă datele populației de cinetica anticorpilor.O diagramă conceptuală cu două panouri: (a) prezintă loturi de puncte ale nivelurilor de anticorpi (unități ELISA, scară de jurnal) pentru populații cu pornire ridicată și cu un nivel scăzut, cu valori mai mari în grupul de înaltă transformare; (B) Afișează nivelurile de anticorpi modelate de -a lungul timpului de la debutul febrei, ilustrând o creștere și o scădere treptată, cu săgeți orizontale care leagă datele populației de cinetica anticorpilor.

Diagrama conceptuală pentru estimarea ratei seroconversiei folosind dinamica anticorpului longitudinal

Ropensci: Suport pentru software de cercetare deschis și durabil

Yani a introdus ecosistemul Ropensci, subliniind modul în care susține dezvoltarea, revizuirea de la egal la egal și durabilitatea software-ului de cercetare în R. Ea a subliniat abordarea bazată pe comunitate și importanța bunelor practici în dezvoltarea software pentru știință.

Revizuirea noastră de colegi de software este o revizuire transparentă, deschisă, neadversală R, cu scopul de a îmbunătăți software-ul pe care l-am construit la știința făcută.

R-Universe este platforma Ropensci pentru îmbunătățirea publicării și descoperirii software-ului de cercetare în R. R-Universe Construiți binarele pentru diferite sisteme de operare, inclusiv WebAssembly! De asemenea, construiește documentația, distribuie seturi de date și urmărește o mulțime de statistici despre pachetul dvs.

Proiectul nostru multilingv de publicare se concentrează pe crearea procesului și infrastructurii pentru a furniza conținutul nostru în alte limbi decât engleza, asigurând în același timp calitatea conținutului respectiv. De asemenea, pare să ofere comunității R capacități multilingve în diferite contexte.

Programul nostru de campioni încearcă să identifice, să recunoască și să recompenseze liderii într -o comunitate. Este concentrat pe oameni din grupuri excluse din punct de vedere istoric și sistematic care sunt interesați să contribuie la Ropensci și la comunitățile de știință deschise și deschise mai largi. Prin mentorat și antrenament, campionii dezvoltă un proiect pe parcursul unui an.

Yani a menționat cum fiecare dintre proiectele Ropensci poate servi drept instrumente pentru a depăși unele dintre barierele menționate în discuții, cum ar fi revizuirea de la egal la egal și comunitatea dezvoltatorilor care nu numai că mențin, dar și generează documentație, utilizează cazuri și răspund la întrebări, cu pachete orientate spre cercetare, chiar dacă sunt nișă. De asemenea, programul Campionilor ca Calea de învățare Pentru oamenii de știință care dezvoltă software de cercetare.

De asemenea, a împărtășit existența Pyopensci pentru oamenii care programează în Python și Carpentries pentru ateliere introductive și lecții deschise.

Gânduri finale

Această sesiune a oferit un amestec de interacțiune, reflecție și învățare. Aceasta a ajutat participanții să -și conecteze experiențele personale la practici științifice deschise mai largi, au apărut provocări comune și i -a introdus la noi instrumente și comunități. Până la sfârșitul celor 90 de minute, era clar că calea către un software de cercetare mai deschis, accesibil și durabil este unul cel mai bine mers împreună. Dacă sunteți interesat să aflați mai multe despre viitoarele evenimente și resurse CSIDNET, vă puteți înscrie la lista principală.

Dominic Botezariu
Dominic Botezariuhttps://www.noobz.ro/
Creator de site și redactor-șef.

Cele mai noi știri

Pe același subiect

LĂSAȚI UN MESAJ

Vă rugăm să introduceți comentariul dvs.!
Introduceți aici numele dvs.