De Fenne Riemslagh
Am avut plăcerea să ne adunăm cu Kirsten Bulsink, cercetător de date la Institutul Național Olandez pentru Sănătate Publică și Mediu (RIVM). Discuția noastră a acoperit călătoria ei de la răspunsul la pandemie la dezvoltarea pachetului R și modul în care Centrul eScience din Țările de Jos a jucat un rol în crearea unei părți esențiale a instrumentelor la RIVM. Povestea ei demonstrează importanța muncii colaborative în cercetare.
Î: Ne puteți spune despre trecutul dvs. și despre rolul actual la RIVM?
R: Lucrez la RIVM de puțin peste trei ani acum. Experienta mea este in psihologie, cu un master in neurostiinte. În timpul masterului meu de cercetare, mi-am descoperit pasiunea pentru analiza datelor și găsirea de răspunsuri prin intermediul datelor. Acest lucru m-a determinat să urmez o specializare în știința datelor.
Am început să lucrez la RIVM în timpul pandemiei de COVID-19. Inițial, a fost o perioadă haotică, cercetătorii lucrând peste ore pentru a analiza și raporta rapid datele. Când m-am alăturat, exista deja un canal de date semi-automat, dar încă a trebuit să facem față unor provocări complexe, cum ar fi calcularea ratelor de vaccinare cu date dintr-un grup selectat (din cauza renunțării).
Pe măsură ce echipa noastră a crescut la aproximativ 9 până la 10 persoane, am început să organizăm ateliere pentru a reflecta asupra proceselor noastre. Ne-am întrebat ce a funcționat bine și ce am face diferit dacă am putea lua de la capăt. Această reflecție a condus la dezvoltarea de noi instrumente și abordări.
„…am început să organizăm ateliere pentru a reflecta asupra proceselor noastre. Ne-am întrebat ce a funcționat bine și ce am face diferit dacă am putea lua de la capăt. Această reflecție a condus la dezvoltarea de noi instrumente și abordări.”
Înainte de pandemie, procesele și metodele diferă pentru diferite boli infecțioase. Drept urmare, cercetătorii de la RIVM au fost nevoiți să efectueze multe acțiuni manual, iar aceste procese puteau diferi în funcție de boală infecțioasă. Pandemia a necesitat mai mult schimb de cunoștințe și colaborare. Am început să standardizăm și să automatizăm transformarea și raportarea datelor pentru boli infecțioase.
Î: Înțelegem că dvs. și colegul dvs. ați participat la workshop-ul R-packaging organizat de eScience Center. Ne poți spune despre acea experiență și despre pachetul R dezvoltat de echipa ta?
Da, este corect. Unul dintre colegii mei a participat de fapt la atelierul de ambalare R oferit de Centrul eScience înaintea mea. Mai târziu, am avut și eu ocazia să urmez același curs.
Pachetul, care servește acum ca instrument de bază pentru conductele epidemiologice la RIVM, oferă funcționalități pentru încărcarea, curățarea și raportarea datelor, cu diverse verificări în loc. De asemenea, include funcții pentru a crea grafice în culorile și stilul RIVM.
De exemplu, în timpul pandemiei de COVID-19, am folosit metode de analiză pentru a procesa datele privind cazurile pozitive, a calcula numărul de cazuri de-a lungul timpului și a genera rapoarte. Acum, folosim pachetul pentru monitorizarea și raportarea diferitelor boli infecțioase, cum ar fi infecțiile cu transmitere sexuală și infecțiile respiratorii, nu doar COVID-19.
Cum a ajutat atelierul R-packaging să vă profesionalizați pachetul?
După ce m-am alăturat atelierului de la Centrul eScience din Țările de Jos, am organizat o sesiune pentru echipa mea pentru a împărtăși ceea ce am învățat. Deși colegii mei făcuseră deja o treabă grozavă, atelierul ne-a ajutat să îmbunătățim coerența în gestionarea dependențelor. De asemenea, ne-am îmbunătățit documentația. Îmbunătățirile pachetului au făcut mai ușor pentru alții să folosească pachetul. Instalarea a devenit mai ușoară, iar utilizatorii nu mai trebuiau să-și dea seama de ce trebuiau să instaleze pachete suplimentare.
„Îmbunătățirile pachetului au făcut ca alții să folosească pachetul mai ușor. Instalarea a devenit mai simplă, iar utilizatorii nu mai trebuiau să-și dea seama de ce trebuiau să instaleze pachete suplimentare.”
Mai târziu, am urmat și cursul de dezvoltare software Python oferit de eScience Center, care mi-a deschis cu adevărat ochii. Am învățat despre instrumente precum linters, medii virtuale, testare, acoperire și conducte CI/CD. Aceste cunoștințe ne-au făcut să realizăm că trebuie să implementăm aceste practici și în pachetul nostru R.
Î: Ce a dus la decizia de a organiza hackathoane pentru dezvoltarea ulterioară a pachetelor și cum s-a implicat eScience Center?
După ce am acumulat toate aceste cunoștințe de la cursurile eScience Center, ne-am simțit pregătiți să ducem pachetul nostru la nivelul următor. Am decis să organizăm hackathon-uri pentru a ne concentra pe implementarea celor mai bune practici și îmbunătățirea structurii pachetelor noastre.
Primul nostru obiectiv principal a fost să demonstrăm pe plan intern că avem un produs de înaltă calitate, mai ales că multe analize ale datelor privind bolile infecțioase se bazează pe acest pachet. Al doilea obiectiv a fost să împărtășim metodologia noastră cu părți externe, cum ar fi GGD (Serviciile Municipale de Sănătate), chiar dacă nu am putut partaja datele reale.
Am contactat echipa de instruire eScience Center pentru asistență și ne-au conectat cu Pablo Rodríguez Sánchez (unul dintre inginerii software de cercetare (RSE) ai Centrului eScience și autorul principal al cursului R-packaging, n.red.) pentru a ne consulta în timpul hackatonului nostru . Această colaborare a fost foarte valoroasă pentru a ne ghida eforturile și pentru a oferi informații de specialitate.
Î: Care au fost rezultatele hackathon-urilor?
Am avut două hackathon-uri. În primul, ne-am concentrat pe testare și documentare. Ne-am mărit acoperirea testelor și am îmbunătățit documentația pachetului, inclusiv prin crearea unei vignete cu exemple.
Pablo ne-a oferit o perspectivă nouă și ne-a ajutat să confirmăm că suntem pe drumul cel bun. Expertiza lui a fost deosebit de valoroasă în al doilea hackathon, când luam decizii cu privire la structura pachetului și fluxul de lucru.
„Pablo Rodríguez-Sánchez, Research Software Engineer (RSE) la Netherlands eScience Center, ne-a oferit o perspectivă nouă și ne-a ajutat să confirmăm că suntem pe drumul cel bun. Expertiza lui a fost deosebit de valoroasă în al doilea hackathon, când luam decizii cu privire la structura pachetului și fluxul de lucru.”
Î: Cum a schimbat această experiență modul de lucru al echipei tale?
În ultimul an, am început să lucrăm mult mai mult ca o echipă de dezvoltare software. Acum folosim o placă Kanban pentru managementul proiectelor și am implementat conducte CI/CD, ceea ce ne-a făcut procesul de dezvoltare mult mai ușor. Împărțirea pachetului a făcut totul mai ușor de gestionat și este mai ușor să vedem unde avem nevoie de anumite teste sau îmbunătățiri.
Î: Ce urmează pentru pachetul și echipa ta?
Apreciem faptul că eScience Center este un partener de lupta pentru a face față acestor provocări tehnice.
În rolul meu actual, acum am o combinație plăcută de abilități tehnice și sarcini de consiliere. Consiliem și îi facem pe alți oameni de la RIVM să fie entuziasmați de instrumentele noastre. Experiența noastră recentă în dezvoltarea acestui pachet R a fost neprețuită.
Centrul eScience din Țările de Jos ar dori să-i mulțumească lui Kirsten pentru timpul acordat pentru interviu. Așteptăm cu nerăbdare să ne continuăm colaborarea. Dacă doriți să aflați mai multe despre colaborarea cu eScience Center sau sunteți interesat de programul nostru de formare, vă rugăm să vizitați Training & Workshops — eScience Center. Dacă sunteți interesat să primiți consultanță, așa cum a făcut-o Kirsten, este posibil să fiți interesat de programul nostru de burse.
From Pandemic Response to Package Development a fost publicat inițial în Netherlands eScience Center pe Medium, unde oamenii continuă conversația subliniind și răspunzând la această poveste.