Tehnologie pentru care sunt recunoscător (repost)

URMĂREȘTE-NE
16,065FaniÎmi place
1,142CititoriConectați-vă

(Acest articol a fost publicat pentru prima dată pe Terminarea geneticiiși cu amabilitate a contribuit la R-bloggeri). (Puteți raporta problema legată de conținutul acestei pagini aici)


Doriți să vă distribuiți conținutul pe R-bloggeri? dați clic aici dacă aveți un blog, sau aici dacă nu aveți.

Repostat din https://blog.stephenturner.us/p/tech-im-thankful-for-2024

Știința datelor și tehnologia bioinformatică pentru care sunt recunoscător în 2024: tidyverse, RStudio, Positron, Bluesky, bloguri, Quarto, bioRxiv, LLM-uri pentru cod, Ollama, Seqera Containers, StackOverflow, …

Este o săptămână scurtă aici, în SUA. În timp ce reflectez la instrumentele care modelează bioinformatica modernă și știința datelor, este izbitor să văd cât de departe am ajuns în cei 20 de ani în care am fost în acest domeniu. Ecosistemul de astăzi este bogat cu instrumente care ne fac munca mai rapidă, mai bună, plăcută și din ce în ce mai accesibilă. În această postare, împărtășesc o parte din tehnologia pentru care sunt deosebit de recunoscător – de la cali de lucru consacrați care au transformat modul în care codificăm și analizăm datele, până la platformele emergente care remodelează fluxurile de lucru de comunicare și dezvoltare științifică.

  • The tidyverse: Pachete R pentru știința datelor. Nu mai are nevoie de prezentare.

  • devtools + foloseste asta + testa asta: Folosesc fiecare dintre aceste instrumente cel puțin săptămânal pentru dezvoltarea pachetului R.

  • Rstudio, Pozitronși VS Cod: De cele mai multe ori folosesc o combinație de VS Code și RStudio. Prima mea experiență cu Positron a fost una pozitivăși deoarece mai multe dintre funcționalitățile mele de dealbreaker sunt aduse în Positron, îmi imaginez că anul viitor va fi IDE-ul meu principal pentru toate aspectele științei datelor.

  • Bluesky. Acest loc se simte ca „vechiul” Twitter științific de la sfârșitul anilor 00 / începutul adolescenței. Am scris despre Bluesky pentru Știință ca să te începi. Este atât de grozav să am un loc pentru discuții civile și de bună-credință despre noile evoluții în știință, să pot crea propriile mele fluxuri algoritmice și să creez liste de blocuri/mute termonucleare.

  • Comunități slăbite. Există multe grupuri de interese speciale și comunități cu comunități Slack/Discord deschise oricui. Câteva din care fac parte:

  • Bloguri. Bloguri vechi bune din epoca anilor 2000. Am scris regulat pe blog la Terminarea geneticii timp de aproape un deceniu. De-a lungul timpului, Twitter m-a făcut un blogger leneș. Postările mele au devenit mai scurte, mai puține și mai lungi între ele. Sunt destul de sigur că același lucru s-a întâmplat multora dintre ele blogurile pe care le urmăream atunci. Într-o epocă în care atât de mult conținut de pe internet este GenAI panta Am ajuns să apreciez cu adevărat tratarea de lungă durată a subiectelor complexe și scufundările profunde în conținutul tehnic. Câteva bloguri pe care le citesc în mod regulat:

  • Quarto: Următoarea generație de RMarkdown. Am folosit asta scrie lucrăricreați rapoarte, pentru a crea întreg cărți (postarea de blog va fi în curând pe aceasta), tablouri de bord interactive și multe altele.

  • Zotero: Folosesc Zotero de peste 15 ani, de când Zotero era doar o extensie de browser Firefox. Este singurul manager de referință de care sunt conștient care se integrează cu Word, Google Docs și RStudio pentru managementul citărilor și generarea bibliografiei. Cititorul PDF de pe iPad are tot ceea ce vreau și nimic nu – pot evidenția și marca un PDF și pot sincroniza acele adnotări pe toate dispozitivele mele. Zotero este gratuit, open-source și cu o mulțime de plugin-uri care își extind funcționalitatea, cum ar fi acesta pentru conectarea cu Inciteful.

  • bioRxiv: bioRxiv a fost lansat acum aproximativ 10 ani și câștigă în fiecare an mai multă tracțiune în comunitatea științelor vieții. Iar atitudinile legate de pretipăririle de astăzi sunt mult diferite de cele din 2014 („dar ce se întâmplă dacă primesc scos?”).

  • Containere Seqera: Nu sunt client Seqera și nu folosesc (încă) URI-urile Seqera Containers în codul meu de producție, dar aceasta este o resursă uimitoare pe care o folosesc în mod obișnuit pentru a crea imagini Docker cu mai multe instrumente pe care le doresc. Caut și adaug instrumente și primesc înapoi un fișier Dockerfile și un fișier conda.yml pe care le pot folosi pentru a-mi construi propria imagine.

  • Ollama: Folosesc Ollama pentru a interacționa cu LLM-uri locale open-source pe Macbook Pro, pentru cazurile în care confidențialitatea și securitatea sunt de maximă preocupare.

  • StackOverflow: SO obișnuia să locuiască în bara mea de marcaje din browserul meu. Estimăm că utilizarea mea SO este în scădere cu 90% față de ceea ce era în 2022. Cu toate acestea, niciunul dintre LLM-urile pentru cod nu ar fi ceea ce sunt astăzi fără milioanele de întrebări adresate și răspunsuri pe SO de-a lungul anilor. Nu sunt sigur ce înseamnă acest lucru pentru viitorul SO și LLM care se bazează pe date bune de formare.

Dominic Botezariu
Dominic Botezariuhttps://www.noobz.ro/
Creator de site și redactor-șef.

Cele mai noi știri

Pe același subiect

LĂSAȚI UN MESAJ

Vă rugăm să introduceți comentariul dvs.!
Introduceți aici numele dvs.