Computo – A Journal for Transparent and Reproducible Research in Statistics and Machine Learning

URMĂREȘTE-NE
16,065FaniÎmi place
1,142CititoriConectați-vă

Logo Computo

Computo este un jurnal care promovează contribuții metodologice, computaționale și algoritmice în statistică și învățare automată, care oferă o mai bună înțelegere a modelelor sau metodelor care sunt cele mai potrivite pentru a răspunde întrebărilor științifice specifice. Computo folosește instrumente moderne în programare și raportare științifică pentru a sprijini rezultate de cercetare mai transparente, interactive și reproductibile. Suntem încântați să prezentăm Computo comunității rOpenSci ca un drum complementar către publicarea cercetărilor reproductibile alături de inițiativele de evaluare inter pares ale software-ului rOpenSci.

De ce am creat Computo

Ideea Computo a luat naștere din dorința de a promova o înțelegere științifică mai profundă, precum și din necesitatea de a aborda mai multe provocări în peisajul publicării științifice actuale, în special în statistici și învățarea automată. În special, criza de reproductibilitate este o preocupare semnificativă, iar volumul tot mai mare de publicații care încordează procesul de revizuire poate afecta calitatea publicațiilor științifice..

Proliferarea rapidă a noilor metode în învățarea automată și statistică poate face dificilă stabilirea unui stadiu clar al abordărilor statistice care abordează întrebări științifice specifice. Există adesea o lipsă de seturi de date de referință stabilite, specifice subiectului, iar presiunea de a demonstra superioritatea metodelor noi poate duce uneori la evaluări ale performanței mai puțin decât obiective. În plus, publicarea rezultatelor negative (de exemplu, eșecul de a demonstra o îmbunătățire semnificativă din punct de vedere statistic), care sunt esențiale pentru progresul științific, rămâne o provocare.

Computo a fost creat pentru a promova contribuții metodologice și algoritmice care nu numai că sunt reproductibile, ci și oferă o mai bună înțelegere a modelelor sau metodelor care sunt cele mai potrivite pentru a răspunde întrebărilor științifice specifice. Credem că construirea cunoștințelor științifice solide necesită atât reproductibilitatea rezultatelor publicate, cât și o articulare clară a implicațiilor științifice ale acestora. În timp ce multe reviste necesită acum cod și date, acestea sunt adesea insuficiente pentru a asigura reproductibilitatea reală sau pentru a înțelege pe deplin contribuția științifică.

Ce oferă Computo

Computo se deosebește de alte reviste existente atât prin domeniul său de aplicare, cât și prin centralitatea acordată reproductibilității și științei deschise.

Domeniul de aplicare

Computo salută o serie de contribuții în statistică și învățare automată:

  • Metode noi cu evoluții originale de statistici/ML, sau studii numerice care ilustrează rezultatele teoretice în statistici/ML;

  • Studii de caz sau anchete privind statistici/metode ML pentru a aborda un anumit (tip de) întrebare în analiza datelor, studii de comparație neutre care oferă o perspectivă asupra când, cum și de ce metodele comparate au rezultate bune sau mai puțin bune;

  • Lucrări software/tutoriale pentru a prezenta implementări ale algoritmilor statistici/ML sau pentru a prezenta utilizarea unui pachet/cutie de instrumente. Pentru astfel de lucrări ne așteptăm nu doar la descrierea unei implementări existente, ci și la studiul unui caz concret de utilizare. Dacă este cazul, se așteaptă, de asemenea, o comparație cu lucrările conexe și o evaluare comparativă adecvată.

Reproductibilitate și știință deschisă

Combinând accesul deschis, reproductibilitatea și claritatea metodologică, Computo își propune să sprijine comunitatea științifică în a face alegeri informate și transparente în analiza datelor:

  • Computo este un jurnal doar online, sub modelul de publicare cu acces deschis diamant, gratuit pentru autori și cititori;

  • Computo pune la dispoziție în mod sistematic toate schimburile dintre autori și recenzenți: recenziile sunt adesea foarte utile pentru cititori, iar punerea lor la dispoziție este, de asemenea, o recunoaștere a muncii importante efectuate de recenzori. Pentru a răspunde temerii unor potențiali autori că o recenzie excesiv de negativă ar putea submina șansele publicării ulterioare, am ales să facem recenziile disponibile la publicare. Mai mult, evaluatorii pot alege să rămână anonimi, deoarece unii evaluatori nu se simt confortabil să-și ridice anonimatul;

Unde suntem

De la începuturile sale la sfârșitul anului 2022, am creat un ecosistem robust pentru știința reproductibilă. În iulie 2025, am publicat 17 articole, iar 4 sunt în curs de revizuire. Un exemplu de lucrare publicată este prezentat mai jos:

Simularea eficientă a modelelor populației individualeSimularea eficientă a modelelor populației individuale

Colaborare și provocări

O provocare semnificativă a fost perfecționarea procesului nostru de evaluare inter pares pentru a echilibra rigoarea cu accesibilitatea. Am explorat diverse platforme și în prezent luăm în considerare o viitoare mișcare către un sistem mai transparent și mai condus de comunitate pentru a spori implicarea.

O provocare mai fundamentală constă în definirea și evaluarea reproductibilității adevărate a lucrărilor științifice. Facem distincție între „reproductibilitatea editorială” – capacitatea de a relua codul furnizat și de a obține aceleași rezultate – și „reproductibilitatea științifică”, care analizează mai profund robustețea și generalizarea constatărilor. Stabilirea unor orientări și politici clare în acest sens, în special în domenii complexe precum Deep Learning, a fost un efort continuu. De exemplu, evaluarea unei lucrări de învățare profundă în care recalificarea unui model ar putea fi imposibilă sau în afara domeniului de aplicare a lucrării depuse necesită o analiză atentă a ceea ce constituie o contribuție „reproductibilă” din punct de vedere științific, dincolo de simpla execuție a codului.

Viitorul Computo

Având un accent comun pe îmbunătățirea calității contribuțiilor științifice, rOpenSci și Computo oferă abordări complementare pentru încurajarea cercetării reproductibile. rOpenSci (și, prin extensie, pyOpenSci pentru partea Python) se concentrează pe fiabilitatea și robustețea instrumentelor software printr-un proces de evaluare inter pares transparent, condus de comunitate. Computo, la rândul său, se asigură că aceste instrumente sunt utilizate în articole științifice computaționale transparente și complet reproductibile, păstrând codul, datele și specificațiile de mediu.

Privind în perspectivă, ne propunem să îmbunătățim și mai mult diseminarea cunoștințelor științifice, trecând către o interactivitate mai mare, vizualizări de date mai bogate și explorarea modelelor de comunicare inovatoare, inspirându-ne din inițiative precum fostul distill.pub. Abordarea noastră este de a implica progresiv toate părțile interesate: editori, ingineri, autori și comunitatea științifică mai largă în această evoluție.

Următorii noștri pași concreti se concentrează pe:

  • Eficientizarea fluxurilor de lucru și a instrumentelor: Consolidarea procesului nostru editorial, potențial într-un mediu mai concentrat pe comunitate și extinderea instrumentelor de creație cu medii de calcul ușor de utilizat pentru pre-trimitere.
  • Asigurarea accesului și inovației pe termen lung: Implementarea unei platforme robuste pentru reproductibilitate pe termen lung, inclusiv crearea și arhivarea containerelor din mers, continuând în același timp să exploreze și să integreze modalități noi de a prezenta și interacționa cu descoperirile științifice.

Așteptăm cu nerăbdare să ne continuăm călătoria cu sprijinul comunității noastre și al organizațiilor cu idei similare precum rOpenSci.

Dominic Botezariu
Dominic Botezariuhttps://www.noobz.ro/
Creator de site și redactor-șef.

Cele mai noi știri

Pe același subiect

LĂSAȚI UN MESAJ

Vă rugăm să introduceți comentariul dvs.!
Introduceți aici numele dvs.