(Acest articol a fost publicat pentru prima dată pe Blog HOXO-Mși cu amabilitate a contribuit la R-bloggeri). (Puteți raporta problema legată de conținutul acestei pagini aici)
Doriți să vă distribuiți conținutul pe R-bloggeri? dați clic aici dacă aveți un blog, sau aici dacă nu aveți.
TheseusPlot este un pachet R care descompune diferențele într-o metrică a ratei dintre două grupuri în contribuții la nivel de subgrup și vizualizează rezultatele ca un „Plot Theseus”.
De exemplu, când o rată de clic, o rată de conversie sau o rată de retenție diferă între două perioade de timp sau grupuri, TheseusPlot vă ajută să răspundă la întrebări precum: care subgrup a contribuit cel mai mult la diferență?
Să presupunem că rata de clic (CTR) a fost de 6,2% în 2024 și de 5,2% în 2025, o scădere de 1,0 punct procentual. Un diagramă Theseus poate arăta cum este descompusă această scădere: în acest exemplu, 0,8 puncte procentuale sunt atribuite utilizatorilor bărbați și 0,2 puncte procentuale utilizatorilor de sex feminin sub descompunere.

Versiunea 0.3.0 este acum disponibilă pe CRAN. Această versiune remediază o problemă de compatibilitate cu cascadele 1.1.4, îmbunătățește redarea barei de dimensiune a subgrupurilor și rafinează mai multe valori implicite ale graficului.
Ce este nou în 0.3.0
Etichete mai curate ale parcelei
În versiunile anterioare, TheseusPlot afișa automat numele coloanei analizate ca subtitrare. Cu toate acestea, acest lucru nu a fost întotdeauna util, mai ales atunci când intriga a fost deja folosită într-un document sau o prezentare în care contextul era clar.
În versiunea 0.3.0, subtitrarea automată a numelui coloanei a fost eliminată. Acest lucru face parcelele rezultate mai curate și mai ușor de combinat cu titluri personalizate, subtitrări și textul din jur.
Această versiune adaugă, de asemenea, un xlab argument la create_ship()astfel încât să puteți personaliza eticheta pe axa x folosită de plot() şi plot_flip().
De exemplu:
ship <- create_ship(
data_2024,
data_2025,
y = clicked,
labels = c("2024", "2025"),
xlab = "Gender",
ylab = "CTR (%)"
)
ship$plot(gender)


Acest lucru este util atunci când numele coloanei din date este scurt sau tehnic, dar doriți o etichetă mai lizibilă în diagramă.
Etichete implicite mai bune
Etichetele implicite ale grupului au fost modificate "Original" şi "Refitted" la "Baseline" şi "Comparison".
ship <- create_ship( data_2024, data_2025, y = clicked ) ship$plot(gender)


Etichetele anterioare reflectau ideea internă de a înlocui un grup cu altul, dar nu au fost întotdeauna intuitive pentru utilizatori. Noile valori implicite se potrivesc mai bine cu scenariile obișnuite de comparație, cum ar fi comparațiile de la an la an, control versus tratament și analize înainte și după.
Desigur, puteți încă să specificați propriile etichete:
ship <- create_ship(
data_Nov,
data_Dec,
y = on_time,
labels = c("November", "December")
)
Afișaj numeric mai simplu
Numărul implicit de zecimale afișate a fost modificat de la 3 la 1.
În multe parcele, trei zecimale au făcut etichetele mai detaliate decât este necesar. Deoarece TheseusPlot este destinat în principal să ajute utilizatorii să înțeleagă structura unei diferențe metrice, o zecimală este adesea suficientă pentru interpretarea vizuală.
Puteți controla în continuare precizia cu digits argumenta când este nevoie.
ship <- create_ship(
data_2024,
data_2025,
y = clicked,
labels = c("2024", "2025"),
digits = 2
)
ship$plot(gender)


Îmbunătățiri ale graficului și remedieri de erori
Versiunea 0.3.0 include, de asemenea, câteva îmbunătățiri și remedieri de erori legate de redarea intrării.
În primul rând, lipsesc barele de dimensiune a subgrupului plot() şi plot_flip() cu cascade 1.1.4 au fost reparate. Barele de dimensiune a subgrupurilor sunt o parte importantă a diagramelor Theseus, deoarece arată dimensiunea eșantionului fiecărui subgrup din ambele grupuri. Fără ele, devine mai greu de judecat dacă o contribuție mare provine dintr-un subgrup mare, o diferență mare de rate sau ambele.
În al doilea rând, scalarea barei de dimensiune a subgrupului a fost îmbunătățită. Înălțimile barelor sunt acum calculate în mod consecvent din punctajul maxim al diagramei în ambele plot() şi plot_flip(). Acest lucru face comparațiile vizuale mai stabile între direcțiile parcelei. Înălțimea maximă a acestor bare poate fi controlată în continuare cu bar_max_value argument.
Treilea, text_size manipularea a fost remediată la aplicarea temei curente ggplot2. Acest lucru face ca scalarea textului să fie mai previzibilă atunci când utilizatorii personalizează temele complotului.
ship <- create_ship(
data_2024,
data_2025,
y = clicked,
labels = c("2024", "2025"),
text_size = 1.5
)
ship$plot(gender)


Instalare
Puteți instala TheseusPlot din CRAN cu:
install.packages("TheseusPlot")
Încearcă-l
TheseusPlot este util atunci când doriți să înțelegeți de ce valorile ratei diferă între două grupuri.
Exemplele tipice includ:
- rata de clic
- rata de conversie
- rata de retenție
- rata de succes
- rata de eroare
Pentru detalii, vă rugăm să consultați site-ul web al pachetului:
