Explorarea unui set de date sintetic 3-D

(Acest articol a fost publicat pentru prima dată pe John Russellși a contribuit cu drag la R-Bloggers). (Puteți raporta problema despre conținutul de pe această pagină aici)

Doriți să vă împărtășiți conținutul pe R-Bloggers? Faceți clic aici dacă aveți un blog sau aici dacă nu.

Pe Bluesky, am lucrat prin câteva provocări. Pentru lunile februarie și martie, am participat la Dubois Challenge, unde aveți nevoie de o săptămână pentru a recrea unele dintre vizualizările puternice care au ieșit din Expoziția de la Paris de la Web du Bois. Munca mea acolo, completată cu cod, poate fi găsită în github -ul meu

Inspirat de acest lucru, am făcut și #30dayChartChallenge, unde faci o diagramă pe zi pe o temă care se schimbă în fiecare zi. Am considerat acest lucru ca o ocazie de a explora pachetul Histdata al lui Michael Friendly, care scoate din cartea sa excelentă cu Howard Wainer. Am făcut postări despre John Snow, The Trial of the Pyx, Florence Nightingale și alții pe Github -ul meu. Cu toate acestea, un set de date la care un complot simplu nu face justiție este setul de date de polen. Acest set de date, cum ar fi mtcars şi flightssunt seturi de date sintetice care au fost utilizate ca provocări ale datelor (celelalte două sunt acum seturi de date de bază pentru represalii).

Acest set de date arată însă puterea plotly.

Cod în r

library(tidyverse)
library(HistData)
library(plotly)

data("Pollen")
head(Pollen)

# A tibble: 6 × 5
  ridge   nub crack  weight density
          
1 -2.35  3.63  5.03  10.9     -1.39
2 -1.15  1.48  3.24  -0.594    2.12
3 -2.52 -6.86 -2.80   8.46    -3.41
4  5.75 -6.51 -5.15   4.35   -10.3 
5  8.75 -3.90 -1.38 -14.9     -2.42
6 10.4  -3.16 12.8  -14.9     -6.49

Primele trei variabile sunt menite să fie reprezentate pe axa X, Y și Z, unde celelalte variabile sunt menite să descrie boabele de polen. Efectuarea unei corelații rapide arată că există cel puțin o corelație puternică care poate fi văzută prin utilizarea culorii, unde greutatea este foarte corelată cu axa X.

Cod în r

res <- cor(Pollen)
round(res,2)

        ridge   nub crack weight density
ridge    1.00  0.13 -0.13  -0.90   -0.57
nub      0.13  1.00  0.08  -0.17    0.33
crack   -0.13  0.08  1.00   0.27   -0.15
weight  -0.90 -0.17  0.27   1.00    0.24
density -0.57  0.33 -0.15   0.24    1.00

Cu toate acestea, atunci când complotați setul de date, apare altceva. Din fericire, plotly Vă permite să trageți un complot pentru a -l explora.

Cod în r

plot_ly(Pollen, x = ~ridge, y = ~nub, z = ~crack)  |> 
  add_markers(color = ~weight, size=2) |> 
  layout(title="David Coleman's Synthetic Pollen Dataset")|>
  config(displayModeBar=FALSE)

Explorarea unui set de date sintetic 3-D

LĂSAȚI UN MESAJ Renunțați la răspuns