Cu câteva zile în urmă, în sesiunea noastră de laborator, am discutat despre păduri aleatorii și, deoarece se baza pe exemplul din ISLR, am avut o discuție rapidă despre alegerea aleatorie a caracteristicilor și despre „(m=sqrt{ p})” regula

Interesant este că pe acela, putem juca puțin și încercam toate opțiunile și o facem din nou, pe o altă împărțire tren/test,
library(randomForest)library(ISLR2)set.seed(123)
sim = function
iar acum îl putem trasa, cu MSE pe setul de date de testare, în funcție de (m), numărul de caracteristici selectate, la fiecare nod
boxplot(t(M))


sau mai clar
vm=apply(M,1,mean)plot(2:12,vm,type="b",pch=19,ylim=c(10.5,15))abline(v=sqrt(12),col="red")


Chiar dacă aici, regula „(m=sqrt{p})” s-ar putea să nu fie optimă, putem vedea că folosind o pădure aleatoare în loc de o strategie de însacare, adică „()m
