Ajustarea și estimarea modelelor au evoluat de la extrapolare simplă la cadre de modelare probabilistică sofisticate. În știința datelor contemporane, factorii de decizie necesită mai mult decât estimări, nevoia de declarații clare despre probabilitate, risc și incertitudine sunt esențiale pentru luarea deciziilor corecte. Cu toate acestea, în ciuda progreselor în modelarea predictivă, există o limitare persistentă a luării de decizii rapide și robuste din probabilitățile estimate. Estimările nu sunt adesea interpretate în mod semnificativ. Aici funcția odds_summary devine importantă din punct de vedere strategic. Acesta convertește rezultatele probabilistice în rezumate structurate care susțin direct:
În termeni practici, transformă numerele în dovezi.
model Un obiect R al estimărilor din modelele acoperite. Deocamdată sunt acoperite doar modelele glm, multimon și polr.
lot2 <- glm(lot2 ~ log(u), data = clotting, family = Gamma)
modelsummary::datasummary_df(odds_summary(lot2))
Variabile
Coeficient
Eroare std
valoarea t
valoarea p
Coef Sig
Rata_cote
%
Cote Sig
CI_inferioară
CI_sus
(Intercepta)
-0,02
0,00
-18.02
0,00
-0,024***
0,98
-2,36
0,976***
0,97
0,98
log(u)
0,02
0,00
40,92
0,00
0,024***
1.02
2.39
1.024***
1.02
1.03
x <- rnorm(100)
y <- rpois(100, exp(1 + x))
lm2 <- glm(y ~ x, family = quasi(variance = "mu", link = "log"))
modelsummary::datasummary_df(odds_summary(lm2))
Variabile
Coeficient
Eroare std
valoarea t
valoarea p
Coef Sig
Rata_cote
%
Cote Sig
CI_inferioară
CI_sus
(Intercepta)
0,92
0,06
14.45
0,00
0,915***
2.50
149,71
2.497***
2.20
2,82
x
1.05
0,04
29.75
0,00
1,053***
2,87
186,74
2.867***
2,67
3.07
lm3 <- glm(y ~ x, family = poisson)
modelsummary::datasummary_df(odds_summary(lm3))
Variabile
Coeficient
Eroare std
valoarea t
valoarea p
Coef Sig
Rata_cote
%
Cote Sig
CI_inferioară
CI_sus
(Intercepta)
0,92
0,07
13.56
0,00
0,915***
2.50
149,71
2.497***
2.18
2,84
x
1.05
0,04
27.92
0,00
1,053***
2,87
186,74
2.867***
2,66
3.09
Model logistic multinomial
Pentru regresia logistică multinomială, fiecare măsură este un data.frame, deci rezumatul este o listă de cadre de date. Rezumatul este pentru fiecare dintre nivelurile variabilei dependente.