Scopul acestei postări este de a utiliza modele de serii de timp pentru a prezice lungimea conclavelor papale.
Un conclav este un vot secret care are loc pentru a alege un nou papă. Conclavele sunt toate furia acum. Nu numai că a fost filmul Conclav Lansat în 2024, dar cel mai recent conclav a început la 7 mai 2025 după moartea Papei Francisc și s -a încheiat la alegerea lui Leo XIV.
Chiar și statisticienii au devenit interesați. Un articol recent în Semnificaţie Revista folosește tehnici de analiză a supraviețuirii pentru a estima cât va fi domnia lui Leo (mediana posterioară este de 13,9 ani).
Mă interesează o altă întrebare: putem prezice cât va dura conclavul? Conform unui articol CBS
Nu există nicio modalitate de a prezice cât timp va dura un conclav, dar poate fi luate îndrumări din istoria recentă.
Sună ca un loc de muncă pentru modelele de serii de timp! Din păcate, nu mai devreme nu am obținut datele decât a fost ales noul Papa, așa că nu am avut timp să fac o predicție. Dar presupun că putem prezice următorul Conclav.
O mulțime de date interesante despre papi și cardinali sunt disponibile pe catolic-hierarchy.org. Am răzuit un set de date de conclave și am reprezentat lungimea în zilele fiecărui conclav din 1404.

În mod depășit, nici numărul de cardinali care au votat, vârsta medie a cardinalilor, nici timpul de la ultimul conclav nu au o mare relație cu durata conclavului în zile. Deci, $ x $ -axis de pe grafic arată numărul ordinal al Conclavului (de la 1 la 64).
Este foarte clar că variația lungimilor conclavelor nu este stabilă în timp. Așadar, avem nevoie de un fel de model care să țină seama de heteroskedasticitate.
Modelul Ingarch
Deoarece avem date de număr valorite întregi, prima mea idee a fost să folosesc un model Ingarch. Am întâlnit pentru prima dată aceste modele când mi s -a cerut să modelez numărul de cazuri de o anumită boală. Autorii precedenți au folosit modele ARIMA, care produc intervale de încredere care includ valori negative, care nu au neapărat sens pentru datele de numărare. Modelele Ingarch oferă o alternativă.
Modelele Ingarch sunt implementate în pachetul TSCOUNT R. Cea mai bună familie model pentru date de numărare este de obicei binomială negativă. Modelul Ingarch (1,1) presupune că parametrul de overdispersion $ phi $ este fixat, iar media $ lambda $ urmează un proces al formularului
( lambda_t = beta_0 + beta_1 y_ {t-1} + alpha_1 lambda_ {t-1} )
Pentru unele $ beta_0, beta_1, alpha_1 in mathbb {r} $.
Următorul cod R poate fi utilizat pentru a se potrivi modelului pentru a fi din ce în ce mai lungi seguri inițiale ale seriei de timp și pentru a prezice lungimea următorului Conclav în secvență.
conclave <- read.csv("conclave_data.csv") tsglm_models <- list() for (i in 10:length(z)){ tsglm_models((i)) <- tsglm(ts=ts(conclave$n_days(1:i)), model=list(past_obs=1, past_mean=1), distr="nbinom", link="identity") } tsglm_models <- tsglm_models(!sapply(tsglm_models, is.null)) predict_next_value <- function(model){ pred <- predict(model, 1) CI <- pred$interval } # 95% intervals (the default) CIs <- lapply(tsglm_models(!is.null(tsglm_models)), predict_next_value)
Am reprezentat rezultatele pe o scară de jurnal, deoarece unele dintre intervale sunt extrem de largi. (Rețineți că o limită mai mică de zero nu are sens pe o scară de jurnal, așa că am lăsat -o.)


Intervalul de predicție de 95% pentru lungimea în zilele Conclavului 2025 este $ (0, 22) $, iar predicția pentru următorul Conclav (ori de câte ori se întâmplă acest lucru) este $ (0, 17) $.
Modelul Garch
Dacă luați jurnalul lungimilor conclavelor (ca în complotul anterior) și complotați diferențele, primiți următorul complot


Chiar dacă aceasta este o serie de timp destul de scurtă, este clar că variația nu este constantă. Modelul natural pentru acest tip de situație este modelul Garch.
Puteți încadra un model GARCH (1,1) la „Returnarea jurnalului” a seriei de lungimi conclave folosind următorul cod R.
library(fGarch) z <- diff(log(conclave$n_days)) garch_models <- list() for (i in 10:length(z)){ garch_models((i+1)) <- garchFit(~1+garch(1,1),data=z(1:i),trace=F) } garch_models <- garch_models(!sapply(garch_models, is.null)) predict_next_value <- function(model){ pred <- predict(model, n.ahead=1) CI <- pred$meanForecast + 1.96 * pred$standardDeviation * c(-1, 1) } # confidence interval for the next value of z CI_z <- lapply(garch_models(!is.null(garch_models)), predict_next_value) # confidence interval for the next value of n_days CI_garch <- sapply(CI_z, exp) * matrix(rep(conclave$n_days(11:64), 2), nrow=2, byrow=T)
Din complotul de mai jos, este clar că predicțiile Garch sunt mult mai sensibile la evenimentele recente decât predicțiile Ingarch. Cu toate acestea, întregul punct al lui Garch este că modelul ține cont și de faptul că perioadele de mare variație au avut loc în trecut.


Intervalul de predicție de 95% pentru lungimea în zilele Conclavului 2025 este $ (0,1, 5,1) $, iar predicția pentru următorul Conclav este $ (0,1, 4,4) $.
Următorul complot compară cele două modele. Pe o scară de jurnal, nu există prea multe de ales între ele. Personal, cred că prefer modelul Garch. Până la urmă, datele nu sunt cu adevărat discrete. Faptul că este vorba despre datele de numărare este doar un artefact de rotunjire până la cea mai apropiată zi.


Concluzie
Chiar dacă „nu există nicio modalitate de a prezice cât va dura un conclav”, o anumită analiză a seriei de timp brute sugerează că următorul conclav poate fi de așteptat să dureze între 0 și 5 zile (sau 0 și 17 zile dacă preferați modelul Ingarch). Când se va întâmpla? Din Semnificaţie Articol, probabil 10-20 de ani în viitor.
Și, desigur, densitatea papilor din Vatican City este probabil să rămână constantă la puțin peste cinci papi pe mile pătrate!