(Acest articol a fost publicat pentru prima dată pe R – Win Vector LLCși a contribuit cu drag la R-Bloggers). (Puteți raporta problema despre conținutul de pe această pagină aici)
Doriți să vă împărtășiți conținutul pe R-Bloggers? Faceți clic aici dacă aveți un blog sau aici dacă nu.
Am efectuat recent o sesiune de atelier de serii de timp pentru AI+ pentru AI+ găzduită de ODSC. A mers foarte bine și aș fi fericit să ofer ateliere interactive mai lungi (vă rugăm să vă adresați dacă echipa dvs. ar dori una!).
Unul dintre exemplele pe care le -am împărtășit a fost derivat din graficul următor prezentat în creșterea incredibilă a Python pe Stack Overflow.
În acest grafic, axa x este data (pe lună), axa y este ceea ce procentul din vizualizările de întrebări de preaplin a stivei sunt în fiecare dintre curbele etichetate. Graficele lansate ulterior par a fi formarea de întrebări, nu vizualizări. Toate datele anterioare lunii septembrie 2017 s -au întâmplat când a fost pregătit graficul și tot ce a trecut această dată este o proiecție în viitor.
Întrebarea a fost: Cât de rezonabil a fost această predicție de la sfârșitul anului 2017? Răspunsul a fost: destul de rezonabil, o metodologie bună (sezonieră cu loess), o durată de predicție rezonabilă (mai scurtă decât perioada de antrenament), şi Datele viitoare conexe au sfârșit prin a se potrivi cu predicția la sosirea acesteia.
În discuția mea am menționat, de asemenea, potrivirea unui model mai radical, cum ar fi modelul de difuzie a produsului de bas. Așa cum am menționat anterior, modelul de bas este radical, prin faptul că acesta presupune Toate lucrurile se termină (și de multe ori destul de curând, cu sau fără dovezi).
Am jucat cu câteva metodologii de montare și m -am instalat pe utilizarea Stan pentru a face o inferență Bayesiană completă asupra parametrilor modelului din datele anterioare. Acest lucru pare a fi mai puțin părtinitor decât metodele de transformare potrivite și neliniare pe care le-am folosit înainte. Ideea de la Sanjiv Ranjan Das, Știința datelor: teorii, modele, algoritmi și analize Este esențial să se potrivească relația dintre evenimente și evenimente cumulate. Diferitele curbe de bas sunt atât de similare, încât curba care se potrivește prin punctele orientate spre timp nu constrânge puternic parametrii dedusi.
Acest lucru îmi permite să pregătesc următorul grafic. În acest grafic, fiecare curbă este un model care se potrivește pe date înainte de o dată dată. Și toate predicțiile diferite sunt linii diferite. În acest caz, chiar și modelul de bas prezice creșterea viitoare până când observațiile din apropierea Introducerii ChatGPT devin disponibile.
Aceasta nu este o potrivire perfectă. Dar este interesant și evocator modul în care modelele ulterioare încep să digere tendințele în schimbare. Nu trebuie să se potrivească pe deplin un model de bas pentru creșterea cunoscută. Este suficient să știi acolo sunt tendințe comune (cum ar fi modelul de bas sau curba S) care Uite Ca o creștere exponențială, până nu sunt.
Codul R și datele pentru a produce aceste grafice este aici.