
Slide-uri: https://jakubnowosad.com/rome2025
Inregistrare video: https://youtu.be/uZe7thh80MI
Cod reproductibil: https://jakubnowosad.com/rome2025/index.R
Cartografierea predictivă geospațială este o sarcină comună în multe domenii, având ca scop producerea de suprafețe continue din observații punctuale și predictori spațiali. Există mulți algoritmi disponibili pentru a îndeplini această sarcină, de la metode simple de interpolare la modele complexe de învățare automată și o varietate de pachete R implementează aceste metode. Astfel, producerea unei hărți din puncte este ușoară, dar înțelegerea cât de fiabilă este acea hartă este mult mai dificilă.
În discursul meu de la Roma R Users Group (27 noiembrie 2025), am prezentat fluxuri de lucru practice R pentru generarea și evaluarea predicțiilor spațiale. Folosind date despre bogăția speciilor de plante din America de Sud, am comparat metode precum ponderarea distanței inverse, Kriging obișnuit și universal și Păduri aleatorii. Aceste abordări produc adesea hărți atractive din punct de vedere vizual, dar pot induce în eroare. Problemele comune includ predicții nerealiste în afara intervalelor de valori observate, predicții pentru medii care nu sunt reprezentate în datele de antrenament și metrici de precizie prea optimiste atunci când punctele de antrenament și de testare sunt grupate spațial.
Pentru a rezolva aceste probleme, m-am concentrat pe două instrumente complementare:
- kNN Distance Matching (kNNDM), o metodă de validare încrucișată adaptivă la domeniul predicției, care remodelează pliurile de validare, astfel încât datele păstrate să semene cu zone „nevăzute”. Acest lucru reduce distorsiunea de evaluare cauzată de eșantionarea datelor și oferă estimări de performanță mai realiste.
- Zona de aplicabilitate (AoA), care identifică locații ale căror condiții de mediu diferă de datele de antrenament. Mascarea sau evidențierea acestor regiuni ajută la comunicarea unde predicțiile sunt mai mult sau mai puțin de încredere.
Împreună, kNNDM și AoA mută accentul de la acuratețea centrată pe model la înțelegerea domeniului de predicție: unde se poate avea încredere în model și cât de bine sunt cuantificate erorile sale în acel domeniu.
Citare
citat BibTeX:
@online{nowosad2025,
author = {Nowosad, Jakub},
title = {R for {Geospatial} {Predictive} {Mapping:} {Takeaways} from
the {Talk}},
date = {2025-12-01},
url = {https://jakubnowosad.com/posts/2025-12-01-rome-talk/},
langid = {en}
}
Pentru atribuire, vă rugăm să citați această lucrare ca:
Nowosad, Jakub. 2025. „R pentru cartografierea predictivă geospațială: concluzii din discuție.” 1 decembrie 2025. https://jakubnowosad.com/posts/2025-12-01-rome-talk/.
