(Acest articol a fost publicat pentru prima dată pe Florian Teschnerși cu amabilitate a contribuit la R-bloggeri). (Puteți raporta problema legată de conținutul acestei pagini aici)
Doriți să vă distribuiți conținutul pe R-bloggeri? dați clic aici dacă aveți un blog, sau aici dacă nu aveți.
Scurte sfaturi practice privind publicitatea în căutare:
-
Priviți dincolo de cuvintele cheie de marcă și categorie
Lucrarea arată „cuvinte cheie asociate” – termeni precum „licență”, „baterie”, „plăci” – sunt căutați cu 50-80 de zile înainte de cumpărare, au o probabilitate mare de cumpărare în categorii și costă semnificativ mai puțin decât termenii de marcă sau de categorie. -
Doar câteva zile de istoric de căutare îmbunătățește dramatic direcționarea
Modelele care utilizează 5 zile de istoric de căutare realizează o îmbunătățire cu 8-15 puncte procentuale în predicția conversiilor, comparativ cu direcționarea cu o singură interogare. Randamentele se diminuează rapid după 7 zile. -
Eficacitatea anunțurilor variază în funcție de etapa călătoriei și de tipul de cuvânt cheie
Cuvintele cheie ale mărcii funcționează cel mai bine la achiziție (creștere de 1,5x), dar cuvintele cheie asociate oferă o creștere semnificativă mai devreme în călătorie, când diferența dintre categorie și angajamentul de marcă este cea mai mare. -
Vizați „decalajul de angajament”
Cea mai mare oportunitate sunt persoanele angajate să cumpere în categorie, dar care nu s-au angajat încă pentru un anumit brand. Acest decalaj este cel mai mare la începutul călătoriei, care este exact locul în care agenții de publicitate cheltuiesc cel mai puțin în prezent.
Versiune lungă
O lucrare recentă a lui Rothschild, Needell, Veverka și Yom-Tov (2025) cartografiază călătoriile de conversie folosind un corpus masiv de interogări de căutare Bing. Ceea ce mi s-a părut interesant este cât de clar arată că agenții de publicitate își concentrează cheltuielile pe oameni care sunt deja probabil să cumpere, ignorând în același timp etapele anterioare ale călătoriei în care rentabilitatea marginală a reclamei ar putea fi mult mai mare.
Autorii introduc „cuvinte cheie asociate” – termeni care au legătură cu călătoria de conversie, dar nu cu produsele, mărcile sau categoriile de produse reale. Acești termeni reprezintă o oportunitate în mare măsură neexploatată de a viza persoanele care se angajează să cumpere din această categorie, dar înainte ca aceștia să se angajeze pentru o anumită marcă.
Constatări cheie
Lucrarea analizează trei categorii de produse: vehicule (mașini și camioane), laptopuri și telefoane. Iată ce au găsit:
| Categoria de produs | Creșterea anunțurilor la conversie |
|---|---|
| Vehicule | +7% |
| Laptop-uri | +22% |
| Telefoane | Nicio creștere vizibilă |
Autorii constată, de asemenea, că:
- Majoritatea călătoriilor de conversie sunt scurte și clare, dar unii utilizatori au călătorii în mai multe moduri (căutare timpurie, întrerupere, apoi achiziție)
- Agenții de publicitate concentrează foarte mult publicitatea la sfârșitul călătoriei, când utilizatorii sunt deja probabil să facă conversii
- Cuvintele cheie asociate apar frecvent și mai devreme în călătoria de conversie
- Cu 5 zile de istoric de căutare, precizia predicțiilor se îmbunătățește cu 8-15 puncte procentuale
Cuvinte cheie asociate explicate
Lucrarea definește cuvintele cheie asociate ca termeni care: (1) sunt legați de călătoria de conversie, (2) au o probabilitate mare de cumpărare în categoria de produse, (3) au probabilitate scăzută de cumpărare pentru orice produs specific, (4) au un cost mai mic decât termenii de categorie/marcă și (5) apar la începutul călătoriei.
Exemple din lucrare:
| Cuvânt cheie | Tip | Cost | Categoria Prob. | Brand Prob. | Zile înainte de cumpărare |
|---|---|---|---|---|---|
| Vad | Marca | 0,60 USD | 76% | 58% | 0 |
| camion | Categorie | 1,97 USD | 50% | 18% | 0 |
| licenţă | Asociat | 0,62 USD | 69% | 26% | -80 |
| baterie | Asociat | 1,06 USD | 71% | 19% | -85 |
Cuvintele cheie „licență” și „baterie” sunt căutate cu 2-3 luni înainte de cumpărare, indică o intenție mare de a cumpăra în categorie, dar nu vă angajați pentru nicio marcă anume – și costă o fracțiune din termeni de categorie precum „camion”.
simulare R
Permiteți-mi să simulez câteva dintre aceste perspective pentru a vizualiza oportunitatea.
library(ggplot2)
library(dplyr)
library(tidyr)
set.seed(42)
# --- Keyword types and their properties ---
# Based on Table 2 from the paper
keywords <- data.frame(
keyword = c("Ford", "Honda", "Toyota", "truck", "car", "license", "plates", "dmv", "battery"),
type = c("Brand", "Brand", "Brand", "Category", "Category", "Associated", "Associated", "Associated", "Associated"),
ad_cost = c(0.60, 0.70, 0.65, 1.97, 2.20, 0.62, 0.35, 0.40, 1.06),
category_prob = c(0.76, 0.80, 0.78, 0.50, 0.55, 0.69, 0.84, 0.75, 0.71),
brand_prob = c(0.58, 0.55, 0.50, 0.18, 0.10, 0.26, 0.60, 0.25, 0.19),
days_before_purchase = c(0, 0, 0, 0, 0, -80, 0, -60, -85),
stringsAsFactors = FALSE
)
# Calculate the "commitment gap"
keywords$gap <- keywords$category_prob - keywords$brand_prob
head(keywords)
keyword type ad_cost category_prob brand_prob days_before_purchase gap
Ford Brand 0.60 0.76 0.58 0 0.18
Honda Brand 0.70 0.80 0.55 0 0.25
Toyota Brand 0.65 0.78 0.50 0 0.28
truck Category 1.97 0.50 0.18 0 0.32
car Category 2.20 0.55 0.10 0 0.45
license Associated 0.62 0.69 0.26 -80 0.43
Slot: Oportunitatea asociată cu cuvinte cheie
ggplot(keywords, aes(x = days_before_purchase, y = gap,
size = ad_cost, color = type, label = keyword)) +
geom_point(alpha = 0.7) +
geom_text(hjust = -0.15, vjust = 0.5, size = 3) +
geom_hline(yintercept = 0, linetype = "dashed", color = "gray60") +
scale_x_continuous("Expected days before purchase") +
scale_y_continuous("Category - Brand probability gap") +
scale_size_continuous("Ad cost ($)", range = c(2, 8)) +
labs(title = "The Associated Keyword Opportunity",
subtitle = "High gap = likely to buy in category, but not committed to brand",
caption = "Keywords with high gap and early timing represent untapped opportunities") +
theme_minimal(base_size = 12) +
xlim(-90, 10)

Graficul arată ceea ce descrie lucrarea: cuvintele cheie asociate precum „licență”, „baterie” și „dmv” apar la începutul călătoriei (zile negative), au un decalaj mare între probabilitatea categoriei și a mărcii și costă semnificativ mai puțin decât termenii categoriei.
Precizia modelului cu istoricul căutărilor
Lucrarea arată că doar 5 zile de istoric de căutare îmbunătățește dramatic precizia predicțiilor. Lasă-mă să simulez asta:
# Diminishing returns model based on paper's findings
days_history <- c(0, 1, 2, 3, 5, 7, 14, 30, 60, 90)
base_accuracy <- 0.65
max_improvement <- 0.15 # 8-15 pp improvement from paper
accuracy_fn <- function(days) {
base_accuracy + max_improvement * (1 - exp(-0.3 * days))
}
model_accuracy <- data.frame(
days_history = days_history,
accuracy = sapply(days_history, accuracy_fn)
)
ggplot(model_accuracy, aes(x = days_history, y = accuracy)) +
geom_line(color = "#1f77b4", linewidth = 1.2) +
geom_point(color = "#1f77b4", size = 3) +
geom_vline(xintercept = 5, linetype = "dashed", color = "gray50") +
annotate("text", x = 5, y = 0.68, label = "5 days: ~85% of max benefit",
hjust = 1.1, vjust = 0, size = 3, color = "gray50") +
scale_x_continuous("Days of search history considered") +
scale_y_continuous("Model accuracy in predicting conversion",
labels = scales::percent, limits = c(0.60, 0.85)) +
labs(title = "Prediction Accuracy Improves with Search History",
subtitle = "Diminishing returns after ~5-7 days of context") +
theme_minimal(base_size = 12)


Perspectiva cheie aici este că cea mai mare parte a beneficiilor provine din doar câteva zile de context. După aproximativ 7 zile, istoricul suplimentar oferă o valoare suplimentară minimă.
Creșterea anunțurilor în funcție de etapa călătoriei
# Simulated ad lift by keyword type and journey stage
# Based on patterns described in the paper
journey_stage <- c("Early (>45 days)", "Mid (15-45 days)", "Late (<15 days)", "At purchase")
ad_lift_by_stage <- data.frame(
stage = journey_stage,
brand_keywords = c(1.15, 1.30, 1.45, 1.50),
category_keywords = c(1.05, 1.12, 1.25, 1.35),
associated_keywords = c(1.20, 1.18, 1.10, 1.05)
)
p4_long <- ad_lift_by_stage %>%
tidyr::pivot_longer(cols = c(brand_keywords, category_keywords, associated_keywords),
names_to = "keyword_type",
values_to = "lift") %>%
mutate(keyword_type = factor(keyword_type,
levels = c("associated_keywords", "category_keywords", "brand_keywords"),
labels = c("Associated", "Category", "Brand")),
stage = factor(stage, levels = c("Early (>45 days)", "Mid (15-45 days)", "Late (<15 days)", "At purchase")))
ggplot(p4_long, aes(x = stage, y = lift, fill = keyword_type, group = keyword_type)) +
geom_line(linewidth = 0.8) +
geom_point(size = 3.5, shape = 21, color = "white", stroke = 1.5) +
geom_hline(yintercept = 1.0, linetype = "dashed", color = "gray60") +
scale_y_continuous("Conversion lift multiplier", breaks = seq(1.0, 1.6, 0.1)) +
scale_fill_manual("Keyword type", values = c("#2ca02c", "#ff7f0e", "#1f77b4")) +
labs(title = "Ad Lift Varies by Keyword Type and Journey Stage",
subtitle = "Brand keywords strongest at purchase; Associated keywords valuable early") +
theme_minimal(base_size = 12) +
theme(axis.text.x = element_text(angle = 45, hjust = 1),
legend.position = "bottom")


Modelul de aici arată că cuvintele cheie ale mărcii funcționează cel mai bine la punctul de cumpărare, dar cuvintele cheie asociate oferă o creștere semnificativă la începutul călătoriei, când clientul este încă nehotărât cu privire la marcă.
Implicații pentru căutarea bazată pe LLM
Lucrarea se încheie cu o observație interesantă: pe măsură ce căutarea se îndreaptă către interfețele conversaționale bazate pe LLM, platformele vor avea mai mult context decât o singură interogare. Conversațiile în mai multe etape vor oferi semnale bogate despre locul în care se află un utilizator în călătoria sa de conversie.
Acest lucru ar putea schimba în mod semnificativ peisajul publicitar. Dacă platforma poate înțelege contextul dintr-o conversație și nu doar dintr-un cuvânt cheie, întregul model de direcționare trece de la „cine a căutat X” la „cine se află în etapa Y a călătoriei lor pentru categoria de produse Z”.
Limitări
Lucrarea recunoaște câteva limitări: folosește experimente observaționale și naturale mai degrabă decât RCT, se concentrează pe trei categorii de produse care sunt achiziționate de mai multe ori de-a lungul vieții și analizează datele de la Bing (care are o cotă de piață mai mică decât Google).
Simularea mea are limitări suplimentare: se bazează mai degrabă pe statistici rezumate publicate decât pe date brute, iar creșterea anunțurilor în funcție de etapă este mai degrabă ilustrativă decât estimată direct din lucrare.
La pachet
Cea mai utilă perspectivă pentru mine este „decalajul de angajament” – identificarea utilizatorilor care se angajează să cumpere în categorie, dar care nu s-au angajat încă față de o marcă. Aici cuvintele cheie asociate oferă cea mai mare valoare și acolo unde agenții de publicitate cheltuiesc cel mai puțin.
Dacă rulați campanii de căutare, luați în considerare:
- Identificarea cuvintelor cheie asociate din categoria dvs
- Testarea rentabilității acestora la începutul canalului
- Utilizarea istoricului minim de căutare (5-7 zile) pentru a îmbunătăți direcționarea fără costuri semnificative pentru confidențialitate
Resurse
Rothschild, DM, Needell, C., Veverka, J. și Yom-Tov, E. (2025). Căutarea călătoriilor de conversie și oportunitatea ratată a cuvintelor cheie asociate. Frontiers in Communication, 10:1560141.
