
(Acest articol a fost publicat pentru prima dată pe blogul pharmaverseși cu amabilitate a contribuit la R-bloggeri). (Puteți raporta problema legată de conținutul acestei pagini aici)
Doriți să vă distribuiți conținutul pe R-bloggeri? dați clic aici dacă aveți un blog, sau aici dacă nu aveți.
Există o versiune a poveștii AI-in-pharma care spune astfel: LLM-urile sunt instruite pe cantități mari de cod R, astfel încât să poată scrie programe ADaM la cerere. Pachete ca
Datele de referință de la pharma-skills spun o poveste diferită.
Ce face de fapt un agent necalificat
Când unui agent de codare AI i se cere să obțină un set de date ADAE fără acces la derive_var_trtemfl() sau derive_vars_merged() cu parametrii corecti. În mai multe execuții de referință, agenții necalificați au căzut în două moduri de eșec consecvente: fie generând date sintetice decât să utilizeze seturi de date de referință pharmaverse, fie scrieți la comandă dplyr conducte care au reimplementat logica
Un exemplu de benchmarking BDS este deosebit de grăitor. Fără îndrumări de calificare, agenții au folosit în mod constant derive_vars_merged() unde derive_vars_merged_lookup() a fost necesar pentru atribuirea codului de parametru. Ambele funcții există în derive_vars_merged() elimină în mod silențios înregistrările nepotrivite, producând un set de date cu un număr de rânduri greșit. Nici un avertisment. Fără accident. Doar ieșire greșită care trece printr-o recenzie obișnuită.
Aceasta nu este o problemă de calitate a modelului. Este o problemă de cunoaștere. Modelul nu știe ce știe comunitatea farmaceutică.
Pachetul ca specificație
derive_vars_dtm() cu steaguri de imputare corecte, ei nu scriu doar cod R. Ei implementează o specificație care a fost revizuită, validată și documentată.
Un LLM instruit pe codul R general nu moștenește în mod fiabil această specificație. S-a văzut parse_dtc_datetime() funcția folosind substr() şi as.POSIXct() — mai degrabă decât să suni derive_vars_dtm() — nu era leneș. Făcea tot posibilul cu ceea ce știa. Cea mai bună nu a fost suficient de bună, iar erorile pe care le-a introdus au fost în cazurile marginale care contează cel mai mult într-o prezentare clinică.
Ce face priceperea
The
Rezultatele de referință reflectă acest lucru în mod direct. În ADSL, ADAE, ADVS și ADLB:
- Cu pricepere: 88–100% rate de trecere pe domenii
- Fără îndemânare: 17–59% rate de promovare, cu varianță mare
Acea variație în condiția necalificată contează la fel de mult ca și media. Ieșirea inconsecventă nu este un proces susținut într-un context GxP. Un agent ghidat de abilități produce consecvență, urmărire,
Ancora Responsabilității
Există aici o dimensiune de reglementare care depășește calitatea codului. O transmitere clinică trebuie să urmărească derivațiile sale la metode validate, versiuni, documentate. O conductă personalizată generată de LLM – oricât de funcțională – nu are o astfel de ancoră. derive_var_trtemfl() dintr-o versiune fixată a
Acesta este motivul pentru care proiectul pharma-skills încadrează abilitățile nu ca șabloane prompte, ci ca artefacte de cunoștințe de domeniu. Scopul nu este de a face AI să scrie mai mult cod R. Este pentru a face AI să scrie
Ultima actualizare
2026-06-14 18:52:36.863336
Detalii
Reutilizați
Citare
citare BibTeX:
@online{dickinson2026,
author = {Dickinson, Jeff},
title = {Why We Still Need {Admiral} in an Age of {AI}},
date = {2026-06-14},
url = {https://pharmaverse.github.io/blog/posts/2026-06-14_admiral_in_age_of_ai/admiral_in_age_of_ai.html},
langid = {en}
}
Pentru atribuire, vă rugăm să citați această lucrare ca:
Dickinson, Jeff. 2026. „De ce avem încă nevoie de {Amiral} într-o era a inteligenței artificiale.” 14 iunie 2026. https://pharmaverse.github.io/blog/posts/2026-06-14_admiral_in_age_of_ai/admiral_in_age_of_ai.html.