Agenții AI au loc în viziunea Microsoft pentru viitor
Ceva de așteptat cu nerăbdare: Oricât de interesant ar fi lumea modelelor de limbaj mare, este clar că industria tehnologică se deplasează rapid și dincolo de capacitățile instrumentelor actuale Genai pentru a intra într-o nouă fază axată pe agenții alimentate de AI. În cadrul evenimentului Microsoft Build axat pe dezvoltatori, compania a făcut ca următoarea etapă în evoluția AI evidentă printr-o gamă largă de anunțuri care indică modul în care agenții software pot extinde capacitățile LLM în aplicații mai sofisticate și de anvergură.
BuzzWord Microsoft folosit la Build a fost „Web agentic”. Cu toate acestea, oportunitățile bazate pe agent pe care compania le-a descris nu se limitează la aplicațiile web sau la cloud-se extind și la Windows și la alte medii bazate pe clienți.
În construirea viziunii sale pentru agenți, Microsoft a introdus o varietate de instrumente pentru dezvoltatori pentru a crea cu ușurință agenți și a dezvăluit mai multe noi pre -construite. De asemenea, compania a discutat despre capacitățile de organizare și orchestrare a acțiunilor mai multor agenți. Mai ales, Microsoft a introdus mecanisme pentru tratarea agenților ca „angajați digitali” – completate cu identități și drepturi de acces gestionate prin intermediul cadrului de identitate digitală și de autentificare al companiei Entra.
Pe frontul de dezvoltare, Microsoft a debutat agentul de codificare Github Copilot, conceput pentru a eficientiza crearea de aplicații și agenți AI. Descris ca „un partener agent”, agentul de codificare a copilotului a fost asemănat cu un coleg care poate ajuta cu părți ale unui proiect de dezvoltare, cum ar fi refactorizarea codului vechi sau remedierea erorilor.
Pentru non-programatori, Microsoft a prezentat, de asemenea, un set de instrumente cu cod redus/fără cod pentru crearea de agenți, inclusiv Copilot Studio. În plus, compania a introdus conceptul de agenți de utilizare a computerului (Cuas), care poate efectua acțiuni pe un ecran de computer, așa cum ar face un om. CUA -urile sunt capabile să interacționeze cu site -urile și aplicațiile în moduri care nu sunt posibile doar prin API -uri tradiționale.
Odată cu lansarea reglării copilotului, Microsoft facilitează utilizatorilor să regleze LLM-urile existente folosind propriul conținut, permițând crearea de agenți personalizați adaptați la sarcini specifice. De exemplu, un agent ar putea învăța să scrie în stilul unei persoane sau să încorporeze cunoștințele specializate ale unei organizații în generarea de conținut. Această capacitate deschide noi posibilități pentru o gamă mai largă de utilizatori.
Conceptual, acest lucru este similar cu ideea unui instrument personal de zdrență (generare de regăsire-augmentată), un concept care a atras atenția în ultimul an, dar niciodată nu a fost destul de mare. Abordarea bazată pe agentul Microsoft prin reglarea copilotului simplifică procesul, permițând utilizatorilor să selecteze documentele pentru a mări setul de instruire al modelului-potențialul de a face un impact mai mare.
Una dintre temele cheie pe care Microsoft a subliniat -o la Build a fost modul în care coordonarea mai multor agenți poate debloca capacități și mai puternice. Compania a prezentat mecanisme de orchestrare pentru conectarea și sincronizarea acțiunilor diferitelor agenților. În Copilot Studio, de exemplu, dezvoltatorii pot conecta mai mulți agenți pentru a gestiona sarcini mai complexe în colaborare.
Poate că cel mai izbitor anunț a fost capacitatea de a înregistra agenți în cadrul Entra. Acest detaliu aparent minor are implicații semnificative – crește efectiv software -ul autonom în rolul unui angajat digital.
În timp ce implementarea din lumea reală și limitările acestor „angajați digitali” rămân de văzut, faptul că acest concept este sub o considerație serioasă subliniază cât de inovatoare-și potențial perturbatoare-ar putea deveni AI bazată pe agenți. În special, CEO -ul NVIDIA, Jensen Huang, a vorbit și despre agenții digitali ca angajați în nota sa cheie la Computex, subliniind un impuls mai larg al industriei din spatele ideii.
Microsoft a făcut, de asemenea, mai multe anunțuri în ceea ce privește dezvoltarea standardelor. Compania a aprobat puternic atât standardele de protocol de context (MCP), cât și agent-agent (A2A). MCP oferă o metodă unificată pentru interacțiunea cu LLM -urile pe diferite modele și medii, în timp ce A2A definește un protocol comun pentru comunicarea și colaborarea agentului.
În conformitate cu această abordare deschisă, Microsoft a anunțat un sprijin mai larg al modelului în majoritatea instrumentelor sale de dezvoltare. În timp ce compania nu și -a lansat în mod oficial propriile LLM -uri – în afară de familia Phi de modele de limbă mică (SLM) – includerea a sute de modele în Azure AI Foundry sugerează că Microsoft se îndepărtează de dependența inițială de OpenAI și îmbrățișează o mai mare diversitate a modelului. Nu ar fi surprinzător dacă Microsoft își introduce propria familie de LLMS în viitorul apropiat.
Pentru dezvoltatorii Windows, Microsoft a introdus mai multe funcții noi pentru a simplifica construirea și rularea agenților și aplicațiile AI pe PC -uri. Aceste instrumente sunt concepute pentru a folosi siliciul divers acum disponibil acum în Copilot+ PC -uri. Windows Foundry – succesorul Windows ML Runtime – abordează o provocare cheie: susținerea arhitecturilor variate NPU și GPU de la Qualcomm, Intel, AMD și NVIDIA. Prin furnizarea unui strat de traducere care optimizează codul aplicației pentru hardware-ul disponibil, Windows Foundry ar trebui să încurajeze mai multă dezvoltare a aplicațiilor Windows-accelerate de AI.
Microsoft a introdus, de asemenea, turnătoarea locală, care extinde gama de modele pe care dezvoltatorii le pot utiliza și acceptă integrarea cu platforme externe, cum ar fi NIMS NVIDIA. Datorită recent anunțată de NVIDIA Tensorrt pentru PC-urile RTX, dezvoltatorii pot rula acum aplicații CUDA pe PC-uri cu GPU-uri NVIDIA RTX, deschizând încă un mecanism pentru aducerea aplicațiilor AI-accelerate la PC-uri.
În cele din urmă, cu asistența MCP în Windows 11, agenții AI pot servi acum ca intermediari în diferite aplicații înregistrate ca servere MCP. Aceasta deschide ușa către automatizarea fluxurilor de lucru complexe, cu mai multe etape, pe mai multe aplicații. În timp ce acest lucru va începe probabil pe un singur computer, MCP permite, de asemenea, distribuirea sarcinilor în diverse medii – deschizând calea pentru aplicații AI avansate, hibride.
Ca și în cazul majorității evenimentelor Microsoft Build, volumul pur de anunțuri poate fi copleșitor.
Ceea ce devine din ce în ce mai clar este faptul că agenții – și instrumentele și protocoalele care le permit – se impun într -o nouă eră a dezvoltării AI. Acești agenți de ultimă generație se deplasează dincolo de chatbots și spre aplicații AI mai puternice și structurate. Ei chiar pun bazele pentru „colegii” digitali care ar putea modela dramatic modul în care organizațiile funcționează și cum se termină munca.
Bob O’Donnell este fondatorul și analistul șef al Technisy Research, LLC O firmă de consultanță tehnologică care oferă servicii de consultanță strategică și cercetare de piață industriei tehnologice și comunității financiare profesionale. Îl poți urma pe x @bobodtech