AI-agenter fortsätter att ta fart när företag använder kraften i generativ AI för att återuppfinna kundupplevelser och automatisera komplexa arbetsflöden. Vi ser Amazon Berggrundsagenter tillämpas i investeringsanalys, behandling av försäkringsfordringar, analys av grundorsaker, reklamkampanjer och mycket mer. Agenter använder resonemangsförmågan hos grundmodeller (FM) för att dela upp användarbegärda uppgifter i flera steg. De använder instruktioner från utvecklaren för att skapa en orkestreringsplan och genomföra den planen genom att säkert anropa företagets API:er och komma åt kunskapsbaser med hjälp av Retrieval Augmented Generation (RAG) för att korrekt hantera användarens begäran.
Även om organisationer ser fördelen med agenter som är definierade, konfigurerade och testade som hanterade resurser, har vi alltmer sett behovet av ett ytterligare, mer dynamiskt sätt att anropa agenter. Organisationer behöver lösningar som anpassar sig i farten – oavsett om de ska testa nya tillvägagångssätt, svara på ändrade affärsregler eller anpassa lösningar för olika kunder. Det är här det nya inline-agenter kapacitet i Amazon Bedrock Agents blir transformerande. Det låter dig dynamiskt justera din agents beteende under körning genom att ändra dess instruktioner, verktyg, skyddsräcken, kunskapsbaser, uppmaningar och till och med de FM:er som den använder – allt utan att omdistribuera din applikation.
I det här inlägget utforskar vi hur man bygger en applikation med Amazon Bedrock inline-agenter, och visar hur en enskild AI-assistent kan anpassa sina kapaciteter dynamiskt baserat på användarroller.
Inline-agenter i Amazon Bedrock Agents
Denna runtime-flexibilitet som möjliggörs av inline-agenter öppnar kraftfulla nya möjligheter, som:
- rapid prototyping – Inline-agenter minimerar de tidskrävande skapa/uppdatera/förbereda cykler som traditionellt krävs för agentkonfigurationsändringar. Utvecklare kan omedelbart testa olika kombinationer av modeller, verktyg och kunskapsbaser, vilket dramatiskt påskyndar utvecklingsprocessen.
- A/B-testning och experiment – Datavetenskapsteam kan systematiskt utvärdera olika modell-verktygskombinationer, mäta prestandamått och analysera svarsmönster i kontrollerade miljöer. Detta empiriska tillvägagångssätt möjliggör kvantitativ jämförelse av konfigurationer innan produktionsinstallation.
- Prenumerationsbaserad anpassning – Mjukvaruföretag kan anpassa funktioner baserat på varje kunds prenumerationsnivå, vilket ger mer avancerade verktyg för premiumanvändare.
- Persona-baserad datakälla integration – Institutioner kan justera innehållets komplexitet och ton baserat på användarens profil, tillhandahålla personanpassade förklaringar och resurser genom att ändra kunskapsbaserna som är kopplade till agenten i farten.
- Dynamiskt val av verktyg – Utvecklare kan skapa applikationer med hundratals API:er och snabbt och exakt utföra uppgifter genom att dynamiskt välja en liten delmängd av API:er som agenten ska överväga för en given begäran. Detta är särskilt användbart för stora SaaS-plattformar (Software as a Service) som behöver skalning med flera klienter.
Inline-agenter utökar dina alternativ för att bygga och distribuera agentlösningar med Amazon Bedrock Agents. För arbetsbelastningar som kräver hanterade och versionerade agentresurser med en förutbestämd och testad konfiguration (specifik modell, instruktioner, verktyg och så vidare), kan utvecklare fortsätta att använda InvokeAgent på resurser som skapats med CreateAgent. För arbetsbelastningar som kräver dynamiska körningsbeteendeförändringar för varje agentanrop, kan du använda den nya InvokeInlineAgent API. Med båda tillvägagångssätten kommer dina agenter att vara säkra och skalbara, med konfigurerbara skyddsräcken, en flexibel uppsättning modellinferensalternativ, inbyggd tillgång till kunskapsbaser, kodtolkning, sessionsminne och mer.
Lösningsöversikt
Vårt exempel på HR-assistent visar hur man bygger en enda AI-assistent som anpassar sig till olika användarroller med hjälp av de nya inline-agentfunktionerna i Amazon Bedrock Agents. När användare interagerar med assistenten konfigurerar assistenten dynamiskt agentfunktioner (som modell, instruktioner, kunskapsbaser, åtgärdsgrupper och skyddsräcken) baserat på användarens roll och deras specifika val. Detta tillvägagångssätt skapar ett flexibelt system som justerar dess funktionalitet i realtid, vilket gör det mer effektivt än att skapa separata agenter för varje användarroll eller verktygskombination. Den fullständiga koden för detta exempel på HR-assistent finns tillgänglig på vår GitHub repo.
Detta dynamiska verktygsval möjliggör en personlig upplevelse. När en anställd loggar in utan direktrapporter ser de en uppsättning verktyg som de har tillgång till baserat på sin roll. De kan välja mellan alternativ som att begära semester, kontrollera företagspolicyer med hjälp av kunskapsbasen, använda en kodtolk för dataanalys eller skicka in kostnadsrapporter. Den inbyggda agentassistenten konfigureras sedan med endast dessa utvalda verktyg, vilket gör att den kan hjälpa medarbetaren med sina valda uppgifter. I ett verkligt exempel skulle användaren inte behöva göra valet, eftersom programmet skulle fatta det beslutet och automatiskt konfigurera agentanropet vid körning. Vi gör det explicit i denna ansökan så att du kan visa effekten.
På samma sätt, när en chef loggar in på samma system, ser de en utökad uppsättning verktyg som återspeglar deras ytterligare behörigheter. Förutom verktygen på medarbetarnivå har chefer tillgång till funktioner som att köra prestationsrecensioner. De kan välja vilka verktyg de vill använda för sin nuvarande session och omedelbart konfigurera inline-agenten med sina val.
Införandet av kunskapsbaser anpassas också utifrån användarens roll. Anställda och chefer ser olika nivåer av företagspolicyinformation, där chefer får ytterligare tillgång till konfidentiell information som prestationsgranskning och ersättningsinformation. För denna demo har vi implementerat metadatafiltrering att endast hämta rätt nivå av dokument baserat på användarens åtkomstnivå, vilket ytterligare förbättrar effektiviteten och säkerheten.
Låt oss titta på hur gränssnittet anpassar sig till olika användarroller.
Medarbetarvyn ger åtkomst till viktiga HR-funktioner som semesterförfrågningar, utläggssändningar och företagspolicyuppslag. Användare kan välja vilka av dessa verktyg de vill använda för sin nuvarande session.
Managervyn utökar dessa alternativ till att inkludera övervakningsfunktioner som kompensationshantering, som visar hur inline-agenten kan konfigureras med en bredare uppsättning verktyg baserat på användarbehörigheter.
Managervyn utökar dessa möjligheter till att inkludera övervakningsfunktioner som kompensationshantering, som visar hur inline-agenten dynamiskt justerar sina tillgängliga verktyg baserat på användarbehörigheter. Utan inline-agenter skulle vi behöva bygga och underhålla två separata agenter.
Som visas i de föregående skärmdumparna erbjuder samma HR-assistent olika verktygsval baserat på användarens roll. En anställd ser alternativ som Knowledge Base, Apply Vacation Tool och Submit Expense, medan en chef har ytterligare alternativ som Performance Evaluation. Användare kan välja vilka verktyg de vill lägga till agenten för sin aktuella interaktion.
Denna flexibilitet möjliggör snabb anpassning till användarnas behov och preferenser. Till exempel, om företaget introducerar en ny policy för att skapa förfrågningar om affärsresor, kan verktygskatalogen snabbt uppdateras för att inkludera ett Skapa affärsresebokningsverktyg. Anställda kan sedan välja att lägga till det här nya verktyget i sin agentkonfiguration när de behöver planera en affärsresa, eller så kan applikationen automatiskt göra det baserat på deras roll.
Med Amazon Bedrock inline-agenter kan du skapa en katalog med åtgärder som väljs dynamiskt av applikationen eller av applikationens användare. Detta ökar nivån av flexibilitet och anpassningsförmåga hos dina lösningar, vilket gör dem till en perfekt passform för att navigera i det komplexa, ständigt föränderliga landskapet av modern affärsverksamhet. Användare har mer kontroll över sin AI-assistents kapacitet, och systemet förblir effektivt genom att bara ladda de nödvändiga verktygen för varje interaktion.
Teknisk grund: Dynamisk konfiguration och åtgärdsval
Inline-agenter tillåter dynamisk konfiguration vid körning, vilket gör det möjligt för en enskild agent att effektivt utföra mångas arbete. Genom att specificera åtgärdsgrupper och ändra instruktioner i farten, även inom samma session, kan du skapa mångsidiga AI-applikationer som anpassar sig till olika scenarier utan flera agentdistributioner.
Följande är nyckelpunkter om inline-agenter:
- Runtime-konfiguration – Ändra agentens konfiguration, inklusive dess FM, under körning. Detta möjliggör snabba experiment och anpassningar utan att omdistribuera applikationen, vilket minskar utvecklingscyklerna.
- Styrning på verktygsnivå – Tillämpa styrning och åtkomstkontroll på verktygsnivå. Med agenter som förändras dynamiskt under körning, hjälper styrning på verktygsnivå att upprätthålla säkerhet och efterlevnad oavsett agentens konfiguration.
- Agent effektivitet – Tillhandahåll endast nödvändiga verktyg och instruktioner vid körning för att minska tokenanvändningen och förbättra agentens noggrannhet. Med färre verktyg att välja mellan är det mindre komplicerat för agenten att välja rätt, vilket minskar hallucinationer i verktygsvalsprocessen. Detta tillvägagångssätt kan också leda till lägre kostnader och förbättrad latens jämfört med statiska agenter eftersom att ta bort onödiga verktyg, kunskapsbaser och instruktioner minskar antalet in- och utmatningstoken som bearbetas av agentens stora språkmodell (LLM).
- Flexibel handlingskatalog – Skapa återanvändbara åtgärder för dynamiskt urval baserat på specifika behov. Detta modulära tillvägagångssätt förenklar underhåll, uppdateringar och skalbarhet för dina AI-applikationer.
Följande är exempel på återanvändbara åtgärder:
- Enterprise systemintegration – Anslut till system som Salesforce, GitHub eller databaser
- Verktyg – Utför vanliga uppgifter som att skicka e-post eller hantera kalendrar
- Teamspecifik API-åtkomst – Interagera med specialiserade interna verktyg och tjänster
- Databearbetning – Analysera text, strukturerad data eller annan information
- Externa tjänster – Hämta väderuppdateringar, aktiekurser eller utför webbsökningar
- Specialiserade ML-modeller – Använd specifika maskininlärningsmodeller (ML) för riktade uppgifter
När du använder inline-agenter konfigurerar du parametrar för följande:
- Kontextuellt val av verktyg baserat på användarens avsikt eller konversationsflöde
- Anpassning till olika användarroller och behörigheter
- Växla mellan kommunikationsstilar eller personas
- Modellval baserat på uppgiftens komplexitet
Inline-agenten använder den konfiguration du tillhandahåller under körning, vilket möjliggör mycket flexibla AI-assistenter som effektivt hanterar olika uppgifter i olika affärssammanhang.
Bygga en HR-assistent med hjälp av inline-agenter
Låt oss titta på hur vi byggde vår HR-assistent med Amazon Bedrock inline-agenter:
- Skapa en verktygskatalog – Vi utvecklade en demokatalog med HR-relaterade verktyg, inklusive:
- Kunskapsbas - Använder sig av Kunskapsbaser för Amazons berggrund för att komma åt företagets policyer och riktlinjer baserade på applikationsanvändarens roll. För att filtrera kunskapsbasinnehållet baserat på användarens roll måste du också tillhandahålla en metadatafil som anger vilken typ av medarbetares roller som kan komma åt varje fil
- Ansök semester – För att begära och spåra ledighet.
- Kostnadsberättelse – För att skicka in och hantera utgiftsrapporter.
- Kodtolk – För att utföra beräkningar och dataanalys.
- Kompensationshantering – för att genomföra och granska anställdas ersättningsbedömningar (endast chefsåtkomst).
- Ställ in konversationston – Vi definierade flera konversationstoner för att passa olika interaktionsstilar:
- Professionella – För formella, affärsmässiga interaktioner.
- Casual – För vänligt, dagligt stöd.
- Entusiastisk – För positiv, uppmuntrande hjälp.
- Implementera åtkomstkontroll – Vi implementerade rollbaserad åtkomstkontroll. Applikationens backend kontrollerar användarens roll (anställd eller chef) och ger tillgång till lämpliga verktyg och information och skickar denna information till inline-agenten. Rollinformationen används också för att konfigurera metadatafiltrering i kunskapsbaserna för att generera relevanta svar. Systemet möjliggör dynamisk verktygsanvändning under körning. Användare kan byta personas eller lägga till och ta bort verktyg under sin session, vilket gör att agenten kan anpassa sig till olika konversationsbehov i realtid.
- Integrera agenten med andra tjänster och verktyg – Vi kopplade inline-agenten till:
- Amazon Bedrock Knowledge Bases för företagspolicyer, med metadatafiltrering för rollbaserad åtkomst.
- AWS Lambda funktioner för att utföra specifika åtgärder (som att skicka in semesterförfrågningar eller utgiftsrapporter).
- Ett kodtolkverktyg för att utföra beräkningar och dataanalys.
- Skapa användargränssnittet – Vi skapade ett kolvbaserat användargränssnitt som utför följande åtgärder:
- Visar tillgängliga verktyg baserat på användarens roll.
- Tillåter användare att välja olika personas.
- Tillhandahåller ett chattfönster för interaktion med HR-assistenten.
För att förstå hur denna dynamiska rollbaserade funktion fungerar under huven, låt oss undersöka följande systemarkitekturdiagram.
Som visas i föregående arkitekturdiagram fungerar systemet enligt följande:
- Slutanvändaren loggar in och identifieras som antingen chef eller anställd.
- Användaren väljer de verktyg som de har tillgång till och gör en förfrågan till HR-assistenten.
- Agenten bryter ner problemen och använder de tillgängliga verktygen för att lösa frågan i steg, vilket kan inkludera:
- Amazon Bedrock Knowledge Bases (med metadatafiltrering för rollbaserad åtkomst).
- Lambdafunktioner för specifika åtgärder.
- Kodtolkverktyg för beräkningar.
- Kompensationsverktyg (endast tillgängligt för chefer för att skicka in begäran om grundlönehöjning).
- Applikationen använder Amazon Bedrock inline-agenten för att dynamiskt skicka in lämpliga verktyg baserat på användarens roll och begäran.
- Agenten använder de valda verktygen för att bearbeta begäran och ge ett svar till användaren.
Detta tillvägagångssätt ger en flexibel, skalbar lösning som snabbt kan anpassa sig till olika användarroller och förändrade affärsbehov.
Slutsats
I det här inlägget introducerade vi Amazon Bedrocks inline-agentfunktionalitet och lyfte fram dess tillämpning på ett HR-användningsfall. Vi valde dynamiskt verktyg utifrån användarens roller och behörigheter, anpassade instruktioner för att sätta en konversationston och valde olika modeller under körning. Med inline-agenter kan du förändra hur du bygger och distribuerar AI-assistenter. Genom att dynamiskt anpassa verktyg, instruktioner och modeller under körning kan du:
- Skapa personliga upplevelser för olika användarroller
- Optimera kostnader genom att matcha modellens kapacitet till uppgiftens komplexitet
- Effektivisera utveckling och underhåll
- Skala effektivt utan att hantera flera agentkonfigurationer
För organisationer som kräver mycket dynamiskt beteende – oavsett om du är en AI-startup, SaaS-leverantör eller företagslösningsteam – erbjuder inline-agenter ett skalbart tillvägagångssätt för att bygga intelligenta assistenter som växer med dina behov. För att komma igång, utforska vår GitHub repo och HR-assistent demoapplikation, som visar viktiga implementeringsmönster och bästa praxis.
För att lära dig mer om hur du blir mest framgångsrik i din agentresa, läs vår tvådelade bloggserie:
För att komma igång med Amazon Bedrock Agents, kolla in följande GitHub repository med exempelkod.
Om författarna
Ishan Singh är en generativ AI Data Scientist på Amazon Web Services, där han hjälper kunder att bygga innovativa och ansvarsfulla generativa AI-lösningar och produkter. Med en stark bakgrund inom AI/ML, är Ishan specialiserad på att bygga generativa AI-lösningar som driver affärsnytta. Utanför jobbet tycker han om att spela volleyboll, utforska lokala cykelleder och umgås med sin fru och hund, Beau.
Maira Ladeira Tanke är Senior Generative AI Data Scientist på AWS. Med en bakgrund inom maskininlärning har hon över 10 års erfarenhet av att bygga och bygga AI-applikationer med kunder inom olika branscher. Som teknisk ledare hjälper hon kunder att accelerera deras uppnående av affärsvärde genom generativa AI-lösningar på Amazon Bedrock. På fritiden tycker Maira om att resa, leka med sin katt och umgås med sin familj på en varm plats.
Mark Roy är en huvudarkitekt för maskininlärning för AWS, som hjälper kunder att designa och bygga generativa AI-lösningar. Hans fokus sedan början av 2023 har varit att leda lösningsarkitekturen för lanseringen av Amazon Bedrock, flaggskeppet för generativ AI från AWS för byggare. Marks arbete täcker ett brett spektrum av användningsfall, med ett primärt intresse av generativ AI, agenter och skalning av ML över hela företaget. Han har hjälpt företag inom försäkringar, finansiella tjänster, media och underhållning, hälsovård, allmännyttiga företag och tillverkning. Innan han började på AWS var Mark arkitekt, utvecklare och teknikledare i över 25 år, inklusive 19 år inom finansiella tjänster. Mark har sex AWS-certifieringar, inklusive ML Specialty Certification.
Nitin Eusebius är Sr. Enterprise Solutions Architect på AWS, erfaren inom mjukvaruteknik, Enterprise Architecture och AI/ML. Han brinner djupt för att utforska möjligheterna med generativ AI. Han samarbetar med kunder för att hjälpa dem att bygga väldesignade applikationer på AWS-plattformen och är dedikerad till att lösa tekniska utmaningar och hjälpa till med deras molnresa.
Ashrith Chirutani är en mjukvaruutvecklingsingenjör på Amazon Web Services (AWS). Han är specialiserad på backend-systemdesign, distribuerade arkitekturer och skalbara lösningar, vilket bidrar till utvecklingen och lanseringen av högeffektiva system hos Amazon. Utanför jobbet tillbringar han sin tid med att spela pingis och vandra genom Cascade-stigar och njuta av utomhus lika mycket som han tycker om att bygga system.
Shubham Divekar är en mjukvaruutvecklingsingenjör på Amazon Web Services (AWS), som arbetar i Agents for Amazon Bedrock. Han fokuserar på att utveckla skalbara system i molnet som möjliggör ramverk och orkestrationer för AI-applikationer. Shubham har också en bakgrund inom att bygga distribuerade, skalbara system med hög volym och hög genomströmning i IoT-arkitekturer.
Vivek Bhadauria är chefsingenjör för Amazon Bedrock. Han fokuserar på att bygga djupinlärningsbaserade AI- och datorvisionslösningar för AWS-kunder. Utanför jobbet tycker Vivek om att vandra och följa cricket.
- SEO-drivet innehåll och PR-distribution. Bli förstärkt idag.
- PlatoData.Network Vertical Generative Ai. Styrka dig själv. Tillgång här.
- PlatoAiStream. Web3 Intelligence. Kunskap förstärkt. Tillgång här.
- Platoesg. Kol, CleanTech, Energi, Miljö, Sol, Avfallshantering. Tillgång här.
- PlatoHealth. Biotech och kliniska prövningar Intelligence. Tillgång här.
- Källa: https://aws.amazon.com/blogs/machine-learning/build-a-dynamic-role-based-ai-agent-using-amazon-bedrock-inline-agents/