3 Mai 2026

8 Min. Lesezeit

Amazon Bedrock AgentCore ist GAs Antwort auf das PoC-zu-Produktion-Problem in Enterprise-KI-Projekten. Mit Managed Harness, nativer Terraform-Unterstützung und Batch-Evaluation-Pipelines baut AWS eine Governance-Schicht unter Agentic-AI-Deployments. Wer heute KI-Agenten in Tests isoliert betreibt, bekommt jetzt ein Framework für den nächsten Schritt – mitsamt CDK-Tool-Chain und A/B-Infrastruktur für LLM-Performance-Vergleiche.

Das Wichtigste in Kürze

  • Amazon Bedrock AgentCore GA seit April 2026: Managed Harness für Produktions-Agenten mit Lifecycle-Management, Rollback und Audit-Trail
  • CDK-Konstrukte und Terraform-Provider für AgentCore: IaC-first-Deployment für Agenten-Infrastruktur ohne AWS-Console-Klickpfade
  • Batch-Evaluation-Pipeline: A/B-Tests zwischen Agenten-Versionen mit definierten Eval-Metriken (Latenz, Genauigkeit, Kosten pro Token)
  • Performance-Governance: Automatische Rollback-Trigger wenn Eval-Score unter Schwellwert fällt – kein manuelles Monitoring mehr Pflicht
  • DACH-Cloud-Architekten: EU-Region (Frankfurt) von Anfang an unterstützt, DSGVO-konforme Datenhaltung innerhalb EU möglich

VerwandtKubernetes 1.36 Migration: Enterprise-Checkliste cgroup-v2 + DRA-GA  /  FinOps 2026: Enterprise Cloud-Kosten im Griff

Was ist Amazon Bedrock AgentCore?

Was ist Amazon Bedrock AgentCore? Amazon Bedrock AgentCore ist die Produktions-Laufzeitumgebung für KI-Agenten innerhalb von Amazon Bedrock. Es stellt Managed Harness (vorkonfigurierte Ausführungsumgebung), Lifecycle-Management (Versioning, Rollback, Deployment-Phasen) und eine Evaluation-Pipeline für A/B-Tests zwischen Agenten-Konfigurationen bereit.

Das Problem, das AgentCore löst, ist präzise definiert: KI-Agenten, die in Isolation gut funktionieren, scheitern in Produktion an nicht-funktionalen Anforderungen. Latenz-Spitzen unter Last, fehlende Audit-Logs für Compliance, keine Möglichkeit Agenten-Versionen zu vergleichen ohne manuelles A/B-Setup – das sind die typischen Blocker zwischen PoC und Live.

AgentCore packt diese Infrastruktur-Probleme in einen verwalteten Service. Das bedeutet: Weniger undifferenzierter Infrastruktur-Code, mehr Fokus auf die Agenten-Logik selbst.

AgentCore-Architektur in drei Schichten

Managed Harness

Vorkonfigurierte Laufzeitumgebung für Agenten – Compute, Networking, Secrets-Management inklusive

Lifecycle-Engine

Versioning, Deployment-Phasen (Canary/Blue-Green), Rollback auf vorherige Version mit einem API-Call

Eval-Pipeline

Batch-Evaluation mit definierten Metriken, automatischer Vergleich zwischen Agenten-Versionen A/B

Verwandt: State of FinOps 2026: Warum FinOps jetzt Technology Value Management heißt und was das für DACH-Cloud-Budgets bedeutet

CDK-Tool-Chain: IaC-First für Agenten-Deployments

Das erste praktische Hindernis bei Enterprise-Agenten-Deployments ist meist nicht das Modell, sondern die Infrastruktur: Wie deploye ich einen Agenten reproduzierbar, versioniert und pipeline-fähig? AgentCore beantwortet das mit nativen AWS CDK Konstrukten und einem Terraform-Provider.

CDK-Konstrukte für AgentCore: AWS stellt L2-Konstrukte bereit, mit denen ein AgentCore-Deployment in CDK-Code beschreibbar wird. Das ermöglicht Agenten-Infrastruktur als Teil des bestehenden CDK-Stacks – gleiche Pipeline, gleiche Review-Prozesse, gleiche State-Management-Konventionen wie bei anderen AWS-Ressourcen.

Terraform-Provider: Für Teams, die auf Terraform setzen, stellt AWS einen AgentCore-Provider bereit. Die Ressource-Definitionen folgen dem bekannten HCL-Schema – AgentCore-Deployments lassen sich in bestehende Terraform-Module einbetten ohne CDK-Parallelwelt.

„Der Wechsel von Console-Click-Deployment auf CDK-Code ist für viele Teams der entscheidende Schritt in Richtung produktionsreife KI. AgentCore bringt diese IaC-Disziplin direkt auf Agenten-Ebene.“

– Adrian Garcia-Kunz, cloudmagazin

Für DACH-Teams relevant: Die CDK-Konstrukte unterstützen Region-Parameter für die Frankfurt-Region (eu-central-1). Wer DSGVO-konforme EU-Datenhaltung braucht, konfiguriert das direkt im CDK-Stack – kein nachträglicher Region-Swap notwendig.

A/B-Tests und Batch-Evaluation: Performance-Governance für Agenten

Das schwierigste Problem bei Agenten-Versionsupgrades ist die Qualitätsbewertung: Ist Version 2 wirklich besser als Version 1 – oder nur bei bestimmten Inputs? Ohne systematische Evaluation werden Agenten-Upgrades zur Glaubensfrage.

AgentCore Batch-Evaluation adressiert das mit einer strukturierten Pipeline:

  1. Eval-Dataset definieren: Strukturierte Liste von Test-Inputs mit erwarteten Outputs – aus historischen Produktionsdaten oder synthetisch generiert. Dataset liegt in S3, versioniert.
  2. Metriken konfigurieren: AgentCore unterstützt vordefinierte Metriken (Latenz p50/p95, Token-Kosten, Output-Korrektheit via Judger-LLM) und Custom-Metriken über Lambda-Hooks.
  3. Batch-Job triggern: AgentCore führt beide Agenten-Versionen gegen das Dataset aus und sammelt Metriken. Keine manuelle Infrastruktur für parallelen Test notwendig.
  4. Ergebnisse auswerten: Eval-Report in CloudWatch Metrics und S3. Automatischer Pass/Fail gegen definierte Schwellwerte.
  5. Deployment-Entscheidung: Auf Basis des Eval-Reports entweder automatisches Deployment (wenn Schwellwert erreicht) oder Eskalation an Engineering-Review.

Stärken von AgentCore

  • Managed Infrastruktur – kein EC2/ECS-Eigenaufwand
  • IaC-nativ (CDK + Terraform) von Anfang an
  • A/B-Evaluation ohne parallele Infrastruktur
  • Rollback auf API-Call-Ebene
  • EU-Region Frankfurt unterstützt (DSGVO)

Einschränkungen beachten

  • Nur für Bedrock-native Agenten (kein LangChain-Support nativ)
  • Custom-Metriken erfordern Lambda-Hooks (Mehraufwand)
  • Preismodell für Eval-Batch-Jobs noch nicht GA-final
  • Terraform-Provider noch in Beta-Qualität (Stand April 2026)
  • Cross-Account-Deployments benötigen zusätzliche IAM-Architektur

Fazit: Wann AgentCore der richtige nächste Schritt ist

Amazon Bedrock AgentCore ist kein Produkt für Teams, die noch am ersten Agenten-PoC arbeiten. Es ist ein Produkt für Teams, die diesen Schritt hinter sich haben und jetzt die Infrastrukturfrage lösen müssen.

Die Indikation ist klar: Wer mehr als zwei Agenten in Produktion plant, wer Agenten-Upgrades ohne Downtime braucht, wer Qualitätsvergleiche zwischen LLM-Versionen systematisch führen will – für die lohnt AgentCore. Für One-Off-Agenten in nicht-kritischen Anwendungen ist der Overhead der verwalteten Plattform wahrscheinlich nicht gerechtfertigt.

Quelle Titelbild: Pexels | Weiterführend: Amazon Bedrock AgentCore – AWS | AWS CDK Bedrock Alpha

Häufige Fragen

Funktioniert AgentCore auch mit Agents, die LangChain oder LlamaIndex nutzen?

Nativ unterstützt AgentCore nur Bedrock-native Agenten. LangChain- oder LlamaIndex-basierte Agenten können in einen Lambda-Wrapper eingekapselt werden, der dann von AgentCore als Custom-Tool aufgerufen wird – das erzeugt aber einen Indirektions-Overhead. Für Teams mit starker LangChain-Basis ist ein direktes Bedrock-Agenten-Refactoring die sauberere Option.

Wie aufwendig ist die Migration von bestehenden Bedrock-Agenten auf AgentCore?

Für Agenten, die bereits als Bedrock-Agent deployed sind, ist die Migration auf AgentCore ein mehrstündiges Aufgabe – primär das Erstellen der CDK- oder Terraform-Konfiguration und das Konfigurieren des Managed Harness. Die Agenten-Logik selbst bleibt unverändert. AWS stellt ein Migrationsskript bereit, das bestehende Bedrock-Agent-Konfigurationen in CDK-Code exportiert.

Was kostet AgentCore im Vergleich zu Self-Managed Bedrock-Agenten?

AgentCore berechnet Kosten für Managed-Harness-Runtime (pro Agenten-Stunde) und für Eval-Batch-Jobs (pro 1000 Eval-Runs). Der genaue Preistarif ist GA-final noch nicht publiziert (Stand April 2026). Als Orientierung: Der Managed-Overhead liegt typischerweise bei 20-40% über Self-Managed, wird aber durch reduzierten Engineering-Aufwand für Infrastruktur meist kompensiert.

Unterstützt AgentCore Multi-Agent-Orchestrierung?

Ja, AgentCore unterstützt Supervisor-Agent-Patterns: Ein Orchestrierungs-Agent kann Sub-Agenten über AgentCore aufrufen. Das Lifecycle-Management gilt dann für jeden Agenten im Verbund separat – ein Sub-Agenten-Upgrade beeinflusst nicht automatisch den Orchestrierungs-Agenten. Eval-Pipelines können auf einzelne Agenten oder auf den gesamten Multi-Agent-Flow angewandt werden.

Wie integriert sich AgentCore in bestehende AWS-Monitoring-Stacks?

AgentCore schreibt Metriken nativ in CloudWatch (Latenz, Fehlerraten, Token-Verbrauch pro Agenten-Aufruf). Log-Outputs gehen in CloudWatch Logs mit strukturierten JSON-Events. X-Ray-Tracing ist für Agenten-Calls aktivierbar. Teams, die bereits CloudWatch-Dashboards und Alarms für ihre Bedrock-Workloads betreiben, können AgentCore-Metriken direkt in die bestehende Observability-Infrastruktur einbetten.

Adrian Garcia-Kunz schreibt für cloudmagazin.com über Cloud-native Patterns und Developer-Tooling.

Quelle Titelbild: Pexels / Brett Sayles (px:5092815)

Auch verfügbar in

Ein Magazin der Evernine Media GmbH