23 April 2026

8 Min. Lesezeit · Stand: 23.04.2026

FinOps-Teams im deutschen Mittelstand bewerten ihre AWS-Commits gerade neu. Der Anlass ist nicht nur die Routine der Quartals-Reviews, sondern eine Marktbewegung. Google Cloud hat die Compute-Listenpreise gesenkt. AWS EC2 C8in und C8ib bringen neue Preis-Leistungs-Klassen. Die AWS-Bedrock-Kostenstruktur verlangt andere Reservierungsmuster als klassische EC2-Lasten. Die Frage nach Savings Plans oder Reserved Instances ist 2026 nicht akademisch, sondern unmittelbar budgetrelevant. Der Praxischeck zeigt, welcher Mechanismus zu welchem Workload passt und wo die stillen Fallstricke liegen.

Das Wichtigste in Kürze

  • Savings Plans und Reserved Instances sind 2026 keine Alternativen, sondern ein Portfolio. Wer nur eines nutzt, verschenkt Potenzial.
  • Compute Savings Plans bleiben die flexible Wahl für gemischte EC2-, Fargate- und Lambda-Workloads mit wechselnder Regionslast.
  • EC2 Instance Savings Plans liefern höhere Rabatte, binden aber an eine Instance-Familie und zwingen zu einer stabilen Architektur.
  • Standard Reserved Instances sind 2026 in RDS, ElastiCache, OpenSearch und DynamoDB relevant, wo Savings Plans keine Alternative bieten.
  • Bei Laufzeiten zählt Cash-Flow-Profil vor Rabatt-Optimum: 12 Monate mit No Upfront bleibt für viele Mittelständler die wirtschaftlich beste Wahl.

Was sich 2026 verändert hat und warum ein neuer Blick lohnt

Was ist ein AWS Savings Plan? AWS Savings Plans sind ein flexibles Preismodell, bei dem Unternehmen eine feste stündliche Ausgabe über 12 oder 36 Monate zusichern und dafür Rabatte bis zu 72 Prozent auf On-Demand-Preise erhalten. Im Unterschied zu Reserved Instances binden sie den Rabatt an einen Dollar-Betrag, nicht an eine konkrete Instance-Konfiguration. Das erleichtert Architektur-Änderungen, kostet aber einige Rabatt-Prozentpunkte gegenüber den strenger gebundenen EC2 Instance Savings Plans.

Zwischen 2022 und 2024 galt eine einfache Faustregel. Compute Savings Plans schlagen klassische Reservierungen, weil sie flexibler sind und gegen Architektur-Änderungen absichern. Diese Regel stimmt 2026 nicht mehr uneingeschränkt. Drei Entwicklungen haben den Blick verschoben. Erstens gibt es eine breitere Produktpalette, auf die Savings Plans keinen Zugriff haben. ElastiCache, OpenSearch, Neptune und DynamoDB Reserved Capacity laufen weiterhin über eigene Reservierungsprodukte. Zweitens führen Graviton- und Trainium-Chips zu Architektur-Verschiebungen, bei denen EC2 Instance Savings Plans spürbar höhere Rabatte geben, falls die Workload-Familie stabil bleibt. Drittens verändern Multi-Account- und Shared-Savings-Modelle die Optimierungslogik gegenüber klassischen Einzelabrechnungen, weil Commitments anders verteilt werden.

Parallel verändert sich der Marktkontext. Der AWS EC2 C8in- und C8ib-Launch im April 2026 bringt Netzwerk- und Analytics-Workloads eine neue Preis-Leistungs-Klasse, die Commitments auf älteren C7i-Generationen wirtschaftlich fragwürdig macht. Die Entscheidung über eine neue Reservierung hängt 2026 stärker als früher davon ab, ob die eigene Workload in den nächsten zwölf Monaten voraussichtlich auf eine neue Generation wechselt. Wer das ignoriert und einfach drei Jahre C7i reserviert, kauft sich in eine Architektur-Starre ein.

bis 72 %
maximaler Rabatt bei EC2 Instance Savings Plans mit 3 Jahren Laufzeit und All Upfront im Vergleich zu On-Demand, ohne Private-Pricing-Zusagen
Quelle: AWS Pricing, Stand April 2026

Die drei praktischen Entscheidungsachsen

Wer 2026 saubere Commitments aufsetzen will, arbeitet entlang von drei Achsen: Workload-Stabilität, Architektur-Freiheitsgrad und Cash-Flow-Profil. Diese drei Achsen bestimmen, welches Produkt in welcher Dosis sinnvoll ist.

Die erste Achse ist Workload-Stabilität. Für viele Mittelständler gilt: Kern-ERP, klassische Webservices und interne Dienste laufen mit hoher Konstanz. Hier greifen Compute Savings Plans oder EC2 Instance Savings Plans zuverlässig. Workloads, die im Jahr 2026 stark wachsen, schrumpfen oder auf neue Architekturen wandern, passen schlechter in lange Reservierungen. KI-Inference, Datenintegrations-Pipelines und Container-Plattformen sollten zuerst stabilisiert, dann reserviert werden.

Die zweite Achse ist der Architektur-Freiheitsgrad. Wer eine klare Roadmap hat, auf Graviton zu migrieren oder von x86 auf ARM zu wechseln, sichert sich diesen Schritt mit Compute Savings Plans ab. Wer dagegen in einer stabilen Architektur sitzt und in den nächsten zwölf bis 24 Monaten keine Sprünge plant, nimmt die Extra-Rabatte der EC2 Instance Savings Plans mit. Der Unterschied macht je nach Workload vier bis zehn Prozent im Gesamtrabatt aus. Für Enterprise-Budgets lohnt sich diese Differenz. Für Architektur-getriebene Teams ist die Flexibilität trotzdem wichtiger.

Die dritte Achse ist das Cash-Flow-Profil. All Upfront bringt den höchsten Rabatt, belastet aber das Quartal. Partial Upfront ist der Mittelweg, No Upfront schont die Liquidität und kostet ein paar Prozent Rabatt. In vielen mittelständischen CFOs-Sitzungen lohnt sich eine kleine Rechnung: Wie viel zusätzlicher Rabatt steht gegenüber welchen Zinskosten für alternativ verzinste Liquidität? 2026 mit wieder positiven Zinssätzen ist die Antwort nicht mehr trivial. No Upfront mit 12 Monaten kann wirtschaftlich attraktiver sein als All Upfront mit 36 Monaten, wenn die interne Kapitalverzinsung ausreicht.

Wann Savings Plans 2026 die bessere Wahl sind

  • Gemischte Workload-Landschaft mit EC2, Fargate und Lambda im selben Account
  • Wechselnde Regionslasten, Multi-AZ-Failover und geplante Architektur-Migration
  • Moderne Container-Plattformen mit häufigen Release-Zyklen und Ressourcen-Skalierung
  • Teams ohne eigene Reservation-Governance, die Flexibilität vor Maximalrabatt stellen

Wann Reserved Instances 2026 weiter sinnvoll sind

  • RDS, ElastiCache, OpenSearch oder DynamoDB mit planbarer Grundlast
  • Workload-Profile, die strikt an eine Instance-Familie gebunden sind (zum Beispiel SAP-Systeme)
  • Convertible Reserved Instances bei stabilen Cloud-Accounts mit seltenen Architektur-Wechseln
  • Workloads in Regionen, in denen Savings Plans nicht die beste Preisstruktur liefern

Ein 90-Tage-Fahrplan für FinOps-Teams

Ein strukturierter FinOps-Sprint bringt Ordnung in das Commitment-Portfolio, bevor neue Produkte oder Preisänderungen die Lage weiter verändern. Die folgenden drei Monate haben sich in mehreren DACH-Cloud-Teams als brauchbarer Rhythmus erwiesen.

Woche 1-2
Bestandsanalyse. Alle aktiven Savings Plans und Reservations listen, inklusive Laufzeit-Ende, Rabatt-Tier und gebundener Workloads. Zielbild: tabellarisches Inventar mit Expiry-Datum und Utilization-Rate aus AWS Cost Explorer.

Woche 3-4
Workload-Review. Welche Applikationen sind architekturstabil, welche stehen vor Migration oder Konsolidierung? Datenquellen: Technical-Debt-Liste, Projekt-Roadmap, Infrastructure-as-Code-Changes der letzten sechs Monate.

Woche 5-6
Finanz-Workshop mit CFO. Cash-Flow-Varianten rechnen: 12 vs. 36 Monate, No vs. Partial vs. All Upfront. Alternative: Finanzierungskosten gegen Rabatt-Differenz gegenrechnen. Entscheidung als Prinzip fixieren.

Woche 7-9
Commitment-Strategie. Zielportfolio definieren: Wie viel Compute Savings Plan, wie viel EC2 Instance Savings Plan, wie viel RDS- oder ElastiCache-Reservation? Faustregel: 60-70 Prozent Abdeckung der planbaren Grundlast, nicht 100 Prozent.

Woche 10-11
Umsetzung. Alte Reservations auslaufen lassen, neue Commitments gestaffelt aufsetzen. Parallel: Observability-Dashboards auf Utilization-Rate und Coverage anpassen, Alerts einrichten.

Woche 12
Governance-Update. Reservation-Kalender pflegen, quartalsweise Review terminieren, Rolle für Commitment-Steuerung benennen. Ergebnis: FinOps-Team mit klarem Rhythmus statt reaktiver Feuerwehreinsätze.

Häufige Fehler, die FinOps-Teams 2026 vermeiden sollten

Im Austausch mit Cloud-Leitungen aus dem DACH-Mittelstand wiederholen sich einige Fehler. Der häufigste ist eine Überabdeckung mit All-Upfront-Reservations in einer Periode, in der Architekturprojekte laufen. Wer gerade auf Graviton migriert und gleichzeitig drei Jahre x86 all upfront zahlt, verbrennt dreistellige Summen pro Monat. Der zweite Fehler ist die blinde Bindung an eine Region. US-East-1 wirkt auf dem Papier günstiger als Frankfurt, aber Latenz, Datenhoheit und Compliance-Kosten können den Preisvorteil im deutschen Geschäft neutralisieren.

Der dritte Fehler ist weniger sichtbar. Viele Teams reservieren auf Konto-Ebene, obwohl die AWS Organizations die Share-Across-Accounts-Funktion bieten. Wer Savings Plans auf einem einzelnen Tochter-Account einkauft, verliert die Möglichkeit, die Ersparnis über das Gesamt-Portfolio zu heben. Shared Savings Plans sind 2026 die Voreinstellung für strukturell denkende FinOps-Teams. Das vierte Muster ist eine zu späte Auseinandersetzung mit AWS Bedrock-Kosten. Generative-AI-Workloads skalieren anders als klassische Compute-Lasten. Die Bedrock-Pricing-Modelle arbeiten mit Committed Throughput, nicht mit klassischen Reservierungen. Wer das nicht bis Q3 2026 verstanden hat, zahlt Überraschungsgebühren.

Ein letzter Punkt gehört auf die Vorstandsebene. Commitments sind keine rein technische Entscheidung. Wer über drei Jahre mehrere Hunderttausend Euro All Upfront zahlt, trifft eine Entscheidung mit Einfluss auf Bilanz und Liquidität. Die Abstimmung zwischen CIO, CFO und Treasury sollte formalisiert sein, nicht improvisiert. FinOps-Reife zeigt sich nicht am Dashboard, sondern am Freigabeprozess für diese Commitments.

Wie FinOps-Reporting in der Praxis aussieht

Das Reporting rund um Savings Plans und Reserved Instances lebt von drei Kernindikatoren. Coverage misst, welcher Anteil der On-Demand-Nutzung durch Commitments abgedeckt ist. Utilization beschreibt, zu welchem Prozentsatz die gekauften Commitments tatsächlich verbraucht werden. Effektive Stundenrate zeigt den Mischpreis aus Commitments und On-Demand. Wer diese drei Kennzahlen monatlich und in einer Tabelle pro Business-Unit führt, hat eine belastbare Steuerungsgrundlage.

Die Grenze zwischen Technik und Finanzen verläuft bei FinOps nicht mehr so scharf wie früher. Ein reines Technik-Dashboard ohne betriebswirtschaftlichen Bezug produziert keine handlungsleitenden Entscheidungen. Ein reines Finance-Dashboard ohne Architektur-Kontext nimmt Entscheidungen vorweg, die technisch nicht tragen. Die beste Praxis ist ein gemeinsames Dashboard mit beiden Lesarten, moderiert durch einen FinOps-Practitioner, der zwischen den Disziplinen übersetzt.

Ein häufig übersehener Aspekt ist die Dokumentation der Entscheidungen. Warum wurde ein 3-Jahres-Commitment auf C7g-Instanzen gekauft? Wer hat zugestimmt, welche Alternative wurde verworfen, welches Ausstiegsszenario ist hinterlegt? FinOps-Teams, die diese Dokumentation pflegen, sparen sich bei der nächsten Bilanz-Diskussion Stunden an Rekonstruktion. Wer sie nicht pflegt, sucht in 18 Monaten in alten Chats nach Begründungen und findet Halbwahrheiten.

Eine letzte Beobachtung aus dem DACH-Mittelstand betrifft die Vertrags-Architektur mit Resellern. Viele Teams kaufen Savings Plans nicht direkt bei AWS, sondern über einen Reseller, der einen Marktplatz oder ein Privat-Pricing-Programm bündelt. Das ist legitim und kann zusätzliche Rabatte bringen, verschiebt aber den Steuerungspunkt. Wer Reseller-gebundene Savings Plans hat, sollte vertraglich klären, wie schnell Konfigurationsänderungen fließen, wer Recommendations vorschlägt und wie das Reporting in das eigene FinOps-System gespielt wird. Zwei Jahre stille Reseller-Abhängigkeit ohne dieses Setup kosten messbar Effizienz und kostbare Verhandlungsoptionen, wenn die nächste Vertragsrunde ansteht. Pragmatische Teams beziehen den Reseller in die Quartals-Reviews ein und lassen sich Optimierungsvorschläge schriftlich geben, nicht in flüchtigen Telefonaten oder Workshops ohne nachvollziehbare Schriftform.

Wer diese Mechanik einmal in der Steuerung verankert hat, gewinnt drei spürbare Vorteile zurück: kürzere Entscheidungswege bei neuen Commitments, klarere Eskalationspfade bei unerwarteten Kostenausschlägen und ein Reporting-Niveau, das auch in Aufsichtsrats-Vorlagen ohne Rückfragen besteht.

Häufige Fragen

Wie hoch sollte die Savings-Plan-Coverage in einem gesunden FinOps-Portfolio sein?

60 bis 70 Prozent der planbaren Grundlast ist ein guter Zielkorridor. Wer deutlich darüber liegt, verliert Flexibilität bei Architektur-Wechseln. Wer deutlich darunter liegt, verschenkt Rabatte. Die konkreten Prozentzahlen hängen von Utilization-Rate und Architektur-Volatilität ab.

Lohnen sich 3-Jahres-Commitments 2026 noch?

Für stabile Legacy-Workloads ja, für neue Plattformen selten. Der Rabatt-Unterschied zwischen 12 und 36 Monaten liegt bei All Upfront in der Regel zwischen 15 und 25 Prozent. Diese Differenz ist nur attraktiv, wenn der Workload realistisch drei Jahre bleibt.

Wie verhalten sich Savings Plans bei AWS Bedrock und anderen KI-Services?

Bedrock nutzt ein eigenes Modell namens Provisioned Throughput. Savings Plans greifen hier nicht. Wer produktive KI-Workloads auf Bedrock fährt, braucht einen separaten Commitment-Prozess. Der wird oft monatlich neu bewertet, weil Modell-Updates und Preisstrukturen sich schneller ändern als bei klassischen EC2-Lasten.

Was passiert mit bestehenden Convertible Reserved Instances?

Convertible Reserved Instances laufen weiter und können weiterhin getauscht werden. Für neue Käufe empfehlen die meisten FinOps-Teams 2026 Compute Savings Plans. Die Flexibilität ist ähnlich, die Governance wird schlanker.

Wie sieht ein Shared Savings Plan in einer Organization aus?

Savings Plans können auf Zahlkonto-Ebene eingekauft und automatisch über alle verbundenen Accounts geteilt werden. Das aktiviert die Share-Funktion in AWS Organizations. Für Mittelständler mit Tochtergesellschaften ist das fast immer der bessere Weg, weil Ersparnisse im gesamten Portfolio wirken.

Welche Rolle spielt Cost Explorer bei der Planung?

AWS Cost Explorer liefert Recommendations für Savings Plans und Reservations aus der eigenen Nutzungshistorie der letzten 7, 30 oder 60 Tage. Die Empfehlungen sind ein guter Startpunkt. Sie sollten gegen die Architektur-Roadmap validiert werden, weil historische Empfehlungen sonst die aktuelle Architektur zementieren statt sie weiterzuentwickeln.

Wie reagiert AWS auf den GCP-Preisschnitt bei Compute-Listenpreisen?

AWS antwortet bislang nicht mit Listenpreis-Anpassungen, sondern mit neuen Instance-Familien wie C8in und C8ib, die die Preis-Leistungs-Klasse implizit verbessern. Für FinOps-Teams heißt das, dass Vergleichsrechnungen nicht auf Listenpreise, sondern auf effektive Preise nach Rabatt und Instance-Generation abgestellt werden müssen.

Quelle Titelbild: Pexels / Negative Space (px:97080)

Ein Magazin der Evernine Media GmbH