7 Min. Lesezeit
Fast jede Organisation hat heute FinOps, eine Disziplin zur Steuerung der Cloud-Kosten. Trotzdem verschwenden Unternehmen weiter 25 bis 35 Prozent ihrer Cloud-Ausgaben für ungenutzte Ressourcen. Die Zahl ist seit Jahren stabil, obwohl die Werkzeuge immer besser werden. Das liegt nicht an fehlender Sichtbarkeit. Es liegt daran, dass Sichtbarkeit nicht dasselbe ist wie die Befugnis, etwas abzuschalten.
Das Wichtigste in Kürze
- Die Verschwendung bleibt. 25 bis 35 Prozent der Cloud-Ausgaben fließen in ungenutzte oder überdimensionierte Ressourcen, trotz FinOps.
- FinOps sieht, darf aber nicht. Die Disziplin liefert Reports, hat aber selten die Autorität, eine Ressource abzuschalten.
- KI verschärft das Problem. 98 Prozent der Praktiker steuern inzwischen KI-Ausgaben, ein Posten, der schneller wächst als jede Optimierung.
Verwandt:VMware VCF 9.1 und die Souveränitäts-Frage / 800-Volt-Gleichstrom für KI-Racks
Was FinOps eigentlich leisten soll
Was ist FinOps? FinOps steht für Financial Operations und bezeichnet die Praxis, Cloud-Kosten transparent zu machen und zwischen Technik, Finanzen und Geschäft zu steuern. Ziel ist, dass jede Ausgabe einem Verantwortlichen zugeordnet ist und Entscheidungen über Kosten dort fallen, wo auch die technische Kontrolle sitzt.
In der Theorie schließt FinOps eine alte Lücke. Früher kam die Cloud-Rechnung am Monatsende, niemand konnte sie einzelnen Teams zuordnen, und Optimierung war ein Ratespiel. FinOps bringt Transparenz: Welches Team verursacht welche Kosten, welche Ressource läuft ungenutzt, wo lohnt eine Reservierung. Der Markt für FinOps-Werkzeuge ist entsprechend gewachsen, und laut dem State-of-FinOps-Report steuern inzwischen 98 Prozent der Praktiker auch KI-Ausgaben und 90 Prozent SaaS-Kosten mit.
Die Werkzeuge sind also da, und sie sind gut. Genau das macht die stabile Verschwendungsquote so bemerkenswert. Wenn die Sichtbarkeit steigt, die Verschwendung aber bleibt, dann ist Sichtbarkeit nicht der Engpass. Der Bericht zeigt das Problem präzise an, aber den Bericht zu lesen ist nicht dasselbe wie zu handeln.
Warum die Zahl nicht sinkt
Der Grund ist organisatorisch, nicht technisch. FinOps-Teams haben fast immer die Sicht, aber selten den Schalter. Sie können präzise sagen, dass eine Datenbank seit drei Monaten leerläuft oder eine Instanz dreifach überdimensioniert ist. Was sie nicht können: sie einfach abschalten. Denn die Ressource gehört einem Entwicklungsteam, das im Zweifel sagt, es brauche sie noch, und das den Ausfall verantworten müsste, wenn doch etwas dranhängt.
So entsteht eine Pattsituation. FinOps empfiehlt, das Team zögert, niemand entscheidet. Die ungenutzte Ressource läuft weiter, weil ihr Abschalten ein kleines Risiko trägt und ihr Weiterlaufen nur Geld kostet, das in der Sammelrechnung untergeht. Geld, das niemandem persönlich wehtut, schlägt im Zweifel ein Risiko, das jemand persönlich verantworten müsste. Das ist menschlich nachvollziehbar und in Summe teuer.
Die KI-Welle macht diese Dynamik schärfer. GPU-Instanzen und Inferenz-Endpunkte kosten ein Vielfaches einer normalen VM, und sie werden oft für Experimente hochgefahren, die niemand wieder abräumt. Wenn schon eine ungenutzte Standard-Datenbank niemand abschaltet, bleibt ein vergessener GPU-Cluster erst recht stehen. Die 98 Prozent, die jetzt KI-Kosten steuern, steuern damit einen Posten, der schneller wächst, als die alte Pattsituation ihn schrumpfen lässt.
Warum es hängt
- FinOps berichtet, darf aber nicht abschalten
- Kosten tun niemandem persönlich weh
- Vergessene KI-Experimente laufen teuer weiter
Was die Zahl bewegt
- FinOps mit Mandat zum Abschalten nach Frist
- Kosten je Team sichtbar im eigenen Budget
- Ablaufdatum für jede KI-Experiment-Ressource
Was die Quote tatsächlich senkt
Der Hebel ist nicht ein weiteres Werkzeug, sondern eine Befugnis. FinOps muss vom Berichtenden zum Entscheidenden werden, zumindest im Rahmen klarer Regeln. Eine bewährte Form ist das Mandat mit Frist: Eine als ungenutzt markierte Ressource wird nach einer definierten Karenzzeit automatisch abgeschaltet, wenn das verantwortliche Team nicht aktiv widerspricht. Die Beweislast kehrt sich um. Nicht FinOps muss das Abschalten rechtfertigen, sondern das Team das Weiterlaufen.
Der zweite Hebel ist die Zuordnung im richtigen Budget. Solange Cloud-Kosten in einer zentralen IT-Sammelposition landen, spürt kein einzelnes Team den Verbrauch. Werden die Kosten dem verursachenden Team direkt zugeschrieben, ändert sich das Verhalten von selbst. Was im eigenen Budget steht, wird abgeschaltet, lange bevor FinOps es anmahnen muss.
Ein FinOps-Report ohne Befugnis zum Handeln ist eine teure Wetterkarte. Er sagt präzise voraus, wo es regnet, und niemand bekommt einen Schirm.
Für die KI-Ressourcen kommt ein dritter Punkt hinzu: ein Ablaufdatum von Anfang an. Wer einen GPU-Cluster für ein Experiment hochfährt, setzt ihm eine Frist, nach der er automatisch endet. Das verhindert die teuerste Kategorie der Verschwendung, die vergessene Hochleistungs-Ressource. Keiner dieser drei Hebel ist technisch schwierig. Alle drei sind organisatorisch unbequem, weil sie Verantwortung dorthin verschieben, wo bisher nur Komfort war.
Genau deshalb bewegt sich die Zahl so wenig. Bessere Werkzeuge lösen ein Problem, das nie ein Werkzeugproblem war. Wer die 25 bis 35 Prozent senken will, kauft keine weitere FinOps-Plattform. Er gibt der bestehenden ein Mandat. Das ist die unbequeme, aber einzige Antwort, die die Quote in den vergangenen Jahren tatsächlich bewegt hat.
Häufige Fragen
Warum sinkt die Cloud-Verschwendung trotz FinOps nicht?
Weil das Problem organisatorisch ist, nicht technisch. FinOps-Teams haben die Sichtbarkeit, aber selten die Befugnis, eine Ressource abzuschalten. Solange niemand entscheidet, läuft die ungenutzte Ressource weiter.
Was ändert sich durch KI an der Kostenlage?
GPU- und Inferenz-Ressourcen kosten ein Vielfaches normaler Instanzen und werden oft für Experimente hochgefahren, die niemand wieder abräumt. Das vergrößert genau die Kategorie, die schon vorher am schwersten zu kontrollieren war.
Wie bekommt FinOps ein Mandat zum Abschalten?
Über eine Regel mit Frist: Eine als ungenutzt markierte Ressource wird nach einer Karenzzeit automatisch abgeschaltet, wenn das Team nicht widerspricht. Die Beweislast kehrt sich um, von der Rechtfertigung des Abschaltens zur Rechtfertigung des Weiterlaufens.
Hilft eine andere Kostenzuordnung?
Deutlich. Solange Cloud-Kosten in einer zentralen Sammelposition liegen, spürt kein Team den Verbrauch. Werden sie dem verursachenden Team direkt zugeschrieben, ändert sich das Abschaltverhalten von selbst.
Braucht es dafür neue Werkzeuge?
Nein. Die vorhandenen FinOps-Werkzeuge liefern die nötige Sichtbarkeit längst. Was fehlt, ist die Befugnis und die Kostenzuordnung. Ein weiteres Werkzeug löst ein Problem, das nie ein Werkzeugproblem war.
Mehr aus dem MBF Media Netzwerk
16 Entscheider, ein KI-Rechercheur: Der B2B-Vertrieb wird präziser
Bildquelle: KI-generiert (Juni 2026), C2PA-Zertifikat im Bild hinterlegt