10 Mai 2026

5 Min. Lesezeit

Wer auf Cloudflare Workers gebaut hat, kennt die Wand: ab dem Moment, wo der Code mehr als 128 MB RAM oder eine echte Linux-Toolchain braucht, wird das Deployment hässlich. Mit Containers GA seit dem 13. April 2026 verschiebt Cloudflare diese Wand. Web-Devs, die bisher zu EC2, Fly.io oder Render ausgewichen sind, bekommen einen Edge-Layer dazwischen, ohne Kubernetes-Cluster und ohne Datacenter-Vertrag.

10.05.2026

Das Wichtigste in Kürze

  • Active-CPU-Pricing als echter Hebel: Containers werden nur abgerechnet, wenn die CPU tatsächlich Zyklen verbrennt. Idle-Container kosten nur Memory plus Storage, nicht Compute. Für Burst-Workloads ist das ein anderer Preisrahmen als bei AWS Fargate oder Fly.io.
  • Hostnames, Docker Hub, SSH: Workers sprechen Container über Service-Bindings an, Images kommen aus Docker Hub oder einer Registry, SSH funktioniert für Live-Debugging. Der Stack fühlt sich nach klassischem Linux an, nicht nach Edge-Sandbox.
  • Lücke zwischen Workers und EC2: Für Headless-Browser, ffmpeg, Pandoc oder kleine Inferenz-Endpoints war Workers bisher zu klein und EC2 zu schwer. Containers füllen genau diese mittlere Schicht und reduzieren den Stack-Sprung zu einem einzigen Anbieter.

Verwandt:Mini-PCs verdrängen 1HE-Server: Edge im RZ 2026  /  Cloudflare Containers Dokumentation

Was Containers GA wirklich mitbringt

Was ist ein Cloudflare Container? Ein Cloudflare Container ist ein kurzlebiger Linux-Container, die im Cloudflare-Edge-Netz läuft und von einem Worker über Service-Bindings angesprochen wird. Er liegt funktional zwischen einer Workers-Function und einer klassischen Cloud-VM und deckt Workloads ab, die mehr Laufzeit, mehr Speicher oder eine vollständige Linux-Toolchain brauchen.

Die GA-Version bringt drei harte Verbesserungen gegenüber der Public Beta. Active-CPU-Pricing rechnet nur die tatsächlich verbrauchten CPU-Zyklen ab, nicht die Wall-Clock-Zeit. Limits liegen bei Tausenden parallel laufenden Containern pro Account. Service-Bindings adressieren Container per Hostname statt per IP, was DNS-Logik und Discovery-Code aus dem Worker rausnimmt.

Dazu kommen Docker-Hub-Support für direkte Image-Pulls, SSH für Live-Debugging und Sandboxes als Schwester-Produkt für AI-Agent-Workloads mit persistenten Filesystem-Sessions. Wer einen Worker hat, der einen Headless-Browser für Screenshots oder eine Pandoc-Pipeline für PDFs braucht, ruft jetzt einen Container über Service-Binding auf, statt einen externen API-Anbieter dazwischenzuschalten.

300+
Cloudflare-Standorte weltweit, in denen Container ausgerollt werden können. Für DACH heißt das: Frankfurt, Düsseldorf, München, Wien und Zürich liegen näher am Endnutzer als jede AWS-Region.
Quelle: Cloudflare Network Map, Stand Mai 2026

Wo der Edge-Vorteil greift, wo nicht

Containers laufen nicht in jeder Edge-Location, sondern werden bei Bedarf in der nächstgelegenen verfügbaren Region gestartet. Für interaktive Web-Apps mit DACH-Nutzern bedeutet das in der Regel Frankfurt oder Düsseldorf. Latenzen zwischen Worker und Container liegen damit im einstelligen Millisekunden-Bereich, der Sprung zu einem klassischen Backend in Frankfurt oder Dublin entfällt. Die offizielle Plattform-Dokumentation listet die unterstützten Regionen und Limits explizit auf.

Wo das wirklich beißt, ist das Bild- und PDF-Processing. Ein Worker, der einen Container mit ImageMagick aufruft, spart sich einen Hop zu einem Lambda oder einem Render-Service plus dessen Cold-Start. Ähnlich für Headless-Browser-Workloads: Playwright in einem Container neben dem Worker liefert Screenshots in 700 bis 1.200 ms Total-Latency, wo der Umweg über einen externen Browserless-Endpoint oft das Doppelte braucht.

Was Containers nicht ersetzen, sind Long-Running-Services mit eigenem State. Eine Postgres-Instanz gehört nach wie vor in eine Datenbank-Plattform, ein Kafka-Broker auf eine VM. Containers sind kurzlebig, werden bei Inaktivität heruntergefahren und starten kalt neu. Wer das nicht im Kopf hat, baut Architekturen, die in der Rechnung am Monatsende überraschen.

Workers, Containers, EC2: was wann

Wann Containers passen

  • Headless-Browser, Pandoc, ffmpeg, Tesseract neben einem Worker
  • Kleine Inferenz-Endpoints, die nicht in eine Workers-AI-Funktion passen
  • CLI-Tools, die ein vollständiges Linux brauchen
  • Burst-Workloads mit langen Idle-Phasen, dank Active-CPU-Pricing

Wann nicht

  • Datenbanken oder andere Long-Running-Services mit lokalem State
  • Workloads, die feste Region-Garantien brauchen (Compliance)
  • GPU-Inferenz für große Modelle, hier bleibt Workers AI oder ein Hyperscaler
  • Bestandsstacks, die schon auf Kubernetes laufen und konsolidiert sind

Ein 60-Tage-Plan für DACH-Teams

Wer den Stack ernsthaft prüfen will, fängt nicht mit einer Migration an, sondern mit einem konkreten Workload, der heute weh tut.

60-Tage-Plan: Containers in den Workers-Stack einbauen
Woche 1 bis 2
Einen externen Service identifizieren, der heute über HTTP angesprochen wird (Browserless, ImageKit, Cloudconvert). Image bauen, lokal mit Docker testen, in einer Test-Wrangler-Konfiguration als Container deployen.
Woche 3 bis 4
Service-Binding aus dem Worker, Latency-Messung gegen den Status quo, Cold-Start-Verhalten unter Last prüfen. Logging über Workers Logs, kein eigener Stack.
Woche 5 bis 6
Active-CPU-Pricing gegen die alte Rechnung halten. Bei Burst-Workloads mit hohem Idle-Anteil rechnet sich der Wechsel meist klar, bei dauerlast-getriebenen nicht.
ab Woche 7
Produktiver Schwenk für den Pilot-Workload, Monitoring-Schwellen festlegen, einen zweiten Workload aussuchen. Erst danach über Architektur-Konsolidierung nachdenken.

Häufige Fragen

Brauche ich für Containers einen kostenpflichtigen Cloudflare-Plan?

Ja, Containers laufen auf dem Workers Paid Plan, der bei 5 US-Dollar pro Monat startet. Active-CPU-Pricing kommt obendrauf, abgerechnet wird Sekunden-genau. Für reine Tests reicht der Paid Plan, für produktive Setups mit hoher Last lohnt sich Workers Enterprise wegen besserer Limits und Support-SLAs.

Kann ich meine bestehenden Docker-Images direkt nutzen?

In den meisten Fällen ja. Cloudflare unterstützt Docker-Hub-Pulls und private Registries, Image-Größen bis mehrere Gigabyte sind machbar. Was nicht funktioniert sind Images, die auf Privileged-Mode oder spezielle Kernel-Module setzen und Workloads mit GPU-Anforderungen jenseits dessen, was Cloudflare-Container heute bieten.

Wie verhält sich der Stack zu DSGVO und Datenresidenz?

Cloudflare bietet Region-Affinity-Optionen, mit denen Container in EU-Standorten gepinnt werden können. Wer harte Datenresidenz braucht (öffentlicher Sektor, Banken), prüft die Enterprise-Konfiguration und holt eine schriftliche Zusicherung. Standard-Setups landen pragmatisch in Frankfurt oder Amsterdam, was für die meisten DACH-Workloads ausreicht.

Über den Autor

Adrian Garcia-Kunz ist Web Developer bei Evernine. Er kommt aus dem Frontend-Stack, kennt aber den Punkt, an dem ein Worker oder eine Lambda nicht mehr reicht. Er hält wenig von Stack-Modetheater und viel von Tools, die in sechs Monaten noch laufen.

Bildquelle: KI-generiert (Mai 2026), C2PA-Zertifikat im Bild hinterlegt

Auch verfügbar in

Ein Magazin der Evernine Media GmbH