26 Mai 2026

6 Min. Lesezeit

Nvidia-CEO Jensen Huang landete am Samstag, 24. Mai, in Taipeh, acht Tage vor seiner GTC-Keynote am 1. Juni und parallel zu einem Anlauf bei TSMC, an dem die Vera-Rubin-Rampe hängt. Vier Tage vorher, am 20. Mai, war AMD-Chefin Lisa Su in derselben Stadt aufgeschlagen, mit einer Pressemitteilung im Gepäck: mehr als 9 Milliarden Euro in das taiwanische Packaging-Ökosystem, drei Jahre Laufzeit, ASE und SPIL als zentrale Partner. Für DACH-Cloud-Architekten ist das keine Asien-Story, sondern ein H2-Signal.

26.05.2026

Das Wichtigste in Kürze

  • Doppel-Auftritt vor der Computex: Su seit 20.05. in Taipeh mit 10-Milliarden-Ankündigung, Huang seit 24.05. mit TSMC-Stop. Beide CEOs eine Woche vor der bisher größten Messe-Ausgabe (1.500 Aussteller, vier Standorte, 2.-5. Juni).
  • AMDs Setzung zielt auf Advanced Packaging: ASE und SPIL als Partner, Elevated-Fan-Out-Bridge (EFB) als Technologie. Das adressiert genau den CoWoS-Engpass, an dem Nvidias Lieferkette aktuell hängt.
  • Konsequenz für Cloud-Teams: Vera-Rubin-Volumen bleibt eng, Inferenz-Slots werden teurer, AMDs Instinct-Linie wird in H2-Procurement zur ernsthaften Zweitoption. Wer 2026 nur Nvidia geplant hat, sollte das Sourcing-Modell jetzt erweitern.

Verwandt:AWS und Nvidia: GPU-Million zwingt Platform-Teams  /  FinOps für KI-Inferenz

Was am Wochenende in Taipeh wirklich passierte

Was ist Advanced Packaging? Advanced Packaging beschreibt das Stack-and-Bond zwischen Logik-Die und High-Bandwidth-Memory, das eine moderne KI-GPU erst einsatzfähig macht. CoWoS bei TSMC ist die bekannteste Variante, AMDs Elevated-Fan-Out-Bridge die Antwort darauf. Wer hier Kapazität hat, bestimmt das Auslieferungstempo der nächsten GPU-Generation.

Die Reihenfolge der Ereignisse erklärt das Spielfeld. Su platzierte AMDs Setzung in dem Fenster, in dem alle Augen ohnehin nach Taipeh schauen. Huang kam später, aber mit der größeren Geste: einer Pilger-Tour zu TSMC und einem öffentlichen Bekenntnis zu Vera Rubin als größtem Produkt-Launch der Insel-Geschichte.

Chronik der Computex-Woche

  • Mi 20.05.: AMD-CEO Lisa Su trifft in Taipeh ein. AMD-IR-Pressemitteilung kündigt mehr als 9 Milliarden Euro Ecosystem-Investitionen über drei Jahre an. Fokus: Advanced Packaging mit ASE und SPIL.
  • Do 21.05.: Reuters und CNBC verifizieren den Investitionsumfang. Su besucht TSMC zur Klärung der 2-Nanometer-Kapazität.
  • Sa 24.05.: Nvidia-CEO Jensen Huang landet nachmittags in Taipeh. Erstes Statement: Vera Rubin sei der größte Produkt-Launch in Taiwans Geschichte.
  • So-Mo 25.-26.05.: Huang besucht TSMC zur Rampen-Abstimmung. Aufschlag bei Meet-a-Claw mit der lokalen Developer-Community.
  • Mo 01.06.: GTC-Taipei-Keynote im Taipei Music Center, 11 Uhr Ortszeit. Computex startet am 02.06. an vier Standorten in Taipeh.

Die Primärquelle für den AMD-Schritt ist die Investor-Relations-Mitteilung vom 20. Mai. Sie nennt EFB-Technologie und beziffert das Volumen explizit auf drei Jahre. Wer das nur als Marketing liest, unterschätzt den Punkt: AMD platziert die Mittel dort, wo Nvidia heute den Engpass hat.

Warum die Packaging-Setzung das Spielfeld verschiebt

CoWoS war 2024 und 2025 der namentlich größte Bottleneck im KI-Stack. Nvidias H100 und H200, später Blackwell, hingen alle an TSMCs CoWoS-Kapazität, weil sich High-Bandwidth-Memory ohne Advanced Packaging nicht sauber an die GPU heften lässt. Wer eine GB200-Bestellung vor 18 Monaten platziert hat, hat das Lieferdatum noch nicht.

AMDs 10-Milliarden-Setzung zielt nicht auf den Wafer, sondern auf diese Schicht. ASE und SPIL sind die zwei größten Outsourced-Assembly-Player Asiens, Elevated-Fan-Out-Bridge (EFB) ist AMDs hauseigene Antwort auf CoWoS-L. Drei Jahre Laufzeit klingt nach Hauptplanung, nicht nach Reaktion.

Parallel hat Huang die Botschaft seines Aufschlags klar gemacht: Vera Rubin sei der größte Produkt-Launch der Insel-Geschichte. Das ist Marketing-Sprache, hat aber einen harten Kern: Nvidia bindet die nächste GPU-Generation noch enger an TSMCs Roadmap. AWS hat dazu vor vier Tagen seine Millionen-GPU-Setzung sichtbar gemacht und Microsoft, Meta und Google haben für 2026 ähnliche Volumina avisiert. Wenn die Packaging-Kapazität eng bleibt, geht das Volumen primär an die Hyperscaler, weniger an DACH-Mittelstand-Cluster.

Drei Konsequenzen für DACH-Cloud-Architekten

Die Computex-Woche ist für europäische Plattform-Teams keine Asien-Nachricht, sondern ein Indikator für die zweite Jahreshälfte.

Erstens: Inferenz-Slots bleiben knapp. Wer im H2 GPU-Inferenz-Kapazität plant, sollte nicht von sinkenden Spot-Preisen ausgehen. Die Hyperscaler ziehen Volumen, der Sekundär-Markt für Inferenz schrumpft. Die FinOps-Lehre der letzten Monate bleibt gültig: Reservierungen lohnen sich, On-Demand wird zur teuren Notlösung.

Zweitens: AMD Instinct wird Pflicht-Position im Sourcing. Bis Mitte 2025 war AMDs MI300 für DACH-Cloud-Teams oft die Nice-to-Have-Alternative. Mit der Packaging-Setzung und MI355X-Verfügbarkeit verschiebt sich das. Wer 2026 ausschließlich Nvidia geplant hat, sollte das Procurement-Modell überprüfen. Nicht aus Markenliebe, sondern weil Liefersicherheit zur zweiten Achse wird.

Drittens: Inferenz-Architektur wird wichtiger als die nächste GPU-Generation. Wenn die Knappheit anhält, ist der Hebel nicht das nächste Vendor-Briefing, sondern das eigene Inferenz-Layout. Quantisierung, KV-Cache-Strategie, Batch-Routing zwischen Cloud-Regionen, das alles wirkt stärker auf die Rechnung als ein H200-zu-H100-Wechsel. Das Inferenz-Playbook ist der praktischere Startpunkt als ein neuer Hyperscaler-Vertrag.

Was bis zur Keynote am Montag offen ist

Drei Punkte sind bis zur GTC-Taipei-Keynote am 1. Juni nicht geklärt. Erstens ob Huang eine Vera-Rubin-Verfügbarkeit für DACH-Hyperscaler-Regionen konkretisiert. Zweitens ob TSMC öffentlich auf AMDs Packaging-Setzung reagiert, etwa mit einer eigenen CoWoS-Ausbau-Zahl. Drittens ob auf der Computex selbst ein deutscher OEM den Schritt geht und auf Mischbestückung Nvidia plus AMD wechselt.

Bis dahin gilt für Cloud-Architekten der pragmatische Schritt: Sourcing-Modell ehrlich anschauen, Inferenz-Stack als Kostenhebel behandeln, GPU-Strategie nicht als Markenwahl planen.

Häufige Fragen

Was bedeutet die Computex-Doppel-Auftritt von Su und Huang konkret für GPU-Lieferungen in DACH?

Kurzfristig nichts. Mittelfristig viel. Die Hyperscaler binden über 2026 hinweg den größten Teil der Packaging-Kapazität bei TSMC und neuerdings auch bei ASE und SPIL. DACH-Cloud-Teams, die GPU-Server selbst betreiben wollen, sollten mit längeren Lead-Times für GB200 und MI355X planen und Mischbestückung als Plan A behandeln, nicht als Plan B.

Lohnt sich AMD Instinct heute schon als Inferenz-Plattform?

Für viele Inferenz-Workloads ja. MI300 und MI355X liefern in Memory-bandbreiten-limitierten Szenarien konkurrenzfähige Tokens pro Sekunde und Euro. Die Software-Lücke gegenüber CUDA schließt sich langsam: ROCm 7 deckt heute die meisten LLM-Stacks ab. Wer Quantisierung, vLLM oder TGI ohnehin nutzt, kann AMD heute realistisch testen.

Was unterscheidet CoWoS von Elevated-Fan-Out-Bridge?

CoWoS setzt die Dies auf einen Silizium-Interposer, EFB nutzt Brücken-Strukturen für die Verbindung zwischen Logik-Die und HBM-Stacks. Für den Architekten relevant: EFB skaliert in der Fläche anders und entlastet die TSMC-Engpässe bei klassischem CoWoS. Wenn AMDs Ansatz hält, was das Investment verspricht, entsteht 2027 zum ersten Mal eine zweite, unabhängige Packaging-Quelle.

Wie sollten Cloud-Architekten jetzt ihre H2-Procurement-Planung anpassen?

Erstens GPU-Reservierungen nicht nur auf Nvidia setzen, sondern AMD-SKUs in das Sourcing-Modell aufnehmen. Zweitens Inferenz-Workloads daraufhin prüfen, welche Bandbreiten- statt Compute-limitiert laufen, weil dort der AMD-Vorteil sitzt. Drittens beim Hyperscaler die Reservierungs-Fenster für Q3 und Q4 fixieren, bevor die Computex-Ankündigungen die Nachfrage zusätzlich anheizen.

Welche Computex-Keynote sollte ein Cloud-Architekt am 1. Juni live verfolgen?

Die GTC-Taipei-Keynote von Jensen Huang um 11 Uhr Taipei-Zeit. Zwei Dinge sind dort entscheidend: Wird ein konkretes Vera-Rubin-Lieferdatum für Hyperscaler-Regionen außerhalb der USA genannt? Und kommt eine Aussage zur Software-Schicht, also wie sich CUDA und NIM gegen ROCm und Triton positionieren? Beides hat direkten Einfluss auf die Architektur-Entscheidungen in Q3.

Bildquelle: KI-generiert (Juni 2026), C2PA-Zertifikat im Bild hinterlegt

Auch verfügbar in

Ein Magazin der Evernine Media GmbH