6 Min. Lesezeit
Nvidia-CEO Jensen Huang landete am Samstag, 24. Mai, in Taipeh, acht Tage vor seiner GTC-Keynote am 1. Juni und parallel zu einem Anlauf bei TSMC, an dem die Vera-Rubin-Rampe hängt. Vier Tage vorher, am 20. Mai, war AMD-Chefin Lisa Su in derselben Stadt aufgeschlagen, mit einer Pressemitteilung im Gepäck: mehr als 9 Milliarden Euro in das taiwanische Packaging-Ökosystem, drei Jahre Laufzeit, ASE und SPIL als zentrale Partner. Für DACH-Cloud-Architekten ist das keine Asien-Story, sondern ein H2-Signal.
26.05.2026
Das Wichtigste in Kürze
- Doppel-Auftritt vor der Computex: Su seit 20.05. in Taipeh mit 10-Milliarden-Ankündigung, Huang seit 24.05. mit TSMC-Stop. Beide CEOs eine Woche vor der bisher größten Messe-Ausgabe (1.500 Aussteller, vier Standorte, 2.-5. Juni).
- AMDs Setzung zielt auf Advanced Packaging: ASE und SPIL als Partner, Elevated-Fan-Out-Bridge (EFB) als Technologie. Das adressiert genau den CoWoS-Engpass, an dem Nvidias Lieferkette aktuell hängt.
- Konsequenz für Cloud-Teams: Vera-Rubin-Volumen bleibt eng, Inferenz-Slots werden teurer, AMDs Instinct-Linie wird in H2-Procurement zur ernsthaften Zweitoption. Wer 2026 nur Nvidia geplant hat, sollte das Sourcing-Modell jetzt erweitern.
Verwandt:AWS und Nvidia: GPU-Million zwingt Platform-Teams / FinOps für KI-Inferenz
Was am Wochenende in Taipeh wirklich passierte
Was ist Advanced Packaging? Advanced Packaging beschreibt das Stack-and-Bond zwischen Logik-Die und High-Bandwidth-Memory, das eine moderne KI-GPU erst einsatzfähig macht. CoWoS bei TSMC ist die bekannteste Variante, AMDs Elevated-Fan-Out-Bridge die Antwort darauf. Wer hier Kapazität hat, bestimmt das Auslieferungstempo der nächsten GPU-Generation.
Die Reihenfolge der Ereignisse erklärt das Spielfeld. Su platzierte AMDs Setzung in dem Fenster, in dem alle Augen ohnehin nach Taipeh schauen. Huang kam später, aber mit der größeren Geste: einer Pilger-Tour zu TSMC und einem öffentlichen Bekenntnis zu Vera Rubin als größtem Produkt-Launch der Insel-Geschichte.
Chronik der Computex-Woche
- Mi 20.05.: AMD-CEO Lisa Su trifft in Taipeh ein. AMD-IR-Pressemitteilung kündigt mehr als 9 Milliarden Euro Ecosystem-Investitionen über drei Jahre an. Fokus: Advanced Packaging mit ASE und SPIL.
- Do 21.05.: Reuters und CNBC verifizieren den Investitionsumfang. Su besucht TSMC zur Klärung der 2-Nanometer-Kapazität.
- Sa 24.05.: Nvidia-CEO Jensen Huang landet nachmittags in Taipeh. Erstes Statement: Vera Rubin sei der größte Produkt-Launch in Taiwans Geschichte.
- So-Mo 25.-26.05.: Huang besucht TSMC zur Rampen-Abstimmung. Aufschlag bei Meet-a-Claw mit der lokalen Developer-Community.
- Mo 01.06.: GTC-Taipei-Keynote im Taipei Music Center, 11 Uhr Ortszeit. Computex startet am 02.06. an vier Standorten in Taipeh.
Die Primärquelle für den AMD-Schritt ist die Investor-Relations-Mitteilung vom 20. Mai. Sie nennt EFB-Technologie und beziffert das Volumen explizit auf drei Jahre. Wer das nur als Marketing liest, unterschätzt den Punkt: AMD platziert die Mittel dort, wo Nvidia heute den Engpass hat.
Warum die Packaging-Setzung das Spielfeld verschiebt
CoWoS war 2024 und 2025 der namentlich größte Bottleneck im KI-Stack. Nvidias H100 und H200, später Blackwell, hingen alle an TSMCs CoWoS-Kapazität, weil sich High-Bandwidth-Memory ohne Advanced Packaging nicht sauber an die GPU heften lässt. Wer eine GB200-Bestellung vor 18 Monaten platziert hat, hat das Lieferdatum noch nicht.
AMDs 10-Milliarden-Setzung zielt nicht auf den Wafer, sondern auf diese Schicht. ASE und SPIL sind die zwei größten Outsourced-Assembly-Player Asiens, Elevated-Fan-Out-Bridge (EFB) ist AMDs hauseigene Antwort auf CoWoS-L. Drei Jahre Laufzeit klingt nach Hauptplanung, nicht nach Reaktion.
Parallel hat Huang die Botschaft seines Aufschlags klar gemacht: Vera Rubin sei der größte Produkt-Launch der Insel-Geschichte. Das ist Marketing-Sprache, hat aber einen harten Kern: Nvidia bindet die nächste GPU-Generation noch enger an TSMCs Roadmap. AWS hat dazu vor vier Tagen seine Millionen-GPU-Setzung sichtbar gemacht und Microsoft, Meta und Google haben für 2026 ähnliche Volumina avisiert. Wenn die Packaging-Kapazität eng bleibt, geht das Volumen primär an die Hyperscaler, weniger an DACH-Mittelstand-Cluster.
Drei Konsequenzen für DACH-Cloud-Architekten
Die Computex-Woche ist für europäische Plattform-Teams keine Asien-Nachricht, sondern ein Indikator für die zweite Jahreshälfte.
Erstens: Inferenz-Slots bleiben knapp. Wer im H2 GPU-Inferenz-Kapazität plant, sollte nicht von sinkenden Spot-Preisen ausgehen. Die Hyperscaler ziehen Volumen, der Sekundär-Markt für Inferenz schrumpft. Die FinOps-Lehre der letzten Monate bleibt gültig: Reservierungen lohnen sich, On-Demand wird zur teuren Notlösung.
Zweitens: AMD Instinct wird Pflicht-Position im Sourcing. Bis Mitte 2025 war AMDs MI300 für DACH-Cloud-Teams oft die Nice-to-Have-Alternative. Mit der Packaging-Setzung und MI355X-Verfügbarkeit verschiebt sich das. Wer 2026 ausschließlich Nvidia geplant hat, sollte das Procurement-Modell überprüfen. Nicht aus Markenliebe, sondern weil Liefersicherheit zur zweiten Achse wird.
Drittens: Inferenz-Architektur wird wichtiger als die nächste GPU-Generation. Wenn die Knappheit anhält, ist der Hebel nicht das nächste Vendor-Briefing, sondern das eigene Inferenz-Layout. Quantisierung, KV-Cache-Strategie, Batch-Routing zwischen Cloud-Regionen, das alles wirkt stärker auf die Rechnung als ein H200-zu-H100-Wechsel. Das Inferenz-Playbook ist der praktischere Startpunkt als ein neuer Hyperscaler-Vertrag.
Was bis zur Keynote am Montag offen ist
Drei Punkte sind bis zur GTC-Taipei-Keynote am 1. Juni nicht geklärt. Erstens ob Huang eine Vera-Rubin-Verfügbarkeit für DACH-Hyperscaler-Regionen konkretisiert. Zweitens ob TSMC öffentlich auf AMDs Packaging-Setzung reagiert, etwa mit einer eigenen CoWoS-Ausbau-Zahl. Drittens ob auf der Computex selbst ein deutscher OEM den Schritt geht und auf Mischbestückung Nvidia plus AMD wechselt.
Bis dahin gilt für Cloud-Architekten der pragmatische Schritt: Sourcing-Modell ehrlich anschauen, Inferenz-Stack als Kostenhebel behandeln, GPU-Strategie nicht als Markenwahl planen.
Häufige Fragen
Was bedeutet die Computex-Doppel-Auftritt von Su und Huang konkret für GPU-Lieferungen in DACH?
Kurzfristig nichts. Mittelfristig viel. Die Hyperscaler binden über 2026 hinweg den größten Teil der Packaging-Kapazität bei TSMC und neuerdings auch bei ASE und SPIL. DACH-Cloud-Teams, die GPU-Server selbst betreiben wollen, sollten mit längeren Lead-Times für GB200 und MI355X planen und Mischbestückung als Plan A behandeln, nicht als Plan B.
Lohnt sich AMD Instinct heute schon als Inferenz-Plattform?
Für viele Inferenz-Workloads ja. MI300 und MI355X liefern in Memory-bandbreiten-limitierten Szenarien konkurrenzfähige Tokens pro Sekunde und Euro. Die Software-Lücke gegenüber CUDA schließt sich langsam: ROCm 7 deckt heute die meisten LLM-Stacks ab. Wer Quantisierung, vLLM oder TGI ohnehin nutzt, kann AMD heute realistisch testen.
Was unterscheidet CoWoS von Elevated-Fan-Out-Bridge?
CoWoS setzt die Dies auf einen Silizium-Interposer, EFB nutzt Brücken-Strukturen für die Verbindung zwischen Logik-Die und HBM-Stacks. Für den Architekten relevant: EFB skaliert in der Fläche anders und entlastet die TSMC-Engpässe bei klassischem CoWoS. Wenn AMDs Ansatz hält, was das Investment verspricht, entsteht 2027 zum ersten Mal eine zweite, unabhängige Packaging-Quelle.
Wie sollten Cloud-Architekten jetzt ihre H2-Procurement-Planung anpassen?
Erstens GPU-Reservierungen nicht nur auf Nvidia setzen, sondern AMD-SKUs in das Sourcing-Modell aufnehmen. Zweitens Inferenz-Workloads daraufhin prüfen, welche Bandbreiten- statt Compute-limitiert laufen, weil dort der AMD-Vorteil sitzt. Drittens beim Hyperscaler die Reservierungs-Fenster für Q3 und Q4 fixieren, bevor die Computex-Ankündigungen die Nachfrage zusätzlich anheizen.
Welche Computex-Keynote sollte ein Cloud-Architekt am 1. Juni live verfolgen?
Die GTC-Taipei-Keynote von Jensen Huang um 11 Uhr Taipei-Zeit. Zwei Dinge sind dort entscheidend: Wird ein konkretes Vera-Rubin-Lieferdatum für Hyperscaler-Regionen außerhalb der USA genannt? Und kommt eine Aussage zur Software-Schicht, also wie sich CUDA und NIM gegen ROCm und Triton positionieren? Beides hat direkten Einfluss auf die Architektur-Entscheidungen in Q3.
Mehr aus dem MBF Media Netzwerk
Wenn AI-Productivity teuer wird: was die Tool-Konsolidierung kostet
Bildquelle: KI-generiert (Juni 2026), C2PA-Zertifikat im Bild hinterlegt