Zurück zur Übersicht
Production-Benchmarks auf einem neun-Knoten-OCI-Bare-Metal-Cluster mit 72 H100-GPUs zeigen, dass WEKAs NeuralMesh mit Augmented Memory Grid gegenüber DRAM-only-Konfigurationen rund 10× mehr gleichzeitige Nutzer und 10× höheren Token-Durchsatz erreicht.
WEKA und Oracle Cloud Infrastructure veröffentlichten Production-Benchmarks, die auf einem neun-Knoten-Bare-Metal-H100-Cluster mit insgesamt 72 GPUs und Tests mit 100.000-Token-Kontextfenstern durchgeführt wurden. Im Vergleich zu DRAM-only-Konfigurationen berichten die Partner von etwa 10× mehr gleichzeitigen Nutzern, 10× höherem Token-Durchsatz und rund 7× mehr generierten Tokens pro GPU.
Laut den Angaben erreicht WEKAs NeuralMesh mit Augmented Memory Grid diese Verbesserungen, indem NVMe-gestützte Persistenz den nutzbaren Arbeitsspeicher der GPUs effektiv erweitert und damit die bisherige Speicherengstelle bei langen Kontexten entschärft. NeuralMesh mit Augmented Memory Grid ist über den Oracle Marketplace verfügbar.
Die Validierung verändert die Kosten- und Skalierungsbetrachtung für Anwendungen mit sehr langen Kontextfenstern wie multi-turn Agents und persistentem Memory. Ob sich die Benchmarkergebnisse in produktiven SLA-Umgebungen und unter unterschiedlichen Workloads reproduzieren lassen, bleibt anwendungsseitig zu prüfen.
Weiterlesen
Die Unternehmen wollen noch in diesem Jahr mit der Produktion vorgefertigter Referenzarchitekturen für hyperskalige KI-Racks beginnen. Die Partnerschaft zielt auf Standardisierung von Stromversorgung, Kühlung und Energiemanagement für Rechenzentren der nächsten Generation.
KKR hat mit Partnern die Gesellschaft Helix Digital Infrastructure angekündigt. Helix will über 10 Milliarden US-Dollar in Rechenzentren, Energie und Netz investieren, um Engpässe für großskalige KI Modelle zu beheben.
Die AI XPV Platform startet mit einer von Apollo angeführten 35 Milliarden US Dollar Kapitallösung. Ziel ist nach Angaben der Unternehmen, bis 2028 mehr als 20 Gigawatt KI Rechenkapazität bereitzustellen.
Auf der Konferenz INSPIRE 2026 in Shanghai präsentierte Huawei ein Paket für 'Agentic Infra' mit Cluster-, Speicher- und Runtime-Komponenten. Die Firma nennt konkrete Leistungswerte und kündigt ein Open-Source-Projekt für Enterprise-Agenten an.