Zurück zur Übersicht
OpenAI legt ein Leitfaden für unabhängige Evaluierungen von Frontier-Modellen vor. Im Zentrum stehen valide Testumgebungen, sogenannte Harnesses, und Prüfungen, die bei agentischen Systemen nicht das Setup statt die Modellleistung messen.
OpenAI hat ein Playbook für vertrauenswürdige Drittprüfungen von Frontier-Modellen veröffentlicht. Der Leitfaden soll unabhängige Evaluierungen systematischer machen und legt den Schwerpunkt auf belastbare Testumgebungen.
Im Kern fordert OpenAI valide Harnesses und klare Validitätsprüfungen, vor allem für agentische Systeme. Solche Modelle lassen sich nach Darstellung des Unternehmens nur dann sinnvoll bewerten, wenn die Tests die tatsächlichen Fähigkeiten abbilden.
Damit rückt eine oft unterschätzte Frage nach vorn: Nicht nur die Modelle müssen besser werden, sondern auch die Messmethoden. Wer KI im Ernstfall einsetzen will, braucht Benchmarks, die mehr leisten als glänzende Scorecards.
Weiterlesen
Interne, laut Quartz veröffentlichte Finanzunterlagen zeigen für 2025 einen Umsatz von rund 13,07 Milliarden US-Dollar bei deutlich höheren Aufwendungen. Der ausgewiesene Nettoverlust beträgt etwa 38,5 Milliarden Dollar und enthält einmalige Fair-Value-Anpassungen im Zuge einer Umwandlung.
Sensor Tower-Daten, zitiert von TechCrunch, zeigen für Ende Mai einen Anteil von 46,4 Prozent an der weltweiten Nutzung von KI‑Assistenten. Damit fragmentiert der Markt: Googles Gemini und Anthropic Claude gewinnen Nutzer, während das Generative‑KI‑App‑Segment höhere Einnahmen verzeichnet.
OpenAI kündigt ein globales Partnerprogramm an, das Berater, Systemintegratoren und Technologiepartner zertifizieren und fördern soll. Ziel ist, Unternehmen beim tatsächlichen Rollout von KI‑Lösungen zu unterstützen, nicht nur Modelle bereitzustellen.
Frankreich hat Sam Altman, Dario Amodei und Demis Hassabis zu einem Arbeitsessen mit Staats- und Regierungschefs beim G7-Gipfel (15.–17. Juni 2026) eingeladen. Auf der Agenda stehen KI-Governance, Online-Sicherheit und Infrastruktur.
Sam Altman, Dario Amodei und Demis Hassabis werden laut Berichten zum Treffen der G7 Staats und Regierungschefs erwartet. Ihre Teilnahme signalisiert, dass Staaten technische Expertise direkt in Gespräche über KI Sicherheit und Regulierung einbeziehen wollen.