OpenRouter Fusion API: Fable-Level KI zum halben Preis (2026)
Veröffentlicht: 15. Juni 2026 | Lesezeit: 6 Minuten
Am 12.–13. Juni 2026 kollidierten zwei Geschichten auf X: Anthropic setzte Claude Fable 5 aufgrund einer US-Regierungsanordnung aus – und OpenRouter stellte Fusion vor, ein compound-model-API, das CEO Alex Atallah als „Fable-Level-Intelligenz zum halben Preis“ bewirbt.
Fusion ist kein weiteres monolithisches Modell. Es ist ein Panel von frontier models, das parallel antwortet, ein Judge, der Konsens und Widersprüche synthetisiert, und ein finaler Writer, der eine einzige kohärente Antwort erzeugt – alles zugänglich über das einfache Model-Alias "model": "openrouter/fusion" in jedem OpenAI-kompatiblen Client.
Für Entwickler, die sich auf Fable 5 für hochriskante Analysen und tiefgehende Forschung verlassen haben, ist dies die derzeit zeitkritischste Alternative auf dem Markt. Das sollten Sie wissen.
TL;DR
Der Zeitpunkt: Warum jetzt?
Fable 5 und Mythos 5 wurden am 12. Juni 2026 nach einer Anordnung des US-Handelsministeriums wegen nationaler Sicherheitsbedenken ausgesetzt. API-Aufrufe an claude-fable-5 schlagen jetzt fehl; neue Claude-Sessions fallen auf Opus 4.8 zurück. Die Entwickler-Community war unvorbereitet.
Der Launch von OpenRouter fiel in dieselbe Woche. Wie ein Entwickler auf X zusammenfasste: „Fable 5 für 12 Stunden ausgefallen… keine Sorge — OpenRouter Fusion ist da. Wir haben ein Panel von Modellen kombiniert und liegen bei 1 % der Performance von Fable 5 zum halben Preis. Einfach model: openrouter/fusion.“
Fusion repliziert Fable 5 nicht – es umgeht die Abhängigkeit von einem einzelnen Anbieter, indem es Ausgaben von Opus, GPT-5.x-Klasse und Gemini-Modellen kombiniert. Es ist ein grundlegend anderer architektonischer Ansatz: Statt eines einzigen riesigen Modells erhalten Sie ein Ensemble, das durch Deliberation frontier-Performance erreichen kann.
Wie Fusion funktioniert
OpenRouter Fusion implementiert eine compound-model-Pipeline, die jede Anfrage durch vier Stufen leitet:
Your request → Model decides whether to invoke fusion
→ Panel (1-8 models) answers in parallel + web_search + web_fetch
→ Judge compares → structured JSON (consensus, contradictions, blind spots)
→ Final model writes answer from analysisStruktur des Judge-Outputs
Der Judge fügt den Text nicht blind zusammen. Er gibt eine strukturierte Analyse zurück mit:
- Consensus — Punkte, denen die meisten Modelle zustimmen (höheres Vertrauen)
- Contradictions — direkte Meinungsverschiedenheiten zwischen den Panel-Mitgliedern
- Partial coverage — Themen, die nur einige Modelle behandelt haben
- Unique insights — Ideen einzelner Modelle
- Blind spots — Lücken, die kein Panel-Mitglied abgedeckt hat
Dieser strukturierte Ansatz bedeutet, dass Sie mehr als nur eine Antwort erhalten – Sie erhalten Einblick warum das Modell zuversichtlich ist und wo Uneinigkeit besteht.
Qualitäts-Panel (Standard)
Jedes Panel-Mitglied arbeitet mit aktivierten Web-Search- und Web-Fetch-Tools (standardmäßig bis zu 8 Tool-Aufrufe). Wichtig: Innere Aufrufe sind vor Rekursion geschützt – Panel- und Judge-Modelle können Fusion nicht erneut aufrufen, sodass die Deliberation nur eine Ebene tief geht.
Zwei Wege, Fusion aufzurufen
Option 1 — Model-Alias (am einfachsten):
{
"model": "openrouter/fusion",
"messages": [
{ "role": "user", "content": "Compare ridge, lasso, and elastic-net regression for a financial risk model." }
]
}Option 2 — Server-Tool auf Ihrem eigenen Modell:
{
"model": "~anthropic/claude-opus-latest",
"messages": [{ "role": "user", "content": "..." }],
"tools": [{ "type": "openrouter:fusion" }]
}Beide nutzen dieselbe Pipeline. Ihr Modell entscheidet wann Fusion den zusätzlichen Aufwand wert ist – es fungiert als intelligentes Middleware, nicht nur als brute-force Ensemble.
Vollständiges TypeScript-Beispiel
const response = await fetch('https://openrouter.ai/api/v1/chat/completions', {
method: 'POST',
headers: {
Authorization: `Bearer ${process.env.OPENROUTER_API_KEY}`,
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'openrouter/fusion',
messages: [
{
role: 'user',
content: 'What are the strongest arguments for and against carbon taxes?',
},
],
plugins: [
{
id: 'fusion',
analysis_models: [
'~anthropic/claude-opus-latest',
'~openai/gpt-latest',
],
},
],
}),
});
const data = await response.json();
console.log(data.choices[0].message.content);OpenRouter berechnet jede Panel-Completion + Judge-Aufruf separat – prüfen Sie Ihren Activity-Tab, um genau zu sehen, welche Modelle ausgeführt wurden und was sie gekostet haben.
Performance und Preisgestaltung: Was die Benchmarks zeigen
Die zentrale Erkenntnis: Betrachten Sie diese Zahlen als orientierend, bis Sie sie mit Ihrem eigenen Aufgabenmix reproduzieren. Fusion optimiert für analytische Tiefe, nicht für reine Geschwindigkeit. Bei Aufgaben, die von mehreren Perspektiven profitieren — Rechtsanalyse, medizinische Forschung, strategische Planung — kann der Ensemble-Ansatz sogar Top-Einzelmodelle übertreffen.
Wann Fusion gewinnt
- Mehrstufige Forschung mit Web-Grundlage
- Entscheidungen, bei denen falsche Antworten teuer sind
- Aufgaben, die von Modell-Diversität profitieren (Recht, Medizin, Finanzanalyse — immer mit menschlicher Validierung)
Wann Fusion verliert
- Sub-Sekunden-Chat-Antworten
- Einfaches Code-Completion
- Hochvolumige Batch-Jobs, bei denen Token-Multiplikation Ihr Budget belastet
Fusion vs. andere Multi-Model-Ansätze
OpenRouters entscheidendes Merkmal: Drop-in-Kompatibilität über openrouter/fusion in bestehenden OpenAI-kompatiblen Stacks. Kein benutzerdefinierter Orchestrierungscode, keine zusätzliche Infrastruktur. Wenn Ihre App bereits das OpenAI-API-Format spricht, können Sie mit einer Zeilenänderung zu Fusion wechseln.
Für Entwickler, die Routing ohne volles Fusion-Setup benötigen, bietet OpenRouter zudem Auto Router (Modellauswahl basierend auf Aufgabe) und Pareto Code Router (coding-optimierte Modellauswahl).
Wer sollte Fusion jetzt in Betracht ziehen
- Teams, die durch Fable 5 blockiert sind — Das Ensemble kann die Tiefenlücke überbrücken, bis Wiederherstellungs-Zeitpläne klarer sind
- Forschungspipelines — Integrierte Web-Suche pro Panel-Mitglied reduziert eigenen Aufwand
- Kostenbewusste Teams — Das Budget-Preset bietet überzeugenden Wert gegenüber teuren Solo-Frontier-Modellen
- Multi-Vendor-Strategen — Reduziert das Risiko eines Single-Point-of-Failure in Ihrem KI-Stack
Falls Sie Anthropic-spezifische Werkzeuge wie Claude Code oder MCP-Workflows benötigen, beachten Sie, dass Fusion nur API-basiert ist. Es ergänzt diese Werkzeuge, ersetzt sie jedoch nicht.
Fazit
OpenRouter Fusion ist ein compound-model-API, das nahezu Fable 5-Forschungs-Performance zu etwa halbierten Kosten liefert – genau zu dem Moment, an dem die Entwickler-Community eine Alternative am dringendsten brauchte. Es setzt auf Modell-Diversität statt Modell-Größe, und die ersten Ergebnisse sind vielversprechend.
Der Kompromiss ist klar: mehr Tokens, höhere Latenz, aber mehr Intelligenz pro Dollar bei schwierigen Fragen. Für Teams, die bereits OpenRouter's API-Gateway nutzen, erfordert das Hinzufügen von Fusion nur eine Code-Zeile. Für Teams, die an einen einzigen Anbieter gebunden sind, ist es ein überzeugender Grund, zu diversifizieren.
Probieren Sie den Fusion Lab Playground aus, bevor Sie ihn in Produktionspipelines einbinden, und benchmarken Sie stets gegen Ihre eigenen Workloads — die Ergebnisse können variieren.
Möchten Sie besprechen, wie zusammengesetzte KI-Modelle in Ihre Technologielandschaft passen? Bei aratech helfen wir Unternehmen, KI-Systeme zu bewerten, zu integrieren und zu optimieren, um reale Leistungsfähigkeit zu erzielen. Kontakt aufnehmen →