OpenRouter Fusion API : IA de niveau Fable à moitié prix (2026)
Publié : 15 juin 2026 | Temps de lecture : 6 minutes
Le 12-13 juin 2026, deux actualités se sont heurtées sur X : Anthropic a suspendu Claude Fable 5 suite à une directive du gouvernement américain — et OpenRouter a lancé Fusion, une API à modèle composé que le PDG Alex Atallah décrit comme « intelligence de niveau Fable à moitié prix ».
Fusion n'est pas un autre modèle monolithique. C'est un panel de modèles de pointe répondant en parallèle, un juge qui synthétise consensus et contradictions, et un rédacteur final qui produit une réponse cohérente unique — le tout accessible via le simple alias de modèle "model": "openrouter/fusion" sur n'importe quel client compatible OpenAI.
Pour les développeurs qui s'appuyaient sur Fable 5 pour des analyses à enjeux élevés et de la recherche approfondie, c'est l'alternative la plus opportune du marché. Voici ce qu'il faut savoir.
TL;DR
Le timing : pourquoi maintenant ?
Fable 5 et Mythos 5 ont été suspendus le 12 juin 2026 suite à une directive du Département du Commerce des États-Unis pour des raisons de sécurité nationale. Les appels API vers claude-fable-5 renvoient maintenant une erreur ; les nouvelles sessions Claude retombent à Opus 4.8. La communauté des développeurs a été prise au dépourvu.
Le lancement d'OpenRouter a eu lieu la même semaine. Comme un développeur l'a résumé sur X : « Fable 5 en panne pendant 12 heures… ne craignez rien — OpenRouter Fusion est là. Nous avons combiné un panel de modèles et atteint à moins de 1 % des performances de Fable 5 à moitié prix. Il suffit de model: openrouter/fusion. »
Fusion ne reproduit pas Fable 5 — il contourne la dépendance à un seul fournisseur en combinant les sorties d'Opus, de la classe GPT-5.x et des modèles Gemini. C'est une approche architecturale fondamentalement différente : au lieu d'un seul modèle très grand, vous obtenez un ensemble capable d'égaler les performances de pointe grâce à la délibération.
Comment Fusion fonctionne
OpenRouter Fusion implémente un pipeline à modèle composé qui traite chaque requête en quatre étapes :
Votre requête → Le modèle décide d'appeler la fusion
→ Panel (1-8 modèles) répond en parallèle + web_search + web_fetch
→ Juge compare → JSON structuré (consensus, contradictions, points aveugles)
→ Modèle final rédige la réponse à partir de l'analyseStructure de sortie du juge
Le juge ne fusionne pas le texte à l'aveugle. Il renvoie une analyse structurée contenant :
- Consensus — Points sur lesquels la plupart des modèles s'accordent (confiance élevée)
- Contradictions — Désaccords directs entre les membres du panel
- Couverture partielle — Sujets abordés seulement par certains modèles
- Idées uniques — Apports provenant de modèles individuels
- Points aveugles — Lacunes qu'aucun modèle du panel n'a couvertes
Cette approche structurée vous donne plus qu'une simple réponse : vous obtenez une visibilité sur le pourquoi du niveau de confiance du modèle et le où les désaccords existent.
Panel de qualité (par défaut)
Chaque membre du panel s'exécute avec les outils de recherche web et de récupération activés (jusqu'à 8 appels d'outils par défaut). Important : les appels internes sont protégés contre la récursion — les modèles du panel et le juge ne peuvent pas ré-appeler la fusion, gardant la délibération à un seul niveau de profondeur.
Deux façons d'appeler Fusion
Option 1 — Alias du modèle (le plus simple) :
{
"model": "openrouter/fusion",
"messages": [
{ "role": "user", "content": "Compare ridge, lasso, and elastic-net regression for a financial risk model." }
]
}Option 2 — Outil serveur sur votre propre modèle :
{
"model": "~anthropic/claude-opus-latest",
"messages": [{ "role": "user", "content": "..." }],
"tools": [{ "type": "openrouter:fusion" }]
}Les deux options passent par le même pipeline. Votre modèle décide quand la fusion vaut le coût supplémentaire — ce qui en fait un middleware intelligent, pas seulement un ensemble de force brute.
Exemple complet TypeScript
const response = await fetch('https://openrouter.ai/api/v1/chat/completions', {
method: 'POST',
headers: {
Authorization: `Bearer ${process.env.OPENROUTER_API_KEY}`,
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'openrouter/fusion',
messages: [
{
role: 'user',
content: 'What are the strongest arguments for and against carbon taxes?',
},
],
plugins: [
{
id: 'fusion',
analysis_models: [
'~anthropic/claude-opus-latest',
'~openai/gpt-latest',
],
},
],
}),
});
const data = await response.json();
console.log(data.choices[0].message.content);OpenRouter facture chaque complétion du panel + chaque appel du juge séparément — consultez votre onglet Activité pour voir exactement quels modèles ont été exécutés et à quel coût.
Performance et tarification : ce que disent les benchmarks
Le point principal : considérez ces chiffres comme indicatifs jusqu'à ce que vous les reproduisiez sur votre propre jeu de tâches. Fusion optimise la profondeur analytique, pas la vitesse brute. Sur les tâches qui bénéficient de multiples points de vue — analyse juridique, recherche médicale, planification stratégique — l'approche ensembliste peut dépasser même les meilleurs modèles individuels.
Quand Fusion l'emporte
- Recherche à plusieurs étapes avec ancrage web
- Décisions où une mauvaise réponse est coûteuse
- Tâches tirant parti de la diversité des modèles (juridique, médical, analyse financière — toujours avec validation humaine)
Quand Fusion perd
- Réponses de chat en moins d'une seconde
- Complétion de code simple
- Jobs par lots à haut volume où la multiplication des tokens pèse sur le budget
Fusion vs autres approches multi-modèles
La caractéristique phare d'OpenRouter : compatibilité plug-and-play via openrouter/fusion sur les piles déjà compatibles OpenAI. Aucun code d'orchestration personnalisé, aucune infrastructure supplémentaire. Si votre application parle déjà le format API OpenAI, vous pouvez passer à Fusion avec une modification d'une ligne.
Pour les développeurs qui ont besoin de routage sans fusion complète, OpenRouter propose aussi Auto Router (sélection de modèle selon la tâche) et Pareto Code Router (sélection optimisée pour le code).
Qui devrait envisager Fusion dès maintenant
- Équipes bloquées par Fable 5 — L'ensemble peut combler le manque de profondeur jusqu'à ce que les délais de rétablissement soient clairs
- Pipelines de recherche — La recherche web intégrée à chaque membre du panel réduit le besoin d'outils personnalisés
- Équipes soucieuses du coût — Le préréglage Budget offre un rapport valeur convaincant face aux modèles premium en solo
- Stratèges multi-fournisseurs — Réduit le risque d'un point unique de défaillance dans votre stack IA
Si vous avez besoin d'outils spécifiques à Anthropic comme Claude Code ou les flux MCP, notez que Fusion est uniquement API. Il complète ces outils mais ne les remplace pas.
Conclusion
OpenRouter Fusion est une API à modèle composé qui délivre des performances de recherche proches de Fable 5 à environ moitié prix — lancée au moment exact où la communauté des développeurs avait besoin d'une alternative majeure. C'est un pari sur la diversité des modèles plutôt que la taille du modèle, et les premiers retours sont prometteurs.
Le compromis est explicite : plus de tokens, plus de latence, mais plus d'intelligence par dollar sur les questions difficiles. Pour les équipes déjà sur la passerelle API d'OpenRouter, ajouter Fusion ne nécessite qu'une ligne de code. Pour les équipes enfermées à un seul fournisseur, c'est une raison convaincante de diversifier.
Essayez le laboratoire Fusion avant de l'intégrer aux pipelines de production, et benchmarkez toujours sur vos propres charges de travail — les résultats varient selon les usages.
Vous voulez discuter de la façon dont les modèles IA composés s'intègrent à votre stack technologique ? Chez aratech, nous aidons les entreprises à évaluer, intégrer et optimiser les systèmes IA pour des performances réelles. Contactez-nous →