Choisir le bon modèle d'IA : propriétaire, open source, auto-hébergé

Il existe une croyance tenace : pour faire de l’IA sérieuse, il faudrait toujours le modèle le plus gros, le plus récent, le plus médiatisé. C’est faux, et c’est même souvent contre-productif. Le bon modèle, c’est celui qui convient au cas d’usage. Et ce choix se fait sur trois critères, pas sur la couverture médiatique du moment.

Trois critères, pas un

Pour chaque agent, nous arbitrons entre trois choses.

La performance : le modèle est-il assez bon pour la tâche ? Résumer une réunion et analyser finement un contrat n’exigent pas la même puissance. Sur-dimensionner, c’est payer pour une capacité qu’on n’utilise pas.

Le coût : les modèles les plus puissants coûtent cher à l’inférence, c’est-à-dire à chaque appel. Sur une tâche répétée des centaines de fois par jour, un modèle plus léger mais suffisant peut diviser la facture par cinq sans dégrader le résultat. À l’échelle d’une année, l’écart est considérable.

La confidentialité, enfin : selon la sensibilité des données, on privilégiera un fournisseur conforme au cadre européen, voire un modèle open source auto-hébergé qui ne quitte jamais votre périmètre. C’est un critère qui pèse lourd, et que nous traitons en détail dans RGPD et souveraineté des données.

Aucun de ces critères ne prime systématiquement. Le bon arbitrage dépend du contexte, ce qui est l’essence même du sur-mesure.

Propriétaire ou open source ?

Les modèles propriétaires, comme ceux d’OpenAI, d’Anthropic ou de Mistral, offrent souvent les meilleures performances brutes et une mise en œuvre rapide. Ils conviennent à beaucoup de cas, à condition d’encadrer correctement le traitement des données. C’est un excellent point de départ pour un premier agent.

Les modèles open source auto-hébergés, eux, brillent dans deux situations. Quand la confidentialité est critique, parce que les données ne sortent pas de votre infrastructure. Et quand le volume rend le coût à l’API prohibitif, parce que le coût devient alors prévisible et maîtrisé. En contrepartie, ils demandent davantage d’ingénierie pour être déployés et maintenus.

Notre position là-dessus est sans dogme : on choisit au cas par cas, et on documente le choix pour que vous puissiez le comprendre et, plus tard, le remettre en question.

Le modèle n’est qu’une brique

Une erreur fréquente consiste à réduire un agent à une seule question : « quel modèle utilises-tu ? ». Le modèle n’est qu’une brique parmi d’autres, et probablement pas la plus déterminante.

Ce qui fait la fiabilité d’un agent, c’est l’architecture autour du modèle. La qualité des connexions à vos outils, que nous détaillons dans Connecter l’IA à vos outils métier. Les règles métier qui encadrent ses décisions. Et surtout la supervision humaine qui contrôle ses actions sensibles. Un modèle moyen, bien architecturé et bien supervisé, battra toujours un modèle de pointe lâché sans garde-fous.

Garder la liberté de changer

Les modèles évoluent à un rythme rapide. Celui qui domine aujourd’hui ne sera peut-être pas le meilleur choix dans un an. Concevoir un agent soudé à un fournisseur unique, c’est se condamner à le reconstruire à chaque changement de marché.

Nous architecturons donc les agents pour que le modèle reste remplaçable. Si un meilleur compromis apparaît, on peut basculer sans repartir de zéro. Cette souplesse est le pendant technique de la réversibilité, et elle vous évite de subir les soubresauts d’un secteur qui bouge vite.

La hype des annonces de modèles laisse progressivement la place à l’ingénierie sérieuse : reproductibilité, coût d’inférence maîtrisé, auditabilité. C’est sur ce terrain, peu spectaculaire mais décisif, que se gagne la valeur réelle.

Plusieurs modèles dans un même agent

Une idée fausse mérite d’être levée : rien n’oblige à choisir un seul modèle pour tout un agent. Dans la pratique, les agents les plus efficaces en combinent souvent plusieurs, chacun affecté à ce qu’il fait le mieux. Un modèle léger et bon marché s’occupe du tri, de la classification et des tâches simples qui représentent l’essentiel du volume. Un modèle plus puissant n’est appelé que pour les cas qui le justifient vraiment, comme une analyse fine ou une synthèse délicate.

Cette répartition optimise la facture sans sacrifier la qualité là où elle compte. C’est exactement le genre d’arbitrage qui passe inaperçu dans une démo, mais qui fait toute la différence sur la facture mensuelle une fois l’agent en production à grande échelle. Concevoir un agent, ce n’est donc pas parier sur le bon modèle, c’est orchestrer les bons modèles aux bons endroits. Et comme cette orchestration est documentée, elle reste ajustable quand les prix ou les performances du marché évoluent.

Une question sur le modèle adapté à votre cas ? Échangeons, on vous dira ce qui se justifie, et ce qui serait surdimensionné pour rien.

Trois critères, pas un

Propriétaire ou open source ?

Le modèle n’est qu’une brique

Garder la liberté de changer

Plusieurs modèles dans un même agent

À lire ensuite

Un cas d'usage en tête ?