
80,9 % sur SWE-bench : Opus 4.5 et le basculement vers les agents autonomes
Lancement d'Opus 4.5 par Anthropic, qui obtient 80,9% sur le benchmark SWE-bench, marquant une tendance vers des agents autonomes capables d'exécuter des tâches complexes sans supervision. Ce modèle propose une gestion des coûts innovante via le paramètre 'effort', ainsi qu'une stratégie de tarification plus compétitive. Des fonctionnalités telles que le 'Context Editing' et la 'Compaction' optimisent la gestion de la mémoire, permettant à Opus 4.5 de rivaliser avec des modèles comme GPT-5.1 et Gemini 3. Le marché évolue, favorisant des agents autonomes sur les chatbots.

