Anthropic donne le coup d’envoi au renouvellement de sa famille de modèles de langages Claude. La génération Claude 3 avait été lancée en mars dernier (en mai commercialement en Europe) et déclinée en trois modèles aux performances croissantes : Haiku, Sonnet et Opus. C’est le modèle intermédiaire qui passe le premier en version Claude 3.5 Sonnet. Il franchit un nouveau pallier de performances puisqu’il surpasse Opus, le meilleur modèle de la génération précédente. D’après Anthropic, il est aussi deux fois plus rapide à l’usage.

Le nouveau modèle démontre aussi ses qualités dans les benchmarks, parvenant à dépasser GPT-4o, le modèle le plus récent d’OpenAI, dans plusieurs tests de raisonnement, de code et de mathématiques.

Claude 3.5 Sonnet est aussi selon Anthropic son meilleur modèle de vision : « Ces améliorations sont particulièrement remarquables pour les tâches qui requièrent un raisonnement visuel, comme l’interprétation de tableaux et de graphiques. Claude 3.5 Sonnet peut également transcrire avec précision du texte à partir d’images imparfaites – une capacité essentielle pour la vente au détail, la logistique et les services financiers », souligne la startup.

« Il montre une nette amélioration dans la compréhension des nuances, de l’humour et des instructions complexes, et est exceptionnel dans la rédaction d’un contenu de haute qualité avec un ton naturel et pertinent », ajoute Anthropic visiblement satisfait des progrès de son petit dernier.

Les utilisateurs vont pouvoir se faire leur propre avis puisqu’il est immédiatement disponible en version gratuite limitée sur le site Claude.ai, l’app Claude pour IOS et dans les offres sur abonnement Claude Pro et Claude Team, pour une utilisation plus intensive.

Le modèle est par ailleurs accessible par l’API Anthropic et les plateformes Amazon Bedrock et Vertex AI de Google Cloud. Ses tarifs, inchangés par rapport au modèle précédent, sont de de 3 $ par million de jetons d’entrée et 15 $ par million de jetons de sortie. La fenêtre contextuelle conserve sa limite de 200.000 tokens, supérieure aux 128.000 tokens de GPT-4o mais bien loin du millions de tokens de Gemini 1.5.

Anthropic innove enfin en ajoutant à Claude.ai la fonctionnalité en avant-première Artifacts. Cette dernière permet de visualiser dynamiquement dans une fenêtre, en vis-à-vis de la fenêtre de conversation, les éléments de code, de textes ou de design générés. Une  interface qui évoluera pour devenir collaborative. « Dans un avenir proche, des équipes pourront centraliser leurs connaissances, leurs documents et leur travail en cours dans un seul espace partagé, Claude faisant office de coéquipier à la demande », précise Anthropic.

Les autres modèles Claude 3.5 Haiku et Opus arriveront plus tard dans l’année.