Les données de Jin10 du 22 juillet : Tongyi Qianwen : Aujourd'hui, nous avons mis à jour le modèle phare Qwen3, en lançant une version mise à jour du mode non-pensant (Non-thinking) Qwen3-235B-A22B-FP8, nommée Qwen3-235B-A22B-Instruct-2507-FP8. Le nouveau modèle Qwen3 présente une amélioration significative de ses capacités générales, y compris le suivi des instructions, le raisonnement logique, la compréhension du texte, les mathématiques, les sciences, la programmation et l'utilisation d'outils. Il a excellé dans de nombreux tests tels que GQPA (connaissances), AIME25 (mathématiques), LiveCodeBench (programmation), Arena-Hard (alignement des préférences humaines), BFCL (capacité des agents), surpassant des modèles open source de premier plan comme Kimi-K2, DeepSeek-V3 et des modèles fermés avancés comme Claude-Opus4-Non-thinking.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Tongyi Qianwen : mise à jour du modèle phare Qwen3 avec une amélioration significative des capacités générales
Les données de Jin10 du 22 juillet : Tongyi Qianwen : Aujourd'hui, nous avons mis à jour le modèle phare Qwen3, en lançant une version mise à jour du mode non-pensant (Non-thinking) Qwen3-235B-A22B-FP8, nommée Qwen3-235B-A22B-Instruct-2507-FP8. Le nouveau modèle Qwen3 présente une amélioration significative de ses capacités générales, y compris le suivi des instructions, le raisonnement logique, la compréhension du texte, les mathématiques, les sciences, la programmation et l'utilisation d'outils. Il a excellé dans de nombreux tests tels que GQPA (connaissances), AIME25 (mathématiques), LiveCodeBench (programmation), Arena-Hard (alignement des préférences humaines), BFCL (capacité des agents), surpassant des modèles open source de premier plan comme Kimi-K2, DeepSeek-V3 et des modèles fermés avancés comme Claude-Opus4-Non-thinking.