超过DeepSeek-V3 通义千问更新旗舰版Qwen3模型

【天极网企业频道】7月22日凌晨，通义千问宣布更新了旗舰版Qwen3模型，推出Qwen3-235B-A22B非思考模式(Non-thinking)的更新版本，命名为Qwen3-235B-A22B-Instruct-2507。

据介绍，升级后的Qwen3模型在指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面，在GPQA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等众多测评中有出色表现。通义千问表示，其已经超过Kimi-K2、DeepSeek-V3等顶级开源模型以及Claude-Opus4-Non-thinking等领先闭源模型。

其中Qwen3在BFCL(Agent能力)的领先表明其在处理和理解复杂指令、自主规划、调用工具等能力中更有优势，这将在向着智能体发展的AI应用中占据领先。

除了以上通用能力提升外，升级的Qwen3模型还增强了以下关键性能：

模型多语言的长尾知识覆盖方面显著进步;

在主观及开放性任务中，模型增强了对用户偏好的契合能力，能够提供更有用的回复，生成更高质量的文本;

长文本提升到256K，上下文理解能力进一步增强。

在2025年4月份，Qwen3首次发布，引入了对查询(Query)和键(Key)添加归一化(Normalization)，即RMSNorm，有助于稳定训练并提升模型性能。

Qwen3提供包括4bit、6bit、8bit和BF16等多种精度量化版本，可以在不同终端上实现部署。此外，Qwen3适用于119种语言和方言;引入混合思考模式，用户可以在复杂推理与快速响应之间切换;集成了MCP协议，支持大语言模型与外部数据源、工具的联动。

还有一点值得关注，一个月前，Qwen3全系适配苹果公司的MLX架构，使得从Mac Pro到iPhone等全系列苹果设备都能部署运行Qwen3模型。业界认为这是国行Apple Intelligence(苹果智能)落地的关键一步。尽管有多方消息表示阿里巴巴将是苹果在中国大陆的大模型合作商，但目前国行用户和Apple Intelligence似乎还有一段距离……待到iPhone 17上市时，苹果用户能否解锁全新AI体验也是未知数。

超过DeepSeek-V3 通义千问更新旗舰版Qwen3模型

热门标签