超过DeepSeek-V3 通义千问更新旗舰版Qwen3模型
- +1 你赞过了
【天极网企业频道】7月22日凌晨,通义千问宣布更新了旗舰版Qwen3模型,推出Qwen3-235B-A22B非思考模式(Non-thinking)的更新版本,命名为Qwen3-235B-A22B-Instruct-2507。
据介绍,升级后的Qwen3模型在指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面,在GPQA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等众多测评中有出色表现。通义千问表示,其已经超过Kimi-K2、DeepSeek-V3等顶级开源模型以及Claude-Opus4-Non-thinking等领先闭源模型。
其中Qwen3在BFCL(Agent能力)的领先表明其在处理和理解复杂指令、自主规划、调用工具等能力中更有优势,这将在向着智能体发展的AI应用中占据领先。
除了以上通用能力提升外,升级的Qwen3模型还增强了以下关键性能:
模型多语言的长尾知识覆盖方面显著进步;
在主观及开放性任务中,模型增强了对用户偏好的契合能力,能够提供更有用的回复,生成更高质量的文本;
长文本提升到256K,上下文理解能力进一步增强。
在2025年4月份,Qwen3首次发布,引入了对查询(Query)和键(Key)添加归一化(Normalization),即RMSNorm,有助于稳定训练并提升模型性能。
Qwen3提供包括4bit、6bit、8bit和BF16等多种精度量化版本,可以在不同终端上实现部署。此外,Qwen3适用于119种语言和方言;引入混合思考模式,用户可以在复杂推理与快速响应之间切换;集成了MCP协议,支持大语言模型与外部数据源、工具的联动。
还有一点值得关注,一个月前,Qwen3全系适配苹果公司的MLX架构,使得从Mac Pro到iPhone等全系列苹果设备都能部署运行Qwen3模型。业界认为这是国行Apple Intelligence(苹果智能)落地的关键一步。尽管有多方消息表示阿里巴巴将是苹果在中国大陆的大模型合作商,但目前国行用户和Apple Intelligence似乎还有一段距离……待到iPhone 17上市时,苹果用户能否解锁全新AI体验也是未知数。
最新资讯
热门视频
新品评测