DeepSeek重构算力逻辑 昇腾提供“最优解”加速AI普惠
- +1 你赞过了
【天极网企业频道】“大力出奇迹、一力降十会”的策略让算力成为驱动人工智能产业发展的最重要动力,也让大模型的性能强弱与其背后算力资源的多少直接画“等号”。而DeepSeek的出现让很多人眼前一亮,利用多项创新技术实现突破,重构算力逻辑,做到了“四两拨千斤”的效果。例如DeepSeek-V3模型的训练成本为557.6万美元,但性能方面已经与 OpenAI旗下的ChatGPT-4o不相上下。
算力 “紧张”地表示:坏了,是冲着我来的!
那么DeepSeek真的会让算力的地位下降吗?
原本需要消耗一桶汽油才能跑100公里的汽车,在采用工程创新的“超级引擎”后,只需半桶就能完成同样的路程。于是这款汽车变得省油又便宜,吸引了更多用户开始买车驾车。从工作通勤到自驾旅行,不仅路上的车多了,消费者用车的频次、时长与场景也都在增加,结果就是加油站的总汽油销量不降反升。
把汽油换成算力,把DeepSeek视为“超级引擎”,汽车看成大模型…那么DeepSeek对于人工智能行业,特别是算力需求的影响就不言而喻了。
收到“DeepSeek发布之后,AI和大模型行业对算力的需求是会增加还是降低?”这个问题后,DeepSeek自己的答复是:单位算力需求降低,但总量可能因应用普及而增长。在长期趋势方面,应用场景扩展也将推动算力需求激增。
在DeepSeek爆火后,加速了AI技术普惠化进程,从个人用户到企业行业均在快速接入——网页及APP的访问量指数级增长;手机、汽车、PC等终端也纷纷拥抱;包括其他大模型在内的千行百业在感到震惊和春节假期“被安排了”之后,也选择积极拥抱。可以说,除了冲击影史纪录的《哪吒2》,似乎没有人能抢走属于DeepSeek的“头条”。
其中,最有危机感的还是DeepSeek的竞争对手们,在打不过就加入的同时,也有巨头们持续增加算力资源投入保证在AI行业的领先地位。当然感受到DeepSeek的压力还只是一个原因,更重要的是目前大模型加速“技术摸高”,投入算力是必然。根据目前曝光的消息来看,包括微软、亚马逊、谷歌、Meta等拥有大模型业务的公司,仍将大规模投资算力。财报显示这四家公司在去年资本支出总额高达2431亿美元,同比增长63%。
所以说,无论是DeepSeek未来迭代演进,还是其他大模型训练推理,都需要海量数据、算法与生态、AI集群支撑。在这一领域,稳定可靠的算力底座仍是模型突破创新的关键与根基。
前沿企业竞争加剧,让AI公司加大投入还只是DeepSeek对人工智能产业影响的一个方面。DeepSeek的“创新思路”还将带来产业链结构性变化,从硬件堆叠到软硬协同,结合开源也将加速应用创新、场景丰富以及商业模式构建。因此,DeepSeek进一步降低门槛后,中小企业、专业用户也将更积极拥抱大模型。在这个进程中,稳定、灵活、易用的算力将扮演着驱动AI能力转化为生产力的重要角色,支持企业根据自身业务需求的大模型微调、二次训练等需求,实现从具备数智能力到利用数智能力的发展。
DeepSeek与算力的关系已经捋顺了,不难预料未来两者会呈现“螺旋上升”趋势。那么在拥抱DeepSeek或者未来选择更“物美价廉”的模型时,企业与用户如何对DeepSeek也施展一招“四两拨千斤”,选出更有性价比的算力底座?
昇腾提供了一个DeepSeek部署的“最优解”。
昇腾与DeepSeek的关系可以追溯到后者爆火之前,两家公司在未来趋势洞察和技术布局层面有许多相似之处,可以说是“不谋而合”。昇腾在国内首个适配完成DeepSeek核心算法,支持DeepSeek全系模型预训练及微调,也是业界唯一从预训练到微调全流程适配的DeepSeek AI训练平台。
更重要的是,昇腾为了客户、行业能够高效灵活利用DeepSeek等AI创新,其准备的解题思路也拥有“多维度”。
例如,昇腾提供“行业强化微调解决方案”,支撑行业快速将DeepSeek强化学习技术应用到模型训练中,快速提升模型效果。同时,基于行业深耕、框架及算法等创新,可以凭借多卡并行推理与专家负载均衡等特性实现DeepSeek模型推理吞吐性能提升超过30%。
昇腾的软硬件协同,做到全系硬件支持部署DeepSeek全系模型,提供业界领先的性能,满足大部分客户的算力需求;昇思MindSpore AI框架支持DeepSeek-V3预训练、微调、推理全流程;异构计算架构CANN提供深度优化高性能算子库,加速多模态、MoE等模型计算,支持超过1400基础算子,支持度达100%,覆盖主流大模型加速场景,配合全栈软件、工具,做到开箱即用,根据业务需求灵活部署,加速落地。
相比国内外其他厂商,昇腾在行业解决方案与生态完善方面也有显著优势。昇腾与华为行业军团深度绑定,可以依托丰富的行业产业(如互联网、金融、运营商、政务、教育等)经验赋能客户及伙伴,攻克业务难题或打造有价值解决方案。截至2024年12月31日,昇腾已经发展超过60家硬件合作伙伴、330万多开发者、2500多家行业合作伙伴,并共同孵化了150多个昇腾原生硬件产品与超过5800个解决方案。
同时昇腾的技术支持专家队伍,AI计算使能与优化工具链,与高校和科研院所的深度合作等,也能成为企业快速部署DeepSeek、进行商业化探索的“资源”。
昇腾不仅推出了DeepSeek一体机Atlas 800I A2等组合丰富的产品,还公布了一系列助力企业快速部署DeepSeek的“实用技巧”,如2月4日DeepSeek系列模型上线昇腾社区;综合业务对于性能、选用模型差异化等需求,昇腾公布了推理服务部署推荐配置。
与DeepSeek“双向奔赴”也让昇腾借助本次契机加速推动自身及客户的业务发展。据悉,2024年12月26日,DeepSeek AI正式推出的大型语言模型DeepSeek-V3,发布即支持昇腾。现在,各行业已有超过150家客户及伙伴已基于昇腾快速适配或上线DeepSeek系列模型并对外提供服务,还有20余家正适配测试中,占据国内70%份额。同时,昇腾助力超过20个省、25座城市的AICC启动部署DeepSeek系列模型,让全国超70%区域可获取本地服务。
合作方面,魔乐社区联合昇腾社区同步上线DeepSeek系列模型,下载量突破50万,一跃成为国内最具欢迎的模型社区。在政务领域,龙岗区政务服务和数据管理局依托昇腾AI基础软硬件平台,在区政务外网部署上线DeepSeek-R1全尺寸大模型,创新推出40个政务AI应用,并通过将“边聊边办”“知识库问答助手”等原有应用迁移至DeepSeek大模型基座,实现了AI能力全面升级。
DeepSeek的到来并不是给算力设定了“上限”,恰恰相反,凭借工程创新等突破,DeepSeek展现了人工智能产业的更多可能与发展路径,这将成为AI普惠的一个新起点。
DeepSeek让性能领先的大模型减少了对算力资源的“依赖”,推进AI普惠化。从产品落地层面来看,手机、PC、汽车、可穿戴设备等终端都能获得“智能”升级。包括一些数据敏感的行业与用户,甚至在PC等仅具备一定算力的设备上就能够部署更好用的端侧大模型产品,获得更安全、个性化、低时延且无需网络连接的AI服务。对于企业而言,物美价廉且开源的大模型既能够优化自身工作流程,推进数智化发展,也可以带来业务模式升级、创新,挖掘商业化潜力。
在这些趋势背后仍需要有符合客户、商业应用需求的可靠算力底座支撑。昇腾具备的一系列技术、产品、服务优势以及广泛的生态合作让其DeepSeek创造的机遇中“赢在起跑线”。或许你手中正在使用的DeepSeek相关服务背后就是昇腾提供的算力。对于客户而言,昇腾的响应速度、能力,在追求效率和敏捷性的数智市场中同样重要。还有一点就是在未来大模型发展的“技术摸高”层面,对于算力的需求将远高于现阶段,在打造大规模算力集群经验上,目前国内只有昇腾。
所以,昇腾提供的“最优解”在商业应用、前沿探索中能够获得来自客户、用户多少评分,以及未来赋能国内人工智能产业、助力技术创新还将有哪些突破,让我们拭目以待。
最新资讯
热门视频
新品评测