
上证报中国证券网讯(记者李兴彩)联思在AI大模子鸿沟再获冲破。 近日,联思集团晓示,基于联思问天WA7780 G3就业器,在行业内初次已毕单机部署DeepSeek-R1/V3 671B大模子,以低于行业公认1TGB显存(本色768GB)承载100并发用户看法体验,不错得志千东说念主以上企业的使用需求,为行业招引了企业级大模子部署新基准。 稠密企业皆在准备土产货化部署DeepSeek大模子,然则,在落地实行过程中,用户多数靠近以下环节决策贫穷:单机能否部署满血版DeepSeek R1?所需最低建

上证报中国证券网讯(记者李兴彩)联思在AI大模子鸿沟再获冲破。
近日,联思集团晓示,基于联思问天WA7780 G3就业器,在行业内初次已毕单机部署DeepSeek-R1/V3 671B大模子,以低于行业公认1TGB显存(本色768GB)承载100并发用户看法体验,不错得志千东说念主以上企业的使用需求,为行业招引了企业级大模子部署新基准。
稠密企业皆在准备土产货化部署DeepSeek大模子,然则,在落地实行过程中,用户多数靠近以下环节决策贫穷:单机能否部署满血版DeepSeek R1?所需最低建树是什么?若何确保高并发与迷糊量下的优质体验?若何幸免采购陷坑?
联思这次冲破为企业提供科学选型指南。联思研发团队通过众人并行优化、智能访存架构升级及PCIe 5.0全互联架构创新,大幅晋升了显存欺骗率,从辛劳毕性能晋升。
联思实测数据走漏,在512token表率测试环境下,该系统可补助100个并发用户合手续获取每秒10token的得当输出,首token反映时刻压缩至30秒内。即便面对4K长序列复杂场景,仍能保合手25个并发用户同等性能发达。
尤为值得存眷的是,这台就业器仅建树8张96GB显存的GPU卡。而DeepSeek-R1大模子的模子参数就需占用约700GB显存,仅余不到100GB显存空间可用于KV-Cache等计较,若是不作念有益优化,仅能补助2、3个用户接入。
联思在万全异构智算平台加合手下通过尽心优化已毕了冲破,得手达成用户最为存眷的三项环节有盘算推算:首token蔓延小于30秒、单token蔓延小于100毫秒、补助2K以上长序列问题处理,同期已毕了20%以上的资本量入为用,充分彰显联思在就业器鸿沟的深厚技能积聚与创新实力。

联思问天WA7780 G3大模子训推一体就业器
在业内东说念主士看来,联思的技能冲破将灵验取销大模子落地瓶颈,显贵加快大模子在企业的落地进度。据悉,畴前万博manbext体育官网app娱乐,联思基础设施业务群与联思有计划院先进计较执行室将继续联袂相助,依托联思万全异构智算平台对DeepSeek平台从AI预熟悉、后熟悉到推理的全经过进行合手续优化,为客户奉献性能更佳、性价比更高的居品和惩办决策,以加快DeepSeek大模子落地,鼓舞新一轮坐褥力立异。