151-5812-0335
您的位置: 首页 -> 信息动态 -> 行业动态

超聚变FusionOne AI以精益成本性能跃升,大幅降低DeepSeek-R1 671B模型的部署门槛

来源:www.huaxin-time.com.cn      发布日期: 2025年02月27日
超聚变FusionOne AI以精益成本、性能跃升的双重突破,大幅降低DeepSeek-R1 671B模型的部署门槛,以普惠形态让更多企业和科研机构能够轻松应用。未来,超聚变将持续加大研发投入,聚焦AI算力优化与应用拓展,加速企业AI应用落地。

超聚变FusionOne AI以精益成本、性能跃升的双重突破,大幅降低DeepSeek-R1 671B模型的部署门槛,以普惠形态让更多企业和科研机构能够轻松应用。未来,超聚变将持续加大研发投入,聚焦AI算力优化与应用拓展,加速企业AI应用落地。




usionOne AI三大亮点,打破行业质疑:谁说96GB H20单机跑不了满血版?

亮点1:精益成本

•  无需额外服务器,1台FusionServer G8600,8张H20卡即可运行原生满血模型(DeepSeek-R1 671B FP8精度);

•  显存使用量降低30%:从原本141GB H20降低为96GB。

亮点2:良好性能

•  通过对推理引擎的深度优化和KV Cache策略的优化,单台G8600 H20(768GB)跑满血大模型,性能提升50%,实现32个并发访问;吞吐量可至1000 token/s。

亮点3:灵活部署

•  通过易用的容器管理平台,灵活选择部署DeepSeek全系列模型以及多种AI加速卡,快速满足不同AI应用场景。


+ 微信号:13750856549