超聚变FusionOne AI以精益成本性能跃升，大幅降低DeepSeek-R1 671B模型的部署门槛

来源：www.huaxin-time.com.cn 发布日期： 2025年02月27日

超聚变FusionOne AI以精益成本、性能跃升的双重突破，大幅降低DeepSeek-R1 671B模型的部署门槛，以普惠形态让更多企业和科研机构能够轻松应用。未来，超聚变将持续加大研发投入，聚焦AI算力优化与应用拓展，加速企业AI应用落地。

usionOne AI三大亮点，打破行业质疑：谁说96GB H20单机跑不了满血版？

亮点1：精益成本

• 无需额外服务器，1台FusionServer G8600，8张H20卡即可运行原生满血模型（DeepSeek-R1 671B FP8精度）；

• 显存使用量降低30%：从原本141GB H20降低为96GB。

亮点2：良好性能

• 通过对推理引擎的深度优化和KV Cache策略的优化，单台G8600 H20（768GB）跑满血大模型，性能提升50%，实现32个并发访问；吞吐量可至1000 token/s。

亮点3：灵活部署

• 通过易用的容器管理平台，灵活选择部署DeepSeek全系列模型以及多种AI加速卡，快速满足不同AI应用场景。

上一条 筑梦前行•创启未来浙江旭鑫|华鑫时代FY24工作总结暨FY25规划圆满落幕！

下一条 超聚变FusionOne AI可提供从末端、边缘到中心的全套本地化部署解决方案