玩球体育在线(中国)唯一官方网站

设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

曦望新一代推理 GPU 芯片启望 S3 发布:单位 Token 推理成本降低 90%

2026/1/27 19:24:47 来源:IT之家 作者:远洋 责编:远洋

IT之家 1 月 27 日消息,据界面新闻报道,国产 GPU 厂商曦望(Sunrise)发布了新一代推理 GPU 芯片启望 S3。这是该公司在近一年累计完成约 30 亿元战略融资后的首次集中公开亮相。

据IT之家了解,启望 S3 是一款面向大模型推理的定制化 GPGPU 芯片。据了解,该芯片在典型推理场景下的整体性价比较上一代产品提升超过 10 倍。算力与存储设计上,芯片支持 FP16 至 FP4 精度切换,采用 LPDDR6 显存方案,显存容量较上一代提升 4 倍。

在应用层面,启望 S3 在 DeepSeek V3/R1 满血版等主流大模型推理场景中,单位 Token 成本较上一代降低约 90%。

曦望还同步发布了面向大模型推理的寰望 SC3-256 超节点方案,可适配千亿、万亿级参数的多模态 MoE 推理场景。此外,曦望还联合商汤科技、第四范式等生态伙伴,共同发起“百万 Token 一分钱”推理成本计划。曦望与浙江大学签署战略合作协议,联合成立“智能计算联合研发中心”。

曦望前身是商汤科技大芯片部门,不久前宣布在一年内完成了近 30 亿元战略融资。2025 年,曦望芯片交付量已突破万片。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

玩球体育在线(中国)唯一官方网站相关的文章

关键词:芯片GPU曦望启望S3

软媒旗下网站: IT之家 最会买 - 返利返现优惠券 Win7之家 Win10之家

软媒旗下软件: 软媒玩球体育在线(中国)唯一官方网站APP应用 魔方