
据澎湃新闻无间特工,5月21日,记者获悉,智谱联合驭驯网络与清华大学,在GLM-5.1线上生产集群中完成了新一代网络架构ZCube的规模化落地。在线上GLM-5.1 coding场景中,在保持GPU算力、软件栈与应用不变的前提下,ZCube节省了33%交换机与光模块成本,同时将GPU平均推理吞吐提升了15%,并将TTFT P99降低了40.6%。这意味着,同样的硬件投入,智谱的 GLM 大模型现在每秒能多响应 15% 的 API 请求。对于大模型 API 平台而言,日韩精品一区二区三区影院这直接对应更高的并发上限以及在流量峰值下更稳定的用户体验。
举报 相关阅读
英伟达刷新最高季度营收纪录,年内CPU收入预计200亿美元英伟达CEO黄仁勋表示,英伟达的增长速度应该会超过超大规模科技企业的资本支出增速。
17691 昨天 07:34
“最大AI芯片”公司上市首日涨68%,美股AI热潮与分歧共存英伟达7连涨创新高,新贵上市首日高开无间特工,市场提醒“别贪婪”
36384 05-15 10:33
马化腾回应腾讯AI落后质疑,超300亿资本开支主投AI第一季度腾讯Non-IFRS经营利润756.3亿元,如果剔除新AI产品的影响,该数据为844亿元。
122440 05-13 22:13
英伟达市值失守5万亿美元,发生了什么?多家科技公司透露了芯片自研进展,英伟达面临竞争。
30060 05-01 08:45
时隔近半年,英伟达市值再次突破5万亿美元近期市场上多有关于AI需求强劲的消息无间特工。
1527 04-25 07:28 一财最热 点击关闭
