华为发布AI推理创新技术UCM:实现高吞吐、低时延推理体验,降低每Token推理成本
新浪科技讯 8月12日下午消息,发布在2025金融AI推理应用落地与发展论坛上,推理吞吐n推华为联合中国银联共同发布AI推理创新技术UCM(推理记忆数据管理器),创新实现高吞吐、技术低时延的现高推理体验。 在当今数字化时代,低时低AI发展日新月异。延推验降大模型训练的理体理成热潮尚未消退,AI推理体验却已悄然成为AI应用的发布关键。中信建投在2025WAIC期间发布的推理吞吐n推白皮书指出,AI正从训练向推理的创新结构性转变而快速增长。在这样的技术大背景下,AI推理体验的现高重要性愈发凸显。 推理体验直接关系到用户与AI交互时的低时低感受,包括回答问题的延推验降时延、答案的准确度以及复杂上下文的推理能力等方面。资料显示,国外主流模型的单用户输出速度已进入200 Tokens/s区间(时延5ms),而我国普遍小于60Tokens/s(时延50 - 100ms),如何解决推理效率与用户体验的难题迫在眉睫。 据介绍,华为此次发布的AI推理创新技术UCM(推理记忆数据管理器),作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。 责任编辑:郭栩彤 海量资讯、精准解读,尽在新浪财经APP
- 最近发表
- 随机阅读
-
- 《忍者龙剑传4》全新视频 准备大战性感狐花魁
- 最热闹的国家德比,除了防守什么都有
- 武汉女足:从大学校园,到亚洲之巅
- 樊振东、王哲林等873名运动员将获得保送上大学的推荐资格
- 画面水平接近!外媒称《古剑》是下一个《黑神话:悟空》
- 这个老头儿,仍然是你们的头儿
- 樊振东、王哲林等873名运动员将获得保送上大学的推荐资格
- 17分逆转!步行者OT险胜尼克斯1
- 环保装备规范条件企业名单发布 专家:“标杆效应”激活产业升级
- 威少被交易时,雷霆下一个MVP已在阵中
- “孙兴慜就是热刺,热刺就是孙兴慜”
- 精选大乐透专家:海天、常哥同中一等1048万
- 我,高育良,太想让学生进步了!
- 有我们在,苏杯冠军,包的老弟
- 这个老头儿,仍然是你们的头儿
- “孙兴慜就是热刺,热刺就是孙兴慜”
- 宿州市:聚力发展“菜园子” 拎稳市民“菜篮子”
- 白鹭玩偶走红苏杯,羽球文化注入新玩法
- “鱼有一条尾巴,而我有一条腿。”
- 北京请神马布里?许利民真有“玄学”!
- 搜索
-
- 友情链接
-
- 索尔纳造3.8倍冷平 足彩任九开36210注254元
- 精选大乐透专家:榜二莫晨风累擒8千万又中4+1!
- 彩民领走福彩"流金岁月"60万 直言还继续打工
- 爆火!专家预测大乐透4期连中6注头奖豪揽6千万
- 老彩民中大乐透1805万 曾因误删号码错失大奖
- 俞俐均亮相茶圣杯推广围棋 东盟智运会蓄势待发续新篇
- 东盟智运会推广大使俞俐均:围棋国际化需大家支持
- [新浪彩票]足彩第25106期任九:德岛漩涡赢球
- 布加勒星造12倍冷负 足彩头奖1注500万滚存528万
- 精选双色球专家:云河连擒三等和5红累擒超2千万
- 用生命拼出8个世界冠军,那个男人还没赢够
- 库里36+7+9勇士击落火箭2
- 我国将全面加快知识产权强国建设
- 离开曼联,他在马拉多纳的城市里成为明星
- 掀翻北京,轰出5连胜!CBA大黑马诞生,他们也有机会夺冠
- 又一位NBA球员破产!无力支付5万抚养费,生涯共赚1.2亿挥霍一空
- 面对一群天赋怪,阿森纳只能接受失败
- 凯尔特人大胜尼克斯2
- 神剧情!挥霍22分领先戈登0.1秒补扣绝杀 掘金险胜快船2平约基奇36+21+8
- 庄宇珊:最喜欢巴西队员加比 但更想成为中国的庄宇珊