华为:AI推理创新技术UCM将于今年9月正式开源

新浪科技讯 8月12日晚间消息,推理在2025金融AI推理应用落地与发展论坛上,创新中国银联执行副总裁涂晓军、技术华为数字金融军团CEO曹冲出席并发表致辞。于今论坛上,年月华为公司副总裁、正式数据存储产品线总裁周跃峰发布AI推理创新技术——UCM推理记忆数据管理器,开源旨在推动AI推理体验升级,推理提升推理性价比,创新加速AI商业正循环。技术同时,于今华为携手中国银联率先在金融典型场景开展UCM技术试点应用,年月并联合发布智慧金融AI推理加速方案应用成果。正式
周跃峰在论坛上强调:“AI时代,开源模型训练、推理推理效率与体验的量纲都以Token数为表征,Token经济已经到来”。为保障流畅的推理体验,企业需持续加大算力投入,但如何在推理效率与成本之间找到最佳平衡点,成为了全行业亟待解决的重要课题。
为此,华为推出UCM推理记忆数据管理器,包括对接不同引擎与算力的推理引擎插件(Connector)、支持多级KV Cache管理及加速算法的功能库(Accelerator)、高性能KV Cache存取适配器(Adapter)三大组件,通过推理框架、算力、存储三层协同,实现AI推理“更优体验、更低成本”。
在与中国银联的联合创新技术试点中,UCM的技术价值得到验证。在中国银联“客户之声”业务场景下,借助UCM技术及工程化手段,大模型推理速度提升125倍,仅需10秒即可精准识别客户高频问题,促进服务质量提升。未来,中国银联将依托国家人工智能应用中试基地,联合华为等生态伙伴共建“AI+金融”示范应用,推动技术成果从“实验室验证”走向“规模化应用”。
论坛现场,华为正式公布了UCM开源计划。UCM通过开放统一的南北向接口,可适配多类型推理引擎框架、算力及存储系统。今年9月,UCM将正式开源,后续逐步贡献给业界主流推理引擎社区,携手全产业共同推动AI推理生态的繁荣发展。

责任编辑:何俊熹
(责任编辑:知识)
-
"此法主要是指援引典型的历史事实来阐明主旨。历史是现实的一面镜子,是生动的教科书,是启人智慧、让人思考的范本。以史作证,谈古论今,将古代事实正反并用,显示深厚的文化底蕴,因而比一般的讲 ...[详细]
-
盖世汽车讯 据路透社报道,特斯拉首席执行官埃隆·马斯克表示,该公司将调整人工智能AI)芯片研发方向,专注于开发用于运行AI模型并做出实时决策的推理芯片。此前彭博社援引知情人士的消息称,马斯克已下令解散 ...[详细]
-
最近,演员徐冬冬刚发表完只减120斤以上的肉肉。昨天晚上,她就晒出了自己的真实肚子。网友直呼:姐这个身材真是刚刚好。其实,每种身材各有各的好,只要健康不必拘泥于某一种单一标准,谁说女演员非得体重不过百 ...[详细]
-
据烟台市纪委监委消息:烟台市商务局党组成员、副局长滕鹏涉嫌严重违纪违法,目前正接受烟台市纪委监委纪律审查和监察调查。原标题:烟台市商务局党组成员、副局长滕鹏接受纪律审查和监察调查 ...[详细]
-
来源:蝌蚪五线谱每天晚上,当夜幕降临,我们已经习惯了打开家中的灯,用电来为我们的家“续费”光明。而你有没有好奇,在小小的灯泡亮起的时候,里面究竟有什么故事在发生呢?白炽灯、节能灯、LED灯,冷光灯、暖 ...[详细]
-
Ready菜鸟裹裹怎么不让亲友看到自己的包裹?菜鸟裹裹app上可以给亲友分享快递信息,这样日常相互帮忙取快递也比较方便,那么如果不想被别人看到包裹信息如何设置呢,大家可以按照以下的步骤来进行操作。菜鸟 ...[详细]
-
搜狐视频自制网络剧《假面迷情》今晚18点迎来会员收官,作为一部集合了“疯批复仇”、“极限拉扯”、“双强CP”等等诸多元素的悬疑爱情题材剧,《假面迷情》凭借仅仅16集长度,为观众讲述了一个时而有着暗黑色 ...[详细]
-
中国长安汽车全体董事、高管拟增持长安汽车:每人不低于30万元
19名董事和高管将增持长安汽车。8月11日晚间,重庆长安汽车股份有限公司长安汽车,000625)发布公告称,公司及间接控股股东中国长安汽车集团有限公司下称“中国长安汽车”)部分董事、高级管理人员计划自 ...[详细]
-
大学生建筑行业材料员顶岗实习报告随着人们自身素质提升,报告的适用范围越来越广泛,报告具有语言陈述性的特点。你所见过的报告是什么样的呢?以下是小编为大家整理的大学生建筑行业材料员顶岗实习报告,仅供参考, ...[详细]
-
报道称,曼城将为马尔穆什向法兰克福支付8000万欧元的转会费,其中7500万事固定金额,另外500万是浮动金额。在与哈兰德续下长约的情况下,又签约马尔穆什,曼城的攻击线会有怎样的表现,我们只能等待时间 ...[详细]