华为发布全新AI存储,以长记忆内存新范式使能AI大模型训练和推理

9月20日,在华为全联接大会2024期间举办的数据存储峰会上,华为公司副总裁、数据存储产品线总裁周跃峰博士发布全新AI存储OceanStor A800,以长记忆内存新范式全面提升AI大模型训练和推理能力,助力千行万业大步迈入数智时代。

17270771137671379_500x333-7

华为公司副总裁、数据存储产品线总裁周跃峰发表主题演讲

人类文明从远古的石器时代,到农业时代、工业时代,直至如今的数智时代,数据作为发展新质生产力的关键生产要素。人们利用数据,在AI大模型、具身智能、AI for science等核心AI领域取得长足发展。

数智时代是数据的黄金时代,数据规模爆炸式增长、数据价值不断攀升的同时,也面临xPU与存储的带宽不足、算力集群可用度低、推理时延长等挑战,对存储提出更高要求。数智时代呼唤 Storage for AI,具备极致性能、高扩展性、数据韧性、可持续发展、新数据范式以及数据编织能力的数据存储是通往AI数智时代的必由之路。

为应对以上挑战,华为发布全新AI存储OceanStor A800,在AI大模型高效训练能力的基础上,大幅增强推理能力,并在集群性能、新数据范式上有了跨越式提升,促进AI在千行万业落地。

1.单套AI存储设备支持十万卡级大模型训练。通过构建前端网卡全共享、控制器与后端SSD盘全互联的技术架构,单套存储设备可支持10万卡级集群全互联。一套OceanStor A800 存储最多可实现与19.2万卡训练集群的静态全连接,性能提升40%,空间占用降低80%。

2.以存强算,AI集群可用度提升30%。AI训练中断频频发生,据统计AI训练中心持续训练的时间最长仅为2.6天,导致GPU/NPU必须反复保存CKPT数据。中国移动将华为OceanStor AI存储用于大模型训练,实现150PB单存储集群、8TB/s带宽和2.3亿IOPS的能力,集群可用度提升32%,为后续更大规模大模型训练提供有力支撑。

3.以存代算,长记忆内存型存储提升推理体验并降低系统成本。

Long context(长上下文)成为大模型推理的必然发展趋势,根据Scaling law,提供足够高的推理算力和中间Token数,可大幅提升推理的准确度。通过专业AI存储,可长期保存Long context及海量中间推理 Token,最大程度提升大模型的逻辑思考和推理能力,尤其是慢思考能力。

OceanStor A800作为业界首款提供长记忆能力的存储,创新性采用多级KV缓存机制,将KV-Cache持久化保存并高效使用,让大模型推理具备长记忆能力,减少在Prefill阶段的重复计算,客户推理时延降低78%,单个xPU卡的吞吐量提升67%,大幅提升推理体验的同时降低成本。

数智时代的全新AI存储,正在金融信贷、投研分析、医疗健康、药物研发等行业场景发挥价值。周跃峰表示,在数据的黄金时代,华为以其创新的AI存储,释放先进数据存力,铸就数智时代根基。

本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除,不承担任何侵权责任。转转请注明出处:https://sctf.yruqt.com/10659.html

(0)
上一篇 2024年6月26日 下午12:35
下一篇 2024年4月12日 下午4:40

相关推荐

  • 叫叫联动经典IP舒克贝塔开启17周年礼遇季

    叫叫联动经典IP舒克贝塔开启17周年礼遇季 从2006年小鸡叫叫形象的诞生到一系列优质绘本的面世,再到叫叫APP的上线以及各类优质数字内容产品的推出,叫叫始终坚持深耕儿童内容领域,用形式丰富、有益有趣的内容陪伴孩子们快乐成长。日前,小鸡叫叫IP形象迎来了17周岁的生日,叫叫开启以“守护兴趣小火苗”为主题的17周年生日礼遇季活动,通过线上线下多元联动,为孩子们…

    2024年1月5日
    0
  • 禾赛科技再下一新里程碑,激光雷达单月交付突破5万!

    禾赛科技再下一新里程碑,激光雷达单月交付突破5万! 日前,禾赛科技宣布,其激光雷达累计交付量突破30万台,成为全球首个创下此里程碑的车载激光雷达公司。不久前,禾赛科技又拿下一个全新里程碑,宣布2023年12月的交付数据成功突破5万大关,成为车载激光雷达行业首个单月交付量突破5万台的公司。 作为全球激光雷达行业领导者,禾赛科技的成绩堪称全球激光雷达产业的高光时…

    2024年1月5日
    0
  • 艾美特X京东家电联合发布“0噪感”循环扇

    艾美特X京东家电联合发布“0噪感”循环扇 小家电也能不断玩出新花样,近日小家电品牌艾美特联合京东家电推出了一款主打轻音“0噪感”的循环扇并于4月8日开始了新品预售。创新的“黄金环”结构,大大降低了传统风扇的噪音问题,使得风扇在体感上具备了“0噪感”的特性,大大提高了用户体验。 据悉此款风扇是在今年3月在上海AWE展上首次亮相,凭借独特的设计和强悍性能一经发布…

    2024年4月16日 智能科技
    0
  • RTX 4090都够用 850W白金全模组SFX电源829元(1W不到1块)

    5月11日消息,RTX 4090显卡不仅是当前性能最强的游戏卡,能效也非常高,用于MATX甚至ITX小钢炮都没问题,前提是选择好电源,艾湃电竞的850W白金电源可以做到829元,性价比不错。艾湃电竞SFX-850M白金电源当前秒杀价849元,使用Plus会员500-20元全品类优惠券,可以做到829元,1W不到1块钱,比金牌电源都要低。 虽然850W电源在这…

    2023年5月11日
    0
  • 传国产内存厂商长鑫存储获准进口美系设备!落后美光8年 没法追赶

    5月10日消息,据英国《金融时报》9日引述未具名消息人士的话报导称,中国DRAM芯片制造商长鑫存储经过数月后终于确认,其向美国厂商订购的芯片制造设备不受美国出口管制影响。 长鑫存储是目前中国大陆唯一一家能运用20nm以下制程生产DRAM芯片的厂商。去年10月7日,美国出台了对华半导体出口限制政策,不仅限制了先进芯片、设备的对华出口,长鑫存储等芯片制造商被迫暂…

    2023年5月11日
    0