华为下周发布AI突破性技术 对标英伟达大幅提升AI算力利用率
11月16日,知情人士向观察者网透露,华为将于下周发布AI领域突破性技术成果,有望解决算力资源利用效率难题。据透露,该技术延续 “以软件补硬件”的创新思路,可将GPU、NPU等算力资源利用率从行业平均30%-40%大幅提升至70%,显著释放算力硬件潜能。
本文转载自【观察者网】。
该知情人士提到,华为这项新技术将对标英伟达2024年底收购的以色列公司Run: ai的核心技术,旨在通过软件创新,实现英伟达、升腾以及其他三方算力的统一资源管理与利用,屏蔽算力硬件差异,为AI训练推理提供更高效的资源支撑。
2024年12月,英伟达(NVIDIA)宣布以7亿美元(约合人民币51亿元)价格,收购2018年成立的以色列公司Run:ai。过去7年,这家公司做的产品只围绕一件事——怎么高效使用GPU,比如提供业务看板、GPU权限分配、任务分配等等直观可视化操作工具,本质是在做GPU的“数据产品经理”。
对于有雄厚研发实力和AI积累的大公司来说,这样的内部工具自研可能并不是问题,但对于中小规模、非AI行业的用户来说,Run:ai这套技术却很关键。
彼时有媒体报道,Run:ai的用户包括全球打印机巨头斑马技术、用端到端技术一鸣惊人的自动驾驶公司Wayve、伦敦医学影像与人工智能中心等等。其中Wayve通过Run:ai提供的工具,将原先不足25%的GPU集群效率,提升到80%以上。
在收购的同时,英伟达还宣布开源Run:ai的所有平台技术,买英伟达GPU就能免费用。
黄仁勋这么做的原因,是因为英伟达在AI芯片领域占据垄断地位,控制著高端GPU市场80%的份额,几乎100%的AI计算份额,且一直在寻求构建产品+生态的立体优势。
长期以来,黄仁勋和英伟达一直想做的,就是AI行业的垂直整合,从芯片到工具再到软件应用,打造一个能满足任何AI用户的一站式商店,让客户对其生态形成依赖。
然而,对当下中国来说,恰恰要避免对英伟达的过度依赖,尤其是在先进制程受限、单卡算力存在劣势的情况下,国内产业界更需要“系统补单点”、“软件补硬件”,支撑AI产业发展。
今年以来,华为曾推出多项关键技术,弥补芯片方面的短板。比如升腾384超节点,该技术发挥华为在通讯、存储和基础软件等方面的大杂烩优势,突破了互联瓶颈,实现了算力规模的赶超。再比如华为前不久开源的UCM(Unified Cache Manager)推理记忆数据管理技术,充分利用了不同存储介质的特性,降低AI推理对高端HBM的依赖,还能平衡成本。
AI是一项系统工程,算力更是一个高成本的代表。在中国先进芯片受限的情况下,华为即将发布的新技术,将如何提升算力资源利用的效率,无疑值得关注。