华为能否顶上英伟达?

自从生成式AI浪潮席卷全球,各大科技巨头纷纷加码大模型开发。

美国政府的最新“芯片禁令”提前生效。

10月25日,英伟达向美国证券交易委员会递交的一份文件中披露,美国政府通知该公司,针对适用于总处理性能大于等于4800TTP并为数据中心设计或销售的产品的相关出口管制,立即生效。该管制影响到的英伟达产品有A100、A800、H100、H800和L40S等。

事情缘起当地时间10月17日,美国商务部工业和安全局更新了针对中国的“先进计算芯片和半导体制造设备出口管制规则”(下称“新规”),新规设置了“性能密度阈值”作为参数,只要芯片总算力大于或等于4800TTP,不论互联带宽多少都受管制。在新规的补充说明里,美国商务部毫不掩饰地表示设置这一参数的目的就是限制芯片被用于训练大型两用AI基础模型。

该新规将英伟达、AMD、英特尔等厂商现有的高性能算力芯片全部涵盖。此外,美国商务部还扩大了芯片制造工具出口限制清单,中国两家国产GPU制造商摩尔线程、壁仞科技被列入“实体清单”。媒体还爆料,美国政府在考虑限制向中国AI公司出租云服务,确保美国企业不能“灵活运用”规则。

原本新规有30天公示期,被行业人士视为“最后30天窗口期”。在窗口期内,中国企业可以集中采购、运输急需的高端AI芯片。出于对中国市场的依赖和商业契约,理论上美国芯片企业会配合尽快完成中国企业的订单。

结果8天后,新规提前执行。受此消息影响,英伟达股价在当天下跌4.31%,第二天又下跌3.48%。而对于中国科技、大模型创业企业来说,同样是影响巨大的,这意味着无法再获得训练大模型所需的高性能算力芯片。

《最话》了解到虽然提前储备了不少H800芯片,但面对新规提前执行,各家中国科技企业并没有解决办法。

如果说有,那就是“推动算力国产化”。

从目前来看,除了租用云服务算力,能大量采购到的部分替代英伟达的高性能算力芯片,只有华为昇腾系列(HUAWEI Ascend)AI算力芯片。

《最话》从接近华为的人士了解到,目前无论是华为AI集群的算力,还是涉及到的硬件设备,“供应都是非常充足的。”

01

“卡脖子”

自从生成式AI浪潮席卷全球,各大科技巨头纷纷加码大模型开发。训练大模型需要大量高性能AI算力芯片。据市场调查机构TrendForce数据显示,如果以英伟达A100芯片的处理能力计算,GPT-3.5大模型需要上万块GPU来处理训练数据。

中国科技企业开发的大模型所需的高性能算力芯片也在万块以上,并且随着大模型迭代,所需的芯片量还会增加。

按照一份流传出的交流纪要,阿里云AI专家提到,阿里云在云上就有上万片的A100,整体能够达到10万片,集团体量应该是阿里云的5倍。腾讯云利用H800加速卡打造的大模型算力集群,集群规模达到了数千台服务器。

2022年10月,美国发布了针对A100、H100和GH200等AI芯片的限制措施,停止向中国出口。

一时间A100芯片价格暴涨,《最话》了解到今年原价1万美元/张的A100,年中在市场上报价15万元/张,更有“黄牛”报价155万元/张,是原价的21倍。

英伟达通过减配等方式绕过了美国“芯片禁令”,可以继续对华销售H800和A800型号芯片,综合使用效率虽然只有A100/H100的60%,但已经是中国企业在从英伟达手里买到的最好的芯片。

根据英伟达2022年财报,中国区销售收入占到总收入的20%。媒体推测,仅中国四大互联网巨头百度、字节跳动、腾讯和阿里巴巴就向英伟达下单购买了价值50亿美元的A800显卡。

英伟达当然不想失去中国市场,今年初,英伟达CEO黄仁勋就在媒体面前反复强调着中国市场不可替代的重要性,“没有另一个中国,只有一个中国。”他甚至还表示,限制向中国出口人工智能芯片将导致美国行业永久失去机会,也不可能限制住中国的发展。

虽然英伟达舍不得数十亿美元的订单,但作为一家美国企业,英伟达必须要遵守美国监管机构的新规。

在新规公布后,英伟达紧急表示:“鉴于全球对我们产品的需求,我们预计新的规定短期内不会对我们的财务业绩产生实质性的影响。”不过,官方也承认:“新规定可能会影响公司的开发和交付能力,包括按时完成某些产品开发,为现有客户提供支持,或者向受影响地区以外的客户供应这些产品。”

坊间流传的消息显示,英伟达建议国内客户在10月17日晚12点前增补订单,并间接承认后续新增订单将很难获得供货保证。

而现在未交付的订单和增补的订单都打了水漂。对于此前下了订单,等着芯片构建算力集群的中国科技公司来说,新规提前执行,芯片没了,也不知何时才能拿到。

一位云计算企业人士说,“合同都提前写好了不可抗力会免责,这没办法。”对于租用他们算力的大模型客户,云计算企业也要求客户给予免责。至于自建算力的大模型企业,同样面临着“停芯”“后续无芯可用”的窘境。一连串连锁反应正在发生。

国际市场调研机构Counterpoint估算,目前中国科技企业落后OpenAI的GPT-4等顶尖大模型大约2.5年到3年。芯片供应不稳定的状态下,该机构认为,中国科技企业与全球同行的差距,在未来几年将继续拉大。

02

“B计划”

所以,无论是从自主可控还是从经营角度,中国科技企业必须尽快另觅高性能算力芯片的供应商。

算力芯片粗略可分为训练、推理两种用途,前者需要更大的算力规模。从目前来看,国内投入大规模量产并在业务上使用的算力芯片有华为昇腾910、阿里倚天710、百度昆仑芯2代、腾讯紫霄、海光DCU Z100等。

据《电子工程专辑》发布的《45家国产AI芯片厂商调研分析报告》,阿里倚天710是CPU,用于逻辑计算,而非AI推理训练;百度昆仑芯2代被应用于文心一言大模型的推理端,训练端主要还是使用英伟达V100和A100;海光DCU Z100训练算力较小,不到100TFLOPS,只适合一些推理场景,不足以支持训练大模型;腾讯紫霄虽然大规模投入实际业务中,但定位于偏中低端,用于AI推理。

2019年8月23日正式推出的华为昇腾910是国内算力最强的AI处理器,芯片基于自研华为达芬奇架构3D Cube技术。昇腾910A只支持FP16半精度计算,而昇腾910B已升级到支持FP32单精度计算,昇腾910B的FP32单精度计算算力可达75T,支持HBM内存技术,可以用于大模型训练,已适配盘古、Llama、清华大学自研大模型等。

科大讯飞在第三季度业绩说明会上曾透露,公司已于今年初与华为昇腾启动专项攻关,如今华为发布的昇腾910B能力已经基本做到可对标英伟达A100芯片,未来算力紧张状态将得到缓解。

昇腾910系列芯片采用7nm工艺制程,此前由台积电代工。一位数码博主在微博上称,“华为芯片制造问题解决了,往后几年将是海思各类芯片的井喷,华为昇腾也全面开花了”。

这与《最话》了解到的情况大致相同,麒麟9000S芯片的良品率已经基本达到台积电水平,这意味着7纳米的良品率和产能已经不是大问题,目前华为内部各条业务线都在抢产能,其中就包括昇腾910系列芯片。

《最话》从接近华为的人士了解到,目前昇腾主要有两种类型的客户,一类是制造业客户,买两三台做AI质检,对并行计算没什么要求;还有一类是央企国企背景的企业,会与华为有深度沟通和合作。但一些中型或者大型科技企业,“目前合作是比较少的,它们过去肯定是优先购买英伟达的产品,现在有可能转向购买国产AI算力芯片了。”

“目前来看,华为无论是平台的算力,还是涉及到的硬件设备的供应,都是非常充足的。”该人士表示。

昇腾910B支持的FP32单精度计算,对于一般图形处理计算、深度学习、大模型等领域,已经够用。但对于需要处理的数字范围大且需要精确计算的科学计算,如计算化学、分子建模、流体动力学等,就需要支持FP64双精度计算。

原定于2021年推出的昇腾920,因受2019年美国对华为的制裁影响,进度大幅延宕。今年5月,在华为昇腾开发者峰会上,一张PPT引发了关注,很多人在猜测云脑Ⅲ 原型机采用的会不会就是昇腾920。这就只有时间来证明了。

华为能否顶上英伟达?

同时,华为也在开发技术工具,帮助客户在不同计算卡间解决算力调度问题,方便客户混合部署。

03

背水一战

新规出台后,黄仁勋强调,中国本土也有包括华为在内很多优秀的科技厂商,英伟达必须努力与这些企业竞争。

但谁都知道,英伟达在GPU、高性能算力芯片领域的地位是短时间内难以撼动的。花旗研究分析师Christopher Danely(克里斯托弗·丹尼利)表示,英伟达将占据AI高性能计算芯片市场至少90%的份额。

新规如果不能解除,那就意味着绝大部分想自研通用大模型的中国AI创业企业将面临巨大挑战,当然,资金实力雄厚的科技大企业,还可以通过与华为等协同攻关或直接采购以熬过难关。

这是在与时间赛跑。

英伟达首席科学家表示:“随着训练需求每6到12个月翻一番,这一差距将随着时间的推移而迅速扩大。”生成式AI实在发展的太快了,新规毫无疑问是想拉大国内企业和美国企业在人工智能上的时间差和代差。面对英伟达在硬件上、Open AI在算法上不断迭代,中国科技企业并没有太多犹豫时间,也没有太多试错机会,必须保证每一步做出正确的决定。

美国政府一纸规定,就让英伟达被迫退出中国高性能算力芯片市场,这一局面不是黄仁勋希望看到的。10月21日,黄仁勋曾表示,英伟达会遵循美国政府的相关规定,但也“希望尽可能拥有较大的市场,会尽量支援各个市场需求,也支持中国大陆市场客户。”

只是处在夹缝中的英伟达并没有选择的余地。同样没有选择余地的还有AMD、英特尔,AMD的MI250X、MI300,英特尔的Gaudi 2、Gaudi 3也上了管制名单。据报道,黄仁勋、英特尔高层和美国高级官员交涉过,但无功而返。

AI算力芯片折旧一般2-3年,最长不超过5年。管制新规生效后,即使国内科技大厂、大模型创业公司囤积了不少H800,很会在未来两三年后面临折旧、换代的需求,如果得不到补充,将面临巨大困境。

与此同时,哪怕其他国产AI芯片企业能解决授权、设计问题,在制造领域还得靠台积电等芯片企业代工,在供应渠道上也有一定不确定性。

现在就需要看国内企业能否通力合作解决半导体制造全产业链问题了。

此时此刻,所有科技公司都在夹缝中寻找生机,英伟达、AMD、英特尔掌握着先发优势和巨大市场,新规并不会造成致命影响,但对于国内科技、算力芯片企业来说,在管制新规的高压之下,想要活下去,唯有背水一战。

给TA打赏
共{{data.count}}人
人已打赏
5G半导体芯片

Arm IPO后首份财报:营收8亿美元同比增长28%,业绩指引不及预期盘后跌7%

2023-11-11 1:24:35

5G半导体芯片

苹果、高通同时发布芯片,英特尔先慌了?

2023-11-11 1:24:37

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索