其他
中国也要有属于自己的“英伟达”了吗?
特朗普上台了,有一件事情是可以确定的,那就是“国产替代”的热度还得上升。
二级市场永远是最先反应的“敏感肌”,特朗普当选之后中国的半导体股指——中证全指半导体指数迅速上涨,2024年的涨幅也已达到26%。可见就连A股“韭菜”都知道中国半导体自力更生是迫在眉睫了。
差不多这个节骨眼上,又一个要做“国产英伟达”的公司宣布准备推进上市进程。摩尔线程在北京证监局办理辅导备案登记正式启动A股上市辅导。
在此之前,燧原科技、壁仞科技也都已经推进IPO进程,有趣的是,摩尔线程创始人以前是英伟达的全球副总裁,燧原科技和壁仞科技的创始人团队也有AMD出身的,可谓是英伟达、AMD阵营的“中门对狙”。
仔细看,这几个新晋国产GPU成立时间都不长,基本都是2018年前后成立的,也就4-6年的时间,既得到了明星资本的青睐,又有了破百亿的估值,站在巨人的肩膀上就是好做事。
但是国产GPU从模仿英伟达到超越英伟达可谓是任重道远,虽然现在不少初创公司拿着某个单项算力数据对标英伟达,狂吹“吊打英伟达”的牛皮,但是市场规模是不会骗人的,国产芯片从营收数据和增速来看可以说几乎没有能打的。
这是因为英伟达有的不只是硬件实力,还有软硬件结合的能力。十五年前英伟达下了盘大棋,CUDA的推出让英伟达从生态和用户上直接开始了垄断,开发者从最初的简单上手到如今的无法脱离才逐渐意识到了问题的严重性。而国产GPU不论是兼容CUDA还是另创自己的生态系统都极具挑战。
国产芯片这几年有资本的大力支持,也有环境的迫在眉睫,但是到底谁能做成这个“国产英伟达”,说实话还不好说。
01 谁是第一支“国产英伟达”
国产GPU正在努力打破英伟达“赢者通吃”的局面。
前几天,国产GPU摩尔线程传来准备上市的消息,证监会官网显示摩尔线程已经在北京证监局办理辅导备案登记,正式启动A股上市辅导,辅导机构为中信证券,公司注册资本为3.3亿元。
而摩尔线程已经是今年第三家启动IPO的国产芯片了。此前壁仞科技和燧原科技都已经开启了IPO进程。
“国产替代”的需求,是催化国产芯片资本化的重要原因之一。“现在只要是个投资人都在研究芯片。”林峰(化名),一位硬科技投资人说道,“投早、投小、投科技都已经快成投资人的‘政治正确’了。”要说原因,林峰表示,既是投资人主动也是被动。
主动在于,国产芯片确实有GAP没有填满。消费电子、汽车、数据中心三大芯片场景里,消费电子芯片国内已经有自己的优势了。
华为、小米、OPPO、VIVO都做得很好,比起海外苹果、三星几乎独大的局面,国内消费电子芯片还非常内卷,而且已经有了结合中国用户需求的产品,比如快充、影像方面的芯片,国产技术已经有所领先;汽车芯片也因为国内新能源政策大力支持有所发展,国产电车迭代的速度在倒逼自动驾驶、智能座舱芯片的进步。
但数据中心芯片,国内还在落后。尤其是在大模型活跃之后,全球算力需求直线上升,芯片厂商也在往人工智能推理方向升级。英伟达销量大涨、英特尔、AMD猛猛追击。不过国产芯片在这方面还处于“模仿,争取别被落下太远”的阶段。
“对投资人来说,有GAP的地方就有市场,外加近几年由于各种原因,国内很多国企、政企都有使用国产芯片的需求,所谓‘国产替代’风就异常火热,投资人们也想追上这波热点。”
林峰表示,至于被动方面,“现在很多投资人的LP都是国资,国资拿钱是需要返投指标的,那么一系列办公室软件、互联网平台这样轻资产的项目就没有优势,而消费企业这几年上市退出又很难,选来选去,都是硬科技最保险。”
据科创板日报,去年一级市场共发生投融资事件8370起,而这其中,半导体领域的投融资事件达到了1058起,是当之无愧的资本香饽饽。
重赏之下必有创业者,去年国内的芯片设计公司已经有了3400多家,比2022年多了200多家。不过这3000多家芯片公司里,超过55%的公司收入还不到1000万元,而销售额上亿的公司占比只有不到20%。(国产替代半导体)
不过这千军万马杀出来的三家IPO备选,可都是独角兽的存在。壁仞科技估值155亿元、燧原科技估值160亿元、摩尔线程估值更是达到了255亿元。IDG、深创投、红杉中国等大牌资本也先后出现在这些项目身后。
3000多家公司,杀出三家准IPO,产品肯定是一大能力,三家公司针对的侧重点其实略有不同。
壁仞科技就是标准的国产GPU定位。2022年就推出了GPU产品BR100和BR104,都采用了7nm工艺,其中BR104对标英伟达2020年推出的A100、BR100对标英伟达4nm芯片H100。BR104 FP32算力为128T FLOPS,BR100 FP32算力为256T FLOPS。
燧原科技定位的就不只是AI芯片厂商,而是“云端技术平台提供商”。用他们COO张亚林的话来说,“客户需要的是算力,公司交付的是系统级解决方案。”所以燧原科技全栈布局了板卡、智算一体机、液冷算力集群以及配套的软件系统等。2019年12月燧原云端训练芯片邃思1.0发布,并规划5年推出三代芯片,构筑AI算力的系统级能力。
摩尔线程,做的事情则和英伟达更相似,做AI芯片和生态。摩尔线程的AI计算芯片包括MTT S2000、MTT S3000和MTT S4000,其中MTT S4000是2023年12月发布的最新芯片,这三款芯片FP32算力分别为10.6T FLOPS、15.2T FLOPS、25T FLOPS。对比AI芯片巨头英伟达的产品,A100 FP32算力为19.5T FLOPS,H100 SXM版本F32算力为67T FLOPS,可见算力方面仍有差距。
为了加强自己对标英伟达的定位,摩尔线程在今年5月和智谱AI开展GPU大模型适配及性能测试,包括大模型推理和基于夸娥千卡智算集群的大模型预训练。测试结果表明,推理方面摩尔线程自研全功能GPU优于对比产品英伟达RTX3090和RTX4090。
不过得注意,对标的这两个英伟达显卡都是消费级的显卡并不是专业的AI芯片。而且摩尔线程也在往现在最火的大模型需求上靠拢,上线国产千卡千亿模型训练平台KUAE(夸娥),并在今年5月和无问芯穹完成基于国产全功能GPU千卡集群的3B(30亿)规模大模型实训。
02 狂飙背后的隐忧
千军万马的独木桥,争的都是一个名头——谁才是中国的英伟达。
要竞争,除了比质量还得比速度。摩尔线程才成立四年、壁仞科技也才五年,为了快速实现商业化,比起吭哧吭哧自研IP,大部分国产GPU的半导体IP都是直接采买现成的。
采买底层技术的优势是很明显的,省钱、省力、省时间。如果走GPU IP自研路径,基本需要3-4年,而且团队也要100-200名工程师才行,如果是用采买IP,整个研发周期可以缩短一年甚至一年半。能尽快从烧钱到赚钱,这是任何投资人都喜闻乐见的。
目前的半导体IP可以按照产品分类为:处理器IP、接口IP、其他物理IP与其他数字IP。从市场规模上看,处理器IP是规模最大的品类(49.5%),主要涵盖CPU、GPU、NPU、VPU、DSP、ISP等6类产品;第二大的接口IP(24.9%)是增速最快的品类,其中95%为有线接口IP(如PCIe、DDR、D2D、SerDes、USB等),剩余则是无线接口IP(如蓝牙、Zigbee、Thread IP等);其他物理IP(16.8%)则包含了通用模拟IP、数模混合IP、eNVM IP、内存编译器IP、射频IP等类别;其他数字IP则占8.7%。
目前国内芯片厂很多半导体IP是从一家叫Imagination Technologies的英国芯片设计公司买来授权,这家公司之前也是苹果的老搭档,后来苹果开始自研GPU,Imagination Technologies又辗转被一家中资背景的机构凯桥资本收购,成了国内芯片厂的一大供应商。
不过拼速度也是有代价的,举个不完全正确的例子,IP和芯片设计就像是楼房的框架和设计,理论来说自主研发的IP成分越大后期的芯片设计越能做出差异化的产品,而如果采买了特定的IP核,就像拿到一个楼房固定的框架图纸,再在这个基础上堆砌设计也是受到功能限制的。而且授权IP的知识产权还是开发者拥有的,采买的公司可能会受到使用条款的限制。
这就是为什么苹果当年不惜背着被告的风险也要“背刺”Imagination Technologies,不仅仅是踩在后者肩膀上自研GPU还带走了他们好多工程师,可谓是“连吃带拿”。
采买IP还有一个风险就是提供IP的供应商也得是条够粗的“大腿”,不然创业公司这边风风火火研发到一半,IP公司倒闭了,可就搞笑了。现在现金流大的大厂都有自研IP的意识和动作,自然稀释了半导体IP厂的市场,Imagination Technologies去年就传出中国地区裁员40%的消息,这也会给采买其IP授权的厂商带来一定的风险因素。
当然,IP是自研还是采购还只是一个底层技术的问题。别说超越英伟达,就算是要靠近,需要的也远不止这一项能力。
现在很多国产芯片公司研发做得如何不知道,但是中文玩得很溜。动不动就拿某几项参数和英伟达对标,恨不得分分钟把英伟达甩出个十里地。再加上隔三岔五的合作消息,看起来都是风生水起。
但是要判断下游的计算中心客户是否真的买单,最好的方法还是看收入。今年第二季度,英伟达单季度营收已经超过了300亿美元。再看国内,一直在算力上标着英伟达的寒武纪在第二季度营收是3910万元人民币、A股此前上市的GPU概念股景嘉微营收是2.4亿元人民币,我想这规模足以说明下游客户现阶段的真实想法。
问就是支持国产替代,查就是偷偷在买英伟达。这就能说明,光是拿着参数铆劲是没用的,在实战情况下,稳定、持续、高效运行千亿参数大模型以及背后的万卡数据中心并不是一个能靠某一两个参数单点穿透的事情。
就拿最简单大模型评测维度来说,也要考虑至少5个方面——单卡性能、卡间互联、集群利用率、大模型训练的支持、以及对现有生态的兼容。国产芯片会在单独一两项超过英伟达,但目前还没有出现英伟达那样的“五边形战士”。
03 生态大网怎么破?
如果说技术是英伟达单项技能满点的基石,那CUDA就是把这些能力汇聚成多边形战士的网格。
对于英伟达的CUDA,开发者们可以说是爱之、恨之、想要取而代之。
CUDA之于英伟达是其业务转型和腾飞的“蜜糖”。十五年前英伟达推出了这个并行计算平台和编程模型,本意就是让开发者能够直接在GPU上编写代码,CUDA的核心优势就是“并行计算”,比如说在训练模型的时候处理大量的图片要耗费大量的时间,通过CUDA就可以让成千上万计算单元同时进行计算工作,极大缩短计算成本。
众所周知,英伟达最开始是靠做游戏显卡发家的,那个时期英伟达主要的优势是图形渲染技术,而CUDA的推出直接让英伟达搭上了AI这趟高速列车。“并行计算”的能力完全符合AI大模型训练的需求。
这项极具前瞻性的布局让英伟达直接从游戏市场跨界到了区块链矿卡市场,再转到AI市场迎来彻底爆发,到了今年第二季度英伟达游戏业务营收是29亿美元,相比之下有CUDA加持的数据中心业务营收已经达到了263亿美元,可见这一布局带来的重要的战略意义。
通过CUDA,英伟达的软硬件实现了一个完整的生态闭环,之后英伟达的TensorRT(AI软件栈)、DGX服务器(数据中心解决方案)也都是围绕CUDA展开的软件业务。而且英伟达在2016年打造了超算平台DGX-1之后就把它捐给了当时还默默无闻的OpenAI来帮助他们训练大模型,所以英伟达在大模型生态的布局也是遥遥领先。CUDA之于所有想要再造英伟达的创业者、替代者,甚至是使用英伟达产品的部分开发者都是无法摆脱的“砒霜”。
逐渐的,开发者们和竞争者们都发现英伟达的这块“蜜糖”有点“粘牙”。开发者们在CUDA上运行的代码简直是行云流水,但是离开了CUDA的环境就“寸步难行”,这是因为英伟达提供了非常强大的开发者工具链和资源,比如英伟达 GPU Cloud(NGC)、英伟达 Developer Program,这就让进入CUDA的开发者非常容易上手,而想要离开CUDA的开发者就要花时间和精力再去学习,时间久了开发者就会发现对CUDA的依赖越来越重。
所有做toB生意的人都得明白,客户(花钱的人)和用户(使用的人)不一定是一群人,英伟达CUDA就深谙此道,用用户的粘性倒逼客户的续约。
国产GPU们冲破技术大关就已经十分困难,还要去破英伟达垄断性的生态大网就更为不易,所以大家伙就想出一招——先和平相处。于是乎很多国产厂商打出“全面兼容CUDA”的口号。比如摩尔线程的MUSA生态、壁仞科技的 BIRENSUPA平台、沐曦科技的 MXMACA平台都声称可以兼容CUDA。
但是从实际情况来看,国产GPU对CUDA兼容的完善度未必是100%。
比较重要的特性中可能60%-70%都无法支持。况且要做到兼容CUDA本身就非常不容易,需要投入工程师的数量巨大。涉及50个驱动、50个编译器、50个数学库、300个应用层工程师,3-5年的时间。而其功能的验证,用户的培养可能还需要额外3-5年。(IC大家谈)
英伟达自然也是知道后来者都想从模仿到超越,所以每次在CUDA API更新的时候都会增加兼容的难度。开发者如果升级代码,就得面对新的适配问题,而这些问题可能都得在英伟达的GPU上才能解决。所以,即使一时兼容一时爽,一直兼容也很不容易。
也有的选手够莽,直接就要自己另创一个自定义的编程语言,比如华为昇腾、寒武纪等。2024上半年在国内所有的选手中,华为GPU的市占率约为17%是仅次于英伟达的80%的,2018年华为也建立了自己的达芬奇架构,当时华为推出AI芯片Ascend 310(昇腾310)首次亮相,也标志其达芬奇架构正式被应用。
和CUDA类似的,华为达芬奇核心优势也在于做运算加速,采用3D Cube,据数据猿,每个AI Core可以在一个时钟周期内实现4096个MAC操作,相比传统的CPU和GPU实现数量级的提升。
虽然和英伟达相比小了一轮,但华为达芬奇架构也在穷追猛打,从设计目标来看,CUDA更看重通用性,支持大规模并行处理能力,适合处理各种复杂的计算任务,所以也被广泛应用在科学研究、医学、金融等多个领域;达芬奇架构更主要针对AI计算,特别是在端侧、边缘侧及云端的AI应用场景中,比如国内最受欢迎的自动驾驶、智能手机以及云场景。
作为后来者,华为从国内客户需求入手搭建这个编程生态思路是很聪明的,只是毕竟晚到十几年,从整个开发者生态的完整性上仍有欠缺。而华为在内所有自研生态的厂家除了烧钱费力去从英伟达里“夺食”之外,也要面临不同体系之间的竞争,毕竟对于开发者而言,选了一个生态就不容易再选第二个。
现在有一种声音说,或许要破解英伟达的垄断并不是一家能够做到的,不论是英伟达的大客户还是竞争者都不愿意看到他们赢者通吃的局面,所以开源共享技术,同工创立一个生态也是一个办法。不过这种想法实在是有点过于理想主义了。
芯片是一个前瞻性布局至关重要的行业,这些英伟达、AMD的前高管们带着一身光环去追赶巨头,到底谁会最先从“追赶光”到“成为光”,才是关键。
酷玩实验室整理编辑首发于微信公众号:酷玩实验室(ID:coollabs)如需转载,请后台留言
酷玩实验室视频号热点视频推荐↓↓↓
“英伟达们”再造英伟达
,
选择留言身份