“黄教主”话音刚落,台下创业者已哭出声
拉斯维加斯CES 2026现场,当黄仁勋说出”Token成本降低10倍”时,整个会场瞬间被点燃。一位来自中国AI创业公司的CEO当场站起来鼓掌,眼眶泛红——“等了三年,终于等到这天。”
这不是夸张。就在上周,他的公司每月还要支付120万美元的算力费用,其中光是生成token的成本就占去70%。而现在,英伟达刚刚告诉他:兄弟,从2026年下半年开始,你只需付原来的十分之一。
90%的成本暴跌,这不是降价,这是核爆。
六剑合璧:一场”极限协同设计”的暴力美学
过去,英伟达每代产品只换1-2颗芯片,但这一次,摩尔定律真的跟不上了。AI模型规模每年狂涨10倍,生成文本量每年暴增5倍,可晶体管数量只能增加1.6倍。怎么办?
黄仁勋的答案简单粗暴:一次性重设计全部6颗核心芯片。
这颗”六芯核弹”,名曰Vera Rubin。
第一剑:Vera CPU——史上最强”配角”
88个物理核心,176线程,性能是前代2倍。但别误会,它不是为了抢GPU风头,而是专职做AI的”超级管家”——数据预处理、任务调度、内存管理,把所有杂活干得明明白白,让GPU专心算大事。简单说,这就是个从不喊累的”AI牛马CPU”。第二剑:Rubin GPU——性能怪兽的王者归来
采用3nm制程,两颗计算芯片+两颗I/O芯片的”四芯”封装。AI推理性能直接干到Blackwell的5倍,训练性能也翻了3.5倍。最牛的是那颗NVFP4 Tensor Core——它不是简单用4位精度糊弄你,而是能动态识别模型哪层需要高精度、哪层可以放飞自我,在速度与精度间疯狂横跳。这就像开车时,该飙高速就飙,该减速过弯就减速,全程自动挡。
第三剑:NVLink 6交换机——比全球互联网还宽的高速公路
单芯片400Gbps,72颗GPU互联总带宽260TB/s。什么概念?全球互联网总流量也就100TB/s。这意味着72颗GPU能像”一颗巨型GPU”那样无缝协作,集体通信时再也不用挤独木桥。延迟?几乎不存在。
第四剑:ConnectX-9网卡——1.6Tbps的”光速快递”
专门处理AI的”东西向流量”,把数据搬运效率拉满。配合Vera CPU的深度整合,RDMA操作快如闪电。第五剑:BlueField-4 DPU——150TB的”记忆宫殿”
这是革命中的革命。AI对话越长,GPU的HBM内存越吃紧(就是那个死贵死贵的显存)。现在英伟达直接在机架里塞了个150TB的共享内存池,由BlueField-4统一管理。每颗GPU除了自己的HBM,还额外获得16TB的极速访问空间。长文本处理?百万token上下文?不好意思,现在GPU能”记住”一辈子对话内容,再也不用担心内存溢出。这相当于把显存成本砍掉了80%。
第六剑:Spectrum-X光子交换机——光纤直接”长”在芯片上
全球首款硅光子共封装交换机,512个200G端口,激光器直接集成在芯片封装里。功耗减半,延迟再降一个数量级。这是为万卡级”AI工厂”准备的终极杀器。六剑合璧,重两吨,100%液冷,220万亿晶体管。 这不是服务器,这是艺术品。
账本革命:从”烧钱炼金”到”躺平数钱”
算笔账就明白为什么创业者要哭。
以前:一个日活10万的AI应用,每次对话平均1000 token,按GPT-4定价$0.03/1K token,每天光生成成本就是 $3000,一年110万美元。这还没算服务器折旧、电费、工程师工资。
现在:Vera Rubin直接把token成本打到$0.003/1K token,甚至更低。同样规模的应用,年成本骤降至11万美元。省下的100万美元,够招3个顶尖算法工程师+2个产品经理,再加一年云存储费用。
更狠的是推理性能5倍提升。以前需要100台服务器扛住的并发量,现在20台就够。电费省80%,机房租金省80%,运维人力省80%。这哪是降成本?这是把创业公司的”生死线”直接抹平了。
一位VC在朋友圈写道: “今天之前,投AI应用要看团队会不会’算钱’;今天之后,只看团队会不会’造场景’。算力自由时代来了。”
创业春晓:哪些赛道将原地起飞?
token成本暴跌90%,等于把AI创业的”水电气”变成了白菜价。哪些领域会最先爆炸?
1. 超长文本处理:法律、医疗、金融的福音
合同审查、病历分析、研报解读,这些动辄几十万token的场景以前根本不敢想。现在,一个创业团队用几台Rubin服务器,就能服务全行业。法律科技创始人激动地说:“我们终于可以把整个《民法典》+500个典型案例塞到上下文里,让AI真正’懂法’了。”2. 实时多模态交互:视频、语音、图像一锅炖
视频生成成本降90%意味着什么?Sora级别的能力,Pika的价格。虚拟主播、短剧制作、电商视频将彻底平民化。一家做AI短剧的创业公司算完账后,当场决定把预算从”购买算力”改成”all in创意团队”。3. 智能体(Agent)网络:百万AI员工不是梦
当每个AI智能体的运行成本低到几分钱,企业可以部署成千上万个专业Agent。一个Agent负责客服,一个写代码,一个做数据分析,它们还能互相协作。这不再是科幻,是2027年的标配。4. 教育个性化:每个孩子配一个AI苏格拉底
1v1个性化辅导最大的障碍是成本。现在,AI导师可以24小时在线,记住学生三年来的所有错题、习惯、性格特点。教育平权,从算力平权开始。5. 游戏NPC革命:真正的开放世界
《西部世界》级别的NPC对话系统,成本降到游戏公司能承受的范围。每个NPC都有百万token的记忆,真正”活”在虚拟世界里。游戏行业将迎来”剧本已死,交互当立”的时代。大厂恐慌,小厂狂欢:格局重塑进行时
黄仁勋这次打破了英伟达自己的”祖训”——每代产品最多换两颗芯片。为什么?因为他明白:在AI工厂时代,卖单卡就是卖铲子,卖系统才是卖整座金矿。
这对大公司是利空。Meta、谷歌这种自建数据中心的巨头,原本靠规模摊薄成本。现在小厂用Rubin直接跳过”堆量”阶段,在单卡性能上实现弯道超车。算力霸权被稀释了。
但对中国的AI制造业却是史诗级利好。有业内人士分析:”英伟达转向’系统级方案’,短期内会冲击国产芯片,但长远看,具备制造业优势的中国更占赢面。”毕竟,造”AI工厂”比拼的是工程整合能力、供应链控制力和成本优化能力——这不就是中国制造的基本盘吗?
站起来,时代变了
过去三年,AI创业者最怕投资人问三个问题:“你的护城河是什么?”“GPT-5出来怎么办?”“算力成本能cover住吗?”
从2026年下半年开始,第三个问题消失了。当token成本不再是枷锁,真正的竞争将回归本质:谁更懂用户?谁更会创新?谁更能造出杀手级场景?
黄仁勋用220万亿个晶体管,砸碎了算力高墙。墙外,是10万家AI创业公司的春天。
别犹豫了,孩子。是时候all in了。