Token风暴
去年 CES 舞台上,黄仁勋穿着标志性皮衣讲了个宏大的故事——物理 AI 时代来了。Blackwell 芯片、百万 token 长上下文、智能体处理、自动驾驶决策……听起来都挺前景。
但这一次不一样了。今年的英伟达,开始认真啃一个现实问题:怎么真正搞定推理的成本。
这很关键。因为从 DeepSeek R1 这类开源推理模型火了以后,整个行业都看明白了——当协作真的放开,技术扩散快得离谱。开源模型虽然还慢半年左右,但每半年就能追近一轮,下载量和使用量直线上升。
现实逼着英伟达得改变策略。光有芯片不够,得把推理所需的算力、网络、存储基础设施一整套补齐,才能从源头上压低推理成本。这不是为了超级大模型的训练跑分,而是为了真正把 AI 能力嵌进自动驾驶、机器人这些真实场景里去。
这意味着产业格局在悄悄变。推理成本的大幅下降会直接撬动硬件需求,而基础设施的完善程度会成为决定谁能快速部署应用的关键因素。
但这一次不一样了。今年的英伟达,开始认真啃一个现实问题:怎么真正搞定推理的成本。
这很关键。因为从 DeepSeek R1 这类开源推理模型火了以后,整个行业都看明白了——当协作真的放开,技术扩散快得离谱。开源模型虽然还慢半年左右,但每半年就能追近一轮,下载量和使用量直线上升。
现实逼着英伟达得改变策略。光有芯片不够,得把推理所需的算力、网络、存储基础设施一整套补齐,才能从源头上压低推理成本。这不是为了超级大模型的训练跑分,而是为了真正把 AI 能力嵌进自动驾驶、机器人这些真实场景里去。
这意味着产业格局在悄悄变。推理成本的大幅下降会直接撬动硬件需求,而基础设施的完善程度会成为决定谁能快速部署应用的关键因素。