在GTC 2026台北大会上,英伟达CEO黄仁勋用两个小时的演讲传递了一个核心判断:AI正在从"生成内容"阶段进入"执行任务"阶段,代理式人工智能(Agentic AI)将成为下一代计算的核心工作负载。
围绕这一判断,英伟达发布了从芯片到平台、从云端到终端的全线产品布局。
推理取代训练,成为算力消耗的主战场
黄仁勋在演讲中明确指出,AI行业的算力瓶颈正在从模型训练转向推理。AI Agent在执行任务时需要长链推理、多轮规划、工具调用和多Agent协同,每一步都消耗推理算力。
由此引出本次大会的硬件核心——Vera Rubin平台。该平台专为Agentic AI工作负载设计。其中,Vera CPU是英伟达面向AI Agent推出的全新处理器,强调极致单线程性能和能效比, 旨在为现代 AI 工厂背后的 CPU 密集型工作提供动力,从代理式 AI 和强化学习,到数据处理和编排。
英伟达的设计逻辑很直接:AI Agent在执行任务时需要调用工具、查询数据库、运行代码,这些操作对CPU的响应速度提出了与传统数据中心截然不同的要求。
这对以AI作为重要赋能工具的AI应用型企业而言意味着实质性的成本拐点。以港股上市的明略科技(2718.HK)为例,该公司在2025年年报中披露,其Agentic AI相关业务已实现快速增长,核心驱动力之一正是推理成本的持续下降使得AI Agent大规模替代人工执行业务流程成为可能。推理算力每便宜一个数量级,Agent的商业化边界就扩展一圈。
"Token是新的大宗商品"
演讲中频率最高的概念之一是"AI Factory"——AI工厂。黄仁勋将数据中心重新定义为"生产token的工厂",并首次系统阐述了token经济学的定价框架:按速度和智能程度将token分为不同层级。
他甚至预言,Agent(智能体)将终结传统SaaS模式,未来“年薪+Token预算”将成为职场新标配,token消耗将成为企业运营成本的常规科目。
过去一年,从硅谷到中国,已有一批企业开始尝试以token消耗作为服务计价的基础单元,将传统的软件订阅费替换为"token成本+服务费"的模式。红杉资本在近期一份报告中将这类企业描述为"披着服务商外衣的Agent公司"。
SaaS已死?Agentic Service正在重塑软件行业
过去半年,从Salesforce推出Agentforce到ServiceNow上线AI Agent平台,从SAP重新定义"业务AI"到国内多家企业级软件公司调整产品路线,"Agent取代工具"正在成为企业软件行业的共同方向。
在中国市场,明略科技是这一转型中走得较早的公司之一。据其2025年年报,公司全年实现收入14.26亿元,毛利率55.4%,经调整净利润首次扭亏为盈。业务模式上,公司正从传统SaaS交付转向Agentic Service,通过AI Agent直接为客户执行广告投放、内容生产等业务环节。今年5月,公司还发布了搭载端侧AI模型的智能会议终端Octic,将Agent能力延伸至硬件场景。
当然,无论是Salesforce还是明略科技,Agentic Service模式整体仍处于产业早期,规模化复制能力和客户留存率有待更长周期的检验。其仍取决于Agentic AI能否真正从概念进入规模化落地。但至少,当全球市值最高的企业之一将整条产品线对准"Agent"这个方向时,产业界对这一趋势的共识正在加速形成。
新闻来源 (不包括新闻图片): 有连云