美股
基金
外汇丶加密货币
沪丶深港通
港股
 
 
 
 
 
 
新闻分享
如欲分享新闻,请填写收件人及阁下之电邮,再按「送出」。*必需填写
收件者电邮*
请用分号「;」分隔不同电邮地址,例子:a@a.com; b@b.com
阁下之电邮*
分享内容
寻找AI算力的“第二出口”:高额Token时代下的端侧解法
6月1日,微软旗下GitHubCopilot宣布全面废除原有的固定月费制,转向基于Token实际用量的计费模式。这一举措,被业内普遍视为大模型行业“包月低价时代”终结的信号。在过去两年里,企业沉浸在大...
重设
送出
视窗将於5秒内关闭
寻找AI算力的“第二出口”:高额Token时代下的端侧解法
有连云新闻
推荐
0
利好
0
利淡
0
 
 

6月1日,微软旗下 GitHub Copilot 宣布全面废除原有的固定月费制,转向基于 Token 实际用量的计费模式。这一举措,被业内普遍视为大模型行业“包月低价时代”终结的信号。

在过去两年里,企业沉浸在大模型赋能业务、降低成本的乐观叙事中,但许多企业核算报表时却迎来了残酷的财务审计:实际支出不降反升。这种成本悖论的背后,是 AI 技术正从“一问一答”的对话框,加速跨入全天候自主规划、循环调用的智能体(Agent)时代。当智能体在后台默默进行着全天候的屏幕扫描、日志解析和长文本轮询时,每一次自动化决策都是千万级 Token 的高频吞吐。

这场由技术演进引发的“推理成本危机”,正在将大模型的落地推向一个全新的思考节点:当云端的无限智能变成供不起的奢侈品,企业究竟该去哪里寻找算力的“第二出口”?

一、 消失的“免费续杯”:当AI从吞噬软件转向吞噬账单

“市场对智能的需求几乎是无限的,但能源与算力将成为真正的瓶颈。”Coinbase 首席执行官 Brian Armstrong 的这番话,点出了 AI 行业生产力逻辑的剧烈转变。

一个行业共识是:过去企业经营 AI 的重心集中在训练端,赌的是参数的“涌现”;而到了2026年,根据 FinOps 基金会发布的最新数据,AI 推理成本在企业 AI 总预算中的占比已经超过八成。大模型正在从“吞噬参数”的研发怪兽,变成“吞噬账单”的推理老虎。

Gartner 高级分析师 Arun Chandrasekaran 接受 Business Insider 采访时也一针见血地指出,GitHub Copilot 的案例只是冰山一角。随着高级推理模型和智能体工作流的普及,AI 进入了全天候的运行状态。每一次自动化决策背后,都是千万级 Token 的高频交互,这必然倒逼市场转向更严苛的按量计费模式。

在智能体时代,技术可行性不再是唯一的终点,企业投资回报率(ROI)才是真正的试金石。如果推理成本找不到更优的解法,AI 很难真正作为核心生产力嵌入到企业经营的骨干网络中。

二、 重返边缘:未来八成工作任务或由端侧智能完成

面对高昂的云端 API 开销,行业的非共识正在迅速凝聚成新的共识,即逃离单一的云端中心化大模型,走向更具弹性的分布式端侧算力。

斯坦福大学的研究数据指出,本地化小模型在真实对话与复杂推理查询中的准确率,已经从前两年的低谷期,大幅提升至如今的 71.3% 左右,与此同时,其运行能耗与单次推理成本则下降了数个数量级。有业内人士推测,未来大约有八成的工作负载将迁移至本地化、开源且成本更低的小模型上,而剩余两成触及智能上限的极限任务,才需要调用前沿的云端 API。

这种将算力向端侧收拢的趋势,本质上是企业在经济、安全与效率之间重新寻找平衡点的过程:在经济账上: 它将不可控的“云端流量计费”,转变为可预测的“本地硬件资产投入”,大幅消解了企业的 Token 账单焦虑;在安全账上: 企业最核心的敏感数据与用户图形界面(GUI)交互流能够完全留在终端处理,从物理底层降低了机密外泄的风险;在效率账上: 它规避了网络延迟与带宽吞吐的限制,让设备端的毫秒级实时反馈成为可能。

英伟达首席执行官黄仁勋在 GTC 大会上也表达了类似的观点,他认为数以亿计的智能体需要自主观察屏幕并理解图形界面,将这些高频运行的数字员工完全放在云端在工程上并不现实,端侧基础设施正成为智能体规模化落地的温床。

走向端侧不是技术的倒退,而是一场算力红利的物理级分流。企业通过押注端侧,正在将数字化成本从“变动费用”重构为“固定资产”。

三、 从“压缩模型”到“买断智能”:基础设施层的自救

当前,全球科技力量正在加速往端侧设备塞入更强劲的“大模型引擎”。在海外,微软与芯片厂商联合强推 Copilot+ PC 标准,在端侧直接消化日常的语义搜索与文本摘要;谷歌则通过 Gemini Nano 将轻量大模型直接内嵌至操作系统底层。放眼国内,腾讯混元推出的极小端侧模型将内存占用压缩至 600MB 以内,智谱 AI 的端侧智能体产品也开始走入智能座舱。

在这场拼命将大模型“做小、塞进设备”的红海竞争中,明略科技(2718.HK)则试图走一条面向基础设施层面的范式创新之路。明略科技创始人吴明辉此前曾提出一个行业洞察,他认为把单个大模型做大的集中式路线(Scaling Up)正在逼近其边际效应和成本的天花板,未来的真正解法是分布式协同(Scaling Out)——让多个专精的智能体在端侧与私有网络中进行网状协作。

在这个技术判断下,明略科技通过对硬件终端与端侧软件的闭环改造,提供了一种可落地的参考。

首先是攻克从“文本对话”到“视觉交互”的门槛。真实的办公场景大多由密密麻麻的图形界面(GUI)构成。明略科技开源自研的 Mano-P 是一款端侧视觉-语言-动作智能体模型,其轻量化版本能够以纯视觉的方式直接理解并操作复杂的桌面软件与网页系统。在 Apple M5和M5 Pro 芯片上实测,其预填充速度表现出色,而峰值内存仅占 4.3GB 左右。这意味着,跨系统、跨 App 的自动化办公操作,完全有可能在员工的本地终端上运行,从而在特定环节让云端大模型的接口费用回归到零。

其次是打通端侧推理引擎的底层重构。为了让模型在 Apple Silicon 生态上跑得更省、更高效,明略科技自研了专为 macOS 优化的推理加速 SDK —— Cider。该框架直接切入计算算子与硬件调用机制的底层,在相关量化模式下,其算子运行速度相比部分原生框架表现出明显的加速优势,不仅降低了权重内存占用,也大幅提升了多模态小模型的端侧预填充速度。

最终,这种成本与安全的解法,沉淀为组织形态的重构。明略科技打造了 Octo 开源可信智能体协作网络,将其作为组织运转的底层网络。目前在其内部的实际工作流中,正运行着数千个 AI Agent,智能体的数量已经是人类员工的两倍。这不再是一个人机对话的孤立场景,而是多个专精智能体在同一个私有网络中实时协作、互相纠错的分布式架构。

未来的解法已经很清晰,当大家还在卷云端参数时,像明略科技这样切入端侧基础设施、倡导“分布式协作(Scaling Out)”的探索,给行业指出了一条非常聪明的活路:高频、具体的日常办公交互,都将由端侧视觉智能体在本地就地消化。

这不仅是帮企业省下了昂贵的云端账单,更是一次商业模式的重构——把 AI 从一种“随时在计费、停不下来”的变动成本,变成了企业自己可以握在手里、一次性买断的“数字固定资产”。把智能赋给终端,技术才能真正轻盈、踏实地走入每一家企业的日常。

新闻来源 (不包括新闻图片): 有连云
 
网站地图
支援电邮: support@aastocks.com
阿斯达克网络信息有限公司 (AASTOCKS.COM LIMITED) 版权所有,不得转载
免责声明
阁下明确同意使用本网站/应用程式的风险是由阁下个人承担。

AASTOCKS.com Limited、香港交易所资讯服务有限公司、中国投资信息有限公司、深圳证券信息有限公司、Nasdaq, Inc.、其控股公司及/或该等控股公司的任何附属公司、或其资讯来源及/或其他第三方数据供应商均竭力确保所提供资讯的准确和可靠度,但不能保证其绝对准确和可靠,且亦不会承担因任何不准确或遗漏而引起的任何损失或损害的责任(不管是否侵权法下的责任或合约责任又或其他责任)。

AASTOCKS.com Limited、香港交易所资讯服务有限公司、中国投资信息有限公司、深圳证券信息有限公司、Nasdaq, Inc.、其控股公司及/或该等控股公司的任何附属公司、或其资讯来源及/或其他第三方数据供应商均对资讯不作任何明示或隐含的要约、陈述或保证(包括但不限于可销售性及特殊用途合适性的资讯保证) 。

AASTOCKS.com Limited、香港交易所资讯服务有限公司、中国投资信息有限公司、深圳证券信息有限公司、Nasdaq, Inc.、或其控股公司及/或该等控股公司的任何附属公司、或其资讯来源及/或其他第三方数据供应商不会就任何原因导致的中断、不准确、错误或遗漏或因此而造成的任何损害赔偿(不论直接或间接、相应而生、惩罚性或惩戒性)对任何人承担责任。

AASTOCKS.com Limited不负责,亦不承担任何由于不可抗力的事故或在AASTOCKS.com Limited不可合理控制的情况下导致的损失或损害,如台风、暴雨、其他自然灾难、政府或有关机构的限制、骚动、战争、病毒爆发,网络故障或电信故障,引致AASTOCKS.com Limited不能履行协议内的责任或提供服务。

Morningstar免责声明:版权所有©2020 Morningstar,Inc。保留所有权利此处包含的资料,数据,分析和意见(“信息”):( 1)包含Morningstar及其内容提供者的专营资料;(2)除特别授权外,不得复制或转载;(3) 不构成投资建议;(4)仅供参考,(5)并未为所载资料的完整性,准确性及时间性作出保证.Morningstar对于阁下使用任何相关资料而作出的任何有关交易决定,伤害及其它损失均不承担 任何责任。请在使用所有资料前作出核实,并且在咨询专业投资顾问意见前勿作任何投资决定。过往业绩并不代表将来表现,任何投资项目的价值及所得收入皆可升可跌。

本网站/应用程式包含的内容和信息乃根据公开资料分析和演释,该公开资料,乃从相信属可靠之来源搜集,这些分析和信息并未经独立核实和AASTOCKS.com Limited并不保证他们的准确性、完整性、实时性或者正确性。

在本网站/应用程式的资料、金融市场数据、报价、图表、统计数据、汇率、新闻、研究、分析、购买或者出售评分、财金教学及其他资讯仅作参考使用,在根据资讯执行证券或任何交易前,应咨询独立专业意见,以核实定价资料或获取更详细的市场信息。AASTOCKS.com Limited不应被视为游说任何订户或访客执行任何交易,阁下须为所有跟随在本网站/应用程式的资料、评论和购买或出售评分执行的交易负责。

为了方便使用者,阿斯达克网络信息有限公司增加了由 Azure OpenAI开发的翻译功能,以帮助用户理解阿斯达克网络信息有限公司平台上的信息中文以外的语言。 翻译后的文字可能会失去一些原本的意义。信息的某些项目(包括包含文字的图像、带字幕的影片、PDF 文件或地图)可能无法翻译,某些功能可能无法在翻译版本中使用。

阿斯达克网络信息有限公司不保证翻译的准确性及完整性,并且翻译后的文本不应被认为是准确的及完整的。 对于因使用翻译功能而造成的任何形式的损害或损失,阿斯达克网络信息有限公司不承担任何责任。

AASTOCKS.com Limited之信息服务基于「现况」及「现有」的基础提供,网站/应用程式的信息和内容如有更改恕不另行通知。AASTOCKS.com Limited有权但无此义务,改善或更正在本网站/应用程式的任何部分之错误或疏漏。

用户在没有AASTOCKS.com Limited明确的书面同意情况下,不得以任何方式复制、传播、出售、出版、广播、公布、传递资讯内容或者利用在本网站/应用程式的信息和内容作商业用途。

投资涉及风险。 阁下可自行决定利用本网站的财金教学作学术参考用途,但 AASTOCKS.com Limited不能并不会保证任何在本网站/应用程式现在或未来的购买或出售评论和讯息会否带来赢利。 过往之表现不一定反映未来之表现,AASTOCKS.com Limited不可能作出该保证及用户不应该作出该假设 。

AASTOCKS.com Limited也许连结订户或访客至其有兴趣的网站,但AASTOCKS.com Limited只提供此服务给订户或访客并不为此安排负责。

AASTOCKS.com Limited对于任何包含于、经由、连结、下载或从任何与本网站/应用程式有关服务所获得之资讯、内容或广告,不声明或保证其内容之正确性或可靠性。对于阁下透过本网站/应用程式上之广告、资讯或要约而展示、购买或取得之任何产品、资讯资料,本公司亦不负品质保证之责任。

AATV是AASTOCKS.com Limited所属的视频网站平台。

阁下确认:(i)AATV只为提供资讯,而不是为了任何交易目的;(ii)AATV节目内容及其提供的资料本身并不构成任何AASTOCKS为售出任何证券。 (iii)AATV并非并存的人或法律实体,在其他司法管辖区或国家使用,而在某处可能因该使用或分发而违反当地法律或法规。

AASTOCKS.com Limited不对任何其他人进行评论,也不会代表AASTOCKS.com有限公司。 (i)AATV的不准确,错误或遗漏,包括但不限于报价和财务数据;(ii)AATV中的节目传输的流量,错误或中断;(iii)阁下由AATV中部节目内容招致任何损失。

我们保留的权利不时更改本免责声明和并存于本网站/应用程序程序的版本更新版本。阁下必须定期定期查阅于本网站/应用程序声明该信息,并确保您及时知悉任何有关的费用。更新后仍可以继续使用本网站/应用程序,即代表代表阁下同意接受更改后的本免责声明的约束。

本免責聲明應受中華人民共和國香港特別行政區(「香港」)法律管限。閣下同意接受香港法院的專屬司法管轄權管轄。

本免责声明的中英原文如有任何岐异,一切以英文原文为准。

更新日期为: 2026年2月9日