词元调量的指数级增长,正在推动公司估值的飙升。
被称为“Token第一股”的迅策科技,上市仅108天,股价较发行价上涨近6倍,总市值达到1050亿港元。
今年1月8日登陆港股的智谱,上市首日市值约580亿港元,交出首份年度成绩单后股价迅速突破1000港元,市值也冲破4000亿港元。
智谱CEO张鹏认为2026年的关键词是“Token”,认为智能上界突破与Token消耗的指数级增长共同构成了AGI时代的商业价值。

尚未上市的公司中,月之暗面上个月刚完成新一轮超10亿融资,估值达到180亿美金,而去年底的一轮融资中,其估值为43亿美金。
这种估值的短时间跃迁,与今年2月OpenClaw宣布将KiMi K2.5设为其官方主力模型有关。K2.5发布仅一个月,月之暗面A的年度经常性收入即突破1亿美金,业绩增速支撑了估值提升,也打开了公司IPO的可能性。
无论国内外,资本市场都在为Token经济的腾飞定价,未来几个月里,我们将有机会听到各类财富神话。这场Token经济的大繁荣,正在以“大跃进”的方式完成对所有人的认知普及,以及对风险的累积。
增长
聊天Bot刚问世时,很少有人能想象2年后,豆包这一款大模型的日均Token使用量就能突破1万亿。即便按每百万元Token两块钱的价格计算,这意味着每天有3亿元的真实经费在豆包上消耗。
事实上,各家大模型公司都在上演着类似的剧本,全球范围内的Token日均消耗量都在以指数级增长。
工信部旗下中国信息通信研究院发布的数据截至2026年3月,中国日均Token调量已突破140万亿,较2024年初暴涨超过1000倍。

全球最大的AI模型API聚合平台OpenR则统计到,其平台每周处理的Token数量从2025年3月的1.6万亿飙升至2026年3月的16.90万亿,一年内增长超过10倍。
OpenRoute连接着Anthropic、OpenAI、谷歌、Meta等主流模型厂商的API接口,其周Token消耗曲线,本质上是全球AI应用活跃度的实时监测图。
这条Token消耗曲线几乎是垂直向上的,完全反映了人工智能经济的发展趋势。
是什么在驱动Token需求的大爆发?答案是人工智能的技术演进。
早期AI应用以聊天机器人为主,用户输入一句话,模型返回一段回答,一个来回消耗几百到几千Token。但从去年下半年开始,以Agent和Claw为代表的新型应用范式迅速流行。它们的共同特征是让AI不再只是对话工具,而是能够自主规划、调用工具、执行任务的数字员工。这种技术架构的变化,让Token消耗大幅增长。
行业测算表明,在同一业务目标下,Agent消耗的Token大约是Bot模式的50到200倍。这是因为,Agent在执行任务时需要将整个历史对话上下文携带,一个复杂任务动辄累积数十万Token的上下文窗口。
而且Agent每次思考都需要经过多轮推理,都会触发API请求,还需要加载系统配置文件和记忆库,以维持任务的一致性和个性化体验。这导致Agent模式下的Token消耗,更像是不受用户主观控制的黑箱操作。
更值得警惕的是,这个阶段Token的消耗量,并不等同于真实的需求量。当AI成为企业的关键工具时,Token消耗量被越来越多的公司纳入员工考核指标,产生了“Token伪需求”的情况。

Meta内部已有团队将Token消耗量作为AI渗透率的衡量指标,部分员工为了“显得自己懂AI”,故意运行大量冗余任务;国内的一些大厂也存在类似现象,一些业务线甚至发明了“Token刷量”的操作。
这种为了不被时代抛弃而制造多余消耗、夸大业绩的行为,是荒诞的。
核心
当Token消耗量以指数级增长,产业问题也浮出水面——谁来买单,谁会受益?
4月15日,国家数据局公开征求意见,首次在官方政策文件中提出“探索词元交易等新型交易模式,构建以词元为基础的数据集价值体系”。
从“词元交易”被写入国家顶层设计的那一刻起,Token不再仅是一个技术概念,而是逐渐成为人工智能经济的法定计价单位。某种意义上,Token化收费是人工智能经济的核心。

迅策科技被称为“Token第一股”,因为其率先在商业模式上调整,全面转向按Token消耗付费的新模式,构建了“收入=Token价格×调用次数×模块使用数”的增长模型。
目前,Token付费收入占迅策科技总营收的5%左右,公司预计到年底这一比例将提升至20%至30%。市场对迅策的估值逻辑因此发生了重大变化,脱离了传统市销率的限制,拥有了更大的想象空间。
迅策科技的模式也说明,在人工智能经济中,大模型厂商将扮演“精炼厂”的角色,将底层的算力与数据,加工成可被直接消费、以Token计价的“产品”,并掌握着价值分配体系中的关键生态位。
云服务厂商则扮演“发电厂”和“电网”的角色,它们不直接定价Token,却决定了Token的底层成本。
以阿里云为例,截至2026年底,阿里云总营收累计突破1000亿人民币,AI相关产品收入持续增长,实现连续第十个季度三位数同比增长。
紧随需求而来的是涨价,上周阿里云四天内连发三条产品涨价公告,调整部分模型单元价格及部分API免费额度——云厂商对Token成本的影响,显而易见。
云服务厂商在传统架构中主要收入来自虚拟机、存储与网络等基础设施计费,进入Agent时代后,它们完全可以推动按资源(Token)使用量计费,并通过Agent平台订阅、开发者生态套件等获得长期合同收入。

算力厂商则是更上游的原材料供应方,英伟达的高端GPU仍处于产业链核心位置,高带宽内存如今供应紧张,主要存储厂商的产能受限,毛利率抬高。
也许有人会担心算力实际已经过剩,英伟达和存储厂商的股价已过高,但这都不影响Token化收费的历史进程。
Token收费,让整条产业链的价值分配有了清晰的计算依据。
就像千瓦时的确立让电力市场得以形成,Token正在让人工智能经济从“感觉有用”走向“可以算账、可以收税”,成为一种真实存在的经济构成。
狂欢
Token化收费,让人工智能经济运转的逻辑变得清晰,但是人工智能作为一种划时代的技术革命,其经济运转的逻辑是否与传统经济规律一致呢?
至少传统经济学的供需平衡理论,在人工智能经济中并不完全适用。
在传统模型中,供给和需求是两条独立的曲线相交,而在人工智能经济中,供给本身会通过数据飞轮改进供给质量。需求曲线的右移并非因外部收入变化,而是供给曲线本身向下、向右移动。

目前这个阶段,我们可能看到蒸汽时代的“杰文斯悖论”在人工智能时代重演。杰文斯悖论指的是,当蒸汽机效率提升、单位马力耗煤量下降时,煤炭的总消耗量反而暴增,因为更便宜的蒸汽动力催生了更多工厂、火车和轮船。
如今Token的单位生产成本越低,愿意消耗Token的群体越多,愿意使用Token而非人力的场景越多,最后Token的总成本越高,人工智能经济的总价值也越大。
根据国内媒体数据统计,过去两年多,Token生产成本已下降超过99%,GPT-4每百万Token的成本从37.5美元降至0.14美元。但根据硅谷知名风投Menlo Ventures,全球企业2025年在AI的支出反而比2024年增长了3.2倍。
如果这种趋势延续,即使单位Token的价格趋近于零,全人类消耗的Token总价值也可以成百上千倍的增长。
这正是智谱、miniMax等公司在巨额亏损情况下,仍被资本市场赋予超越许多传统互联网企业估值的深层原因——市场定价的不是今天的利润,而是未来Token经济总价值。
更何况,用Token生产的东西,本身也会越来越有价值。
同一百万个Token,在不同场景下创造的价值差距可达十万倍,其价值完全因执行的任务而异——用于闲聊的Token只值几分钱,用于写代码的Token值几百几千元,用于量化投资、企业并购的Token可以价值几万。
斯坦福大学2026年AI指数报告估算,2024年生成式AI为美国消费者创造了约170亿美元的消费者剩余,用户获得的价值远超实际支付的费用。

值得警惕的是,在AI代替大量人类脑力劳动后,传统的劳动供给理论也会面临挑战。传统需求曲线会因购买力萎缩而整体坍塌,而供给端因自动化依然强劲,这就是凯恩斯所说的“技术性失业导致的有效需求不足”。
不过在这个阶段,围绕Token消耗量指数级增长的一切都还披着繁荣的外衣,引领着产业链上下游和资本市场的狂欢。
历史已证明,每当一种新技术被资本市场赋予无限想象空间,泡沫总是比价值更先抵达终点。
