这篇文章有意思。
提出在 AI Agent 时代,任何“固定费率+高token消耗”的订阅模式都难以为继。
他分析了一下目前虽然 LLM 不断的在降价,但是综合的 LLM 成本反而在越来越贵的原因和这种现象会产生的问题。
前段时间的 Cursor 涨价和 Claude Code 涨价都反应了这种囚徒困境。
同时还分析了一下避免这种问题的几个方法。
详细内容:
许多AI公司认为,只要模型推理成本每年下降10倍,先亏损后盈利是可行的。但现实是,虽然如GPT-3.5等旧模型确实变便宜了,但用户需求始终集中在最新、最强的前沿模型(SOTA),而这些模型的价格始终居高不下。
虽然每个token的成本没变高,但AI模型每次任务消耗的token数量却呈指数级增长。AI代理和长时间任务让单用户每日消耗的成本远超传统订阅价格(如$20/月),导致公司亏损加剧。
在AI Agent时代,任何“固定费率+高token消耗”的订阅模式都难以为继。
Anthropic等公司尝试通过高价(如$200/月)、模型自动切换、部分计算卸载到用户本地等方式应对,但依然无法阻止token消耗失控,最终不得不取消无限量套餐。
所有AI公司都明白按用量计费才可持续,但只要有竞争对手提供低价无限量,用户就会流向后者,导致行业陷入“价格战—亏损—倒闭”的恶性循环。
三种可能的出路
从一开始就按用量计费:理论上可行,但消费者普遍讨厌计量收费,实际难以增长。
制造高切换成本:如Devin等企业级AI,通过深度集成和复杂流程锁定大客户,利润率高但市场有限。
垂直整合,基础设施变现:如Replit,将AI代理与托管、数据库、监控等服务打包,AI推理作为引流,真正盈利点在于全栈服务。


文章地址:https://t.co/7DRprZcnLx