文章来源: AI科技大本营
整理 | 王轶群
责编 | 唐小引

图片来源:由无界AI生成 图片来源:由无界AI生成


5月,大模型降价忙。
AI 降价潮愈演愈烈,国内国外都开启了新一轮的 AI 价格战。

中美AI打响价格战,英伟达竟成最大赢家?

国内AI价格激战:降价、大幅降价、直接免费!

国内互联网大厂,包括阿里、字节、百度、腾讯,以及背靠雄厚资本的创业公司,持续发布 AI 及大模型产品,同时逐步加快了降价的节奏,从降价、大幅降价,到直接免费、立即生效!

事情开始于1元可以购买100万tokens。

5月6日,私募巨头幻方量化的AGI(通用人工智能)的新组织“深度求索(DeepSeek)”开源第二代 MoE 模型 DeepSeek-V2,把价格打到了仅为GPT-4-Turbo的近百分之一。其API的定价为:每百万tokens输入1元、输出2元(32K上下文)。

5月13日,智谱大模型开放平台上线了新价格体系,入门级产品 GLM-3 Turbo 模型调用价格下调80%,从5元/百万tokens降至1元/百万tokens。调整后,1元可以购买100万tokens,使用 GLM-3 Turbo 创作一万条小红书文案(以350字计)将仅需约1元钱。

大厂也同样不甘示弱。

5月15日,字节跳动发布豆包大模型,定价大幅低于行业价格。豆包主力模型在企业市场的定价仅为0.0008元/千tokens,即0.8厘就能处理1500多个汉字,比行业便宜99.3%。

在5月9日发布通义千问2.5之时,阿里表示个人用户可以通过 APP、官网和小程序免费使用通义。而不到两周后,在5月21日,阿里通义千问开启降价。由此,1元可以购买100万tokens,被阿里卷到1元最多可购买200万tokens。

通义千问 Qwen-Long 的 API 输入价格大幅下调,从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着1元钱可以购买200万tokens,相当于5本《新华字典》的内容。该模型最高支持1000万tokens的长文本输入降价后的价格约为 GPT-4 的1/400。

中美AI打响价格战,英伟达竟成最大赢家?


阿里的这波降价加限时免费,一定程度上已经超越了前几次其他厂商的大模型降价。但,这并没有让阿里坐稳价格战的头把交椅,甚至屁股都没坐热,就被打着“全面免费”的百度赶下。在阿里宣布如此大幅降价的当日,5月21日晚些时候,百度宣布文心大模型的两大主力模型将全面免费,立即生效。

中美AI打响价格战,英伟达竟成最大赢家?


之前咬紧的降价潮,被百度再卷一次,迎来了全面免费的阶段,国内大模型价格战的正式打响。

随后,仅在第二天,全面免费风头就归属到了卷王腾讯云。5月22日,腾讯云直接“一键三连”:正式对外宣布旗下AI代码助手全面对外开放,公布了全新大模型升级方案,API 输入价格大幅下降,混元-lite模型全面免费。

腾讯云主力模型之一混元-lite 模型,API输入输出总长度计划从目前的4k升级到256k,价格从0.008元/千tokens调整为全面免费;混元-standard API 输入价格从0.01元/千tokens降至0.0045元/千tokens ,下降55%,API输出价格从0.01元/千tokens降至0.005元/千tokens,下降50%;混元-standard-256k,具备处理超过38万字符的超长文本能力,API输入价格下调至0.015元/千tokens,下降87.5%,API输出价格下降至0.06元/千tokens,下降50%;最高配置万亿参数模型混元-pro,API 输入价格从0.1元/千tokens降至0.03元/千tokens,降幅达70%。

中美AI打响价格战,英伟达竟成最大赢家?


腾讯云表示,以上价格调整自发布之时立即生效。

国内的 AI 价格战,在本周打得尤为激烈。不仅模型参数及性能卷起来了,价格更是卷到飞起!从1元可购买100万个tokens,到最多可买200万个,再到免费,最后到全面免费。甚至有业内人士笑称,眼瞅着下一家跟进的厂商可能就得发钱补贴让客户用 API 了。

中美AI打响价格战,英伟达竟成最大赢家?

国外AI:扎堆发布、降本至免费,英伟达坐收渔翁之利


在国内降价免费之前,国外已经走过了一轮大模型降价和免费阶段。

5月初,谷歌就表示其AI聊天机器人的问答成本在过去一年中锐减了80%。这标志着谷歌在 AI 领域再次取得了重要突破,通过 Gemini AI 模型和定制AI芯片的技术革新,谷歌有效降低了 AI 搜索的运营成本。

不仅降本,谷歌还直接免费。一个月前,在4月10日,谷歌最强大模型Gemini 1.5 Pro“全面”对外开放,完全免费。Gemini 1.5 Pro100万的上下文窗口这次也直接对外开放,可以处理的最长音频约为11小时,最长视频则为1小时。谷歌官方给这次免费开放的Gemini 1.5 Pro版本定义为“公开预览版”,主要面向开发者,可在谷歌AI Studio中获得API密钥。这是在 Gemini Ultra 免费试用两个月之后的又一次大模型免费举动。

搅动浑水的鲶鱼,非 OpenAI 莫属。偏偏赶在谷歌 I/O 大会同一时间的前一天,在5月13日,OpenAI 推出了一款名为 GPT-4o 的“旗舰级”生成式人工智能模型,面向所有 ChatGPT 的付费和免费用户,取消其他所有限制,API 价格降价50%。

OpenAI这波对谷歌的阻击力度不小。虽然OpenAI宣传的是“取消所有限制”,但据使用者反馈,也存在每天的使用限制。其免费层的用户将默认使用GPT-4o,但使用 GPT-4o 发送信息的数量有限制,这将根据当前的使用情况和需求而变化。不可用时,免费层用户将切换回GPT-3.5。

第二天,谷歌 I/O 大会以近10个大模型的升级发布绝地反击。

谷歌向全球所有开发者推出 Gemini 1.5 Pro 的改进版本,拥有 100 万个 token 上下文的 Gemini 1.5 Pro 现在可以直接在 Gemini Advanced 中供消费者使用;将 Gemini 1.5 Pro 上下文窗口扩展到了 200 万个 tokens,并以私人预览版的形式提供给开发人员;比 Gemini 1.5 Pro 更轻量级的 Gemini 1.5 Flash 发布;发布可制作“高质量” 1080p 视频的 Veo 模型和文本生成图像模型 Imagen 3;发布采用全新架构、27B 大小尺寸的 Gemma 2.0;推出第一个视觉语言开放模型 PaliGemma。

一周后,微软在 Build 开发者大会上也频频出招。仅仅在第一天两个多小时的演讲中,微软就宣布了50多项更新,包括AI基础设施、模型产品落地等多方面。

在谷歌预览具备语音交互和视觉记忆的AI智能体 Project Astra 后,微软在会上发布 Team Copilot 智能体,作为 Copilot for Microsoft 365 的扩展,该智能体更注重在执行工作任务上,能够提升整个团队的工作效率,完成主持会议、跟踪并安排项目进展等任务。同时,微软宣布将 OpenAI 上周更新的ChatGPT-4o接入Azure云平台,可对外提供API。在垂直领域应用上,微软还与可汗学院合作为 K-12 教师免费提供人工智能Agent,并将开发 Phi-3 数学模型。

在国外,无论是行业应用还是基础模型,国外大模型的市场份额都牢牢被明星创业公司和大厂占据,要么是 OpenAI、谷歌、Meta 等科技巨头,要么是有传统科技巨头大手笔投资的 Anthropic、Mistral AI 等明星初创公司。

然而,占据大部分市场份额的AI公司,其盈利能力却一直不达预期。连 Meta 这样的巨头也无法指望立刻从AI中获利,Meta 在2024年增加了高达100亿美元的基础设施支出,但预计多年内不会从其 AI 产品中赚钱。

那么,AI 浪潮仍在激烈奔涌下,真正赚钱的是谁?算力巨头英伟达坐收渔翁之利。在最新公布的财报中,英伟达获得了创纪录的季度收入。据其发布截至4月28日的2025财年第一财季报告,各项数据全面超越预期的状态。

英伟达第一季度实现收入260亿美元,比去年同期增长262%;净利润为148.8亿美元,同比增长高达644%。英伟达预计,截至7月的本季度营收将达到280亿美元,是去年同期的两倍多,也高于华尔街的预期。

在随后的电话会议上,首席财务官科莱特·克雷斯预计,每花费1美元采购英伟达人工智能基础设施,云提供商在未来四年内就有机会通过提供算力服务(GAAS)赚取5美元收入。

可见,在算力和数据这开发大模型无法绕过的两大难点上,占一头的优势,英伟达就获利颇丰。

中美AI打响价格战,英伟达竟成最大赢家?

谁在获益,谁在被裹挟,免费保增长还是收费报成本?


增算力,获数据,扩市场,这是成为时代 AI 基建的底层逻辑。

目前,算力层面英伟达一家独大。AI模型厂商的眼光就瞄准在了市场、用户和数据规模上。降价,免费,多性能多产品,即为保增长的获客之道。

事实上,降价并没有真的损失多少收入,毕竟大家都没有英伟达赚钱,都没完全跑通商业模式。激活下市场,在行业降价潮中及时入场赚个吆喝,促进企业从“免费试用”开始下水,扩大大模型API的调用量,有助于早点启动大模型发布公司对 AI 进入业务流的尝试。

过去一年,国内大模型厂商在过去一年也做了一系列探索来降低 AI 应用的门槛,以期扩大大模型的调用量,但结果都不及预期,标准化的模型 API 并没有迎来确定性的增长,不如直接降价、免费来得直接。

降价免费,降低使用门槛,促使更多用户使用、更多的API调用,就能带来更大市场,获取更多数据。
数据是AI模型的基础,AI 模型训练获取适合数据的难点和痛点在于:

  • 数据获取难,物理层等数据源缺失,应用难展开,采集数据颗粒度不统一,数据难应用;
  • 数据质量差,数据记录不完整,应用难优化,数据记录不准确,应用难商用;
  • 数据训练成本高昂。

根据HAI研究所的AI报告,训练巨型模型的成本呈指数级增长,谷歌 Gemini Ultra 的训练成本估计为1.91亿美元,GPT-4 的训练成本估计为7800万美元。

降价和免费,也是获取更多可筛选训练优质数据的方式之一。科技博主宝玉表示,现在 AI陷入价格战了,AI服务商都陷入了免费保增长还是收费保成本的两难境地。

免费保增长,还是收费保成本?明显,大厂的选择是先降低使用门槛,然后逐步实现商业化。可以看到,本次降价中,降得最凶的都是有云服务的大公司。“这些云服务商通过大模型来获取云用户,羊毛出在猪身上,降得起。”傅盛表示。

想收费保成本的小厂正在这波降价潮中面临尴尬。大厂和明星创业公司可以随意降价,但由此引发的市场竞争加剧,普通 AI 大模型创业者就被裹挟其中。

科技巨头凭借雄厚的财力、广泛的数据存储库和大量的算力基础设施,在底层模型上可以建立牢固的立足点,明星创业公司背后站着明星投资机构。而初创公司,除非依靠大公司的财力,几乎没有能力承担模型的高训练成本,也没有先发优势,不能跟大厂直接对抗,除非瞄准差异化需求,做垂直细分的赛道,否则很难在裹挟中前进。

目前,行业能形成价格战的连锁反应,也由于当前各大模型的能力放在可用的场景中,尚未拉开差距,用户可选择空间大,甚至有免费开源产品可用。也有质疑声音称一些降价的模型本身吞吐量就低,而高性能模型并没有降价,且还有很多细节条款会让最终企业用起来没有宣传的那么便宜。

需要注意的是,只提供模型的 API,距离 AI 应用在场景中落地还有很大距离,大部分 AI 应用还需要在一个通用的模型 API 之上,在场景里喂数据、做微调等来优化模型引擎。

若一个通用的模型 API 无法深度适配场景,企业用户往往还是要自己基于开源模型,用场景数据做专门的深度训练,并不会接通用的模型 API。无论使用门槛再低,如果与用户需求不适配,依然换不来增长。
卷价格来的直接,但不如卷精准符合用户的需求来的实在且长久。


参考链接:
https://mp.weixin.qq.com/s/HA4RtjXvUhOY-sdHXYvUpg
https://baijiahao.baidu.com/s?id=1799742413819805747&wfr=spider&for=pc
https://baijiahao.baidu.com/s?id=1799762991336129582&wfr=spider&for=pc

(责任编辑:小陈)