原帖出处:https://zhuanlan.zhihu.com/p/1888535008785958517
---- 国外部分 -----尽管国内大模型行业在 DeepSeek的带领下经过去年的奋起直追,目前和国外的差距已经越来越小,甚至在一些细分领域还能取得几个身位的领先。但不可否认,综合实力、行业趋势仍然是国外几大AI巨头在引领。对它们进行重点观察、分析和研究也仍然是近几年国内AI行业必段要坚持做的工作。
个人觉得需要强调一点的是,目前这几个模型厂的用户和营收数据都是在严格限制了比如中国这样有很大消费潜力的国家访问及付费后取得的,随着国际政策的变化,理论上还有不少的提升空间。
OpenAI公司简介作为这个AI时代的起跑发令员兼领跑者,你可以有各种理由不喜欢它的方方面面,但你不能否认,截止目前,O社仍然是AI行业中综合实力最强的头把交椅,目前市面上模形分类、产品形态至少有80%是O社开创并逐步发扬光大的。
2024年是O社高速发展的一年(绝大部分运转正常的模型厂都一样),根据多份大同小异的财报资料显示,O社2024年的营收在37~40亿美元之间,同比增长超过200%。其营收的主要构成是用户会员费和API流量费这两大块,占了总营收的90%以上。剩下和微软Azure合作以及一些杂七杂八的广告收入等等加起来不到10%。
在这两大块中,会员费又占了绝对的大头。综合多份营收数据统计中我们可以大致得出,会员费在OpenAI去年的营收中不低于75%,API流量收入则约为15%左右。
2025年开始,OpenAI 与贝塔斯曼集团合作,探索 ChatGPT Enterprise 的使用并开展联合开发项目。他们还在媒体和新闻行业建立了众多合作伙伴关系,包括与 Guardian Media Group、Schibsted Media Group、Axios、Future等公司。所以今年OpenAI的营收中会增加一定比例的B端收入。
和营收大幅增加所对应的,O社的运营成本也高得令人咂舌,特别是与训练和推理相关的成本,导致 O社在 2024 年亏损度达到了 50 亿美元左右,而且预计到 2026 年,这一数字可能会飙升至每年 140 亿美元。
公开资料显示O社在2024年成功融资66亿美元,2025年3月底O社完成了400亿美元的新一轮融资,由Softbank出资300亿领投,融资后的估值将达到3000亿美元,巩固了自己在AI大模型行业的王者地位。
模型及应用最新版 | 多模态 | 开源 | GPT-4.5 | √ | ╳ | GPT-4o | √ | ╳ |
最新版 | 多模态 | 开源 | o3-mini-high | ╳ | ╳ | o1-pro | ╳ | ╳ |
名称 | 说明 | GPTs | Agents构建和Agents广场 | Canvas | 文档预览/修改 | Projects | 一组使用同一个Agent创建的对话 | Advanced Voice | 实时高级语音对话Agent | Search | 互联网RAG | Deep Research | 结合互联网RAG的主题深度研究以及报告生成 | Agent SDK | 为搭建Agent服务的SDK,支持MCP | Operator | 用prompt命令LLM通过图形界面操作电脑完成任务 |
Anthropic公司简介
A社作为O社离职大佬最青睐的“下一站”,和O社的风格区别较大。在Claude 2发布早期拉开了大模型卷上下文长度的序幕后,开始低调行事,不热衷于刷分和PR,只是默默地实践自己的目标,踏实且有实力的感觉深受技术型用户的青睐。应用生态铺得比较窄,主要是为技术型玩家服务,但出手基本必是精品,Artifacts很快就被O社以Canvas的身份带走,Computer Use被O社更名为Operator,Projects则连名字都没有动。而MCP协议的制定和推广更是为自己的江湖座次增加了很重的一块砝码,随着O社扭捏了很久后宣布拥抱MCP协议,该协议的前景一片光明。
整个2024年A社也是营收高速增长,年收入约为10亿美元。和O社不同的是,按照截止2025年3月的数据显示,在2025年14亿美元左右的预期营收中,A社的API流量费收入可以达到接近7亿美元,约占总营收的50%。而且其API的使用量仍在高速增长,坐实了A社偏好服务于有技术能力的大C及小B的倾向。
而和O社一样,A社也处于入不敷出的状态。2024年A社的支出超过了27亿美元,其中有25亿美元是用于Claude系列的训练及推理。尽管目前亏损仍比较严重,但强劲的收入增长加上其明确表示将专注于减少现金消耗,表明A社在未来几年内有望实现财务可持续性。相关研究表明, Anthropic 有望在 2027 年实现现金流为正的目标。
2025 年 3 月,A社在 E 轮融资中筹集了35亿美元,融资后估值达到了615亿美元。由于其受众偏窄,约O社1/5的估值也算合理。希望A社不要辜负自己前往AGI的初心,不要被舆论和市场偏好左右,走自己的路。
模型及应用最新版 | 多模态 | 开源 | Claude 3.7 Sonnet | ╳ | ╳ | Claude 3.5 Haiku | ╳ | ╳ | Claude 3 Opus | ╳ | ╳ |
最新版 | 多模态 | 开源 | Claude 3.7 Sonnet Extended | ╳ | ╳ |
名称 | 说明 | Projects | 一组使用同一个Agent创建的对话 | Artifacts | 文档预览/修改 | Computer Use | 用prompt命令LLM通过图形界面操作电脑完成任务 | Model Context Protocol(MCP) | 大模型上下文协议(发起者) |
Google Deepmind公司简介
不管Anthropic和 xAI发展得多迅速,OpenAI眼里的一生之敌始终只有Google Deepmind。 Google Deepmind前期算是慢热型选手。2023年3月,Gemini的前身Bard问世,然后差不多在整整一年的时间里不温不火。一直到2024年2月,Gemini 1.5 pro带着10M token的上下文长度来争夺江湖坐次,然后被OpenAI等候已久的Sora发布会给抢了头条……
由于Google本身就有着以10亿计的用户基数,加上长期以来的AI积淀,OpenAI将其视为头号竞争对手也是合情合理。 2025年2月Gemini的详细用户统计数据显示总访问量为2.841亿次,其中2/3为桌面用户1/3为移动用户,目前和ChatGPT的5亿周活跃用户相比确实还有差距;截止2025年3月,Gemini的APP下载量达到1.06亿次,离ChatGPT的4.65亿次也有一段路要走。但是,受益于Google本身完善的互联网生态,相关产品也被Gemini的服务覆盖,比如Google AI Overview(直接向Google搜索引擎提问默认给出的总结)的用户被动突破10亿,也不容易分辨其中有几分Gemini的功劳。不过,Google对于Gemini的战略地位还是有着很高的期望,给出了2025年底Gemini用户达到5亿的小目标。
C端的营收主要是Google Advanced membership的订阅费、API流量费以及大模型反哺搜索生态产生的额外广告收入,这部分没有公开资料提及。
Google的B端服务也很成熟。Google Cloud在生成式AI创业生态系统中建立了坚实地位,据报道近90%的生成式AI独角兽企业和超过60%的获得资金的生成式AI创业公司是Google Cloud客户。而其中的Vertex AI平台战略性地整合了由Google Deepmind开发测试的创新技术,包括Gemini等先进模型。该平台提供全面的工具和基础设施,使企业能够无缝构建、测试、微调和部署生成式AI应用,无需大量前期准备或复杂的基础设施管理。Google通过多种举措积极支持更广泛的AI生态系统,包括为AI创业公司和研究机构提供支持,以及与各行业企业合作开发定制AI解决方案。具体云端客户相关数据并没有公布,但这一块是Google Deepmind直接的收入来源。
Gemini的模型性能在2.0 Flash发布时开始成为各大排行榜首位的常客,最近2.5 pro的发布更是一下子把第二名总分甩开了40多分,大有要一骑绝尘的趋势。不过最近的模型发布给人一种战略摇摆不定的感觉,2.0 Flash强调的是All in one多模态和Native Agent,到了2.5 pro忽然就变成了默认thinking mode,一时间让人无法推测其最近一年的战略重心会放在哪里。但作为OpenAI眼里唯一的对手,以Google的体量和能力,不说超越OpenAI,短期内紧贴身位不被甩开还是可以轻松完成的。
模型及应用
最新版 | 多模态 | 开源 | Gemini 2.0 Flash | √ | ╳ |
最新版 | 多模态 | 开源 | Gemini 2.5 pro | √ | ╳ | Gemini 2.0 Flash Thinking | √ | ╳ |
名称 | 说明 | Search | 互联网RAG | Canvas | 文档预览/修改 | Live Screen Sharing | 和Gemini共享屏幕一起阅读 | Deep Research | 结合互联网RAG的主题深度研究以及报告生成 | AI Overview | 向Google搜索引擎提问默认给出的总结 | AI Studio | 高端的AI playground | Vertex AI | 高端企业级AI平台 |
xAI公司简介在大洋彼岸AI界第一集团中,马斯克的xAI是最年轻的后起之秀。但马斯克的流量buff和Grok在LMSYS Arena的排名让它很快将一些前辈挤到了身后,跻身四大天王的行列。
xAI详细营收情况的公开信息有限,根据其产品形态来推断,目前收入可能主要来自 X Premium 的订阅,X用户通过订阅X会员来获得 Grok AI 聊天机器人的访问 。此外,xAI 可能通过向希望构建利用 Grok API流量来产生收入 。根据xAI公布的计划和第三方机构的估计,截止2024年底,xAI已经实现了1亿美元的年收入,绝大部分来自X的订阅费以及马斯克的其他业务。
开支方面,xAI 正在对其计算基础设施进行大量投资,最引人注目的是位于田纳西州孟菲斯的 Colossus 超级计算机,该计算机使用了超过10万个英伟达GPU。此外,据报道,xAI接近达成一项从戴尔购买价值50亿美元的英伟达芯片服务器的交易。所以尽管具体开支数字尚未公开,鉴于其在基础设施和研发方面的巨额投资,该公司的烧钱速率非常高。
但从另一个角度看,X(twitter)的用户订阅收入在关联了Grok的访问权限后开始稳步增长,在Grok3发布后,2025年3月份的月收入同比增长了150%,根据最近4个月的订阅收入数据计算的年化收入达到了约2亿美元,也助力X的估值从2024年9月不足100亿美元的最低谷回到了马斯克收购时的440亿美元附近。
由于目前Grok和X业务的深度绑定,所以其营收和估值计算就会相对复杂。2024 年12月,xAI 成功完成了另一轮 60亿美元的融资后,估值为500亿美元 。据报道,xAI从2025年2月开始正在寻求以750亿美元的估值筹集100亿美元。从融资的频率和金融来看,Grok和训练和推理出乎意料地烧钱。而马斯克的流量buff以及成事能力和偿债能力则是xAI可以持续获得资金来源的保证。 祝xAI回血顺利~
模型及应用
最新版 | 多模态 | 开源 | Grok 3 (Think) | ╳ | ╳ | Grok 3 mini (Think) | ╳ | ╳ |
名称 | 说明 | Search | 互联网RAG | Deep(er) Search | 结合互联网RAG的主题深度研究以及报告生成 |
Meta AI公司简介
如果没有小扎在2021年10月高调地All in Metaverse(元宇宙),可能现在的AI部门还叫Facebook AI,也可能他们并没有这么强烈的愿望去走开源大模型的道路(为了挽救崩溃的股价)。
2023年2月,Meta AI发布了业内首款开源大语言模型——Llama,65B的参数在当时足以让业界小小地震动了一下。尽管没有多少机构/个人能够独立部署这个“巨无霸”,但Meta AI的行业影响力在当时就已经确立;2023年7月,最大参数为70B的Llama 2发布,同时还加入了指令微调版,进一步扩大自己的行业影响力;2024年4月,Llama 3发布,最大参数达到了400B。在DeepSeek-V3横空出世前,最强开源模型的称号一直是Llama 3所有。
除了拳头产品Llama外,Meta AI的开源模型全家桶也是一应俱全,All in one的多模态模型Chemelon,音乐模型JASCO,生图模型Imagine,生视频模型Movie Gen,以及大编程模型的先驱者Code-Llama等等。
从C端来看,由于母公司Meta的C端收入来源主要是广告,Meta AI将模型能力整合到Facebook、Instagram和WhatsApp等社交平台中,能够增强广告定向投放效果,提升用户体验,最终提高广告收入。另外,Meta AI助手已集成在以上这些平台的媒体应用中,且目前通过这些平台已经让Meta AI拥有了7亿月活。接下来,Meta AI计划为其AI助手推出独立应用程序,并很可能在其中加入付费订阅机制,拓展营收渠道。
从B端看,尽管Meta AI的开源大模型路线并没有带来直接的营收,但是让企业价值受到了聪明钱的认可,母公司股价自Llama发布时开始了长达两年的持续上涨,不失为一种高明的营利手段。
DeepSeek这片大火烧过之后,Llama的开源模型王者地位已然不保,母公司股价也随着纳指一路下跌。2025年4月,Llama 4终于姗姗来迟,但是性能明显不及预期,发布后的48小时内就差评如潮。在2025年接下来时间里,Meta AI可能会需要另辟奚径来维持自己股价和在AI大模型行业中的地位。
模型及应用
最新版 | 多模态 | 开源 | Llama 4 | ╳ | √ | Chemelon | √ | √ |
Mistral AI公司简介以Mistral目前的体量按理说不应该出现在这个列表里了,但笔者念其历史地位加之又是欧洲独苗,还是把它保留在其中。作为欧洲的代表孤军奋战一定很辛苦,它都没有放弃,咱又什么理由不努力。
Mistral AI是一家法国公司,总部位于巴黎,于2023年4月创立,三位创始人分别来自Google DeepMind和Meta AI。成立初期时的Mistral为了和友商们拉开区分度,着眼于开源小模型。2023年9月Mistral 7B上线,成为了业内首个开源的SLM,也为自己在刚刚起步的端侧市场打开了知名度;2023年12月,Mixtral 8x7B上线,成为了业内首个有知名度的MoE(专家混合)架构模型,再次提升自己知名度的同时也把MoE这个名词推向了整个行业。
在推出了一些coding, math的专项小模型之后,到了2024年7月,旗舰模型Mistral Large 2上线,在LMSYS竞技场跻身前10,也(短暂地)成为了模型界四大天王之一,这也是Mistral AI的首款闭源模型(后来转为开源)。
Mistral在2025年2月推出了C端ChatBot“Le Chat”,其中包含月费$14.99的pro用户升级方案,Mistral的品牌辨识度+价格方案很难在卷出天际的ChatBot界有足够的存在感。另外,Mistral还有API流量,以及为各行业提供可定制AI解决方案这些B端合作中获得收入。截止目前,这些都没有公开数据。
根据公开消息,Mistral AI最近一笔6亿欧元的融资于2024年6月完成,总融资额达到10亿美元,当时的估值达到了约60亿欧元。接下来Mistral的规划是C端和B端双管齐下并行发展,不断升级模型能力的同时让模型更好地融入到一些细分市场(打造垂类模型),在业务和财务保持稳健的同时,Mistral也不掩饰将来可能会要IPO的想法。 世易时移,目前的行业特征让小模型厂的生存变得非常不容易,愿Mistral且行且珍惜。
模型及应用
最新版 | 多模态 | 开源 | Mistral Large 2 | ╳ | √ | Pixtral Large | √ | ╳ | Ministral | ╳ | √ | Mistral Small 3.1 | ╳ | √ |
名称 | 说明 | Search | 互联网RAG | Le Chat | ChatBot也来凑个数 |
----- 国内部分 -----国内的AI大模型行业紧跟GPT-3的发令枪。百度文心一言2023年3月作为国内首款大模型应用上线后之后,有实力有想法的机构和组织纷纷下海,于2023年下半年掀起了轰轰烈烈的“百模大战”。 杀到2024年上半年,江湖座次有一定雏形时,DeepSeek又于5月份掀起了一波“API价格战”,继续考验各大模型厂的技术、运营、融资能力。能活到今天还在不断推陈出新的公司/品牌,自然是有自己的一技之长。 作为AI大模型这场较量中唯二的参赛选手,尽管中美差距在缩小,但对方也会通过各种方式维持自己的领先地位,国内的AI行业前途光明,而AI人依然任重道远
DeepSeek公司简介
作为国内最出圈的AI大模型公司,DeepSeek行事出奇地低调,没有任何广告和PR,全靠实力造口碑。
DeepSeek的创造成员由原知名量化交易机构幻方量化的核心成员构成,在AI行业进入高速发展期的前夜就完成了算力和人才的布局。其灵魂人物创始人梁文锋在两家机构的发展壮大过程中都起到了举足轻重的作用。
DeepSeek的通用模型早在V2时期就因对MoE(Mixtual-of-Experts, 混合专家)架构的深度优化以及MLA(Multi-Head Latent Attention,多头潜在注意力机制)轻度出圈,V3发布时再叠加了MTP(Multi Token Prediction,多token并行生成)和训练策略的改进,让模型预训练成本缩减到不可思议的550万美元左右,打破了很多之前业内一些“常识性”的规律,彻底出圈。
由于DeepSeek的低调行事风格,目前没有比较可靠的用户及营收数据可以分享。不过大家都可以从公开信息中了解到,从2025年初开始,DeepSeek不仅在流量和口碑上双丰收,C端和B端用户也指数级激增。注册用户破亿、APP下载多次霸榜、以及各种机构部署/接入DeepSeek就会引发股价涨停这样的现象足以说明它已经成为了公认的国民AI应用。而在经历了对其成本/定价的质疑后,DeepSeek也仅仅公布了一下单日成本利润率545%的理论值。尽管这个利润估计参考的意义不是很大,但基本足够平息DeepSeek一直在赔钱赚吆喝扰乱市场的质疑了。
DeepSeek的估值也是一道难题,机构给出的估值范围从10亿美元到上千亿美元不等,完全没有参考价值。不过没有外部资金需求的DeepSeek也不需要这个理论数值。梁文锋曾在公开场合透露过,DeepSeek的愿景是AGI,而坚持开源策略则是为了促进整个AI生态的发展。DeepSeek一直不愿意接受外部投资,除了自身资金实力雄厚之外,更多则是因为不希望有外部资金来干扰公司的中长期发展路线吧。
一个生成文字内容的国民应用,除了实力足够强大之外,更重要的一定是“善良”。也许将来DeepSeek会因为战略意义太过重要而接受更多的政策指导或其他不可抗力的干扰,希望他们能尽可能久地坚持初心。
模型及应用DeepSeek目前仍在不遗余力专注于变强,对于应用生态并不重视,而且由于旗舰模型免费,API也已经足够便宜,模型库里只有旗舰模型,有点像乔布斯时代一年只出一个版本的iPhone。
通义千问公司简介老牌互联网大厂中,通义团队的技术实力还是有口皆碑,独树一帜的。只可惜无论Qwen系列模型在世界范围榜单的评分再高,口碑再好,在杭州它在很长一段时间里只能屈居第二。 Qwen系列模型在诞生初期,采用的是和Grok一样(其实应该说是后来的Grok和Qwen一样),早期模型开源,旗舰模型闭源的半开源策略。尽管2023年9月刚发布时的性能和口碑一般,但在其在集团中的战略地位以及阿里云技术实力的加持下,性能和口碑在2024年上半年就迎来了双丰收。由于Qwen系列和云服务天然地相得益彰,Qwen系列的小参数模型(SLM)在2024年在私有化这个细分市场里发展得很迅速。另外,多模态大模型(特别是视频理解)也在2024年9月份之前取得了行业领先的水平。
但9月份OpenAI发布了业界第一款推理模型o1-preview,在DeepSeek、Kimi等友商迅速发布了自己的推理模型预览版之后,通义团队的前进脚步有点被打乱了。特别是DeepSeek-V3享誉全球,R1被众多友商接入后过了一个多月,Qwen2.5-Max、QwQ-32B、QvQ-Max这些能对标前者性能的模型才姗姗来迟,给人一种疲于应对的感觉。
最近有苹果在大陆地区和通义团队合作打造Apple Intelligence,新晋Agent网红Manus和通义团队达成战略合作的消息,希望通义团队能够借着这些合作的机会拉开与同城友商的区分度,不要把有限的精力都投入到无尽的追随上。
由于阿里集团的生态体系非常庞大,增加了统计Qwen用户数量的难度。与AI业务深度绑定的钉钉有7亿用户,阿里云B端用户(或大C)中的AI用户比例也没有确切的公开数字,更不要说拉取端侧模型默默部署使用的不计名用户。营收数据也比较模糊,通义千问的产品化和应用落地团队已经拆分到智能信息事业群,而技术研发和2B服务仍归属于阿里云,研发成本核算需要两个部门合作完成;而Qwen系列的营收与阿里云深度绑定,有资料显示,在阿里云去年增长的13%营收当中,AI业务只提供了个位数百分比的贡献。
不过通义团队AI业务的价值并不应该只从当下的利润数字来判断,这里插播一则人尽皆知的八卦。话说张勇从CEO的位置让位时本来说好是把阿里云当做分手礼归他管,以后独立拆分上市的。而AI时代的来临让阿里云这样的估值体系和战略价值发生了巨大的变化,这份分手礼对于阿里集团来说显得太过贵重,最终被保留了下来。如今阿里集团的股价较低点上涨了两倍多,阿里云这块业务带来的想像空间功不可没。
2025年,阿里集团高举AI大旗,大量招聘AI人才,马老师也从一个曾经被赶下酒桌的人再次被奉为上宾。在阿里集团的实力和重视下,不管Qwen最终能不能“如愿”成为杭州第一,它的前景都应该被广泛看好。
模型及应用最新版 | 多模态 | 开源 | Qwen2.5-Turbo | ╳ | √ | Qwen2.5-Max | ╳ | √ | Qwen2.5-Omni | √ | √ |
最新版 | 多模态 | 开源 | QwQ-Max | ╳ | √ | QvQ-Max | √ | ╳ |
名称 | 说明 | Search | 互联网RAG | Agent | Agents构建和Agents广场 | 工具箱 | PPT生成,会议记录,阅读助手等工具 | 百炼平台 | AI算力基建 |
字节豆包公司简介字节在大模型领域的起步不算早,而且个人认为和阿里早早成立了达摩院布局基础研究不同,字节的科研基因不太明显。但截止目前,字节的自研大模型道路还是走得异常坚决。 2023年8月,字节内部推出首个大模型“云雀”(Skylark),参数量约为13B,主要服务于内部业务优化,如视频理解、广告投放等,未对外公开。到2024年5月,“云雀”正式更名为“豆包”对外发布,并推出豆包大模型家族,主力模型参数规模提升至 70B。
自豆包APP发布之后,C端用户增长一直可圈可点。得益于还可以的模型性能和互联网大厂打造的应用品质,以及抖音、各大论坛、应用入口等渠道的营销覆盖,豆包的下载量和月活一直在不断飙升。2024年底豆包的用户量突破7500万,2025年3月突破1亿。在B端市场,豆包也在积极拓展,商业生态不断完善,2B客户数量也在攀升。
豆包C端没有收费的产品形态,整体营收依赖并反哺整个字节的生态。基于庞大的用户基数,豆包比较直接的收入来源是移动端广告收入,2024年估计的广告收入约为5000万~1亿,介于2025年初DeepSeek的大火以及腾讯元宝火速接入DeepSeek-R1并开启病毒式营销,整个2025的豆包的C端流量及相应收入会面临一定的挑战。
B端营收主要依赖基于火山引擎提供解决方案以及和硬件厂商合作分成(如手机预装豆包APP),这一块目前并没有公开的详细营收数据。2025年字节的马来西亚AI中心投产,预计会有20%左右的海外用户增长buff,继续反哺广告业务。
值得一提的是字节的大模型应用生态,比如智能体高端定制平台Coze,AI编程IDE Trae,和友商们小打小闹的应用生态相比,字节在应用方面也非常舍得下资源和力气。
其实我个人并不是很理解字节为什么一定要花大力气自研通用大语言模型(特别是在目前公认的SOTA模型DeepSeek坚持开源的前提下),虽然不是没有意义但至少走这条路对于抖音目前的整体生态来说性价比不是很高。可能是源自咱新晋首富功成名就后的个人理想,也可能是有一些比如不能让友商卡脖子等我无法完全参透的商业逻辑。从个人所掌握的信息来来分析,虽然字节有钱有人,但研究的实力很可能会在一段时间内比不上阿里,利用好自己现有的地表最强视频语料库,在多模态、生视频这些细分领域和性能领先的大模型厂拉开差距和区分度,可能会是比较经济实惠的发展路线。
模型及应用最新版 | 多模态 | 开源 | Doubao-1.5 | ╳ | ╳ | Doubao-1.5-Vision | √ | ╳ |
名称 | 说明 | Search | 互联网RAG | Agent | Agents构建和Agents广场 | 豆包爱学 | 专门为K12教育 | Trae | AI编程IDE | Coze | 智能体定制平台 | 火山方舟 | AI算力基建 | 腾讯混元公司简介作为老牌互联网大厂,鹅厂对AI行业的反射弧算是最长的了。2023年9月,混元大模型才通过备案,那个时候“百模大战”已经进行一个季度了。
尽管在混元面市后,鹅厂不停地渲染自己的在大模型研发上的投入,但和阿里、字节这种明显能感受到动真格的态度不同,鹅厂给人的感觉是他们对自己的研究能力非常有自知之明。特别是2024年5月,基于混元大模型的应用品牌“腾讯元宝”问世后,鹅厂的C端战略就更加清晰地把混元团队定位为AI浪潮的参与者和投机者,躬身入局、保持关注的同时,寻找着小成本获取大利润的机会。
在元宝推出了诸如“深度阅读”等特色功能但关注度平平之后,鹅厂出人意料地在2024年11月推出开源通用模型Hunyuan-Large、12月发布开源视频模型Hunyuan Video,一度让人以为他们破天荒地要转向高精尖技术路线,要在大模型竞技场上争个排名的时候。DeepSeek在世界范围内的大火又把鹅厂拉回了它熟悉的道路之上。
2025年春节假期刚刚结束,腾讯元宝敢为天下模型厂之先,高调地接入了友商的开源模型DeepSeek-R1,结合传统互联网公司强大的应用开发能力,以及鹅厂自有的病毒式营销能力,火速让腾讯元宝登上了国内APP下载榜的首位。而且鹅厂和知乎、微博一样,有微信公众号这么一个内容丰富且有区分度的海量knowledge base作为自己的天然优势,一些反应稍慢的二线模型厂也只望流量而兴叹了。
尽管后来鹅厂还发布了自研的推理模型X1,但其做应用的血脉被唤醒后就很难被压制,如果不出意外的话,不断更新应用并抢占各种流量入口推广应用就是其往后的主线任务了。
腾讯元宝是免费的C端应用且暂无收费计划,其营收策略大体上可以定位为用AI业务来反哺腾讯相关的互联网产品线,增加用户活跃度以增加广告收入。B端的腾讯云在鹅厂的营收体系中权重普通,而开源和自研的模型让这一块算力基建发挥出前所未有的能力。但由于腾讯总体的营收目标对AI业务的依赖较少,所以在公开资料中,对于混元和元宝的发展目标基本没有被提及,可以认为鹅厂是从更长远的眼光来发展这块业务。
接入友商的大模型对于鹅厂来说只是普通的趋利而为,而对行业来说有点不讲武德。让一些二三线还在坚持自研模型的厂商在不确定自己能否打得过的同时也不确定是否应该加入。资源和流量因为这个事件加速了往优势资源集中,可能会加速这些二三线的模型厂离开酒桌吧。
模型及应用(整理ing)
百度文心公司简介2023年3月,有人工智能领域“黄埔军校”之称的百度发布了国内首款AI大语言模型应用——文心一言,同时这款模型也是全世界首款多模态的大语言模型应用。如果你觉得百度动作快,那就有点小看百度了,不信你看下面这个表格。 版本 | 时间 | 评价 | 文心大模型1.0 | 2019.03 | 在中文NLP任务中超越BERT预训练模型。 | 文心大模型2.0 | 2019.07 | 在16个中英文公共数据集上领先,刷新多项基准测试。 | 文心大模型3.0 | 2021.07 | 刷新54个中文NLP任务基准,登顶SuperGLUE全球榜单,擅长语言理解和文学创作(小说、歌词、诗词、对联)。 | 文心一言开始邀请测试 | 2023.03 | 新一代知识增强大语言模型,基于ERNIE和PLATO,用于对话、问答和创作。 |
而对那段时间文心一言上线后的消息比较关注的朋友一定会记得,文心一言那会儿比较出圈的事迹是对于“胸有成竹”、“车水马龙”、“鱼香肉丝”等中国传统文化词语的深刻理解和精心绘制。
作为国内大模型行业的领跑者,在2023年下半年国内掀起了“百模大战”,最需要发力冲刺的时候却没了动静。准确的说,是把自己当做了国内的OpenAI,不合时宜地使用了会员收费策略。尽管百度在国内有着深厚的群众基础,在时代卷起的浪涛中,很快文心就发现自己在存在连一朵小水花都激不起来。一直到2024年上半年,百度最出圈的事迹也就只有李厂长那句“开源模型都是智商税”了。
2024年9月,百度这头大笨象似乎开始睡醒了,想起了把移动端品牌升级为“文小言”,发力“新搜索”。而这个举动和5月份百川智能融合sogou的搜索业务,将移动端品牌升级为“百小应”遥相呼应,连“A小B”这个命名方式都完美致敬到了。在此之间,腾讯混元和智谱AI也已经发布了自己的融合了互联网搜索的应用,而百度作为国内靠搜索起家互联网巨头,融合自己拳头产品、抢占市场先机的反射弧如此之长,确实让人匪夷所思。另一个打击是作为苹果公司的国内合作AI服务供应商的资格告吹,这也对文心的品牌形象造成了不小的负面影响。
不过,瘦死的骆驼比马大,产品战略虽然拉胯,百度AI相关的用户数量和营收也还是可圈可点。根据百度Q4的财,2024年母公司的总营收达到了1331亿人民币,其中文心大模型相关业务直接贡献约317亿。截止2024年11月12日,文心一言C端的用户数量达到了4.3亿,B端服务的客户数量达到8万家。2025年,文心系列的发展目标仍是保持用户数量增长,同时AI业务会继续助力百度生态发展,主要包括百度云业务和核心广告业务,同时百度一直在投入的自动驾驶业务也会从AI业务的发展中受益。
看到这里,你会不会也觉得自己眼中被网友们批评,勒令其“退出AI圈”的文心系列并不像你看到这么不堪?2025年3月,百度发布了最新的通用多模态模型文心4.5和推理模型文心X1,同时也加入了自称为“智商税”的开源模型行列。尽管目前文心系列在性能上确实落后主流模型了,但只要没下牌桌,谁知道哪位能笑到最后呢?
|