LeoTalk AI周知 4: AI时代的入口和商业化之路
在这点上OpenAI确实一次次走在前面,做出的一些决定和决策仔细思考还是挺佩服的。
现在在大模型这个方向上,OpenAI领先的并不多,其他竞争对手追赶的太猛了,但是以ChatGPT的先发优势建立的生态和用户粘性,是现阶段OAI的强大护城河,Sam Altman本人的营销和融资能力也是很顶,给了OAI持续的动量。OAI现在不断以ChatGPT为基础去探索和扩展商业版图,是一个很好的策略,也是正确的策略。
相比之下,国内市场,我觉得DeepSeek、豆包和元宝都是类似的,反而是千问,似乎没有一个很有名的C端流量入口,虽然其在大模型方面技术和发展速度很顶,但是似乎在流量入口这块似乎还差点意思。
这块主要是针对C端的,也会辐射一些B端用户。不过B端角度更多还是在于API、推理服务maas、私有化等,那是另一个大市场和打法了。
技术研究/技术突破
- Adobe发布研究报告,预计AI驱动的零售网站的流量将增加520%
- ASAPP发布The generative AI agent 100: 100 use cases for contact centers by industry:概述了100个AI Agent的使用案例
State of AI Report 2025
Air Street Capital发布了2025年的AI状况报告State of AI Report 2025,主要讲述了AI推理能力的成熟、商业化的爆发、算力基础设施的工业化,以及全球竞争格局的重塑
- 2025年是推理元年(Reasoning Got Real)
- OpenAI、Google、Anthropic、DeepSeek等大模型厂商都推出了能进行复杂推理、验证和反思的系统
- 人机交互从生成式迈向推理式,标志着AI进入能规划、验证和自我纠正的新阶段
- 见证了AI推理能力的全球竞赛,研究进展速度非常快
- 产业和商业化:AI进入盈利时代
- AI商业化全面爆发:顶级实验室和企业营收接近200亿美元
- 成本骤降、性价比倍增:模型能力价格比每6-8个月翻倍
- 企业采用率激增:美国使用AI工具的企业从2023年5%飙升至44%;平均合同金额达53万美元;AI-First创业公司增长速度是同行的1.5倍
- 普及化趋势(1200AI从业者中调查):95%在工作或生活中使用AI;76%自费购买工具;大多数表示生产力持续提升
- 算力与基础设施:进入AI工业时代
- 多吉瓦级数据中心标志进入AI工业时代
- 电力和土地取代GPU成为新的瓶颈
- 地缘政治:中美格局成型
- OpenAI仍 保持领先,但是优势已经很微弱了
- Meta推出开源领先地位,中国厂商接棒,DeepSeek、Qwen、Kimi在推理和编程任务上直追GPT-5
- 中国被认为是全球AI能力的可信第二位
- 科研与应用突破:AI成为科研合作者
- AI进入科学研究角色:DeepMind的Co-Scientist、斯坦福的Virtual Lab、Profluent的ProGen3
- 行动链(Chain-of-Action)推理进入无力世界,如AI2的Molmo-Act、Google的Gemini Robotics 1.5等具备推理后行动的具身智能系统
- 安全与对齐:从理论风险专项可监控性
- 安全研究进入务实阶段:模型可伪装对齐,促使研究者提出可监控税(Monitorability Tax)概念,为透明度而牺牲部分性能
- 趋势与未来展望
- AI时新的生产系统
- 扩展推理是下一个前沿:从语言模型走向具备计划、验证、反思和执行链路的智能体
- 经济增长核心驱动力:AI成为全球生产力与竞争力的中心
Opinion:PPT313页,确实很难一页一页看完,比较多是比较空洞的结论,不一定务实,但是可以提取一些自己感兴趣的部分看看,当作参考。我觉得长期工作在一线的从业者,对于AI的应用和敏感度应该还是有的,也能看到实际带来的营收情况。这个报告就当作全球角度的一个印证。
麦肯锡2025科技趋势展望报告
麦肯锡7月分发的2025年科技趋势展望报告,网页上看有交互式体验,完整版PDF有108页。

主要分析了13项前沿科技趋势,聚焦在四个维度上的变化情况:
- 创新(Innovation)
- 关注度(Interest)
- 投资(Equity Investment)
- 行业采纳度(Adoption)

13个趋势分为三大类:
- AI革命(The AI Revolution)
- 计算与连接前沿(Compute & Connectivity Frontiers)
- 工程前沿(Cutting-edge Engineering)
六个宏观主题:
- 自主系统崛起 —— 从实验走向现实,包括机器人与数字代理。
- 人机协作新范式 —— 多模态交互、语音与触觉技术让AI成为“协作者”。
- 算力与基础设施瓶颈 —— 电力、网络、数据中心成为关键制约。
- 地区与国家竞争加剧 —— 科技主权、半导体、自主基础设施等成竞争焦点。
- 规模与专业化并行 —— 同时发展超大模型与本地化/边缘智能。
- 负责任创新 —— 透明度、公平性、伦理与信任成为商业竞争力要素。
最主要的增长依然来自于AI领域,其中最主要的亮点是Agentic AI获得了巨大的关注


2023年因为经济环境波动导致科技投资下滑,但是2024年多数趋势反弹,其中AI、可持续能源、云计算和半导体是最具吸引力的投资方向。AI+专用硬件+清洁能源成为互相促进的三大主轴
总体而言,AI正在成为所有前沿科技的放大器,而Agentic AI的兴起标志着AI从生成内容走向了自主行动的新阶段,企业的竞争力将取决于能否在AI驱动的生态中实现规模化和跨领域融合
Opinion:目前看2025年确实属于AI Agent大年(或者说Agentic AI),最近2个季度以来明显能感受到B端的重视和投入在持续提升,今年跑得快的企业都能收获不少。但是今年更多还是在早期阶段,和以往的技术发展有类似的趋势,AI的这波Adoption有长尾效应,可以预见明年会有更多的B端游预算投入这块,是非常大的机会。反观C端,目前更多还是在于诸如OpenAI这类拥有ChatGPT为超级入口的企业有撬动力,配合一下敢想敢试的战略,有很大机会撬动一些原来并不明显的市场,至少目前我们可以初见一些端倪了。
产品&模型发布
- ElevenLabs发布Agent Workflows
- FigureAI发布Figure 03
- Google发布Gemini Enterprise:对标OpenAI的AgentBuilder(只能通过API),定价为每个用户每月30美元(后续会推出针对初创和中小企业是20美元)
- Amazon发布Quick Suite:对标OpenAI的AgentBuilder
- Google发布Gemini 2.5 Computer Use Model:CUA(Computer Use Agent)是结合了多模态的一个大方向,这个方向也是模型厂兵家必争之地。现在更多还是成本和延时的问题,不然有一些case可以处理的很好,某种角度可以看作是RPA的未来
- 腾讯发布Hunyuan-Vision-1.5-Thinking,多模态视觉大模型,在LM Arena Vision Arena上排名第三。最近腾讯多模态有些成绩
- 三星发布TRM(Tiny Recursion Model),一个7M参数的模型,在某些推理任务上打败了SOTA模型
OpenAI DevDay 2025
OpenAI DevDay 2025,关键点:
- Apps inside ChatGPT:应用可以集成到ChatGPT里,有点类似GPTs升级版,底层基于MCP去构建的。不管如何,势必会引发第一批抢滩登陆的APP,算是给这些应用一次推广和引流的机会
- AgentKit:包括Agent Builder、ChatKit和Evals。更多是基于类似n8n、dify、coze的workflow去快速构建Agent(或者说工作流)。
- Codex:GA了。增加了Slack集成(Integration)、Codex SDK、企业控制(Enterprise Controls)
- API更新:增加了GPT-5 Pro、gpt-realtime-mini、Sora 2



Opinion:我个人非常期待AgentKit,虽然现有的dify、coze等开源方案很Open了,但是更喜欢这种集成到ChatGPT这种日常高频使用的应用里,可以快速拉一些很常用的轻workflow,而不需要自己去serve一个。我相信到时候可以把一些信息摄取流集成进去,结合codex可以玩出很多花样。Jackywine这篇文章分析的也很棒,值得看
投资&商业
- 高通宣布收购Arduino
- 软银以54亿美元收购了ABB的机器人部门(Robotics arm),这次收购让软银立即进入价值750亿美元的机器人市场,该市场的年增长率为8%(AI驱动的部分甚至有20%的增长速度)
- Bloomberg这张关于OpenAI、Nvidia相关的企业间的资本走向很有意思,值得一看:

热点论文
- Agentic Context Engineering (ACE): Self-Improving LLMs via Evolving Contexts, Not Fine-Tuning:斯坦福大学、SambaNova Systems和加州大学伯克利分校推出的ACE框架,不靠修改模型权重(参数微调),而是通过上下文工程,不断编辑、扩展模型输入上下文,像是为大模型维护一个不断成长的操作手册或知识库。有三个Generator、Reflector和Curator三个角色,整个流程采用同一个底座大模型,通过增量更新(而不是整体重写),避免上下文崩塌。
- The Landscape of Agentic Reinforcement Learning for LLMs: A Survey:关于Agentic RL在大模型里的综述,系统性的梳理
- TOUCAN: Synthesizing 1.5M Tool-Agentic Data from Real-World MCP Environments:MIT、IBM和华盛顿大学研究人员发布的,一个用于训练Agent使用MCP的数据集,包含了495个MCP Server和150万工具的交互
- mem-agent: Equipping LLM Agents with Memory Using RL
其他阅读
- 50个OpenAI的AgentBuilder的实用案例
- Mike Futia分享的工作流(基于n8n+Sora2 API),可以快速将一张图片转成HD画质且没有水印的视频
- Antonio Gulli(谷歌Senior Engineer)在Google I/O 2025上Demo了3个AI Agent,目前在Google Docs上开源了400多页的指南,很不错的内容,对于有在构建Agent的人值得一读
- 这篇推文表明:Google现在支持了1300万名开发者、每月处理1.3千万亿Tokens,Gemini已生成2.3亿段视频和130亿张图片,AI Overviews覆盖了20亿用户,65%的客户已经在使用Google的AI产品
Enjoy Reading This Article?
Here are some more articles you might like to read next: