在这点上OpenAI确实一次次走在前面，做出的一些决定和决策仔细思考还是挺佩服的。

现在在大模型这个方向上，OpenAI领先的并不多，其他竞争对手追赶的太猛了，但是以ChatGPT的先发优势建立的生态和用户粘性，是现阶段OAI的强大护城河，Sam Altman本人的营销和融资能力也是很顶，给了OAI持续的动量。OAI现在不断以ChatGPT为基础去探索和扩展商业版图，是一个很好的策略，也是正确的策略。

相比之下，国内市场，我觉得DeepSeek、豆包和元宝都是类似的，反而是千问，似乎没有一个很有名的C端流量入口，虽然其在大模型方面技术和发展速度很顶，但是似乎在流量入口这块似乎还差点意思。

这块主要是针对C端的，也会辐射一些B端用户。不过B端角度更多还是在于API、推理服务maas、私有化等，那是另一个大市场和打法了。

技术研究/技术突破

Adobe发布研究报告，预计AI驱动的零售网站的流量将增加520％
ASAPP发布The generative AI agent 100: 100 use cases for contact centers by industry：概述了100个AI Agent的使用案例

State of AI Report 2025

Air Street Capital发布了2025年的AI状况报告State of AI Report 2025，主要讲述了AI推理能力的成熟、商业化的爆发、算力基础设施的工业化，以及全球竞争格局的重塑

2025年是推理元年（Reasoning Got Real）

OpenAI、Google、Anthropic、DeepSeek等大模型厂商都推出了能进行复杂推理、验证和反思的系统
人机交互从生成式迈向推理式，标志着AI进入能规划、验证和自我纠正的新阶段
见证了AI推理能力的全球竞赛，研究进展速度非常快

产业和商业化：AI进入盈利时代

AI商业化全面爆发：顶级实验室和企业营收接近200亿美元
成本骤降、性价比倍增：模型能力价格比每6-8个月翻倍
企业采用率激增：美国使用AI工具的企业从2023年5%飙升至44%；平均合同金额达53万美元；AI-First创业公司增长速度是同行的1.5倍
普及化趋势（1200AI从业者中调查）：95%在工作或生活中使用AI；76%自费购买工具；大多数表示生产力持续提升

算力与基础设施：进入AI工业时代

多吉瓦级数据中心标志进入AI工业时代
电力和土地取代GPU成为新的瓶颈

地缘政治：中美格局成型

OpenAI仍保持领先，但是优势已经很微弱了
Meta推出开源领先地位，中国厂商接棒，DeepSeek、Qwen、Kimi在推理和编程任务上直追GPT-5
中国被认为是全球AI能力的可信第二位

科研与应用突破：AI成为科研合作者

AI进入科学研究角色：DeepMind的Co-Scientist、斯坦福的Virtual Lab、Profluent的ProGen3
行动链（Chain-of-Action）推理进入无力世界，如AI2的Molmo-Act、Google的Gemini Robotics 1.5等具备推理后行动的具身智能系统

安全与对齐：从理论风险专项可监控性

安全研究进入务实阶段：模型可伪装对齐，促使研究者提出可监控税（Monitorability Tax）概念，为透明度而牺牲部分性能

趋势与未来展望

AI时新的生产系统
扩展推理是下一个前沿：从语言模型走向具备计划、验证、反思和执行链路的智能体
经济增长核心驱动力：AI成为全球生产力与竞争力的中心

Opinion：PPT313页，确实很难一页一页看完，比较多是比较空洞的结论，不一定务实，但是可以提取一些自己感兴趣的部分看看，当作参考。我觉得长期工作在一线的从业者，对于AI的应用和敏感度应该还是有的，也能看到实际带来的营收情况。这个报告就当作全球角度的一个印证。

麦肯锡2025科技趋势展望报告

麦肯锡7月分发的2025年科技趋势展望报告，网页上看有交互式体验，完整版PDF有108页。

主要分析了13项前沿科技趋势，聚焦在四个维度上的变化情况：

创新（Innovation）
关注度（Interest）
投资（Equity Investment）
行业采纳度（Adoption）

13个趋势分为三大类：

AI革命（The AI Revolution）
计算与连接前沿（Compute & Connectivity Frontiers）
工程前沿（Cutting-edge Engineering）

六个宏观主题：

自主系统崛起 —— 从实验走向现实，包括机器人与数字代理。
人机协作新范式 —— 多模态交互、语音与触觉技术让AI成为“协作者”。
算力与基础设施瓶颈 —— 电力、网络、数据中心成为关键制约。
地区与国家竞争加剧 —— 科技主权、半导体、自主基础设施等成竞争焦点。
规模与专业化并行 —— 同时发展超大模型与本地化/边缘智能。
负责任创新 —— 透明度、公平性、伦理与信任成为商业竞争力要素。

最主要的增长依然来自于AI领域，其中最主要的亮点是Agentic AI获得了巨大的关注

2023年因为经济环境波动导致科技投资下滑，但是2024年多数趋势反弹，其中AI、可持续能源、云计算和半导体是最具吸引力的投资方向。AI+专用硬件+清洁能源成为互相促进的三大主轴

总体而言，AI正在成为所有前沿科技的放大器，而Agentic AI的兴起标志着AI从生成内容走向了自主行动的新阶段，企业的竞争力将取决于能否在AI驱动的生态中实现规模化和跨领域融合

Opinion：目前看2025年确实属于AI Agent大年（或者说Agentic AI），最近2个季度以来明显能感受到B端的重视和投入在持续提升，今年跑得快的企业都能收获不少。但是今年更多还是在早期阶段，和以往的技术发展有类似的趋势，AI的这波Adoption有长尾效应，可以预见明年会有更多的B端游预算投入这块，是非常大的机会。反观C端，目前更多还是在于诸如OpenAI这类拥有ChatGPT为超级入口的企业有撬动力，配合一下敢想敢试的战略，有很大机会撬动一些原来并不明显的市场，至少目前我们可以初见一些端倪了。

产品&模型发布

ElevenLabs发布Agent Workflows
FigureAI发布Figure 03
Google发布Gemini Enterprise：对标OpenAI的AgentBuilder（只能通过API），定价为每个用户每月30美元（后续会推出针对初创和中小企业是20美元）
Amazon发布Quick Suite：对标OpenAI的AgentBuilder
Google发布Gemini 2.5 Computer Use Model：CUA（Computer Use Agent）是结合了多模态的一个大方向，这个方向也是模型厂兵家必争之地。现在更多还是成本和延时的问题，不然有一些case可以处理的很好，某种角度可以看作是RPA的未来
腾讯发布Hunyuan-Vision-1.5-Thinking，多模态视觉大模型，在LM Arena Vision Arena上排名第三。最近腾讯多模态有些成绩
三星发布TRM（Tiny Recursion Model），一个7M参数的模型，在某些推理任务上打败了SOTA模型

OpenAI DevDay 2025

OpenAI DevDay 2025，关键点：

Apps inside ChatGPT：应用可以集成到ChatGPT里，有点类似GPTs升级版，底层基于MCP去构建的。不管如何，势必会引发第一批抢滩登陆的APP，算是给这些应用一次推广和引流的机会
AgentKit：包括Agent Builder、ChatKit和Evals。更多是基于类似n8n、dify、coze的workflow去快速构建Agent（或者说工作流）。
Codex：GA了。增加了Slack集成（Integration）、Codex SDK、企业控制（Enterprise Controls）
API更新：增加了GPT-5 Pro、gpt-realtime-mini、Sora 2

Opinion：我个人非常期待AgentKit，虽然现有的dify、coze等开源方案很Open了，但是更喜欢这种集成到ChatGPT这种日常高频使用的应用里，可以快速拉一些很常用的轻workflow，而不需要自己去serve一个。我相信到时候可以把一些信息摄取流集成进去，结合codex可以玩出很多花样。Jackywine这篇文章分析的也很棒，值得看

投资&商业

高通宣布收购Arduino
软银以54亿美元收购了ABB的机器人部门（Robotics arm），这次收购让软银立即进入价值750亿美元的机器人市场，该市场的年增长率为8%（AI驱动的部分甚至有20%的增长速度）
Bloomberg这张关于OpenAI、Nvidia相关的企业间的资本走向很有意思，值得一看：

热点论文

Agentic Context Engineering (ACE): Self-Improving LLMs via Evolving Contexts, Not Fine-Tuning：斯坦福大学、SambaNova Systems和加州大学伯克利分校推出的ACE框架，不靠修改模型权重（参数微调），而是通过上下文工程，不断编辑、扩展模型输入上下文，像是为大模型维护一个不断成长的操作手册或知识库。有三个Generator、Reflector和Curator三个角色，整个流程采用同一个底座大模型，通过增量更新（而不是整体重写），避免上下文崩塌。
The Landscape of Agentic Reinforcement Learning for LLMs: A Survey：关于Agentic RL在大模型里的综述，系统性的梳理
TOUCAN: Synthesizing 1.5M Tool-Agentic Data from Real-World MCP Environments：MIT、IBM和华盛顿大学研究人员发布的，一个用于训练Agent使用MCP的数据集，包含了495个MCP Server和150万工具的交互
mem-agent: Equipping LLM Agents with Memory Using RL

其他阅读

50个OpenAI的AgentBuilder的实用案例
Mike Futia分享的工作流（基于n8n+Sora2 API），可以快速将一张图片转成HD画质且没有水印的视频
Antonio Gulli（谷歌Senior Engineer）在Google I/O 2025上Demo了3个AI Agent，目前在Google Docs上开源了400多页的指南，很不错的内容，对于有在构建Agent的人值得一读
这篇推文表明：Google现在支持了1300万名开发者、每月处理1.3千万亿Tokens，Gemini已生成2.3亿段视频和130亿张图片，AI Overviews覆盖了20亿用户，65%的客户已经在使用Google的AI产品

LeoTalk AI周知 4: AI时代的入口和商业化之路