LeoTalk AI周知 4: AI时代的入口和商业化之路

在这点上OpenAI确实一次次走在前面,做出的一些决定和决策仔细思考还是挺佩服的。

现在在大模型这个方向上,OpenAI领先的并不多,其他竞争对手追赶的太猛了,但是以ChatGPT的先发优势建立的生态和用户粘性,是现阶段OAI的强大护城河,Sam Altman本人的营销和融资能力也是很顶,给了OAI持续的动量。OAI现在不断以ChatGPT为基础去探索和扩展商业版图,是一个很好的策略,也是正确的策略。

相比之下,国内市场,我觉得DeepSeek、豆包和元宝都是类似的,反而是千问,似乎没有一个很有名的C端流量入口,虽然其在大模型方面技术和发展速度很顶,但是似乎在流量入口这块似乎还差点意思。

这块主要是针对C端的,也会辐射一些B端用户。不过B端角度更多还是在于API、推理服务maas、私有化等,那是另一个大市场和打法了。

技术研究/技术突破

State of AI Report 2025

Air Street Capital发布了2025年的AI状况报告State of AI Report 2025,主要讲述了AI推理能力的成熟、商业化的爆发、算力基础设施的工业化,以及全球竞争格局的重塑

  1. 2025年是推理元年(Reasoning Got Real)
  • OpenAI、Google、Anthropic、DeepSeek等大模型厂商都推出了能进行复杂推理、验证和反思的系统
  • 人机交互从生成式迈向推理式,标志着AI进入能规划、验证和自我纠正的新阶段
  • 见证了AI推理能力的全球竞赛,研究进展速度非常快
  1. 产业和商业化:AI进入盈利时代
  • AI商业化全面爆发:顶级实验室和企业营收接近200亿美元
  • 成本骤降、性价比倍增:模型能力价格比每6-8个月翻倍
  • 企业采用率激增:美国使用AI工具的企业从2023年5%飙升至44%;平均合同金额达53万美元;AI-First创业公司增长速度是同行的1.5倍
  • 普及化趋势(1200AI从业者中调查):95%在工作或生活中使用AI;76%自费购买工具;大多数表示生产力持续提升
  1. 算力与基础设施:进入AI工业时代
  • 多吉瓦级数据中心标志进入AI工业时代
  • 电力和土地取代GPU成为新的瓶颈
  1. 地缘政治:中美格局成型
  • OpenAI仍 保持领先,但是优势已经很微弱了
  • Meta推出开源领先地位,中国厂商接棒,DeepSeek、Qwen、Kimi在推理和编程任务上直追GPT-5
  • 中国被认为是全球AI能力的可信第二位
  1. 科研与应用突破:AI成为科研合作者
  • AI进入科学研究角色:DeepMind的Co-Scientist、斯坦福的Virtual Lab、Profluent的ProGen3
  • 行动链(Chain-of-Action)推理进入无力世界,如AI2的Molmo-Act、Google的Gemini Robotics 1.5等具备推理后行动的具身智能系统
  1. 安全与对齐:从理论风险专项可监控性
  • 安全研究进入务实阶段:模型可伪装对齐,促使研究者提出可监控税(Monitorability Tax)概念,为透明度而牺牲部分性能
  1. 趋势与未来展望
  • AI时新的生产系统
  • 扩展推理是下一个前沿:从语言模型走向具备计划、验证、反思和执行链路的智能体
  • 经济增长核心驱动力:AI成为全球生产力与竞争力的中心

Opinion:PPT313页,确实很难一页一页看完,比较多是比较空洞的结论,不一定务实,但是可以提取一些自己感兴趣的部分看看,当作参考。我觉得长期工作在一线的从业者,对于AI的应用和敏感度应该还是有的,也能看到实际带来的营收情况。这个报告就当作全球角度的一个印证。

麦肯锡2025科技趋势展望报告

麦肯锡7月分发的2025年科技趋势展望报告,网页上看有交互式体验,完整版PDF有108页。

主要分析了13项前沿科技趋势,聚焦在四个维度上的变化情况:

  1. 创新(Innovation)
  2. 关注度(Interest)
  3. 投资(Equity Investment)
  4. 行业采纳度(Adoption)

13个趋势分为三大类:

  1. AI革命(The AI Revolution)
  2. 计算与连接前沿(Compute & Connectivity Frontiers)
  3. 工程前沿(Cutting-edge Engineering)

六个宏观主题:

  1. 自主系统崛起 —— 从实验走向现实,包括机器人与数字代理。
  2. 人机协作新范式 —— 多模态交互、语音与触觉技术让AI成为“协作者”。
  3. 算力与基础设施瓶颈 —— 电力、网络、数据中心成为关键制约。
  4. 地区与国家竞争加剧 —— 科技主权、半导体、自主基础设施等成竞争焦点。
  5. 规模与专业化并行 —— 同时发展超大模型与本地化/边缘智能。
  6. 负责任创新 —— 透明度、公平性、伦理与信任成为商业竞争力要素。

最主要的增长依然来自于AI领域,其中最主要的亮点是Agentic AI获得了巨大的关注

2023年因为经济环境波动导致科技投资下滑,但是2024年多数趋势反弹,其中AI、可持续能源、云计算和半导体是最具吸引力的投资方向。AI+专用硬件+清洁能源成为互相促进的三大主轴

总体而言,AI正在成为所有前沿科技的放大器,而Agentic AI的兴起标志着AI从生成内容走向了自主行动的新阶段,企业的竞争力将取决于能否在AI驱动的生态中实现规模化和跨领域融合

Opinion:目前看2025年确实属于AI Agent大年(或者说Agentic AI),最近2个季度以来明显能感受到B端的重视和投入在持续提升,今年跑得快的企业都能收获不少。但是今年更多还是在早期阶段,和以往的技术发展有类似的趋势,AI的这波Adoption有长尾效应,可以预见明年会有更多的B端游预算投入这块,是非常大的机会。反观C端,目前更多还是在于诸如OpenAI这类拥有ChatGPT为超级入口的企业有撬动力,配合一下敢想敢试的战略,有很大机会撬动一些原来并不明显的市场,至少目前我们可以初见一些端倪了。

产品&模型发布

  • ElevenLabs发布Agent Workflows
  • FigureAI发布Figure 03
  • Google发布Gemini Enterprise:对标OpenAI的AgentBuilder(只能通过API),定价为每个用户每月30美元(后续会推出针对初创和中小企业是20美元)
  • Amazon发布Quick Suite:对标OpenAI的AgentBuilder
  • Google发布Gemini 2.5 Computer Use Model:CUA(Computer Use Agent)是结合了多模态的一个大方向,这个方向也是模型厂兵家必争之地。现在更多还是成本和延时的问题,不然有一些case可以处理的很好,某种角度可以看作是RPA的未来
  • 腾讯发布Hunyuan-Vision-1.5-Thinking,多模态视觉大模型,在LM Arena Vision Arena上排名第三。最近腾讯多模态有些成绩
  • 三星发布TRM(Tiny Recursion Model),一个7M参数的模型,在某些推理任务上打败了SOTA模型

OpenAI DevDay 2025

OpenAI DevDay 2025,关键点:

  • Apps inside ChatGPT:应用可以集成到ChatGPT里,有点类似GPTs升级版,底层基于MCP去构建的。不管如何,势必会引发第一批抢滩登陆的APP,算是给这些应用一次推广和引流的机会
  • AgentKit:包括Agent BuilderChatKitEvals。更多是基于类似n8n、dify、coze的workflow去快速构建Agent(或者说工作流)。
  • Codex:GA了。增加了Slack集成(Integration)、Codex SDK、企业控制(Enterprise Controls)
  • API更新:增加了GPT-5 Pro、gpt-realtime-mini、Sora 2

Opinion:我个人非常期待AgentKit,虽然现有的dify、coze等开源方案很Open了,但是更喜欢这种集成到ChatGPT这种日常高频使用的应用里,可以快速拉一些很常用的轻workflow,而不需要自己去serve一个。我相信到时候可以把一些信息摄取流集成进去,结合codex可以玩出很多花样。Jackywine这篇文章分析的也很棒,值得看

投资&商业

  • 高通宣布收购Arduino
  • 软银以54亿美元收购了ABB的机器人部门(Robotics arm),这次收购让软银立即进入价值750亿美元的机器人市场,该市场的年增长率为8%(AI驱动的部分甚至有20%的增长速度)
  • Bloomberg这张关于OpenAI、Nvidia相关的企业间的资本走向很有意思,值得一看:

热点论文

其他阅读

  • 50个OpenAI的AgentBuilder的实用案例
  • Mike Futia分享的工作流(基于n8n+Sora2 API),可以快速将一张图片转成HD画质且没有水印的视频
  • Antonio Gulli(谷歌Senior Engineer)在Google I/O 2025上Demo了3个AI Agent,目前在Google Docs上开源了400多页的指南,很不错的内容,对于有在构建Agent的人值得一读
  • 这篇推文表明:Google现在支持了1300万名开发者、每月处理1.3千万亿Tokens,Gemini已生成2.3亿段视频和130亿张图片,AI Overviews覆盖了20亿用户,65%的客户已经在使用Google的AI产品



    Enjoy Reading This Article?

    Here are some more articles you might like to read next:

  • LeoTalk · Hacker News Daily · 2025.10.13
  • LeoTalk · Hacker News Daily · 2025.10.12
  • LeoTalk · Hacker News Daily · 2025.10.09
  • LeoTalk · Hacker News Daily · 2025.10.08
  • LeoTalk AI周知 3: 追求差异化的最后一公里