Harness的新理解

这次的通透来自于张小珺和戴雨森的创投观察第2集

刚好最近在重新盘点审视Harness,这两天听这集播客带来了一些不错的想法!

我们看Codex/Claude Code/OpenClaw这些其实都可以说是Harness,本质上是通过一些配套的机制、工具和环境让模型更好的发挥能力。

看我用ChatGPT Gen的这张图,简洁明了的介绍了。

做个baseline的Harness很简单,codex、openclaw、openhands、hermes开源的,claude code有泄漏的源码,clone一下,和ai cowork一下就能得到一个in-house版本的harness。那harness的价值在哪里?

我觉得把Harness类比成Agent OS非常make sense!

根据我的想法快速Gen了一张,忽略细节,只是想快速表达想法(暂时不想花太多effort去手撕这个图)。

我们可以把LLM想象成以前的CPU,Harness就和OS一样,会针对不同的LLM做Driver,这样LLM本质是可以任意替换的,只是效果差异而已。外层配套的沙盒、Mem、Tool之类的可以不耦合。

那么Harness的意义就出来了,比如现在的Claude Code的开放生态并不足,Codex的有APP Server并且官方态度明确支持开放(类似Crypto里的ETH的生态力)。也就出现了很多build on top of “harness”的产品,比如:

  • slock(原kimi cli团队出来做的)这种,本机直接跑一个daemon通过ws连到其服务端,这样slock的服务端可以下发命令给codex/claude code

  • 另外Codex.app也可以看作是基于Codex这个Harness本身去做出来的

  • 类似郭宇的wanman这种也是一个不错的点,以前都是Google OAuth2.0登陆一个网站,现在直接是Codex OAuth2.0登陆了,细品

  • Managed Agents这种就是Agent OS的一方服务,甚至更深,可以理解成原来OS里的syscall这种系统调用级别,也就是不需要在Harness之上再做什么动作了,可以对外直接提供这个能力了,这种也就是0代码或者开箱即用的能力

依然是GEN的, 不纠结细节,大体是对的,Codex.app现在就是一个壳,底座是基于codex cli的

可以看到自己打包了codex cli。只不过这是一方的套壳,但是理论上任何人都可以基于codex cli这个harness本身做出一个open-codex.app或任何产品

这个就是Harness或者说Agent OS的机会,如果把其当作一个产品,未来是可以单独把其当作OS去售卖,也可以支撑上层APP的快速开花,或者直接以SaaS版本对外提供。并且像codex/claude code本身都是重单机、重本地的版本,Managed Agents背后一定有一套企业级别的Harness,这种才是应该追求的,这个现在讨论和做的人还比较少,但是随着B端对AI盈利的确定性持续增加,必然会成为大家厮杀的一个主战场。

因此Harness/Agent OS应该做的本身就是做好这个层:

  • 对外屏蔽掉这些细节,体现产品力、易用灵活、可扩展、稳定等

  • 内部做好各种配套的机制来保证稳定、时延、scale、分布、高可用等

  • 对下针对LLM做好适配,甚至可能会需要有一些模型和llm infra的认知

当理清了这些概念后,就会有个清晰的图景去引领迭代的方向。认知的提升只能多看多听多试了,现在变化太快,给决策者带来的挑战很大,时刻保持敏感性和大量的信息输入和内化熵减很重要




    Enjoy Reading This Article?

    Here are some more articles you might like to read next:

  • LLM Infra 101 v0.5: KV Cache分块管理
  • LLM Infra 101 v0.4: 连续批处理
  • System vs Goal
  • LLM Infra 101 v0.3: 静态批处理
  • LLM Infra 101 v0.2: KV Cache