11 · YC 的 AI 操作系统:从只读 SQL 到 350 工具、夜间自我迭代的自演化公司实录
Source: Lightcone Podcast / YC YouTube 作者 / Author: Pete Koomen(YC General Partner,Optimizely 创始人)+ Garry Tan、Jared Friedman 主持 发布日期: 2025–2026(具体日期待核实) | 抓取日期: 2026-06-19 主题: self-evolving-company
一句话
YC 内部用一年时间把公司从"用 AI 写稿"升级成"用 AI 运营"——350 工具注册表 + 只读 SQL agent + 夜间自我迭代的梦循环,完整工程细节首次公开,正是图灵子要给听众的「自演化公司蓝图」。
核心论点(英中对照)
- EN: "We started with just a read-only SQL tool against our single Postgres database, and that one unlock changed everything — agents could now answer arbitrary questions about our business."
-
中: 起点只是一个对生产库的只读 SQL 工具;全量上下文放进同一个 Postgres 后,agent 能回答关于业务的任意问题。Jevons 悖论随即生效——问题数量和复杂度双双暴增。
-
EN: "There are more than 350 tools in our shared tool registry today. Every team is adding their own tools."
-
中: YC 内部共享工具注册表已超过 350 个工具,各团队持续贡献——工具注册表是把通用 agent 变成「在工作中有用」的核心基础设施。
-
EN: "We have a general agent that every night will go and read through all of the agent conversations that employees have had and look for things it could have done better."
-
中: 每晚有一个通用 agent 读取当天所有员工的 agent 对话,寻找可以做得更好的地方——这是「技能改进梦循环」(dream cycle),也是自演化公司的核心飞轮。
-
EN: "One of the partners wrote a skill for writing two-sentence descriptions. Feeding meeting transcripts back into that skill made it noticeably better. This is how superintelligence happens inside organizations."
-
中: 一位合伙人手写了「两句话描述」skill;把办公时间会议录音喂回去自动 meta-prompt 后,skill 明显变强。这就是企业级超级智能的微观机制:任何一件事都可以这样复利迭代。
-
EN: "By default, all agent conversations are globally viewable by any full-time employee. That transparency solved several problems at once — social control, knowledge sharing, and learning by watching."
-
中: 所有 agent 对话默认全员可见,并广播到 Slack。透明度同时解决了三个问题:社会性控制(不用技术手段的安全机制)、知识共享、以及新员工通过观摩加速上手。
-
EN: "The key thing is not to use AI as a co-pilot. Use it as the building layer for everything. And you need to start recording all the artifacts."
-
中: 不要把 AI 当 co-pilot,要当「所有事情的建构层」。关键动作是开始记录所有产物——会议录音、agent 对话、决策过程——它们都是未来 skill 自我迭代的原料。
-
EN: "AI can either be centralizing or decentralizing. We have about 18–24 months to decide which world we build."
-
中: AI 的本质力量可以是集权的(大厂锁住 prompt,用户被动接受),也可以是分权的(个人 agent 掌控自己的 prompt 和数据)。这个窗口期只有 18–24 个月。
-
EN: "Trust-default culture as a requirement — egalitarian access to context is not most organizations. If you're a founder, you have to build that in."
- 中: 「默认信任 + 上下文平权」不是大多数公司的默认值,但它是构建自演化组织的前提条件。创业公司天然更有优势——规模小、信任度高、对齐成本低。
精译(高信息密度段落)
段落一:只读 SQL 的魔法时刻
"I built those tools and I felt a little bit like I was breaking the rules. We started with very limited tools that had very narrowly scoped domains. And I was like, what if we just gave the thing access to the production database where it could just like trample on anything? I surreptitiously pushed it out maybe late at night. And it worked. It worked extremely well."
我造了这些工具,感觉自己像在打破规矩。一开始我们的工具权限极度受限,作用域非常窄。我想:如果直接把生产数据库访问权给它,任它横冲直撞,会怎样?我悄悄在某个深夜把它推出去了。然后——它跑通了,而且效果出奇地好。
图灵子注: 这个「深夜偷偷推 read-only SQL agent」的故事,和 App Store recsys 团队在 feature store 权限开放前的状态一模一样——把工具的权限范围锁死,是一种伪安全,真代价是功能缺失。
段落二:350 工具注册表与 Jevons 悖论
"We had like 20 tools at the beginning including this magical ability to query our SQL database, but over time teams have added more and more tools. There's more than 350 today. And the cool thing is it didn't just make it easier to answer questions — it dramatically increased the number of questions we would ask, and dramatically increased the scale and complexity of questions we would dare to ask."
起初只有 20 个工具,包括那个神奇的 SQL 查询能力;现在超过 350 个,各团队持续添加。神奇的地方不只是「回答问题更容易了」,而是我们愿意问的问题数量和复杂度都大幅提升。以前让数据科学团队跑一个复杂的投资人查询要等好几天,你根本不会开口问;现在随时可以问,于是你问了更多、更难的问题。这就是 Jevons 悖论:把单次任务的摩擦消除后,总需求不降反升。
段落三:梦循环——skill 的自我迭代机制
"We have a general agent that every night will go and read through all of the agent conversations that employees have had and look for things it could have done better and pieces of context that if it had up front, it would have done more efficiently. One of the partners wrote a skill for writing two-sentence descriptions. Feeding meeting transcripts back into that skill made it noticeably better — this skill is now better than I am at writing those. This is how superintelligence happens inside organizations."
每晚有一个通用 agent 读遍当天所有员工的 agent 对话,寻找「如果提前知道这些上下文,可以做得更好」的地方。一位合伙人手写了「两句话描述」skill;把一次 group office hours 的会议录音喂回去,让 agent 基于真实案例做 meta-prompt 后,skill 明显变强。「这个 skill 现在比我自己强了。」这就是企业超级智能的生成方式:不是一次性改造,而是每一个 skill 都在走这个循环,以日为单位复利。
段落四:个人 AI 时代的分叉路口
"AI can either be centralizing or decentralizing. We have about 18–24 months to decide. The centralized scenario: five kings control the most advanced AI, you can't run your own prompts — the AI happens to you. The alternative: a billion people actually control and program what these things are. This should be an extension of yourself, not what Meta or Alphabet or even OpenAI or Anthropic care about."
AI 的力量既可以是集权的(极少数公司控制最强模型,你无法修改 prompt,AI 发生在你身上),也可以是分权的(十亿人各自控制自己的 agent 和数据)。分叉窗口只有 18–24 个月。Homebrew Computer Club、苹果一号都是这个时刻的类比——当时选对了,个人电脑革命诞生;选错了,就是大型机垄断延续几十年。
金句(可直接做短视频字幕/标题)
- "We had 20 tools at the beginning. Now we have more than 350." —— 从 20 到 350 个工具,这就是公司变成操作系统的过程
- "This skill is now better than I am at writing those. This is how superintelligence happens inside organizations." —— skill 比人强的那一刻,企业级超级智能诞生了
- "It dramatically increased the number of questions we would dare to ask." —— 摩擦归零,提问欲望爆炸——这是 Jevons 悖论,不是效率提升
- "The key thing is not to use AI as a co-pilot. Use it as the building layer for everything." —— co-pilot 是 2023 年的思维,2026 年要用 AI 当建构层
- "AI happens to you — or you program AI. We have 18–24 months to choose." —— AI 发生在你身上,还是你定义 AI?这是一道分叉题,窗口不长
剑桥图灵子的加工角度
反共识/框架:recsys 工程一手经验透镜
YC 的三层架构,与 App Store recsys 工具权限分层的直接类比:
| YC agent 基础设施 | App Store recsys 类比 | 工程原则 |
|---|---|---|
| 只读 SQL agent(生产库 read-only) | Read-only feature store(离线特征层) | 开放只读 = 安全基线 + 全量上下文 |
| 350 工具注册表(各团队贡献) | Offline eval pipeline + candidate generator 池 | 工具/模型的 MECE 化管理,DRY 避免重复 |
| 夜间梦循环(读对话 → 改 skill) | Online A/B 实验 → offline policy update | 闭环迭代:真实流量 → 模型/策略更新 |
| 全员可见的 agent 对话(Slack 广播) | 特征/模型变更的全团队可见性(实验日志) | 透明度 = 隐性知识外显 + 社会性安全控制 |
YC 踩的第一个坑(权限过度收窄)和 App Store recsys 早期「过度保护 feature store 导致工程师根本不会用」是同一个坑。解法也一样:先开只读,观察,再逐步扩权。
这个框架给自演化公司的工程蓝图: 1. 数据层:把核心业务上下文放进同一个数据库/知识库(一个 Postgres 胜过十个 SaaS 散点) 2. 工具层:从只读 SQL agent 起步,逐步扩展到 350+ 的共享工具注册表;用 DRY + MECE 原则管理工具命名空间 3. 迭代层:每晚自动读取当天 agent 对话 → 找改进点 → meta-prompt 更新 skill(dream cycle) 4. 透明层:agent 对话默认全员可见,用社会性控制代替技术性权限收紧
我的判断
原作者没说、但值得补的一个视角:「工具注册表」是新的「feature store」,它的 schema 治理将成为自演化公司的核心工程债。
Pete 提到 DRY + MECE 是管理 350 工具的原则,但没有谈到这个问题:当工具注册表从 20 增长到 350 再到 3500,工具命名空间的版本冲突、deprecation 管理、跨团队工具发现成本会急剧上升。这和 recsys 里 feature store 的 schema drift 问题同构。
解法不是靠人工审核(350 工具就已经靠 agent 做 check_resolvable 了),而是需要一套工具注册表的自动健康检查 + 语义去重 agent——本质上是 feature store 的 lineage tracking + 自动化 data quality 检查在 agent 工具层的复现。
这个问题现在是 YC 内部已经在解(check_resolvable meta-skill),但行业级别还没有标准方案。图灵子的判断:谁先把这个做成开源工具/SaaS,就是下一个 dbt(数据转化层的标准化工具)在 agent 工具层的对应物。
短视频脚本骨架(60-90s)
- Hook(3s): 「YC 的合伙人说:这个 skill 现在比我自己强了。」
- 冲突/反共识(15s): 大多数公司用 AI 当 co-pilot,这是 2023 年的玩法。YC 2025 年做的事是:把 AI 变成公司的操作系统。起点只是一个深夜偷偷推上去的只读 SQL 工具,但它打开了一切。
- 论证(30s): 三层结构:一,把所有业务上下文放进同一个数据库,agent 能回答任意问题;二,350 个工具注册表,各团队自己贡献,Jevons 悖论——摩擦消失,问题暴增;三,夜间梦循环——agent 每晚读当天所有对话,找改进点,自动更新 skill。两句话描述 skill 喂了一次会议录音之后,比人类合伙人更强。这就是企业超级智能的微观机制。
- 图灵子落点(15s): 这不是 YC 才能做的事。一个 Postgres + 20 个工具,就是起点。关键是文化:默认信任、上下文平权、agent 对话全员可见。创业公司天然占优。
- CTA: 想看这套架构的工程蓝图拆解,关注,下一期我从 recsys 工程视角逐层解码。
长文大纲
- H2: 自演化公司的起点:一个深夜偷偷推上去的只读 SQL 工具
- YC 的背景:自研软件 + 单一 Postgres 数据库的架构优势
- Jared 深夜推出 read-only SQL agent 的决策过程
- 「打破规矩」的感受 vs. 实际效果
-
为什么「只读」是关键安全基线
-
H2: Jevons 悖论:350 工具注册表如何改变提问行为
- 从 20 工具到 350 工具的增长路径
- 工具注册表的 DRY + MECE 治理原则
- check_resolvable meta-skill:用 agent 管理 agent 工具
-
Jevons 悖论在企业知识访问中的具体表现
-
H2: 梦循环——skill 自我迭代的工程机制
- 夜间通用 agent 的工作流程
- 两句话描述 skill 的案例:从人写 prompt 到会议录音 meta-prompt
- 「skill 比人强」的临界点意味着什么
-
与 Karpathy Auto Research、Codex /goal 的横向比较
-
H2: 透明度作为安全控制:全员可见 agent 对话的设计决策
- 为什么不用技术权限,而用社会性控制
- Slack 广播的实际效果:知识扩散 + 新员工上手加速
-
「raising the floor」:新员工通过观摩学习 star player 的方式
-
H2: AI 的分叉路口:集权还是分权,18–24 个月窗口
- Horseless Carriages 论文的核心论点:AI 应该让用户控制 prompt,不是开发者锁住 prompt
- 1984 vs. Homebrew Computer Club 的历史类比
- 个人 AI 时代的技术条件:自己的数据库、自己的 prompt、选择模型的自由
-
为什么创业公司是这场革命的主战场
-
H2: 图灵子视角:recsys 工程透镜下的自演化公司蓝图
- YC 架构与 App Store recsys 的逐层类比
- 工具注册表的 schema 治理将成为下一个工程债
- 谁先解决「agent 工具层的 dbt 问题」,谁就是下一个基础设施公司
- 对安心舍 / 图灵子 IP 的落地路径
待核实 / 风险
-
发布日期未确认:视频描述未显示具体上传日期。从内容判断(提到「2026 年还有很多公司在用老方法」「January 和 February 我在做 Gary's List」),推断录制时间约在 2025 年底到 2026 年初,但精确日期需在 YouTube 页面手动核对。
-
350 工具数字的时效性:Pete 说「I just checked, right now」——这是录制时的数字,可能已经增长,引用时注意加「截至录制时」。
-
「Horseless Carriages」文章链接:视频提及 Pete 写了一篇同名文章并「went pretty viral」,但本次未找到原文 URL,引用时需补充来源。
-
Open Claw / Hermes / GBrain 的指代:视频中大量提到 Open Claw(OpenClaw?)、Hermes Agent、GBrain——这些是 YC 内部工具还是公开产品,边界不清晰,引用时需标注「YC 内部」。
-
「Jack Dorsey + Block」引用:视频中提及 Jack Dorsey 把 Block 变成「围绕支付的 mini AGI」,这是截至录制时的公开信息,非本集独家,但可能需要核实 Dorsey 的原始表述。
-
完整文字稿来源:本摘要基于 YouTube 自动生成字幕(ASR),可能存在口误转录错误(如 「Open Claw」可能是「OpenClaude」或其他名称的误听),金句引用前建议人工核对视频原声。