图灵子·AI化AI 转型· 管理力是 AI 时代的核武器

09 · 管理力是 AI 时代的核武器

Source: One Useful Thing (Ethan Mollick / Substack) 作者 / Author: Ethan Mollick 发布日期: 2026-01-27 | 抓取日期: 2026-06-19 主题: ai-transformation

一句话

Mollick 用 MBA 学生四天造出可交付的 startup 原型这件事证明:技术能力正在商品化,真正稀缺的是「知道好结果长什么样」并能清楚表达出来的管理力——这是图灵子用古典将道重新诠释 AI 落地的绝佳入口。

核心论点(英中对照)

  • EN: Non-technical MBA students built functional startup prototypes in four days using AI agents — output "an order of magnitude further along" than a full semester of traditional work.
  • 中: 没有工程背景的 MBA 学生用 AI 代理四天内造出可运行的 startup 原型,成果比过去一整个学期的传统课程高出一个数量级。

  • EN: The key equation for AI delegation: delegate when (Human Baseline Time × Probability of Success) > AI Process Time across iterations.

  • 中: AI 授权的核心方程:当「人工基准时间 × 首次成功概率」大于「循环迭代的 AI 处理时间」时,就应该委托给 AI 做。

  • EN: OpenAI GDPval research shows GPT-5.2 Thinking/Pro "tied or beat human experts 72% of the time" on professional tasks averaging 7 hours each, saving ~3 hours per task via draft-review-retry workflow.

  • 中: OpenAI GDPval 研究显示,在平均耗时 7 小时的专业任务中,GPT-5.2 思考版/Pro 版有 72% 的概率追平或超越人类专家,通过「草稿-评审-重试」流程平均每任务节省约 3 小时。

  • EN: The three levers to improve AI delegation ROI are better instructions, improved evaluation, and easier assessment — all of which improve with domain expertise.

  • 中: 提升 AI 委托回报的三个杠杆:更清晰的指令、更快的评估、更低成本的质量判断——三者都随领域专业知识的积累而增强。

  • EN: Existing professional documents — PRDs, shot lists, design intent docs, military Five Paragraph Orders — are already effective AI prompts because they answer "What are we trying to accomplish, and where are the limits of delegated authority?"

  • 中: 现有的专业文档——PRD、拍摄清单、建筑设计意图书、军事五段式命令——本质上已经是高效的 AI prompt,因为它们回答了同一个问题:「我们要完成什么,授权边界在哪里?」

  • EN: Prominent developers at major AI labs report their roles shifting "from mostly programming to mostly management of AI agents."

  • 中: 顶级 AI 实验室的资深开发者反映,他们的工作重心已从「主要写代码」转变为「主要管理 AI 代理」。

  • EN: "The skills that are so often dismissed as 'soft' turned out to be the hard ones."

  • 中: 「那些常被轻视为'软技能'的能力,结果才是真正的硬核能力。」

  • EN: The future belongs to those "who know what good looks like — and can explain it clearly enough that even an AI can deliver it."

  • 中: 未来属于那些「知道好结果长什么样,并且能把它解释得清晰到连 AI 都能执行」的人。

精译(高信息密度段落)

「四天 startup 实验」——原文精华

Mollick 教了一门实验性 MBA 课,让没有技术背景的学生用 Claude Code 和 AI 工具,在四天内从零到一构建 startup 原型。结果令他震惊:「我在短短几天里看到的进展,比学生们用整整一学期传统方式做出来的东西高出一个数量级。」

学生们做出了真实可运行的产品:Ticket Passport(票务二级市场)、Revenue Resilience(高危营收识别工具)、Invive(血糖预测应用)。但 Mollick 的关键洞察不是「AI 很厉害」,而是:这些学生成功的原因,是他们已经掌握的管理技能——「他们多年来学会了如何在自己的专业领域界定问题、定义可交付物、并识别一份财务模型或医疗报告何时出了问题。」

「传统文档即最佳 Prompt」——结构性发现

Mollick 指出各行业早已存在解决「如何向他人授权复杂任务」这一问题的文档范式:软件有 PRD(产品需求文档),电影有拍摄清单,建筑有设计意图书,军队有「五段式命令」(Five Paragraph Orders)。这些文档的核心逻辑完全一致:明确目标、界定授权边界、定义「完成」标准。它们不需要改造,原封不动就是 AI 时代最好的 prompt 模板。

「GDPval 数据」——量化论据

OpenAI 的 GDPval 研究让专家人类与 AI 在多样化专业任务上正面竞争:专家平均每任务耗时 7 小时,评估需约 1 小时;GPT-5.2 思考版和 Pro 版在 72% 的任务上追平或超越人类专家。最优工作流(起草-审核-重试)平均每个 7 小时任务节省 3 小时。结论:会用 AI 的人,等效生产力提升超过 40%。

金句(可直接做短视频字幕/标题)

  • "The skills that are so often dismissed as 'soft' turned out to be the hard ones." —— 那些被轻视为「软技能」的,才是真正的硬核能力。
  • "Who know what good looks like — and can explain it clearly enough that even an AI can deliver it." —— 知道好结果长什么样,并能说清楚到让 AI 都能执行。
  • "From mostly programming to mostly management of AI agents." —— 从主要写代码,到主要管理 AI 代理。
  • "An order of magnitude further along the path to a real startup." —— 离真正的 startup 近了一个数量级。
  • "What are we trying to accomplish, and where are the limits of delegated authority?" —— 我们要做什么,授权的边界在哪里?

剑桥图灵子的加工角度

  • 反共识/框架: 主流叙事是「学 AI 要懂技术」,Mollick 的反叙事是「技术已商品化,稀缺的是管理力」。图灵子的透镜更进一步:这不是新观点,孙子在 2500 年前就解决过这个问题。《孙子兵法》「令文不明,申令不熟,将之罪也」——指挥失败的根源不是士兵(AI)能力不足,而是将令(prompt)不清。PRD 就是现代的「军令文书」:它回答「任务目标/地形限制/行动边界/完成标准」四个永恒问题。给中国企业家的直接行动框架:把你书架上的《孙子兵法》《曾胡治兵语录》《毛泽东军事文集》重读一遍——里面每一条关于「如何向下授权复杂任务」的原则,都是 AI 时代的 prompt engineering 教材。 古典将道的精髓是「将帅明,则三军胜」,翻译成 AI 语言就是「prompt 清晰,则 agent 成功」。

  • 我的判断: Mollick 停在了「管理力有价值」这个结论,但没有说清楚管理力的哪个子维度在 AI 时代价值最大。以我的 ML 工程 + 量化宏观视角,我认为关键不是泛泛的「沟通能力」,而是可操作的验收标准(acceptance criteria)的制定能力——即你能否在启动任务之前,先写出「什么情况下输出是合格的,什么情况下不合格」的明确规则。这本质上是一个测试驱动开发(TDD)的思维,而绝大多数管理者从未被训练过这种思维。未来 AI 落地的分水岭,不在于谁用 AI 更多,而在于谁能「先写验收标准,再下指令」。

短视频脚本骨架(60-90s)

  • Hook(3s): 「没有工程背景的 MBA 学生,四天造出了真实可用的 AI startup——比之前一整个学期的成果高出十倍。」
  • 冲突/反共识(15s): 「所有人都在学 Python、学提示词技巧。但 Mollick 的发现是:这些学生成功,不是因为他们懂 AI,而是因为他们懂管理。那些被轻视为'软技能'的,才是真正的硬核能力。」
  • 论证(30s): 「孙子说:令文不明,申令不熟,将之罪也。AI 代理就是你的士兵——失败的根源永远是将令不清,不是士兵不行。你书架上的《孙子兵法》,其实已经是最好的 prompt engineering 教材。'任务目标、地形限制、行动边界、完成标准'——这四个问题,2500 年前就被解决了。现在的 PRD、五段式军令,本质是同一套东西。OpenAI 的数据:会正确授权 AI 的人,等效生产力提升超 40%。」
  • 图灵子落点(15s): 「我的判断:管理力里最值钱的那个子技能,是在下指令之前先写出验收标准。不是'让 AI 帮我做 X',而是'做到什么程度算合格,做到什么程度算不合格'——这才是分水岭。」
  • CTA: 「评论区告诉我:你现在给 AI 下指令,有没有先写过验收标准?」

长文大纲

  • H2: 一个让 MBA 学生四天造出 startup 的实验
  • 实验背景与学生构成(无工程背景)
  • 三个原型产品的具体案例
  • Mollick 的核心观察:成功因素不是 AI 技能
  • H2: AI 时代的授权方程
  • 三变量公式:人工基准时间 × 成功概率 vs AI 处理时间
  • GDPval 数据解读:72% 胜率,3小时节省
  • 三个提升 ROI 的杠杆
  • H2: 古典将道即最佳 Prompt Engineering 教材
  • 孙子「令文不明」的指挥失败逻辑
  • PRD/五段式军令/设计意图书的共同结构
  • 企业家行动框架:把管理学经典重读为 AI 时代工具书
  • H2: 管理力的核心子技能——先写验收标准
  • 为什么「验收标准」是 prompt 的灵魂
  • TDD 思维 vs 传统任务分配思维
  • 实操:如何在下 AI 指令前写出可验证的完成条件
  • H2: 结论——技术商品化时代,稀缺的是清晰度
  • 未来竞争格局预测
  • 图灵子视角下的中国企业家行动路线

待核实 / 风险

  • GDPval 研究具体参数:文中提到「GPT-5.2 Thinking and Pro models」,需确认 GPT-5.2 是否为正式发布的模型名称还是内部代号;该研究是否已公开发表或仍为预印本。
  • 「四天 startup」学生成果:三个原型(Ticket Passport、Revenue Resilience、Invive)是否有公开展示页面可交叉验证。
  • 「72% 胜率」数据:该数字来自 WebFetch 提取,原文应有更完整的研究引用,建议手动确认原文链接的脚注/参考文献。
  • 原文访问:Substack 部分文章设有付费门槛,本次抓取内容完整度较高,但如有遗漏细节建议订阅原刊核实。