09 · 管理力是 AI 时代的核武器

Source: One Useful Thing (Ethan Mollick / Substack) 作者 / Author: Ethan Mollick 发布日期: 2026-01-27　|　抓取日期: 2026-06-19 主题: ai-transformation

一句话

Mollick 用 MBA 学生四天造出可交付的 startup 原型这件事证明：技术能力正在商品化，真正稀缺的是「知道好结果长什么样」并能清楚表达出来的管理力——这是图灵子用古典将道重新诠释 AI 落地的绝佳入口。

核心论点（英中对照）

EN: Non-technical MBA students built functional startup prototypes in four days using AI agents — output "an order of magnitude further along" than a full semester of traditional work.
中: 没有工程背景的 MBA 学生用 AI 代理四天内造出可运行的 startup 原型，成果比过去一整个学期的传统课程高出一个数量级。
EN: The key equation for AI delegation: delegate when (Human Baseline Time × Probability of Success) > AI Process Time across iterations.
中: AI 授权的核心方程：当「人工基准时间 × 首次成功概率」大于「循环迭代的 AI 处理时间」时，就应该委托给 AI 做。
EN: OpenAI GDPval research shows GPT-5.2 Thinking/Pro "tied or beat human experts 72% of the time" on professional tasks averaging 7 hours each, saving ~3 hours per task via draft-review-retry workflow.
中: OpenAI GDPval 研究显示，在平均耗时 7 小时的专业任务中，GPT-5.2 思考版/Pro 版有 72% 的概率追平或超越人类专家，通过「草稿-评审-重试」流程平均每任务节省约 3 小时。
EN: The three levers to improve AI delegation ROI are better instructions, improved evaluation, and easier assessment — all of which improve with domain expertise.
中: 提升 AI 委托回报的三个杠杆：更清晰的指令、更快的评估、更低成本的质量判断——三者都随领域专业知识的积累而增强。
EN: Existing professional documents — PRDs, shot lists, design intent docs, military Five Paragraph Orders — are already effective AI prompts because they answer "What are we trying to accomplish, and where are the limits of delegated authority?"
中: 现有的专业文档——PRD、拍摄清单、建筑设计意图书、军事五段式命令——本质上已经是高效的 AI prompt，因为它们回答了同一个问题：「我们要完成什么，授权边界在哪里？」
EN: Prominent developers at major AI labs report their roles shifting "from mostly programming to mostly management of AI agents."
中: 顶级 AI 实验室的资深开发者反映，他们的工作重心已从「主要写代码」转变为「主要管理 AI 代理」。
EN: "The skills that are so often dismissed as 'soft' turned out to be the hard ones."
中: 「那些常被轻视为'软技能'的能力，结果才是真正的硬核能力。」
EN: The future belongs to those "who know what good looks like — and can explain it clearly enough that even an AI can deliver it."
中: 未来属于那些「知道好结果长什么样，并且能把它解释得清晰到连 AI 都能执行」的人。

精译（高信息密度段落）

「四天 startup 实验」——原文精华

Mollick 教了一门实验性 MBA 课，让没有技术背景的学生用 Claude Code 和 AI 工具，在四天内从零到一构建 startup 原型。结果令他震惊：「我在短短几天里看到的进展，比学生们用整整一学期传统方式做出来的东西高出一个数量级。」

学生们做出了真实可运行的产品：Ticket Passport（票务二级市场）、Revenue Resilience（高危营收识别工具）、Invive（血糖预测应用）。但 Mollick 的关键洞察不是「AI 很厉害」，而是：这些学生成功的原因，是他们已经掌握的管理技能——「他们多年来学会了如何在自己的专业领域界定问题、定义可交付物、并识别一份财务模型或医疗报告何时出了问题。」

「传统文档即最佳 Prompt」——结构性发现

Mollick 指出各行业早已存在解决「如何向他人授权复杂任务」这一问题的文档范式：软件有 PRD（产品需求文档），电影有拍摄清单，建筑有设计意图书，军队有「五段式命令」（Five Paragraph Orders）。这些文档的核心逻辑完全一致：明确目标、界定授权边界、定义「完成」标准。它们不需要改造，原封不动就是 AI 时代最好的 prompt 模板。

「GDPval 数据」——量化论据

OpenAI 的 GDPval 研究让专家人类与 AI 在多样化专业任务上正面竞争：专家平均每任务耗时 7 小时，评估需约 1 小时；GPT-5.2 思考版和 Pro 版在 72% 的任务上追平或超越人类专家。最优工作流（起草-审核-重试）平均每个 7 小时任务节省 3 小时。结论：会用 AI 的人，等效生产力提升超过 40%。

金句（可直接做短视频字幕/标题）

"The skills that are so often dismissed as 'soft' turned out to be the hard ones." —— 那些被轻视为「软技能」的，才是真正的硬核能力。
"Who know what good looks like — and can explain it clearly enough that even an AI can deliver it." —— 知道好结果长什么样，并能说清楚到让 AI 都能执行。
"From mostly programming to mostly management of AI agents." —— 从主要写代码，到主要管理 AI 代理。
"An order of magnitude further along the path to a real startup." —— 离真正的 startup 近了一个数量级。
"What are we trying to accomplish, and where are the limits of delegated authority?" —— 我们要做什么，授权的边界在哪里？

剑桥图灵子的加工角度

反共识/框架： 主流叙事是「学 AI 要懂技术」，Mollick 的反叙事是「技术已商品化，稀缺的是管理力」。图灵子的透镜更进一步：这不是新观点，孙子在 2500 年前就解决过这个问题。《孙子兵法》「令文不明，申令不熟，将之罪也」——指挥失败的根源不是士兵（AI）能力不足，而是将令（prompt）不清。PRD 就是现代的「军令文书」：它回答「任务目标/地形限制/行动边界/完成标准」四个永恒问题。给中国企业家的直接行动框架：把你书架上的《孙子兵法》《曾胡治兵语录》《毛泽东军事文集》重读一遍——里面每一条关于「如何向下授权复杂任务」的原则，都是 AI 时代的 prompt engineering 教材。古典将道的精髓是「将帅明，则三军胜」，翻译成 AI 语言就是「prompt 清晰，则 agent 成功」。
我的判断： Mollick 停在了「管理力有价值」这个结论，但没有说清楚管理力的哪个子维度在 AI 时代价值最大。以我的 ML 工程 + 量化宏观视角，我认为关键不是泛泛的「沟通能力」，而是可操作的验收标准（acceptance criteria）的制定能力——即你能否在启动任务之前，先写出「什么情况下输出是合格的，什么情况下不合格」的明确规则。这本质上是一个测试驱动开发（TDD）的思维，而绝大多数管理者从未被训练过这种思维。未来 AI 落地的分水岭，不在于谁用 AI 更多，而在于谁能「先写验收标准，再下指令」。

短视频脚本骨架（60-90s）

Hook(3s)： 「没有工程背景的 MBA 学生，四天造出了真实可用的 AI startup——比之前一整个学期的成果高出十倍。」
冲突/反共识(15s)： 「所有人都在学 Python、学提示词技巧。但 Mollick 的发现是：这些学生成功，不是因为他们懂 AI，而是因为他们懂管理。那些被轻视为'软技能'的，才是真正的硬核能力。」
论证(30s)： 「孙子说：令文不明，申令不熟，将之罪也。AI 代理就是你的士兵——失败的根源永远是将令不清，不是士兵不行。你书架上的《孙子兵法》，其实已经是最好的 prompt engineering 教材。'任务目标、地形限制、行动边界、完成标准'——这四个问题，2500 年前就被解决了。现在的 PRD、五段式军令，本质是同一套东西。OpenAI 的数据：会正确授权 AI 的人，等效生产力提升超 40%。」
图灵子落点(15s)： 「我的判断：管理力里最值钱的那个子技能，是在下指令之前先写出验收标准。不是'让 AI 帮我做 X'，而是'做到什么程度算合格，做到什么程度算不合格'——这才是分水岭。」
CTA： 「评论区告诉我：你现在给 AI 下指令，有没有先写过验收标准？」

长文大纲

H2: 一个让 MBA 学生四天造出 startup 的实验
实验背景与学生构成（无工程背景）
三个原型产品的具体案例
Mollick 的核心观察：成功因素不是 AI 技能
H2: AI 时代的授权方程
三变量公式：人工基准时间 × 成功概率 vs AI 处理时间
GDPval 数据解读：72% 胜率，3小时节省
三个提升 ROI 的杠杆
H2: 古典将道即最佳 Prompt Engineering 教材
孙子「令文不明」的指挥失败逻辑
PRD/五段式军令/设计意图书的共同结构
企业家行动框架：把管理学经典重读为 AI 时代工具书
H2: 管理力的核心子技能——先写验收标准
为什么「验收标准」是 prompt 的灵魂
TDD 思维 vs 传统任务分配思维
实操：如何在下 AI 指令前写出可验证的完成条件
H2: 结论——技术商品化时代，稀缺的是清晰度
未来竞争格局预测
图灵子视角下的中国企业家行动路线

待核实 / 风险

GDPval 研究具体参数：文中提到「GPT-5.2 Thinking and Pro models」，需确认 GPT-5.2 是否为正式发布的模型名称还是内部代号；该研究是否已公开发表或仍为预印本。
「四天 startup」学生成果：三个原型（Ticket Passport、Revenue Resilience、Invive）是否有公开展示页面可交叉验证。
「72% 胜率」数据：该数字来自 WebFetch 提取，原文应有更完整的研究引用，建议手动确认原文链接的脚注/参考文献。
原文访问：Substack 部分文章设有付费门槛，本次抓取内容完整度较高，但如有遗漏细节建议订阅原刊核实。