Milestone Review · Vol. VII 2026-04 · 21 milestones · 1948–2021

Engineering the Complex 把复杂当学科 From Norbert Wiener's anti-aircraft predictor to INCOSE's Vision 2035 — a 73-year history of how engineers learned to manage what one person could no longer hold in their head.

系统工程不是工程的某个分支;它是工程之间的学科。从 1948 年 Wiener、Shannon、Macy 会议三股线索同时浮出,到 1986 年 Challenger 在 73 秒里炸成火球教会世界"复杂会反咬",再到 2025 年 SysML v2 + 数字孪生 + STAMP 三者交汇——这是它 73 年的故事。

21 篇里程碑 10 座失败墓碑 10 条反直觉结论 6 张科学家肖像 ~12,000 中文字
编者札记

系统工程是 20 世纪后半叶最容易被误读的学科。它常被当成"流程文档",或被当成"军工的麻烦事"。但翻完 73 年文献后我们发现:它真正解决的,是当一个工程项目大到一个人脑子放不下的时候——某个反馈通路被切断、某份接口规范没人看、某个橡胶圈在低温下脆化但工程师的警报传不到决策层——这种时刻。

我们走访 21 个里程碑(1948–2021),同时给它们陪葬 10 座失败的墓碑。前者告诉你这门学科从哪儿来,后者告诉你它为什么必须存在。

Feynman 1986 年那杯冰水至今没凉。

Figure 1 · Timeline 1948 — 2021

从 Wiener 的控制论到 INCOSE Vision 2035:73 年里程碑分布。深色为 6 篇核心;中灰为 9 篇重要;浅灰为 6 篇辅助。密度峰值出现在 1948-1962 起源期(14 年内 7 件大事)和 1990-2007 标准化期(17 年内 7 件大事)。

起源 1948-56 教科书化 57-68 大工程 69-75 软系统 78-90 标准化 91-07 STAMP+2035 1948 1958 1968 1978 1988 1998 2008 2018 2028 Wiener · Cybernetics Shannon Kelly · Bell Schlager Goode/Machol Forrester · Industrial Dynamics Hall · 七步法 Bertalanffy · GST MIL-STD-499 Limits to Growth Brooks · 人月神话 钱学森 · 文汇报 Checkland · SSM 钱 · OCGS NCOSE Rechtin ISO 15288 Hollnagel · 韧性 SysML Leveson · STAMP Vision 2035 ⬣ 6 核心 (深色填充) · ⬡ 9 重要 (黑色填充) · ◯ 6 辅助 (中灰) 来源:papers.md (21 entries) · 引用数据:OpenAlex API + Google Scholar
Figure 2 · Citation DAG 21 个里程碑 · 67 条引用边

两条万有引力的根:Wiener 和 Shannon 1948 是后世全部 SE 文献的祖先

Leveson 2011 STAMP 为种子,向上拉出 21 个核心节点的引用关系图(含 OpenAlex 拉到的 15 个 STAMP 后继者)。两个最高入度节点是 Wiener 1948(11 条入边)和 Shannon 1948(8 条入边)——它们是从控制论/信息论流向所有后续 SE 文献的源头。注意:本领域 21 篇里程碑只有 4 篇有 DOI,其余皆为书籍/标准/政府报告——这也是 SE 历史的特征:标准与教材的分量远大于期刊论文。

控制论 / 信息论 教科书化 / 系统动力学 软系统 / 中国学派 标准化 / 建筑学 安全 / 数字工程 1948 1957-62 1968-75 1978-91 2002-07 2011+ Wiener 1948 Shannon 1948 Kelly 1950 Schlager 56 Forrester 61 Hall 1962 Goode/Machol 57 Bertalanffy 68 MIL-STD-499 Limits to Growth 72 Brooks 1975 钱学森 1978 Checkland 81 钱 1990 OCGS NCOSE 1990 Rechtin 91 ISO 15288 02 Hollnagel 06 SysML 07 Leveson 2011 · STAMP (seed) Vision 2035 15 篇 STAMP 后继 (OpenAlex)
种子 (Leveson 2011)
核心 21 篇
后继 (15 篇)

来源:citation_graph.json · 节点 36 / 边 67 · OpenAlex API 拉取 4 篇有 DOI 论文 + Leveson 2011 STAMP 的 top-15 引用者;其余 17 个节点(书籍/标准/政府报告)的引用关系由领域历史人工编纂。

I
1948 — 1956 · ORIGINS

1948 之夏 · 哲学、数学、组织三股线索同时浮出

在系统工程这个词被发明之前 2 年,三本书和一场会议把"反馈、信息、控制"装进了同一个工具箱。

Norbert Wiener 1963 年肖像
Norbert Wiener(MIT 数学家,1894-1964)——控制论之父。3 岁会读书、11 岁入塔夫茨大学、18 岁哈佛博士,被誉为 20 世纪最罕见的神童。1940-1945 年在 MIT 做高射炮预测器项目,那段经历直接成了 1948 年《Cybernetics》第二章。书名取自希腊文 *kybernetes*(舵手),他从这个词重建出"反馈+信息+控制"统一框架——既适用于飞机、神经元,也适用于市场。 来源:Wikimedia Commons · uploader Garry Olsh · CC0 1.0 · 1963 HIGH

历史学家很少同意一件事:1948 年是奇迹年。三股本来不相干的线索,在那个夏天和秋天突然合流。第一股是哲学。10 月 Wiener 出版《Cybernetics: or Control and Communication in the Animal and the Machine》。"控制论" 这个词他自创——希腊文 kybernetes 是舵手。书里把反馈、信息、自适应放进一个统一框架:高射炮预测器为了击落飞机,必须根据飞机的过去轨迹连续调整瞄准;这个回路本质上和体温调节、神经元放电、市场价格反馈是同一回事。

第二股是数学。同年 7 月和 10 月,贝尔实验室的 Claude Shannon 在《Bell System Technical Journal》连发两期长文,题目是 A Mathematical Theory of Communication。第一次有人把"信息"做成了一个可量化的物理量。一个比特(bit),= 一次有 50% 不确定性的二选一——熵公式 H = −Σ pi log pi 让"信道容量"成为像功率、电压一样可以测量的工程量。

Claude Shannon 1950s 肖像
Claude Shannon(贝尔实验室 → MIT,1916-2001)——信息论之父。1948 年那篇 79 页的论文如今被引用近 8 万次,是 20 世纪最重要的工程论文之一。Shannon 写完它在贝尔实验室办公室里玩独轮车、抛接 4 球,亲手做了能下棋的机械鼠 Theseus——它是世界上第一台能"学习"的机器。 来源:Wikimedia Commons · Tekniska museet (Sweden) · CC BY 2.0 · c.1950s HIGH

第三股是组织。Wiener 和 Shannon 不孤独——他们都参加了 1944-1953 年间著名的 Macy Conferences。这个跨学科沙龙把数学家、生物学家、人类学家(包括 Margaret Mead、Gregory Bateson)拉到一张桌前,专门讨论"反馈和目的"。两年间他们形成的知识共识是:控制+通讯+反馈三件事的合一是新学科

8
1948 年 Wiener 给"反馈+信息+控制"一个哲学合一框架,到 1956 年 Schlager 写下 SE 的第一份方法论纲领——一门新学科诞生了。这 8 年是"系统工程"从无到有的全部酝酿期。

1956 年 7 月,IRE Transactions on Engineering Management 上有一篇只有 3 页的小文章:K.J. Schlager 的 Systems Engineering — Key to Modern Development。这是第一次有工程师在公开期刊里坦率写:这个新学科还没共识,但实践已经在了。Schlager 列出 5 步流程(系统分析 → 参数研究 → 综合 → 评估 → 决策),承认"行业实践五花八门",呼吁标准化。

Systems engineering is a method of approach to the solution of new problems. K.J. SCHLAGER · IRE TRANS. ENGINEERING MANAGEMENT · 1956-07
II
1950 · NAMING

大西洋两端的命名仪式 · "systems engineering" 第一次正式登场

1950 年 3 月伦敦皇家学会,Mervin J. Kelly 站起来说:"贝尔实验室有三条腿——研究、系统工程、应用开发。"

"systems engineering" 这个英文短语第一次被正式定义,发生在 1950 年 3 月。那天伦敦的英国皇家学会礼堂里,贝尔电话实验室的执行副总裁 Mervin J. Kelly 做了一场题为 The Bell Telephone Laboratories — An Example of an Institute of Creative Technology 的演讲。讲稿后来发表在《Proceedings of the Royal Society A》第 203 卷第 1074 期 287-301 页。

Mervin J. Kelly · The Bell Telephone Laboratories
PROC. ROY. SOC. A 203(1074):287-301 · DOI 10.1098/rspa.1950.0140
第一次在公开学术场合用 "systems engineering" 一词;首次描述贝尔实验室"研究 / 系统工程 / 应用开发"三腿模式——后被惠普、IBM、施乐 PARC 全部抄袭。

Kelly 当年 56 岁,密苏里农场出身的物理学博士。他在演讲里把贝尔实验室的工作分成三条腿:(1) 基础研究——香农那批人,发表论文;(2) 系统工程——把研究变成产品规格;(3) 应用开发——按规格造出可量产设备。"系统工程"这条腿的存在,是 Kelly 觉得最值得对英国学术界讲的事——它解决的是"研究和工程之间的鸿沟"。

同一时间在 MIT,Bell Labs 派去的 G.W. Gilman 开了第一门正式叫 Systems Engineering 的课,学生 18 人。这门课至今还在 MIT 开(编号 ESD.83),成为 SE 教育的鼻祖。1951 年 DoD 把"systems engineering"写进合同文本。1948-1956 这 8 年,系统工程从一个没有名字的实践,变成了一个有名字、有教科书、有合同条款的学科

值得记住的细节:直到 1969-07-17 DoD 颁布 MIL-STD-499 之前,"systems engineering" 是一个口头共识——每家公司怎么做都对。MIL-STD-499 第一次把它法律化:所有承包国防部项目的公司,必须按某种方式做 SE。这是用法律把口头共识固定下来的时刻。

III
1957 — 1968 · TEXTBOOKS

教科书三连击 · Goode → Forrester → Hall → Bertalanffy

11 年里写出了哲学、数学、流程、教科书四件事——一门学科该有的,1968 年底全部齐备。

Ludwig von Bertalanffy 1926 年肖像
Ludwig von Bertalanffy(奥地利生物学家,1901-1972,照片摄于 25 岁)——一般系统论 (GST) 之父。1937 年在芝加哥第一次讲 GST,被生物学界冷遇。30 年后,1968 年终于把多年讲稿合集出版 *General System Theory*。核心主张是"整体大于部分之和"——不是诗意比喻,是严格的数学陈述(涉及"涌现性"emergent property)。 来源:Wikimedia Commons · Bertalanffy Center 档案 · Public Domain · 1926 HIGH

如果说 1948-1956 是哲学和命名期,1957-1968 这 11 年就是写进课表的时期。1957 年 McGraw-Hill 出版了 Goode 和 Machol 合写的 System Engineering: An Introduction to the Design of Large-Scale Systems——历史上第一本以 "system engineering" 命名的教科书。3 年后,1960-10-30 Goode 在密歇根遇车祸身亡,没机会写第二版。

1961 · Forrester:给系统装上数学引擎

Forrester 1939 年从内布拉斯加农场考到 MIT,二战期间领导 Whirlwind 计算机项目,1953 年开始领导 SAGE 防空系统。1956 年他从 Lincoln Lab 调到 MIT Sloan 商学院,把 SAGE 仿真经验带到管理学。他用一个例子说服了整个商学界:牛鞭效应。一个 4% 的零售需求波动,经过零售商 → 批发商 → 工厂三级反馈,会被放大成工厂端 40% 的产能波动。

牛鞭效应放大倍数:4% 的零售需求波动,经过零售-批发-工厂三级反馈,被放大到 ~40% 的工厂产能波动。Forrester 用 DYNAMO 仿真语言精确推演出来这个现象——让"系统动力学"成为一个独立学科。

1962 · A.D. Hall:把方法论流程化

同年 Bell Labs 的 Arthur D. Hall 出了 A Methodology for Systems Engineering。Hall 在贝尔实验室工作了 25 年。这本书最重要的贡献是七步法:问题定义 → 价值系统设计 → 系统综合 → 系统分析 → 备选方案选择 → 行动计划 → 实施。外加一个三维 Hall Morphology 矩阵:时间(项目阶段)× 逻辑(七步法)× 知识(专业领域)。这个三维框架到今天还印在 INCOSE 教科书里。

Hall 七步法的实质是让一个非系统专家的工程师,也能跑系统工程流程。从此 SE 不再是 Wiener、Shannon 那种天才的专属——它变成了一种可教、可重复、可考核的手艺。

1968 · Bertalanffy:哲学顶帽

最后一块拼图来自一位生物学家。Bertalanffy 1937 年就在芝加哥讲过"一般系统论"(GST),但生物学界冷遇,他自己也没出书。30 年后,1968 年他终于把多年讲稿合集成 General System Theory: Foundations, Development, Applications。核心主张:整体大于部分之和——不是诗意比喻,是严格的数学陈述。开放系统、等效终态(多种路径到同一终点)、自组织——这些概念在 Bertalanffy 之前是各自分散的,他第一次把它们做成统一理论。

到 1968 年底,系统工程拥有了哲学(Bertalanffy)、数学(Wiener/Shannon)、仿真(Forrester)、流程(Hall)、教科书(Goode-Machol)——一个学科该有的,全都有了。

IV
1969 — 1975 · MEGAPROJECT CRISIS

大工程时代的三种崩溃

阿波罗、Limits to Growth、IBM OS/360——同时撞上了"复杂会反咬"这堵墙。

Frederick P. Brooks Jr. 2007 年肖像
Frederick P. Brooks Jr.(UNC,1931-2022,照片摄于 2007 年柏林)——IBM System/360 项目经理,《人月神话》作者,1999 年图灵奖。Brooks 1964-65 领导 IBM OS/360 操作系统开发,1000 名程序员、5 亿美元预算、严重延期;1965 年离开 IBM 去 UNC 当系主任。1975 年 200 页复盘随笔集成为软件工程必读,定义了软件项目的"物理定律"。1986 年又写《No Silver Bullet》。 来源:Wikimedia Commons · SD&M (sdm.de) · CC BY-SA 3.0 · 2007 HIGH

把"系统工程"教给一代工程师之后,1960 年代末美国进入了一个史无前例的大工程时代:阿波罗、洲际导弹、跨洲电网、IBM 的 OS/360 操作系统、波音 747。这种规模没人见过。然后所有这些项目几乎同时遇到了麻烦

1969-07-17 · MIL-STD-499:用法律治超支

F-111 战斗轰炸机项目(1962 立项)超支 200%,下马的海军 Typhon 反舰导弹烧掉了几亿美元。DoD 1969 年 7 月 17 日颁布 MIL-STD-499,第一次把 SE 强制写进所有军方合同。这份标准只有 14 页,但极有杀伤力。它要求每一个国防项目必须交付:SEMP(系统工程管理计划)、WBS(工作分解结构)、ICD(接口控制文档)、TPM(技术性能指标)。这四件事到今天还是 SE 的"基本功"。

这条标准演化链是 SE 史的主轴:MIL-STD-499 (1969) → 499A (1974) → 499B 撤回 (1994, 因 Perry 副部长认为"过于刚性") → EIA/IS-632 (1994) → ANSI/EIA 632 → IEEE 1220 → 最终 ISO/IEC 15288:2002。

1972-03 · Limits to Growth:把地球当一个系统

1972 年 3 月,由 70 位欧美知识分子组成的"罗马俱乐部"发表了 Donella Meadows 等四位 MIT 研究者的报告 The Limits to Growth。报告用 Forrester 系统动力学方法搭建了一个 12 变量的全球模型 World3:人口、工业产出、食物、不可再生资源、污染……让计算机仿真未来 100 年。结论:如果指数增长继续,人口和工业产出会在 2050 年之前崩溃。这本书全球卖出 3000 万册。

1980 年 Julian Simon 和 Paul Ehrlich 打了一个著名的 10 年赌局——赌 5 种金属价格 1990 年是涨是跌,Simon 赢了。但 30 年后 Graham Turner 用 1972-2014 的实际数据对比 World3 "标准跑动",发现实际轨迹与"商业惯性"情景高度吻合。Limits to Growth 的真正贡献不是"准确预测",而是第一次把整个地球当作一个反馈系统建模。气候变化的所有 IAM 模型——比如 Nordhaus 2018 诺贝尔奖工作的 DICE 模型——都是这棵树的分枝。

1975 · Brooks:人月神话定律

同样是 1960 年代末,IBM 在做让大型机统一的操作系统 OS/360。项目经理 Brooks 35 岁,最高峰时项目里 1000 名程序员。OS/360 严重延期,预算从 1.25 亿烧到 5 亿美元。10 年后 Brooks 出版 The Mythical Man-Month——核心是布鲁克斯定律

Adding manpower to a late software project makes it later. FRED BROOKS · MYTHICAL MAN-MONTH · 1975

为什么?因为 n 个人的项目沟通成本是 n(n-1)/2 = O(n²)。一个 100 人的项目有 4950 条沟通通道。新加 10 个人,不只意味着新加产能,更意味着新加 1045 条沟通成本。更深的洞见在第 14 章:"hatching a catastrophe":软件项目不是突然炸掉的,是每天慢一天慢慢死的。Brooks 1986 年又发了 No Silver Bullet,区分了"本质复杂性"(问题本身的)和"附属复杂性"(工具/语言/流程引入的)。这个区分今天还在用。

V
1978 — 1990 · SOFT TURN + 中国学派

软系统转向与中国学派 · Hall 七步法对人无效

钱学森把 SE 搬进中国;Checkland 把"硬系统"打回原形;NCOSE 在西雅图把这门学科变成全球专业。

钱学森 1950 年代末肖像
钱学森(1911-2009,照片摄于 1955 年归国后)——Caltech 喷气推进实验室创始人之一,回国后主持"两弹一星"。1978-09-27 与许国志、王寿云在《文汇报》发表《组织管理的技术——系统工程》——9000 字长文,第一次公开把美国军工的 SE 流程和苏联控制论合并起来。1990 年又发表 OCGS(开放复杂巨系统)论文,自我修正——承认 1978 那套对人体、社会、经济失效。中国 1980 年代之后几乎所有理工大学都设了"系统工程"专业,直接来源是这 9000 字。 来源:Wikimedia Commons · 中科院档案 · Public Domain (PD-China) · late 1950s HIGH

1970 年代末发生了两件事:(1)Hall 七步法在处理"人参与的系统"——医院、城市、企业人事——时屡屡失败,失败案例堆成山;(2)中国改革开放,钱学森把美国军工 SE 和苏联控制论搬回国内做组合。这两条线一冷一热,在 1990 年汇合。

1978-09-27 · 钱学森的文汇报文章

1978 年 9 月 27 日,《文汇报》第 4 版头条登了一篇 9000 字长文:《组织管理的技术——系统工程》。署名:钱学森、许国志、王寿云。钱学森那年 67 岁,从 Caltech 喷气推进实验室回国 23 年,主持完了"两弹一星"。他在文章里第一次公开把美国军工的 SE 流程(他在 Caltech 教过 SE-like 课程)和苏联控制论合并起来,称之为"组织管理的技术"——把军工的总体设计部模式(Chief-Designer Office)推广到全社会的复杂工程。

1981 · Checkland 的软系统革命

同年——其实是 1979——英国兰开斯特大学的 Peter Checkland 发表了一篇综述,1981 年集结成书 Systems Thinking, Systems Practice。Checkland 在英国 ICI 化工厂做了 10 年咨询。他发现:Hall 七步法对石化工厂、火箭、计算机这种"硬"系统好用;但搬到医院、人事改革、城市这种"软"系统就完全失效

他的诊断:硬系统假设大家对"问题"有共识。软系统的真问题是没人对"问题是什么"达成一致。所以 SE 第一步不该是"问题定义",而应该是"画一张富图"(Rich Picture)——把所有利益相关者的不同视角画在一张图上。Checkland 提出 SSM 七步法 + CATWOE 框架(Customer / Actor / Transformation / Weltanschauung / Owner / Environment)。

CATWOE 里的 Weltanschauung(世界观)这个德文词,是 Checkland 故意选的——提醒工程师没有客观的系统,只有从某个世界观看到的系统

1990-01 · 钱学森的自我修正

12 年后,1990-01 钱学森、于景元、戴汝为合写《一个科学新领域——开放的复杂巨系统及其方法论》。这篇文章的实质是钱学森对自己 1978 文章的修正。他承认:1978 年那种"军工总体设计部"模式应付不了三类系统——人体、社会、经济。这三类是"开放的复杂巨系统"(OCGS)。他提出"从定性到定量综合集成法",1992 年配套了"综合集成研讨厅体系"——本质上是把人类专家、统计模型、计算仿真三者通过工作流串起来。这思想跟 Checkland 的 SSM 几乎同时、独立到达。

1990-08 · NCOSE 在西雅图成立

同年 8 月,35 家美国公司(波音、洛克希德、雷神、TRW、IBM、惠普……)+ NASA、DoD 工程师在波音西雅图工厂开会,成立 NCOSE。首任主席 Brian P. Mar,约 200 人参会。5 年后改名 INCOSE。今天 INCOSE 17000+ 会员,覆盖 80+ 国,是全球 SE 的官方机构。INCOSE 成立 = 系统工程从"军工部门内的手艺"正式变成"开放、跨行业、可考证的专业"。

VI
1991 — 2007 · STANDARDIZATION

标准化与建筑学 · 学科要不要把自己降级成"流程"?

Rechtin 说 SE 是艺术,ISO 15288 把它做成 25 个流程,Hollnagel 说流程救不了一切。

NCOSE 成立后的 17 年,是 SE 历史上最规整的标准化期。这一时期的张力是:学科要不要把自己降级成"流程"?

1991 · Rechtin:把建筑师隐喻引进来

1991 年 USC 教授 Eberhardt Rechtin 出版 Systems Architecting: Creating and Building Complex Systems。Rechtin 在 JPL 做了 25 年——他造过 Voyager 火星探测器的深空通讯网络。这本书的核心主张是:

Systems architecting is the art that systems engineering is the science. EBERHARDT RECHTIN · USC · 1991

标准化的 SE(流程、文档、检查表)解决不了大型项目里的判断问题。判断问题需要的是架构师——一种像建筑师那样靠经验、品味、启发式(heuristics)做决定的角色。Rechtin 在书里收录了 200+ 条启发式规则,例如"All the serious mistakes are made in the first day."(所有大错都发生在第一天)。这些"格言"在 1990 年代被批评为"不科学"。但 30 年后回头看,Rechtin 是对的——大系统的关键决策无法被标准流程覆盖。

2002-11 · ISO/IEC 15288:把 SE 装进国际标准

1994 年 ISO 工作组 JTC1/SC7/WG7 启动,由 INCOSE 担任技术伙伴。主编 Stuart Arnold(英国 BAE Systems),首席架构师 Harold Lawson(瑞典)。8 年讨论后,2002-11-01 ISO/IEC 15288:2002 *Systems engineering — System life cycle processes* 正式发布。这份标准把 SE 拆成 25 个流程,分 4 大类:协议过程(与外部组织签合同)、组织项目使能过程、项目过程、技术过程。

ISO 15288 在 2008、2015、2023 三次修订。今天 IEEE/ISO 15288:2023 是全球 SE 的默认参考标准——美国 DoD、欧洲 ESA、中国航天、日本 JAXA 都用它。

2006 · Hollnagel 的韧性工程:流程救不了一切

2003-02-01 哥伦比亚号航天飞机解体。事故调查报告 (CAIB) 发现:泡沫脱落是直接原因,但组织文化和流程僵化才是根本原因——和 1986 年 Challenger 一模一样。这次事故让一群工程心理学家、人因专家、安全工程师重新聚首,提出:对复杂系统而言,流程能告诉你"正常情况下怎么做",但事故都发生在"不正常情况下"

2006 年 Erik Hollnagel(瑞典)、David Woods(俄亥俄州立)、Nancy Leveson(MIT)合编 Resilience Engineering: Concepts and Precepts。提出 Safety-II(安全 = 系统在变化中持续成功的能力)对抗传统 Safety-I(安全 = 出错频率低)。韧性工程四能力:响应、监视、学习、预见。后面 Leveson 自己 2020 年发表 Safety III 公开反驳:复杂系统的安全本质还是控制问题,韧性论调过于乐观。

2007-09 · SysML 1.0:可视化语言

2001 年 INCOSE 和 OMG 联合发出 RFP,要求为 SE 定义一种基于 UML 的建模语言。6 年后,2007-09 OMG 正式发布 SysML 1.0——9 种图。SysML 让"模型"取代"文档"成为 SE 的核心制品。这种范式叫 MBSE(基于模型的系统工程)——INCOSE 在 2007 年 Vision 2020 把 MBSE 列为 SE 的未来主轴。SysML 1.x 跑了 17 年,2024-2025 SysML v2 把模型从"图"升级到"语言+API",可以被代码读、被 AI 训练、被数字孪生消费。

VII
2011 — 2021+ · SAFETY + DIGITAL ENGINEERING

STAMP 安全革命与数字工程未来

Leveson 把"事故"重新定义成"控制失效";INCOSE Vision 2035 把整个 SE 范式拖进数字工程。

Nancy Leveson 2022 年肖像
Nancy Leveson(MIT 教授,1953-,照片摄于 2022 年 Purdue 演讲)——STAMP/STPA 创始人。1985-87 Therac-25 放疗机软件杀死/重伤 6 人事件是她转向系统安全的契机。1995 年第一本《Safeware》已提出系统视角,2011 年《Engineering a Safer World》体系化为 STAMP 模型——核心:事故是控制失效,不是元件坏掉。她创办 SafeWare Engineering 服务多家 Fortune 500,2020 年发表 *Safety III* 公开反驳 Hollnagel Safety-II。 来源:Wikimedia Commons · Purdue Engineering · CC BY 3.0 · 2022 HIGH

Nancy Leveson 是 MIT 计算机系教授,研究横跨 SE / 安全 / 系统工程。1985-1987 年 Therac-25 杀人事件是她转向系统安全的契机。2011 年她出版 570 页的 Engineering a Safer World: Systems Thinking Applied to Safety(MIT Press 开放获取)。核心模型 STAMP(System-Theoretic Accident Model and Processes)的底层假设是:

Accidents are control failures, not component failures. NANCY LEVESON · MIT · 2011

传统事故分析(FTA, Fault Tree Analysis)从一个"故障元件"出发,往上推。但 Leveson 发现,越来越多的现代事故(Therac-25、Bhopal、Walkerton 饮水细菌污染、Black Hawk friendly fire)里,没有任何元件坏掉——是层级控制结构里的某个反馈被切断、某个心智模型偏离实际、某个权限被错配。

她提出配套方法论 STPA(System-Theoretic Process Analysis)——系统化危险识别方法,把系统画成层级控制结构,然后枚举每一层的"不安全控制行为"。STPA 在 2010 年代被 NASA、FDA、汽车工业、核电监管广泛采用。Leveson 后来用 STAMP 重新分析 Columbia 航天飞机事故、737 MAX MCAS、特斯拉 Autopilot——结果都比传统方法找到更多组织层面的根因。

2021-12 · INCOSE Vision 2035:未来 13 年的路线图

2014 年 INCOSE 出过 SE Vision 2025。但 2020 年新冠 + AI 大语言模型出现,整个文档失效。INCOSE 重启工作组,由 50+ 国 1500+ 实践者参与,2021-12 发布 Systems Engineering Vision 2035。这份 25 页的报告提出 4 个范式转移:

  1. From document-based to model-based——从文档到模型(MBSE/SysML v2)
  2. From single-disciplinary to multi-disciplinary digital engineering——从单学科到跨学科数字工程
  3. From reactive to predictive (digital twin)——从被动响应到预测式(数字孪生)
  4. From human-only to human-AI collaboration (SE4AI/AI4SE)——从人工到人-AI 协作

最后一点最敏感。INCOSE 区分了两个方向:SE4AI(用系统工程方法设计 AI 系统,保证 AI 可控、可验证、可解释)和 AI4SE(用 AI 增强系统工程过程)。到 2025 年初,AI4SE 已经在工业界产生效果——大型项目用 LLM 自动从 1 万页规范中提取需求,过去 6 周的工作压缩到 1 天。

Interlude · 失败技术公墓 · 10 座墓碑

十座 tombstones ——~100 亿美元 + ~360 条人命教出来的反面教材

不收"理论败北",只收"真有人死、真有钱烧、真有项目被叫停"的案例。SE 共识不是被某位天才建立的——是被这些尸体一具一具教出来的。10 座墓碑按时间排序,分成 4 类:安全软件失败、接口与单位失败、组织与文化失败、部署与流程失败。

I.
Three Mile Island
PWR control room failure
1979-03-28 · 🇺🇸 PA
主张纵深防御 + 告警面板足以让操作员正确响应任何瞬态。
致命PORV 卡开但指示灯显示"已关闭",操作员误判堆芯水位高、关停高压注射,约 50% 燃料熔化。
遗产人因工程进核电执照评审;NUREG-0700;INPO 行业自律。
值班长 Craig Faust 后来作证:"我看到墙上 100 多个红灯亮起,听到至少 6 种喇叭声,我根本分不清哪个先响。" 整场事故操作员喝了约 12 壶咖啡。
II.
Therac-25
Race condition in radiation therapy
1985–1987 · 🇨🇦/🇺🇸
主张软件互锁取代硬件互锁——更便宜、更灵活;软件经过实战验证无需独立形式化分析。
致命6 起严重过量辐射事故,3 死 3 重伤(最严重者 ~100 倍正常剂量)。1993 Leveson 论文逐行拆解:操作员 8 秒内修改光束类型 → 计数器溢出 → 互锁失效。
遗产IEC 61508 SIL;FDA SaMD 法规;几乎所有软件工程教材必读案例。
东德州癌症中心 Ray Cox 第二次过量后冲出治疗室喊:"你们对我做了什么?" 操作台只显示 "MALFUNCTION 54",AECL 客服建议"按 P 继续"。
III.
Challenger
Normalization of deviance
1986-01-28 · 🇺🇸
主张O-ring 历次烧蚀都"在可接受范围"——上次没事这次也没事。
致命升空 73 秒后火球爆炸,7 名宇航员死亡。Diane Vaughan 1996 揭示是"正常化越轨" + 工程师警告被压制。
遗产Roger Boisjoly 工程师警告流程标准化;NASA 安全文化重塑;SE 教材必收的"组织事故"案例。
Feynman 在 1986 Rogers 委员会发布会当众把 O-ring 浸入冰水演示——它瞬间脆化。"For a successful technology, reality must take precedence over public relations."
IV.
Chernobyl
Organizational accident, RBMK
1986-04-26 · 🇺🇦/🇷🇺
主张RBMK 反应堆运行规程足以应对所有低功率瞬态;操作员服从命令即可。
致命4 号机组凌晨低功率测试中正反馈失控,蒸汽爆炸释放 5.3 EBq 放射性。James Reason 1990 据此提出"瑞士奶酪"组织事故模型。
遗产WANO 全球核电运营者协会;IAEA 文化指标;STAMP 模型间接受到启发。
控制员 Akimov 直到死前都不相信反应堆已经爆炸——他派人去看堆顶时,那个员工先看到的是辐射检测器爆表。
V.
Ariane 5 Flight 501
Reused legacy software
1996-06-04 · 🇫🇷/🇪🇺
主张Ariane 4 SRI 惯导软件经过 5 年实战,可直接复用到 Ariane 5。
致命发射 37 秒自毁,损失 ~3.7 亿美元。原因:64 位浮点水平速度转 16 位整数溢出,新型号速度比 Ariane 4 大但代码无 try/catch。
遗产软件复用必须经新环境完整测试;ESA 复用准则改写;ICD 工程在欧洲航天界严格化。
事故报告 Lions 报告:故障根因是"未按 Ariane 5 实际飞行轨迹做仿真"——这种简单测试 Ariane 4 团队做过,Ariane 5 团队认为"复用就不用再做了"。
VI.
Mars Climate Orbiter
英制/公制单位错配
1999-09-23 · 🇺🇸
主张洛克希德和 JPL 是同一个项目,单位约定不必明文写在 ICD。
致命火星气候轨道器失踪,损失 3.27 亿美元。洛克希德地面软件用磅力·秒,JPL 飞行软件用牛顿·秒。轨道注入推力计算偏差 4.45 倍,探测器烧毁在火星大气。
遗产NASA 项目"任何接口必须有书面 ICD"硬性规定;单位转换在所有 NASA 软件入口校验。
事后调查:洛克希德工程师其实在导航数据里写过"lbf-s",JPL 团队从未读这份元数据——3.27 亿美元的预算和 1 行文档的距离。
VII.
FBI VCF + Sentinel
Government IT mega-failure
2005, 2010 · 🇺🇸
主张大瀑布合同 + 单一承包商可在 36 个月交付 FBI 案件管理系统。
致命VCF 项目 2005 取消(损失 $170M,净 $104M);继任 Sentinel 烧 $451M、6 年才上线。GAO 报告指控制流程失效 + 需求漂移 + SE 治理缺失。
遗产美国联邦 IT 项目转向敏捷/迭代;FITARA 法案;TechFAR 现代化合同范式。
VCF 报废前 FBI 探员仍在用 1990 年代的 ACS 终端——9/11 之后无法跨办公室共享线索的核心原因之一。
VIII.
A380 接线危机
CATIA v4/v5 incompatibility
2006 · 🇪🇺
主张汉堡和图卢兹工厂用各自习惯的 CAD 版本不影响整机集成。
致命线束图纸长度不一致——汉堡 CATIA v4、图卢兹 CATIA v5——整机 530 公里布线需返工。A380 推迟 2 年交付,亏损 ~60 亿欧元。空客 CEO Forgeard 辞职。
遗产MBSE/数字孪生鼻祖案例;空客转向"single source of truth"模型驱动工程;后续 A350 全 CATIA v5。
工程师后来回忆:当 530 公里电缆铺好后才发现两端长度不对——必须把整个机身的电缆重新拆一遍,每架飞机的人工成本是原计划 4 倍。
IX.
Boeing 737 MAX MCAS
Single-point failure + hidden control
2018-10, 2019-03 · 🇺🇸
主张737 MAX 与老 737 同型号证书,MCAS 是"轻微调整"——飞行员不需要专门训练,FAA 监管可走快速通道。
致命狮航 JT610(189 死)+ 埃航 ET302(157 死)共 346 死。MCAS 由单一 AoA 传感器触发,自动俯冲 2.5° 反复执行。Leveson 用 STAMP 重做分析揭示 23 处控制结构失效。
遗产FAA 认证流程改革;波音 CEO 辞职 + 200 亿美元损失;MCAS 改为双 AoA 比较 + 飞行员可关停。
埃航 ET302 副驾驶 Yared Getachew 25 岁,发现 MCAS 反复俯冲后大喊 "Pull up, pull up!"——但他和机长之前都不知道 MCAS 存在。
X.
Knight Capital
Deployment inconsistency, no kill-switch
2012-08-01 · 🇺🇸
主张新交易系统部署到 8 台服务器、回滚机制完备、无需人工 kill-switch。
致命部署到 7 台正确,第 8 台旧代码触发"测试模式"——45 分钟内 154 只股票自动连环交易,亏损 4.4 亿美元。Knight 当周流动性危机,被 Getco 收购。
遗产SEC Reg SCI 法规(市场系统必须有 kill-switch);金融业部署一致性自动检测成为标配;CI/CD 蓝绿部署主流化。
Knight CEO Tom Joyce 当天告诉媒体:"我们 17 年来第一次在交易日亏钱——也是最后一次。" 4 个月后公司被卖。
十座墓碑的共同启示 10 个失败加起来烧掉了约 100 亿美元 + 约 360 条人命,但教训只有 3 条: (1) 接口是第一战场。Ariane、MCO、A380 三个加起来 ~100 亿美元——SE 的本质工作不是子系统设计,是子系统之间的合同。 (2) 复用与正常化是慢性毒药。"上次没事"不是证据,是认知偏差。 (3) 告警与 kill-switch 必须存在并被使用。出事时人能不能"快速停下来"决定了灾难的量级。
Epilogue · 10 Counterintuitive Conclusions

十条反直觉结论 · 给工程师、管理者、投资者、政策制定者用

  1. 系统工程不是"工程的子学科",是"工程之间的学科"。它的工作不在子系统里,在子系统接口上。Ariane 5 那 64 位/16 位溢出,发生在 Ariane 4 软件和 Ariane 5 硬件的"合同"上,没有任何元件坏掉。
  2. 复杂系统的安全 ≠ 元件可靠。Therac-25 软件没有 bug——它做的事和说明书完全一致。问题在于操作员心智模型、安全互锁逻辑、监管反馈三个子系统的接口。Leveson 的 STAMP 模型把这种"非元件失效"事故首次理论化。
  3. "上次没事"不是证据,是认知偏差。Challenger 前 24 次飞行 O-ring 都烧蚀过,每次都被记入"在可接受范围"。这种 normalization of deviance 是 1980-1990 年代 NASA 文化的死因。
  4. 增加沟通成本是非线性的。布鲁克斯定律:n 人项目沟通通道是 n(n-1)/2 = O(n²)。100 人项目有 4950 条通道。每加一个人不是加一份产能,是加 N 条新通道。
  5. 流程能解决"重复的复杂",但解决不了"独特的复杂"。ISO 15288 的 25 个流程对火箭发射可用,对城市规划/医院改革/经济政策必败。Checkland 1981 软系统方法论 + 钱学森 1990 综合集成论独立地到达了这个结论。
  6. "硬系统方法"对人无效。有人参与的系统里,问题本身没有共识。SE 的第一步不是"问题定义"——是"画一张包含所有视角的富图"。CATWOE 里的 Weltanschauung(世界观)一词是故意用德文的——提醒工程师没有客观的系统。
  7. "工程师是中立的"是一种自我欺骗。Challenger 工程师 Roger Boisjoly 1985 年 7 月就警告 O-ring 低温失效,被 Morton Thiokol 管理层压制。Therac-25 操作员看到 MALFUNCTION 54 错误码无解。一个工程师的"我已经报告过了"远远不够——SE 必须把警告做成不可被忽略的控制信号。
  8. 数字孪生不是仿真,是"实时监控+控制"。传统仿真做完就扔;数字孪生在系统运行期间持续在线,对真实系统做反馈控制。波音 787 引擎、特斯拉车队、电网都是这个模式。INCOSE Vision 2035 把数字孪生列为 SE 未来 13 年的核心范式。
  9. SE 的"科学性"是被反驳的——它本质是工程艺术。Rechtin 1991 那句 "systems architecting is the art that systems engineering is the science" 是对的。100 年后看,标准化的 SE 流程负责"避免最差",架构师的判断负责"接近最优"。两者都不可缺。
  10. 系统工程的真正成本是"不做"的成本。FBI VCF 烧 1.7 亿美元失败,Sentinel 又烧 4.5 亿美元 6 年才上线——这些被人嘲笑。但波音 737 MAX 不做完整 SE 评估省了几个月时间,付出了 346 条人命 + 200 亿美元损失。Brooks 1975 年那句话 73 年后仍然成立:软件项目里时间不是节约出来的,是付出来的。要么前期付,要么后期付百倍。
Appendix · 21 Milestones 1948 — 2021 · 73 years

21 篇里程碑 · 6 个时代 · 73 年

#年-月类型地域影响力作者 · 标题引用数关键数字
Era 1 · 起源 (1948-1956):控制论 / 信息论 / Bell Labs 命名
11948-10🇺🇸 核心Wiener · Cybernetics · MIT/Wiley~80,000反馈+信息+控制合一
21948-07/10论文🇺🇸 核心Shannon · A Mathematical Theory of Communication · BSTJ~80,000H = −Σp log p · bit
31950-03演讲🇺🇸 重要Kelly · The Bell Telephone Laboratories · Proc. Roy. Soc. A 203(1074):28717"systems engineering" 首次正式使用
41956-07论文🇺🇸 辅助Schlager · Systems Engineering – Key to Modern Development · IRE TEM113SE 第一份方法论纲领
Era 2 · 教科书化 (1957-1968):工程化与体系化
51957🇺🇸 重要Goode & Machol · System Engineering · McGraw-Hill~3,000第一本以"系统工程"命名的教科书
61961🇺🇸 核心Forrester · Industrial Dynamics · MIT Press~22,000牛鞭效应 4× 放大
71962🇺🇸 重要A.D. Hall · A Methodology for Systems Engineering · Van Nostrand~4,500七步法 + 三维 Hall Morphology
81968🇦🇹/🇨🇦 重要Bertalanffy · General System Theory · Braziller~70,000整体大于部分之和
Era 3 · 大工程 (1969-1975):NASA + DoD + 软件危机
91969-07-17标准🇺🇸 重要DoD · MIL-STD-499 Engineering ManagementSEMP / WBS / ICD / TPM
101972-03报告🌐 重要Meadows et al · The Limits to Growth · Universe Books · 罗马俱乐部~30,000World3 12 变量预测 ~2050 崩溃
111975🇺🇸 核心Brooks · The Mythical Man-Month · Addison-Wesley~30,000n(n-1)/2 = O(n²) 沟通
Era 4 · 软系统转向 + 中国学派 (1978-1990)
121978-09-27论文🇨🇳 核心钱学森 · 许国志 · 王寿云 · 组织管理的技术——系统工程 · 文汇报中国学派起点
131981🇬🇧 重要Checkland · Systems Thinking, Systems Practice · Wiley~25,000SSM 七步法 + CATWOE
141990-01论文🇨🇳 辅助钱学森 · 于景元 · 戴汝为 · 开放的复杂巨系统及其方法论 · 自然杂志OCGS + 综合集成研讨厅
151990-08事件🇺🇸 辅助NCOSE 创立 · 西雅图 · 35 公司 + NASA/DoD1995 改名 INCOSE,今日 17,000+ 会员
Era 5 · 标准化与建筑学 (1991-2007)
161991🇺🇸 辅助Rechtin · Systems Architecting · Prentice Hall · USC~6,000"art that science" + 200+ 启发式
172002-11标准🌐 重要ISO/IEC · 15288 Systems engineering — System life cycle processes25 流程 / 4 大类
182006🇸🇪/🇺🇸 重要Hollnagel · Woods · Leveson · Resilience Engineering · Ashgate~9,000Safety-II 四能力
192007-09标准🌐 辅助OMG · SysML 1.0 · Object Management Group9 种图 / MBSE 起点
Era 6 · STAMP + 数字工程 (2011-2021)
202011🇺🇸 核心Leveson · Engineering a Safer World · MIT Press · DOI 10.7551/mitpress/8179.001.0001~5,000STAMP / STPA · 事故=控制失效
212021-12报告🌐 辅助INCOSE · SE Vision 2035MBSE / digital twin / SE4AI

来源:papers.md · 引用数据:OpenAlex API(4 篇有 DOI)+ Google Scholar 估算(书籍/标准/事件无 DOI 故引用数为粗估)。本领域 21 篇里程碑只有 4 篇有 DOI,其余皆为书籍/标准/政府报告——这是 SE 历史的特征:标准与教材的分量远大于期刊论文。