达里奥·阿莫迪 & 丹妮拉·阿莫迪

兄妹携手的安全AI先驱

我们必须假设AI系统最终会变得极其强大。在那一天到来之前，人类必须建造足够坚固的"护城河"来确保AI始终服务于人类利益。 —— 达里奥·阿莫迪旧金山的一间会议室里，灯光昏暗。窗外是旧金山湾的夜景，海湾大桥的灯火在夜色中闪烁。达里奥·阿莫迪站在落地窗前，望着那座连接两座城市的钢铁巨桥。他的妹妹丹妮拉坐在会议桌旁，手指无意识地转动着一支笔。那是2020年的某个深夜。两人刚刚结束与OpenAI董事会的最后一次谈话。空气中弥漫着一种奇怪的平静——不是和解的平静，而是各自都已做出决定的平静。 "我想好了。"达里奥说，依然背对着妹妹，望着窗外的夜景。 "我也是。"丹妮拉回答。他们决定离开。离开那家他们加入时还只是一家小型非营利研究机构的公司，离开那个他们曾经相信的梦想。他们要去创造自己的东西——一种他们认为更安全、更负责任的人工智能。几个月后，Anthropic成立了。 · · · · · ·

两条不同的路

达里奥·阿莫迪和丹妮拉·阿莫迪是兄妹，但他们的背景截然不同。达里奥拥有普林斯顿大学物理学博士学位，专攻生物物理学。他曾在Google和百度从事AI研究，后来加入OpenAI，担任研究副总裁。他的思维模式是典型的技术天才——逻辑严密、注重数据、习惯用数学语言描述世界。丹妮拉则拥有哥伦比亚大学英语文学硕士学位。在硅谷这个满是工程师的地方，她的背景显得颇为另类。她曾在OpenAI领导安全政策团队，研究AI系统的道德框架和治理结构。她擅长的是另一件事——从人类的角度审视技术，思考技术如何影响人们的生活。这种差异从未成为他们之间的障碍。相反，它成为了他们合作的基础。每当达里奥沉浸在技术细节中时，丹妮拉会提醒他："用户会怎么想？"每当丹妮拉提出某个政策建议时，达里奥会问："技术上可行吗？"他们学会了在对方的话语中找到自己缺失的那一块拼图。 · · · · · ·

离开的抉择

关于离开OpenAI的原因，达里奥和丹妮拉从未公开详细说明。但从他们后来的公开言论中，可以看出一些端倪。在多次接受《纽约时报》、《华尔街日报》等主流媒体采访时，达里奥阐述了他对AI风险的深刻担忧。他明确表示，他认为AI可能带来的风险被"严重低估"，且整个行业需要采取更加保守和安全优先的态度。在OpenAI的最后几个月里，这种担忧变成了深深的无力感。他看着这家公司以越来越快的速度向前冲刺，GPT-3、GPT-4、ChatGPT——每一个产品都比他预想的更早到来。他尊重这些成就，但他担心的事情也是真实的：如果继续这样下去，如果不对安全投入足够的关注，事情可能会失控。他和丹妮拉谈了很多次。深夜的电话、周末的咖啡、无数次的深夜长谈。他们讨论技术、讨论商业、讨论使命。但最重要的讨论只有一个核心问题：我们要不要继续留下来？最终，答案是否定的。 "技术安全和人类价值观并不矛盾。我们有机会也有责任确保AI成为人类福祉的推动力。" —— 丹妮拉·阿莫迪 · · · · · ·

Anthropic的诞生

2021年，Anthropic正式成立。"Anthropic"这个词来源于"人类学"——anthropology。公司名称本身就暗示着他们研究的重点是"人类"和"人工智能"之间的关系。从一开始，Anthropic就将自己定位为一家"AI安全公司"，而非单纯的AI技术公司。这种定位体现在公司的方方面面：从组织架构到招聘标准，从产品发布策略到核心技术方向。公司内部流传着一份非正式的"宪章"，阐明了核心原则：安全优先于能力，永远不会发布存在明显安全隐患的模型；透明公开，与学术界和公众分享AI安全研究成果；谨慎扩展，逐步扩展AI能力，给予社会足够的适应时间；责任共担，认识到AI风险是整个社会的挑战，需要多方协作解决。这种理念在硅谷显得有些"非主流"。在那个崇拜"快速行动、打破常规"的地方，Anthropic的谨慎显得格格不入。但也正是这种谨慎，吸引了那些认同他们愿景的人才——那些不仅仅想"建造最强AI"，更想"建造最安全AI"的研究者。 2023年，Anthropic完成了7.5亿美元融资，估值超过180亿美元。2024年，Google向Anthropic投资超过30亿美元，成为最大投资者之一。Anthropic一跃成为全球第三高估值的AI公司，仅次于OpenAI和ByteDance。 · · · · · ·

Claude的诞生

Claude是Anthropic开发的AI助手。与其他AI助手不同，Anthropic在Claude的性格塑造上投入了大量精力。他们采用了一种更加系统化的方法——Constitutional AI，让Claude在训练过程中学习一套明确的行为准则。 Constitutional AI的原理很简单：研究人员为Claude制定了一份"宪章"，包含了数十条行为准则——"尽量减少有害输出"、"尊重用户隐私"、"保持回答的准确性和有用性"。在训练过程中，Claude需要对照这份宪章来评估和改进自己的回答。这种方法的优势在于：它不仅告诉AI"什么不能做"，还教会AI理解"为什么不能做"。通过这种深层次的理解，Claude能够在面对新颖情况时做出更符合人类价值观的判断，而不仅仅是机械地遵循规则。 "我们希望Claude不仅仅是一个工具，而是一个值得信赖的伙伴。就像一个好的助手，Claude会主动帮助你，但也会在你犯错时温和地提醒你。" —— Anthropic官方博客，Claude性格设计理念 · · · · · ·

Claude 3：性能的飞跃

2024年3月，Anthropic发布了Claude 3系列模型，这是继GPT-4之后最重要的AI模型发布之一。 Claude 3系列包含三个版本：Haiku，体积最小、速度最快的版本，适合简单任务；Sonnet，平衡版本，在智能水平和响应速度之间取得最佳平衡；Opus，最强大的旗舰版本，在多项基准测试中超过GPT-4。 Opus展现了接近人类的推理能力，能够处理复杂的逻辑问题、数学证明和多步骤分析任务。它支持高达20万个token的上下文窗口——这意味着它可以一次性阅读并理解整本书籍、代码库或长篇文档。这一能力使它在处理长文本任务时具有独特优势。当评测结果公布时，整个AI社区为之震动。Claude 3 Opus在多项测试中超越了GPT-4，包括MMLU大规模多任务语言理解测试，以及GSM8K小学数学测试。这意味着，在某些维度上，Claude已经比人类专家表现更好。 · · · · · ·

计算机使用：学会操控世界

2024年10月，Anthropic宣布了一个重大突破：Claude获得了"计算机使用"能力。这意味着Claude不仅能回答问题，还能真正操控用户的电脑——打开浏览器、操作软件、点击按钮、填写表格。它的工作方式是：AI在虚拟环境中观察屏幕截图，然后决定要点击哪里、输入什么，就像一个真实的人类用户一样操作电脑。这是一个质的变化。此前的AI助手——包括ChatGPT和Claude——都是"对话型"的：用户提问，AI回答。但当AI能够操控电脑时，它就变成了"行动型"的：用户给出目标，AI自己规划路径、执行操作、完成任务。达里奥在开发者大会上展示了这个功能。他让Claude帮他订一张从旧金山到纽约的机票。Claude自动打开了浏览器，输入了航空公司网站，浏览了航班选项，比较了价格，然后停在支付页面，等待达里奥输入信用卡信息。 "你注意到了吗？"达里奥对观众说，"我让它订票，但它停在支付页面等我。它知道支付需要我的授权，它不会擅自行动。" 这就是Anthropic所说的"安全边界"。Claude不能安装软件，不能访问系统底层，不能执行命令行操作。对于高风险操作，它会暂停并请求用户明确授权。用户可以随时终止Claude的计算机使用会话。 "我们不是在建造一个尽可能强大的AI，"达里奥说，"我们是在建造一个能够被信任的AI。一个你会放心让它操控你电脑的AI。" · · · · · ·

两种不同的声音

硅谷的创业叙事中，兄妹搭档创业的情况极为罕见。但达里奥和丹妮拉正在证明，这种合作模式有其独特的优势。他们的合作体现了独特的优势互补：达里奥负责技术方向和研发领导，丹妮拉则专注于公司文化、运营和政策。在重大决策上，两人经常进行深入讨论，从技术可行性和人类影响两个维度评估每一个重要决定。据内部人士透露，Anthropic的企业文化深受丹妮拉影响。公司强调"建设性质疑"——员工被鼓励对公司的决策提出挑战，无论提出者职位高低。这种文化让Anthropic在快速扩张的过程中，保持着一种独特的批判性思维氛围。 "我们会问自己：'我们是对的吗？'"丹妮拉在一次采访中说，"不是'我们能赢吗'，而是'我们是对的吗'。这是我们和许多竞争对手最大的区别。" · · · · · ·

未完的旅程

从2021年创立至今，不过短短几年时间。但在这几年里，Anthropic已经从一个只有几十人的小团队，成长为拥有数千名员工、数百亿美元估值的AI巨头。Claude已经成为最受企业和开发者欢迎的AI助手之一。Constitutional AI已经成为AI安全领域最具影响力的方法论之一。但对达里奥来说，这只是开始。 "我们不只是在开发一个AI产品，"他在2024年的开发者大会上说，"我们是在为人类建造一个能够真正理解我们、帮助我们、同时不会伤害我们的智能伙伴。" 他望着台下黑压压的人群，那些开发者、研究者、创业者、记者——他们来自不同的国家，说着不同的语言，但都在思考着同一个问题：AI会走向何方？ "我们无法预测未来，"达里奥说，"但我们可以塑造未来。这就是为什么安全不是一种选择，而是一种责任。" 旧金山湾的海风从窗户的缝隙中溜进来，带来一丝咸腥的气息。窗外，海湾大桥的灯火依旧闪烁，连接着旧金山与奥克兰，连接着过去与未来。而在这座桥的另一端，达里奥和丹妮拉正在建造另一种东西——一种他们希望能够连接人类与机器、连接能力与责任、连接现在与未来的东西。他们不知道能否成功。但他们知道，必须尝试。 · · · 第九章 · 完

达里奥·阿莫迪 & 丹妮拉·阿莫迪 ​

两条不同的路 ​

离开的抉择 ​

Anthropic的诞生 ​

Claude的诞生 ​

Claude 3：性能的飞跃 ​

计算机使用：学会操控世界 ​

两种不同的声音 ​

未完的旅程 ​