达里奥·阿莫迪 & 丹妮拉·阿莫迪
兄妹携手的安全AI先驱
我们必须假设AI系统最终会变得极其强大。在那一天到来之前,人类必须建造足够坚固的"护城河"来确保AI始终服务于人类利益。 —— 达里奥·阿莫迪 旧金山的一间会议室里,灯光昏暗。窗外是旧金山湾的夜景,海湾大桥的灯火在夜色中闪烁。达里奥·阿莫迪站在落地窗前,望着那座连接两座城市的钢铁巨桥。他的妹妹丹妮拉坐在会议桌旁,手指无意识地转动着一支笔。 那是2020年的某个深夜。两人刚刚结束与OpenAI董事会的最后一次谈话。空气中弥漫着一种奇怪的平静——不是和解的平静,而是各自都已做出决定的平静。 "我想好了。"达里奥说,依然背对着妹妹,望着窗外的夜景。 "我也是。"丹妮拉回答。 他们决定离开。离开那家他们加入时还只是一家小型非营利研究机构的公司,离开那个他们曾经相信的梦想。他们要去创造自己的东西——一种他们认为更安全、更负责任的人工智能。 几个月后,Anthropic成立了。 · · · · · ·
两条不同的路
达里奥·阿莫迪和丹妮拉·阿莫迪是兄妹,但他们的背景截然不同。 达里奥拥有普林斯顿大学物理学博士学位,专攻生物物理学。他曾在Google和百度从事AI研究,后来加入OpenAI,担任研究副总裁。他的思维模式是典型的技术天才——逻辑严密、注重数据、习惯用数学语言描述世界。 丹妮拉则拥有哥伦比亚大学英语文学硕士学位。在硅谷这个满是工程师的地方,她的背景显得颇为另类。她曾在OpenAI领导安全政策团队,研究AI系统的道德框架和治理结构。她擅长的是另一件事——从人类的角度审视技术,思考技术如何影响人们的生活。 这种差异从未成为他们之间的障碍。相反,它成为了他们合作的基础。每当达里奥沉浸在技术细节中时,丹妮拉会提醒他:"用户会怎么想?"每当丹妮拉提出某个政策建议时,达里奥会问:"技术上可行吗?"他们学会了在对方的话语中找到自己缺失的那一块拼图。 · · · · · ·
离开的抉择
关于离开OpenAI的原因,达里奥和丹妮拉从未公开详细说明。但从他们后来的公开言论中,可以看出一些端倪。 在多次接受《纽约时报》、《华尔街日报》等主流媒体采访时,达里奥阐述了他对AI风险的深刻担忧。他明确表示,他认为AI可能带来的风险被"严重低估",且整个行业需要采取更加保守和安全优先的态度。 在OpenAI的最后几个月里,这种担忧变成了深深的无力感。他看着这家公司以越来越快的速度向前冲刺,GPT-3、GPT-4、ChatGPT——每一个产品都比他预想的更早到来。他尊重这些成就,但他担心的事情也是真实的:如果继续这样下去,如果不对安全投入足够的关注,事情可能会失控。 他和丹妮拉谈了很多次。深夜的电话、周末的咖啡、无数次的深夜长谈。他们讨论技术、讨论商业、讨论使命。但最重要的讨论只有一个核心问题:我们要不要继续留下来? 最终,答案是否定的。 "技术安全和人类价值观并不矛盾。我们有机会也有责任确保AI成为人类福祉的推动力。" —— 丹妮拉·阿莫迪 · · · · · ·
Anthropic的诞生
2021年,Anthropic正式成立。"Anthropic"这个词来源于"人类学"——anthropology。公司名称本身就暗示着他们研究的重点是"人类"和"人工智能"之间的关系。 从一开始,Anthropic就将自己定位为一家"AI安全公司",而非单纯的AI技术公司。这种定位体现在公司的方方面面:从组织架构到招聘标准,从产品发布策略到核心技术方向。 公司内部流传着一份非正式的"宪章",阐明了核心原则:安全优先于能力,永远不会发布存在明显安全隐患的模型;透明公开,与学术界和公众分享AI安全研究成果;谨慎扩展,逐步扩展AI能力,给予社会足够的适应时间;责任共担,认识到AI风险是整个社会的挑战,需要多方协作解决。 这种理念在硅谷显得有些"非主流"。在那个崇拜"快速行动、打破常规"的地方,Anthropic的谨慎显得格格不入。但也正是这种谨慎,吸引了那些认同他们愿景的人才——那些不仅仅想"建造最强AI",更想"建造最安全AI"的研究者。 2023年,Anthropic完成了7.5亿美元融资,估值超过180亿美元。2024年,Google向Anthropic投资超过30亿美元,成为最大投资者之一。Anthropic一跃成为全球第三高估值的AI公司,仅次于OpenAI和ByteDance。 · · · · · ·
Claude的诞生
Claude是Anthropic开发的AI助手。与其他AI助手不同,Anthropic在Claude的性格塑造上投入了大量精力。他们采用了一种更加系统化的方法——Constitutional AI,让Claude在训练过程中学习一套明确的行为准则。 Constitutional AI的原理很简单:研究人员为Claude制定了一份"宪章",包含了数十条行为准则——"尽量减少有害输出"、"尊重用户隐私"、"保持回答的准确性和有用性"。在训练过程中,Claude需要对照这份宪章来评估和改进自己的回答。 这种方法的优势在于:它不仅告诉AI"什么不能做",还教会AI理解"为什么不能做"。通过这种深层次的理解,Claude能够在面对新颖情况时做出更符合人类价值观的判断,而不仅仅是机械地遵循规则。 "我们希望Claude不仅仅是一个工具,而是一个值得信赖的伙伴。就像一个好的助手,Claude会主动帮助你,但也会在你犯错时温和地提醒你。" —— Anthropic官方博客,Claude性格设计理念 · · · · · ·
Claude 3:性能的飞跃
2024年3月,Anthropic发布了Claude 3系列模型,这是继GPT-4之后最重要的AI模型发布之一。 Claude 3系列包含三个版本:Haiku,体积最小、速度最快的版本,适合简单任务;Sonnet,平衡版本,在智能水平和响应速度之间取得最佳平衡;Opus,最强大的旗舰版本,在多项基准测试中超过GPT-4。 Opus展现了接近人类的推理能力,能够处理复杂的逻辑问题、数学证明和多步骤分析任务。它支持高达20万个token的上下文窗口——这意味着它可以一次性阅读并理解整本书籍、代码库或长篇文档。这一能力使它在处理长文本任务时具有独特优势。 当评测结果公布时,整个AI社区为之震动。Claude 3 Opus在多项测试中超越了GPT-4,包括MMLU大规模多任务语言理解测试,以及GSM8K小学数学测试。这意味着,在某些维度上,Claude已经比人类专家表现更好。 · · · · · ·
计算机使用:学会操控世界
2024年10月,Anthropic宣布了一个重大突破:Claude获得了"计算机使用"能力。 这意味着Claude不仅能回答问题,还能真正操控用户的电脑——打开浏览器、操作软件、点击按钮、填写表格。它的工作方式是:AI在虚拟环境中观察屏幕截图,然后决定要点击哪里、输入什么,就像一个真实的人类用户一样操作电脑。 这是一个质的变化。此前的AI助手——包括ChatGPT和Claude——都是"对话型"的:用户提问,AI回答。但当AI能够操控电脑时,它就变成了"行动型"的:用户给出目标,AI自己规划路径、执行操作、完成任务。 达里奥在开发者大会上展示了这个功能。他让Claude帮他订一张从旧金山到纽约的机票。Claude自动打开了浏览器,输入了航空公司网站,浏览了航班选项,比较了价格,然后停在支付页面,等待达里奥输入信用卡信息。 "你注意到了吗?"达里奥对观众说,"我让它订票,但它停在支付页面等我。它知道支付需要我的授权,它不会擅自行动。" 这就是Anthropic所说的"安全边界"。Claude不能安装软件,不能访问系统底层,不能执行命令行操作。对于高风险操作,它会暂停并请求用户明确授权。用户可以随时终止Claude的计算机使用会话。 "我们不是在建造一个尽可能强大的AI,"达里奥说,"我们是在建造一个能够被信任的AI。一个你会放心让它操控你电脑的AI。" · · · · · ·
两种不同的声音
硅谷的创业叙事中,兄妹搭档创业的情况极为罕见。但达里奥和丹妮拉正在证明,这种合作模式有其独特的优势。 他们的合作体现了独特的优势互补:达里奥负责技术方向和研发领导,丹妮拉则专注于公司文化、运营和政策。在重大决策上,两人经常进行深入讨论,从技术可行性和人类影响两个维度评估每一个重要决定。 据内部人士透露,Anthropic的企业文化深受丹妮拉影响。公司强调"建设性质疑"——员工被鼓励对公司的决策提出挑战,无论提出者职位高低。这种文化让Anthropic在快速扩张的过程中,保持着一种独特的批判性思维氛围。 "我们会问自己:'我们是对的吗?'"丹妮拉在一次采访中说,"不是'我们能赢吗',而是'我们是对的吗'。这是我们和许多竞争对手最大的区别。" · · · · · ·
未完的旅程
从2021年创立至今,不过短短几年时间。但在这几年里,Anthropic已经从一个只有几十人的小团队,成长为拥有数千名员工、数百亿美元估值的AI巨头。Claude已经成为最受企业和开发者欢迎的AI助手之一。Constitutional AI已经成为AI安全领域最具影响力的方法论之一。 但对达里奥来说,这只是开始。 "我们不只是在开发一个AI产品,"他在2024年的开发者大会上说,"我们是在为人类建造一个能够真正理解我们、帮助我们、同时不会伤害我们的智能伙伴。" 他望着台下黑压压的人群,那些开发者、研究者、创业者、记者——他们来自不同的国家,说着不同的语言,但都在思考着同一个问题:AI会走向何方? "我们无法预测未来,"达里奥说,"但我们可以塑造未来。这就是为什么安全不是一种选择,而是一种责任。" 旧金山湾的海风从窗户的缝隙中溜进来,带来一丝咸腥的气息。窗外,海湾大桥的灯火依旧闪烁,连接着旧金山与奥克兰,连接着过去与未来。而在这座桥的另一端,达里奥和丹妮拉正在建造另一种东西——一种他们希望能够连接人类与机器、连接能力与责任、连接现在与未来的东西。 他们不知道能否成功。但他们知道,必须尝试。 · · · 第九章 · 完
