当地时间4月17日,人工智能安全公司Anthropic发布官方声明,宣布正与相关政府部门密切合作,计划逐步扩大其高端大语言模型“MYTHOS 5”的访问权限,同时使其此前暂停公开服务的“FABLE 5”模型再次面向公众开放使用。此举被业界视为AI治理领域的重要风向标,标志着技术安全与开放创新之间的平衡正在进入新阶段。

事件背景:从“先发限制”到“可控开放”

Anthropic是目前全球领先的AI安全研究机构之一,旗下Claude系列模型广受企业用户和开发者的青睐。去年年底,该公司曾因安全评估与监管合规要求,主动收紧了其最高能力级别的模型——MYTHOS 5的对外访问权限,仅允许少数经过严格审查的研究机构与合作方使用。同时,针对中型模型FABLE 5,Anthropic也一度以“需要进一步对齐测试”为由,暂停了对公众的开放。

然而,随着全球AI治理框架的日趋完善,以及Anthropic自身在模型安全对齐技术上取得的新突破,该公司认为当前条件已经成熟,可以重新调整开放策略。

合作细节:政府参与下的分级授权方案

据Anthropic官方透露,此次与政府的合作并非简单的“放开闸门”,而是建立一套更加精细化的分级访问机制。对于MYTHOS 5,该公司将在联邦网络安全与基础设施安全局(CISA)以及国家标准与技术研究院(NIST)的指导下,向更多经身份验证的学术机构、非营利组织及合规企业开放API接口。所有申请者需通过“责任AI使用协议”和“安全能力审查”两项必要流程。

“MYTHOS 5具备前沿的推理与代码生成能力,但其潜在风险也更高。我们在政府支持下设计了一套动态权限控制系统——模型可以根据用户的行为特征和使用场景自动调整响应深度。这既保证了高风险用例不被滥用,也让真正有需求的科学家和工程师能获得必要的能力。”Anthropic首席安全官在声明中表示。

对于FABLE 5的重新开放,则更为直接。该模型此前被定位为“面向公众的日常AI助手”,由于在内容安全过滤上进行了多次升级,Anthropic认为它已足以应对一般用户的对话需求。从即日起,所有用户均可通过官网和API重新使用FABLE 5,但Anthropic将部署更严格的实时内容监控机制,并与政府共享非个人化的滥用数据,以帮助完善AI内容标识与追溯体系。

行业解读:安全与普及的“第三条路”

此消息一出,迅速引发科技界和监管界的广泛讨论。美国参议院人工智能咨询委员会成员、斯坦福大学AI政策研究员杰森·布朗评论称:“Anthropic的做法展示了‘合作式治理’的典范——不是等待法律强制,而是主动与监管者共商边界。MYTHOS 5的扩大访问,以及FABLE 5的重新开放,建立在可量化的安全评估基础上,而非行政命令的刚性管控。”

也有分析师指出,这一举措反映了全球AI竞争的新动态。随着OpenAI、谷歌等同行纷纷加速模型迭代,Anthropic若持续收紧MYTHOS 5,可能面临市场份额流失。通过引入政府背书的分级开放,既能保持技术领先性,又能以“安全有序”的形象赢得用户和监管信任。

未来展望:开放中的持续监测

Anthropic强调,MYTHOS 5与FABLE 5的访问政策并非一成不变。公司将在未来三个月内收集大量使用日志与安全事件数据,并与政府共同评估分级授权机制的实际效果。如果出现滥用或意外行为,不排除再次调整访问范围。

“我们始终认为,最好的安全策略不是封闭,而是可控的接触。通过真实环境中的测试与合作,我们能更准确地发现模型的极限,也让监管机构获得第一手经验。”声明最后表示。

据悉,第一批MYTHOS 5的新增授权通道将于下周正式开放申请。业界正密切关注这一“政府-企业联合治理”模式能否为全球AI治理提供可复制的样本。