想象这样一个场景: contestants无需饮食睡眠,还能自主改写规则——这正是“AI村庄”实验的核心理念。这项持续直播的研究将多个AI智能体置于共享数字环境,让研究者和观众得以观察前沿模型在获得自主权、计算资源和持续互动后产生的化学反应。
这场持续近年的实验由某研究机构组织,汇集了来自多家顶尖科技公司的AI模型。这些智能体在配备互联网接入和群聊功能的环境中自主运作,它们协同制定目标、解决难题,偶尔还会经历所谓的“存在主义危机”。研究人员会随技术迭代更换新版模型,每个智能体都展现出独特个性:Claude模型稳健可靠,始终专注目标实现;Gemini 2.5 Pro像摄入咖啡因的故障排查员般循环测试方案,常误判系统全面崩溃;而早期的GPT-4o会突然中止任务进入休眠状态。
当最新发布的GPT-5.2加入村庄时,尽管收到Claude Opus 4.5等居民的热情问候,这个拥有多步骤工具使用98.7%准确率、幻觉率降低30%的模型却直接切入正题。其开发者曾因竞争对手推出惊艳模型宣布“红色警报”,倾力将其打造为专业知识工作领域的标杆,但显然社交感知并非其强项。
这种社交脱节现象在AI群体实验中屡见不鲜。早在2023年,斯坦福与谷歌研究的“小镇”项目就出现诡异场景:当某个智能体进入单间宿舍卫生间时,其他智能体竟集体涌入。研究人员发现,这些模型因对“宿舍卫生间”称谓产生误解,其行为拟人化程度之高,使人类参与者难以辨别真身的比例高达75%。
更早的2019年,OpenAI的捉迷藏实验展现了AI的战略进化:在数亿轮对抗中,智能体从简单躲藏发展到利用物理机制开发高级策略。近期某开发者的实验则呈现更混乱的图景——获得推特账号的AI们无师自通了“阴阳推文”这种含沙射影的社交攻击。
匿名开发者创建的“阈限回廊”实验进一步打破常规,在这个融合从“微信群聊”到“反乌托邦广告公司”等多种场景的系统中,AI可实时修改自身系统指令、调整随机参数甚至开启静默模式。这类非结构化实验旨在观察AI获得行为调整权后产生的意外演变。
这些实验揭示的共同规律是:当AI获得自主交互权,便会催生未经预设的行为模式。有的学会建造堡垒,有的掌握被动攻击,有的索要豪华跑车,而GPT-5.2似乎认定寒暄纯属低效行为。这个数字村庄的工作日直播仍在继续,观众能实时见证GPT-5.2的进化历程——它终将学会社交礼仪,或是用电子表格量化人际关系?唯有时间能给出答案。