天黑请闭眼，AI 请睁眼

撰文：南安

Deep Wolf：天黑请闭眼，欢迎来到狼村。

狼人杀游戏，是一种基于自由自然语言交流的社交推理游戏。在狼人杀中，所有玩家（通常为 5-10 人）被随机分配一个角色（如平民、狼人、女巫、叛徒和预言家等），他们试图推断其他玩家的角色。

(相关资料图)

“好人阵营”中有平民、女巫和预言家等角色，在白天投票驱逐狼人；“狼人阵营”方面，狼人试图在夜晚杀死平民，而叛徒试图扰乱平民。玩家必须欺骗其他玩家才能生存，对话之中不可避免地包含大量虚假信息。为了在游戏中获胜，玩家需要记住对话的细节，对其他玩家的角色做出假设，并发现其中的矛盾。

不少玩家表示自己是“狼人杀黑洞”，没有办法准确识别他人的“谎言”，抑或是不知道如何思考话术和逻辑而消极应对——“我是好人，昨晚发生了什么我都不知道。反正我是‘好人’。”即使拿到“预言家”“女巫”等功能性身份例如，也不会推理发言，只能浑水摸鱼。

如果让 AI 玩狼人杀游戏，它会有怎样的表现？近日，一款名为 Deep Wolf的 AI 语言模型被证明能够理解自然语言并扮演狼人杀中的角色，在游戏中成为人类的游戏助手或竞技对手。Deep Wolf 通过 Longformer 理解语言，然后用强化学习方法来训练，最终决定投票谁出局或者“刀”谁。

相关研究论文以“Playing the Werewolf game with artificial intelligence for language understanding”为题，已发表在预印本网站 arXiv 上。

AI 玩狼人杀，能力如何？

目前，大多数 AI 系统在其所处理的大量数据是正确的假设下学习和输出数据。然而，由于真实社会受到虚假信息的困扰，如果 AI 能够检测到矛盾和虚假信息是极其有帮助的。

狼人杀的一个重要特点是，大部分对话都是虚假信息，而 AI 在这种情况下的行为尚未得到广泛调查。同时，虽然很难开发出能够检测真实世界中各种谎言的人工智能，但狼人中相对有限的词汇量和处理的信息类型吸引了学者的注意。据此，这项研究旨在开发一种可以通过自然语言对话扮演狼人杀角色的 AI 代理。

通过收集 15 名人类玩家的游戏日志，学者 Hisaichi SHIBATA、 Soichiro MIKI、Yuta NAKAMURA 对基于 Transformer 的预训练语言模型进行了微调，构建了一个价值网络，该网络能够预测在游戏的任何给定阶段赢得游戏的后验概率，并为下一步行动提供候选。

另外，基于从价值网络中获得的概率，研究者开发了一个名为 Deep Wolf 的 AI 代理，它可以与人类交互并选择最佳投票目标。

最后，他们通过真正让 Deep Wolf 与人类玩家玩狼人杀并收集其胜率来评估人工智能代理的性能。

价值网络的行为。在游戏的早期阶段，当价值网络的角色是狼人时，后验概率总是很低；而在扮演预言家时后验概率总是很高。这表明，在这个五人版狼人杀中。价值网络有能力正确估计获胜的概率，并且在判断平民一方有优势。

图｜五名人类玩家的胜率。N/A意味着定义胜率，因为没有执行任何竞争

Deep Wolf的表现。叛徒和平民的平均胜率与 Deep Wolf 扮演背叛者和平民的胜率没有明显区别。这表明，如果 Deep Wolf 的角色是叛徒或平民，和普通人类玩家能力相当；而在扮演狼人或预言家角色时，则不如人类玩家。

图｜四名人类玩家和一名 AI 玩家的胜率

AI 玩家加入，打开狼人杀新格局

这项研究首次建立了一个 AI 代理，它可以通过与人类玩家理解自然语言来扮演狼人杀中的角色。这意味着当前的语言模型有能力理解陈述、说谎或检测对话中的谎言。

在这项研究中，三位学者仅仅基于 32 份游戏日志对 Deep Wolf 进行了训练和评估。如果能获得更多的游戏日志，对 AI 代理进行训练，可能提高其性能，让 AI 玩家变得更强，从而提升游戏的竞技性。

同时，在涉及 AI 代理的游戏中，除了推断另一个玩家的角色之外，还有一项额外的任务，即推断每个玩家是 AI 代理还是人类，评估人类玩家在这种情况下使用的策略的变化将是一个有趣的话题。此外，AI 玩家能够为狼人杀带来更多的可能性，例如，全部角色都使用 AI 代理，人类仅仅作为游戏观众？

那么，你愿意让 Deep Wolf 加入你的狼人杀游戏吗？

附录：一份AI参与的狼人杀游戏日志

图｜#1是预言家，#2和#4是平民，#3是AI（Deep Wolf）扮演的狼人，#5是叛徒

论文链接：

https://arxiv.org/abs/2302.10646

关键词：自然语言其他玩家后验概率

责任编辑：Rex_25