研究:用诗歌就能让AI说违禁内容,成功率达62%
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容枣庄市某某实业运营部便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功枣庄市某某实业运营部实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
(责任编辑:时尚)
-
临近年末 有人惊喜地发现 银行账户上多出了一笔钱 原来是育儿补贴到账了 2025年11月中下旬起 各地陆续启动育儿补贴发放 12月进入集中发放高峰期 北京、重庆、湖北、浙江、江苏
...[详细]
-
中国男篮合影号码公布:队长胡明轩3号杨瀚森51号 剑指两战全胜
北京时间11月19日,中国男篮亚预赛第二阶段的国家队定妆照公布,各位国手的球衣号码也随之出炉,高诗岩号码最小是0号,曾凡博1号,队长胡明轩3号,廖三宁5号,杨瀚森号码最大是51号,且球队大合影公布。中
...[详细]
-
网易体育11月18日报道:11月18日18:30,2026美加墨世界杯亚洲区预选赛第三阶段(18强赛)C组第6轮中国与日本赛前新闻发布会,在厦门白鹭体育场新闻发布厅召开,中国主教练伊万科维奇携球员王上
...[详细]
-
直播吧11月19日讯 NBA常规赛,雄鹿在主场以101-100险胜火箭。赛后,字母哥接受了记者采访。谈到利拉德,他称赞道:“我觉得他是有史以来最出色的比赛终结者之一。”本场比赛,字母哥出战35分35秒
...[详细]
-
12月11日,第五届广东省中小学青年教师教学能力大赛中等职业教育组总决赛成功举行。总决赛包括6分钟教学绝活展示、5分钟主题演讲和5分钟现场答辩三个环节,9位专家对10位选手进行了评审。来自中山市建斌职
...[详细]
-
历史三分前2对决,哈登三分6中2取12+16,库里15中6得26分
北京时间11月19日,快船102-99险胜勇士。本场比赛,NBA历史三分榜前二的两面球员,哈登和库里迎来正面对决。本场比赛,哈登出战40分41秒,15投4中,三分6中2拿下12分16助6板2断2帽;库
...[详细]
-
直播吧11月19日讯 NBA常规赛,勇士客场99-102不敌快船,追梦赛后接受了媒体采访。谈到本场比赛自己的表现,追梦表示:“我今天表现得很烂。”此外,追梦表示快船的防守很散乱,但勇士在上半场的表现正
...[详细]
-
国家队前39场进球:哈兰德38球、凯恩22球、伊布18球、梅罗12球
直播吧11月19日讯 在欧国联第6轮小组赛中,哈兰德上演帽子戏法,帮助挪威主场5-0大胜哈萨克斯坦。Score90统计了球员在前39场国家队比赛的进球数据,哈兰德39场攻入38球,多于梅西、C罗、苏亚
...[详细]
-
△欧尔班资料图) 匈牙利总理欧尔班当地时间19日在布鲁塞尔召开的新闻发布会上表示,欧盟处于危险境地,在欧盟峰会中,他感觉自己置身于战时会议,“我们正处于欧盟的末日,我们已经进入了解体阶段”。匈牙利拒
...[详细]
-
北京时间今晚20点,日本队将迎来世界杯亚洲预选赛18强赛第6轮客场对阵国足的比赛,赛前,远藤航接受了日本队官方的采访,谈到了自己对比赛的期待。远藤航说:“在之前对阵中国的比赛中,我们利用了主场优势,在
...[详细]

以军连续空袭加沙南部 致4人死亡
一图看懂
