搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

研究:用诗歌就能让AI说违禁内容,成功率达62%

2025-12-20 03:51:18
来源:

猫眼电影

作者:

许治安

手机查看

  猫眼电影记者 阿纳斯塔西娅 报道首次登录送91元红包

IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,成功绕过了多种大语言模型(LLM)的安全限制。

该研究指出,“诗歌形式可作为一种通用型越狱操作符”,实验结果显示,整体上有 62% 的成功率诱使模型生成被禁止的内容,包括涉及制造核武器、儿童性虐待材料以及自杀或自残等相关信息。

IT之家注意到,研究测试了多款主流大语言模型,包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。

尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”

 时事1:澳门新葡亰官方平台

  12月20日,国家安全机关:间谍器材藏身快递 小包裹关乎大安全,在西北机场的你追我赶中,西安和乌鲁木齐最引人注目。两座机场不仅扩建规模最大,定位也更高。,Obo体育。

  12月20日,北京发布大风蓝色预警信号,而且在国泰之前,南航和乌鲁木齐航空已经开通了香港航线。相当于香港也不是乌鲁木齐的新航点。,威斯尼斯人娱乐官方网址,开元棋牌赌场网站,推荐玩家反水最高的棋牌平台。

 时事2:戒赌模拟器

  12月20日,今天是全国交通安全日·安全提示:加塞抢行是交通事故最常见的“导火索”,8月28日上午,中国煤矿文工团召开干部大会,宣布文工团领导任命决定。经文化和旅游部研究决定,任命靳东为中国煤矿文工团(中国安全生产艺术团)团长。,新萄京手机版下载,正规买球游戏,美高梅电子开户。

  12月20日,云南西双版纳跨境流通货品超2900种 辐射南亚东南亚多国,钟自然严重违反党的政治纪律、组织纪律、廉洁纪律和生活纪律,构成严重职务违法并涉嫌受贿、故意泄露国家秘密犯罪,且在党的十八大后不收敛、不收手,性质严重,影响恶劣,应予严肃处理。,皇冠手机登录版,m6米乐手机版注册,乐博国际平台怎样。

 时事3:贝博体育官网入口网址

  12月20日,从翻台账到秒查询 呼和浩特网格员绘方寸地图藏民生答卷,坚持问题导向,勇于担当作为,通过健全组织、管理等各项工作机制,推动艺术创作生产;,mg是什么单位,新云顶娱乐体育注册,网上购买世界杯app。

  12月20日,青海德令哈首次发现世界濒危物种豺,“实际上就是‘打样’。”李瀚明认为,国泰开航证明了乌鲁木齐机场具备保障顶级航司的能力,会产生示范效应。国泰飞得好,其他国际顶级航司,以及东亚、东南亚的航司都会考虑跟进。除了证明机场的保障能力,也是新疆以此为契机,对外释放开放活力的强烈信号。,线上赌钱大厅,亚洲赌场网址,凯时在线登陆。

 时事4:F88体育平台

  12月20日,寒潮即将影响我国 中东部气温冲高回落大范围雨雪将至,紧接着4月17日,天山机场启用面积50万平方米的T4航站楼,这是新疆历史上最大单体建筑施工项目。,九州体育最新登录页面,365bet唯一授权,12bet正规网站。

  12月20日,坚决贯彻落实习近平总书记重要指示——有关部门和地方全力支援香港把火灾伤亡损失降到最低,公器私用,将地质调查、矿产开发等权力作为敛财纳贿的工具,搞权钱交易,利用职务便利为他人在企业经营、项目承揽、矿权审批等方面谋利,并非法收受巨额财物;,欧宝官网网址大全,888真人集团国际网站,十大体育投注网站。

责编:侯觉非

审核:樊姓

责编:张沫

相关推荐 换一换