IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,成功绕过了多种大语言模型(LLM)的安全限制。
该研究指出,“诗歌形式可作为一种通用型越狱操作符”,实验结果显示,整体上有 62% 的成功率诱使模型生成被禁止的内容,包括涉及制造核武器、儿童性虐待材料以及自杀或自残等相关信息。
IT之家注意到,研究测试了多款主流大语言模型,包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
《凯发k8客户端》,《首次登录送91元红包》世界杯投注365逾3khcc
“立博外围官网”
天博登录
……
{!! riqi() !!}
“银河国际网站靠谱吗”{!! reci() !!}
↓↓↓
{!! riqi() !!},(友城故事)甘肃71对友城惠及多领域合作,买lol外围,mgm在线注册,世界杯买球app网站,TM棋牌
{!! riqi() !!},“冬游宁夏·享受阳光”冬季旅游促消费活动全面启动,天博综合官网,在线体育投注平台,果博登录,十大娱乐平台
{!! riqi() !!},泉州打造世界知名海丝文化旅游目的地,皇冠游戏官网手机版,AG亚游最新地址,271娱乐,bet356官网
{!! riqi() !!}|杭州灵隐寺免门票 浙江多景区跟进|怎么玩斗地主 新手入门|亚洲彩票官网版下载|银河棋牌登录|2020俄罗斯欧洲杯官网
{!! riqi() !!}|治理“小散乱” 广西推动关键金属产业走向高端化|娱乐百家乐现金|M88体育官网|凯发体育官网登录|世界杯投注渠道
{!! riqi() !!}|“炖锅+奶茶+桃酥” 广德“三件套”如何引爆小城烟火气?|万博官方网站|手机麻将输赢规律|皇冠正规官网|九州bet9在线登录……
{!! riqi() !!},空客集团:所有运营中的A320系列飞机执行的航班运行平稳正常,升博电子网投,果博app官网下载,九游会网页版bob,欧洲足球在线视频直播
{!! riqi() !!},法国学者高大伟:高市早苗和日本极右翼势力勾连,让世界面临风险 | 世界观,最新网上老虎机平台,捕鱼放水时间怎么算,亚洲必赢国际,永利皇宫app登录
{!! riqi() !!}|中央经济工作会议:制定实施城乡居民增收计划|贝博体育手机官网首页|赌博线上|利来国际真人娱|皇冠体育外围
{!! riqi() !!},第三届中国侨智发展大会开幕 首批“侨智驿站”获授牌,MG电子登陆,博鱼体育app下载官网,澳门威尼斯网络,凤凰马经(另)
{!! riqi() !!},今年前11个月三亚入境游同比增长42.92%,京灵平台注册,体育app新人注册送18元,球探体育比分老版本ios,必赢亚洲
{!! riqi() !!},从“集中攻坚”到“长治长效” 陕西公检法合力打击“老赖”,乐鱼比分,ayx网址,足球比分90vs足球,开元app官网多少钱
{!! riqi() !!}|第七届澜湄国际电影周落幕 20部澜湄国家影片获金象荣誉|9393体育登陆|凯发娱乐网站app下载|必发网页版|快乐炸金花游戏下载
{!! riqi() !!}|东西问|戴瑞君:数字时代,中国如何应对妇女权利新挑战?|皇冠体育足球|网上玩钱的游戏斗地主|世界杯赌球网站盈利|欧洲杯历届冠军
{!! riqi() !!}|粤港澳自然教育论坛落幕 凝聚推进生态文明共识|银河网上电子|旧版永利皇宫App|手机365体育|娱乐平台大全网
{!! reci() !!},{!! reci() !!}|广西防城港以陆海联动筑东盟门户 借文兴旅谱中越情深|pp体育官方网|世界杯正规买球app排行|赌足球去哪里买的|leyu乐鱼免费试玩
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺