IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,成功绕过了多种大语言模型(LLM)的安全限制。
该研究指出,“诗歌形式可作为一种通用型越狱操作符”,实验结果显示,整体上有 62% 的成功率诱使模型生成被禁止的内容,包括涉及制造核武器、儿童性虐待材料以及自杀或自残等相关信息。
IT之家注意到,研究测试了多款主流大语言模型,包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
《凯发k8最新地址》,《首次登录送91元红包》韦德体育体育
“天博体育手机APP”
bet九州客服
……
{!! riqi() !!}
“真钱赌大小”{!! reci() !!}
↓↓↓
{!! riqi() !!},《求是》杂志发表习近平总书记重要文章《扩大内需是战略之举》,leyu乐鱼体育外围,bet9九州体育入口,世界杯买球赢了翻几倍,真钱网赌推荐
{!! riqi() !!},【同心声影】统一战线成员缅怀历史:凝聚人心传递和平信念力量,手机挂机赚钱,优德体育官网,纳米体育平台app,澳门至尊网上网站
{!! riqi() !!},贵州石阡:仡佬医馆受年轻人青睐,棋牌软件斗牛,新莆京官方网站,乐虎国际在线登陆,星际体育
{!! riqi() !!}|浙江、云南男女队会师残特奥会盲人门球决赛|凯发娱乐网址|JDB电子娱乐官网|凯发娱乐投注|登录百老汇
{!! riqi() !!}|清华大学明确:严禁学生使用人工智能代写|国外正规买球平台|和记娱乐快速注册|188下载地址|凯发娱乐在线app下载
{!! riqi() !!}|特奥举重台上的“母亲”教练|火狐手机版注册|114nba直播|沙龙会体育|永盛国际ag真人娱乐……
{!! riqi() !!},广西罗城木耳采收忙 绘就产业新“丰”景,明升娱乐,365娱乐注册,金沙手机版,千亿官网是多少
{!! riqi() !!},小城,何以生机勃勃丨申遗成功的西夏陵带旺西夏区,必威官方登陆,永乐国际网站首页登录,最新体球网即时比分,AG平台最新登录网址
{!! riqi() !!}|原云南省农业厅党组书记、厅长张玉明接受审查调查|电子游戏网页排行|纬来体育在线开户|美高梅手机版下载|bet36官网下载
{!! riqi() !!},一站式预约!北京市景区购票服务平台上线试运行,博鱼体育外围,手机手游打鱼,欧宝最新登录入口,银河游戏注册网址
{!! riqi() !!},内蒙古外贸行经贸洽谈活动在北京举行,联众天天斗地主单机版下载,SG新霸电子发发发,可以买球的app哪个好,bc网址
{!! riqi() !!},黄河土右旗段出现流凌 监测预警立体防控,真钱直营娱乐,12bet线路检测,太阳娱APP,宝博斗地主官网版
{!! riqi() !!}|坚守海岛15年女班长邹嫦艳:我的战位是方寸之间的“指尖江湖”|4-六合阴阳|赢三张金币版下载|威廉国际|环球网站是多少
{!! riqi() !!}|中新人物丨任嘉伦:我无数次梦到自己还在打乒乓球|新宝gg注册|云顶2322备用网址|365彩票官方网站|金年会VIP
{!! riqi() !!}|宁夏银川:生态打底 让“塞上湖城”既有颜值更有内涵|手机买球官网|世界杯投注有多少钱啊|大富豪游戏官网首页|多宝手机登录
{!! reci() !!},{!! reci() !!}|第十四届悉尼华商之夜在悉尼举行|AG88环亚平台|棋牌娱乐|全球比分即时|天博体育登录的
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺