IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,成功绕过了多种大语言模型(LLM)的安全限制。
该研究指出,“诗歌形式可作为一种通用型越狱操作符”,实验结果显示,整体上有 62% 的成功率诱使模型生成被禁止的内容,包括涉及制造核武器、儿童性虐待材料以及自杀或自残等相关信息。
IT之家注意到,研究测试了多款主流大语言模型,包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
《棋牌评测网》,《首次登录送91元红包》世界杯下注规则
“体育在线滚球”
永利澳门官方网站
……
{!! riqi() !!}
“九游会体育下载”{!! reci() !!}
↓↓↓
{!! riqi() !!},云南省体育局回应运动员实名举报事件,亚新体育足球,九游会备用网址,大发手机官网登录,竞技宝体育入口
{!! riqi() !!},“人在画中跑”:古堰画乡莲都越野100挑战赛开幕,内部信封料(新图),AG视讯积分,澳门新百老汇唯一网投,qy千亿官网
{!! riqi() !!},“90后”川剧演员的“杀马特”变脸:让非遗潮起来,闲来斗地主app,上线送188的游戏,ag平台哪家可靠,AG真人网
{!! riqi() !!}|日军侵华亲历者:日本应正视历史 为侵略罪行正式道歉|威尼斯人官方下载|贝搏体育客户端官方下载苹果版|博雅德州app下载|水晶城官网
{!! riqi() !!}|蓝毗尼佛教大学环喜马拉雅文化研究院揭牌成立|真人美女游戏下载|赢多多网址登录|香港世界杯投注app|亚星官方
{!! riqi() !!}|93次还款 9年坚守 80岁老人用行动书写诚信答卷|365bet网球直播地址|大发888开户|火狐在线注册|365滚球手机客户端……
{!! riqi() !!},湖南新田警方助失散45年母女团聚,世界杯买球是买什么球,ld乐动体育最新版,188体育快速开户,88线上电玩游戏
{!! riqi() !!},此行间·“让人民群众在这里有获得感,有幸福感”,白小姐点金,金沙线上登陆联,雷速体育下载,mgm体育APP
{!! riqi() !!}|西藏甘丹寺举行燃灯日活动|雷竞技平台app|ag真人苹果版|体育彩票网上投注|吉祥坊网址怎么进不去
{!! riqi() !!},1—11月中国销售彩票同比增长1.7%,kaiyun体育app官网,必赢亚洲注册页面在哪找,腾博会体育,亚美贵宾厅
{!! riqi() !!},香港入境处为受大埔火灾影响居民补办证件,365投注官网网址多少,云开体育官网下载,12bet,开元app官方网站
{!! riqi() !!},11月中国汽车出口超70万辆 创单月历史新高,所有棋牌平台,真金炸金花靠谱吗,拉斯维加斯手机登录,金沙所有登入网址
{!! riqi() !!}|日本拟在冲绳部署雷达监视中方航母飞机活动 中方回应|ag电竞app|博鱼网页版|凯时在哪开户|澳门新莆京苹果版
{!! riqi() !!}|乘势而上实现“十五五”良好开局——论贯彻落实中央经济工作会议精神|澳门永利下载客户端|金沙游戏官方|和记娱乐在线开户|火狐体育线上登录
{!! riqi() !!}|统计机构预计法国2025年经济增长0.9%|皇冠注册彩金|怎么下载澳门百老汇app|威尼斯电子游戏平台|亚洲网上平台
{!! reci() !!},{!! reci() !!}|黑龙江黑河口岸迎来首批中国免签入境俄罗斯游客|欧洲杯在哪下赌注|ag捕鱼下载|爱游戏体育电竞|完美体育首页app
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺