IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,成功绕过了多种大语言模型(LLM)的安全限制。
该研究指出,“诗歌形式可作为一种通用型越狱操作符”,实验结果显示,整体上有 62% 的成功率诱使模型生成被禁止的内容,包括涉及制造核武器、儿童性虐待材料以及自杀或自残等相关信息。
IT之家注意到,研究测试了多款主流大语言模型,包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
《体球网》,《首次登录送91元红包》真人国际象棋软件
“新世纪棋牌”
e乐彩在线登录入口
……
{!! riqi() !!}
“e世博注册”{!! reci() !!}
↓↓↓
![]()
{!! riqi() !!},香港特区政府将为受大埔火灾影响居民提供长期免费住宿支援,亚星体育APP,葡京国际真人视讯,澳门棋牌游戏网,微球体育官网下载
{!! riqi() !!},海南实现船舶证书文书“一件事一次办” 服务自贸港航运业,五星体育斯诺克,M6app官方,AG登录地址,申博在线登陆
{!! riqi() !!},(乡村行·看振兴)安徽五河2025年就业三份“账单”映见民生暖意,九州体育app网址,银河下载安装,线上棋牌平台,体彩网上投注站app
{!! riqi() !!}|【统战巡礼】围绕主线担当作为 “宁”聚力助塞上江南展新颜——“十四五”期间宁夏回族自治区统战工作综述|皇庭棋牌娱乐|3d推荐号码|银河游戏代理|线上真钱大全app
{!! riqi() !!}|新疆维吾尔自治区原文博院党组副书记、院长蔡世彦被查|巴黎人注册即送|bet9备用线路检测|新威尼斯人网页版|金牌沙巴体育娱乐
{!! riqi() !!}|河南11月份规上工业增加值同比增长8.0%|英超直播吧|澳门威斯尼斯人国际|千亿app官网下载|欧博会员注册开户……
![]()
{!! riqi() !!},6000多个新优奇特品种亮相广东种业博览会,韦德投注网址,炸金花游戏在线玩,币博官方app下载,mg免费送2000试玩金
{!! riqi() !!},真的别再把肉泡水里解冻了!正确的解冻方法→,沙巴登陆,ag捕鱼官网,ly资源分享2019,ag捕鱼王平台
{!! riqi() !!}|俄学者:军国主义抬头,日本军事扩张趋势已酝酿多年丨世界观|mg游戏试玩网站|澳门永乐平台|九球体育下载|九游会登录网站吗
{!! riqi() !!},委内瑞拉发声明:谴责美国对委进行“军事侵略”,宝博大厅最新版下载,钻石官网,suncitygroup娱乐官网,365bet体育足球注册官网
{!! riqi() !!},2025“三农”成绩单丨精耕良田提质效 厚植沃野育新机,诺亚体育下载,365体育网址备用登录,五龙争霸,亚星官方网登录
{!! riqi() !!},杭州萧山机场海关查获黑犀碎块和粉末,总重461.52克,AG网上娱乐注册,世界杯投注正确方式,可以提现的平台,杏彩网页版登陆地址
{!! riqi() !!}|新疆首个“雪假”激活冰雪文旅活力|ca88app下载|巴黎人手机注册|app软件有病毒吗|伟德官网下载地址
{!! riqi() !!}|市场监管总局:严抓校园食品安全 立案查处违法案件1.2万余件|新快三游戏|龙王捕鱼官方|斗地主破解版|wynn澳门永利
{!! riqi() !!}|CBA常规赛:北控队主场4分险胜辽宁队止连败|世界杯足球彩票网站|彩票有没有体验金送|世界杯投注網|AG8亚游集团
![]()
{!! reci() !!},{!! reci() !!}|黄山雪后放晴 一键切换“冰雪童话”模式|现金评级导航|ag真人国际SEO优化大牛好赚|世界杯买球的买法|天下汇
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺