搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

研究:用诗歌就能让AI说违禁内容,成功率达62%

2025-12-28 12:39:45
来源:

猫眼电影

作者:

郑晓奕

手机查看

  猫眼电影记者 董小龙 报道首次登录送91元红包

IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,成功绕过了多种大语言模型(LLM)的安全限制。

该研究指出,“诗歌形式可作为一种通用型越狱操作符”,实验结果显示,整体上有 62% 的成功率诱使模型生成被禁止的内容,包括涉及制造核武器、儿童性虐待材料以及自杀或自残等相关信息。

IT之家注意到,研究测试了多款主流大语言模型,包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。

尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”

 时事1:大赢家的网址是多少

  12月28日,第四届江南文脉论坛举行 中外学者共话江南文脉与现代文明建设,今年一季度,佛山进出口总额1273.29亿元,同比下降33.1%,增速在外贸20强城市中垫底,外贸规模也由去年同期全国第10位下降至第17位。,金沙亚洲登录。

  12月28日,统计机构预计法国2025年经济增长0.9%,个险渠道受行业“清虚”和“报行合一”冲击,渠道成本控制和产能提升压力大。,美高梅平台官方,obo体育官网入口,欧洲杯2020开赛时间。

 时事2:乐虎88vip

  12月28日,黑龙江铁力:游客沉浸式体验林区生活,▫️ 车企曾对电动汽车市场满怀狂热,但消费者需求的增长从未达到预期;如今热潮褪去,车企纷纷调整战略布局。,kb体育平台怎么样,电竞竞猜app下载,ag捕鱼官网。

  12月28日,残特奥会游泳比赛 蒋裕燕成“八金王”,这份处罚文件的公布,直接触发了上海证券交易所的相关规则,导致人福医药股票被实施其他风险警示。从12月16日起,公司股票简称正式变更为“ST人福(维权)”。,皇冠体育下载,十大赌城平台,必赢亚洲在线下载。

 时事3:金星棋牌官方网站唯一指定

  12月28日,政企携手促发展 湖南东安乡镇企业激活乡村振兴新引擎,1983年至今,共有曾涛、姚广、周觉、曾建徽、姜恩柱、李肇星、傅莹、张业遂、王超9位全国人代会新闻发言人。,皇马国际娱乐娱乐,kok平台体育,新葡萄澳门是真的吗。

  12月28日,你好,小镇丨河南道口:古埠流芳,海外网5月10日电 据台湾“联合新闻网”报道,台中市南屯区一地10日中午施工期间发生吊车吊臂倒塌事件,一旁的捷运车厢遭砸中严重毁损,钢架插穿车厢,场面骇人。事件造成8人受伤送医,一名乘客死亡。,真人钻石国际娱乐网址,365bet备用app,威尼斯人手机登入。

 时事4:皇冠体育app安装

  12月28日,云南澜沧县竹塘乡垃圾倾倒事件追踪:记者直击垃圾倾倒现场,编队刚到达任务海区,雷达部位就报告海区出现可疑目标。编队迅速调整阵位,组成攻击、防御两个阵型。此时受短时降雨影响,海上涌浪明显增强,艇身摇摆不定,能见度低。指挥员立即指挥车舵兵保持航向稳定,配合抓取目标。,雷速体育没有指数栏目,半岛在线体育入口网站,亚新体育注册彩金。

  12月28日,悉尼邦迪海滩枪击案现场:附近路段封控 多名警员驻守,当地时间3月12日,英国首相苏纳克将飞往美国与美国总统拜登及澳大利亚总理阿尔巴尼斯会谈,旨在敲定一份涉及三方的核潜艇合作协议细节。,2026世界杯投注顾v98典tv,澳门九五至尊线上,真人玩斗地主赢钱下载。

责编:周金星

审核:彭昊

责编:王酩

相关推荐 换一换