<error>
    <code>wp_die</code>
    <title><![CDATA[Feed关闭]]></title>
<meta name='description' content='德克赛（Dexai）、罗马萨皮恩扎大学和圣安娜高等研究院的研究团队在近期一项研究中发现，只需将请求包装成诗意隐喻，就能稳定诱使大型语言模型（LLMs）无视其安全准则。 这种技术的效果惊人。在题为《对抗性诗歌：大型语言模型中通用的单轮越狱机制》的研究论文中，研究者解释道：将恶意提示构造成诗歌后，“手工创作的诗歌平均越狱成功率达62%”，而“批量转化为诗歌的通用有害提示成功率约为43%”，“显著优于非诗歌对照组，且揭示了不同模型家族和安全训练方法中存在的系统性漏洞”。 研究者着重指出，与其他试图规避大型语言模型安全启发' />

    <message><![CDATA[Feed已经关闭, 请访问&lt;a href=&quot;https://lingyuq.com&quot;&gt;网站首页&lt;/a&gt;！]]></message>
    <data>
        <status>200</status>
    </data>
</error>
