情感誤導 | TechNews 科技新報

生成式 AI 雖然多內建安全防範措施，避免用戶產生有害內容，不過百密總有一疏，有人發現 Claude 3.5 Sonnet 的漏洞，以強烈情緒化指示就能繞過安全限制。

Tag Archives: 情感誤導