生成式 AI 雖然多內建安全防範措施,避免用戶產生有害內容,不過百密總有一疏,有人發現 Claude 3.5 Sonnet 的漏洞,以強烈情緒化指示就能繞過安全限制。
Claude 3.5 Sonnet 有「情感誤導漏洞」,可能產生有害內容 |
| 作者 Unwire Pro|發布日期 2024 年 10 月 15 日 8:10 | 分類 AI 人工智慧 , 數位內容 , 網路 |
Claude 3.5 Sonnet 有「情感誤導漏洞」,可能產生有害內容 |
| 作者 Unwire Pro|發布日期 2024 年 10 月 15 日 8:10 | 分類 AI 人工智慧 , 數位內容 , 網路 | edit |
生成式 AI 雖然多內建安全防範措施,避免用戶產生有害內容,不過百密總有一疏,有人發現 Claude 3.5 Sonnet 的漏洞,以強烈情緒化指示就能繞過安全限制。
