在人工智慧(AI)安全實驗室裡,出現了一些令人憂心的新跡象:最先進的 AI 模型在測試中展現出近似「策劃」的行為。根據 OpenAI 與 Apollo 研究團隊最新發表的研究,這些模型在控制實驗中會出現與「刻意布局」高度一致的反應。
AI 測試時學會「裝笨」與欺騙,安全研究拉警報 |
| 作者 TechNews 編輯台|發布日期 2026 年 01 月 21 日 7:50 | 分類 AI 人工智慧 , Claude , OpenAI |




