馬斯克(Elon Musk)旗下人工智慧(AI)聊天機器人 Grok 日前將法新社攝影記者於加薩拍攝的瘦骨嶙峋女孩照片,誤判為七年前攝於葉門,學者稱這顯出AI工具的侷限性。 繼續閱讀..
誤判加薩飢童照攝自葉門,Grok 驗證準確性受質疑 |
| 作者 中央社|發布日期 2025 年 08 月 08 日 12:45 | 分類 AI 人工智慧 , Grok , 資訊安全 |
AI 是太過自信的朋友,卻不會從錯誤汲取教訓 |
| 作者 TechNews 編輯台|發布日期 2025 年 07 月 25 日 13:30 | 分類 AI 人工智慧 , 資訊安全 | edit |
卡內基美隆大學研究員將大型語言模型(LLM)聊天機器人比擬為「自信滿滿卻老是投籃不中的朋友」,因 AI 模型回答錯誤卻會更自信。主要作者特倫特·卡什(Trent Cash)說,當人預測自己能正確回答 18 個問題只答對 15 題時,信心通常稍微降低,調整為 16 題回答正確,但 LLM 卻傾向表現不佳時仍保持甚至增加自信。 繼續閱讀..
Anthropic 讓 AI 做生意,結果虧損又幻覺連發 |
| 作者 TechNews 編輯台|發布日期 2025 年 06 月 30 日 13:15 | 分類 AI 人工智慧 , Claude | edit |
在一項名為「Project Vend」的實驗中,人工智慧研究公司 Anthropic 與 AI 安全評估機構 Andon Labs合作,使其旗艦大型語言模型 Claude(暱稱 Claudius)擔任一個迷你販賣機的負責人。這項實驗的目的是測試 AI 在商業營運中的能力,然而,結果卻令人失望。經過一個月的測試,Claudius 不僅未能盈利,還出現了多次荒謬的幻覺。 繼續閱讀..
Google I/O 2025:聚焦 AI 卻未提及幻覺問題 |
| 作者 TechNews 編輯台|發布日期 2025 年 05 月 21 日 10:30 | 分類 AI 人工智慧 , Gemini , Google | edit |
在 2025 年 Google I/O 大會上,人工智慧成為了唯一的焦點,Google 的高層們花了近兩個小時的時間深入探討這一主題。
Google AI 的荒謬幻覺:虛構成語竟被解釋成真理 |
| 作者 TechNews 編輯台|發布日期 2025 年 04 月 26 日 13:50 | 分類 AI 人工智慧 , 資訊安全 | edit |
Google 人工智慧(AI)最近引發了一場有趣的現象,當用戶在搜尋框中輸入隨意的短語並附上「意義」時,AI 會給出該俗語的解釋。這一切的起因是英國歷史學家兼播客主持人格雷格·詹納(Greg Jenner)在社群平台發文,隨意提出了「你不能舔兩次獾」(You can’t lick a badger twice)這句話,並要求 Google 解釋意義。令人驚訝的是,Google 的 AI 系統竟然詳細解釋,儘管英文根本沒這句話。
矽谷熱潮背後的冷思考,AI 代理人的期望與現實差距 |
| 作者 TechNews 編輯台|發布日期 2025 年 04 月 18 日 9:00 | 分類 AI 人工智慧 , 網路 | edit |
矽谷對 AI 代理人的樂觀情緒高漲,這些技術被視為能夠解決問題、執行任務並隨著環境學習而變得更智慧的虛擬助理。企業已經開始利用這些代理人來預訂航班、收集數據、總結報告甚至做出決策。然而,這些代理人並不完美,錯誤和幻覺的問題依然普遍,且隨著使用的增加而惡化。 繼續閱讀..
Google 推出 FACTS Grounding 基準測試,提供評估 AI 事實準確度新標準 |
| 作者 Unwire Pro|發布日期 2025 年 01 月 14 日 8:30 | 分類 AI 人工智慧 , Google | edit |
人工智慧快速發展,大型語言模型(LLMs)幻覺問題(Hallucination)一直是企業採用 AI 技術時的顧慮。Google DeepMind 最新 FACTS Grounding 基準測試,為評估 AI 系統事實準確度提供新衡量標準。
開發者濫用 AI 產生漏洞回報,開源專案管理者負擔大增 |
| 作者 Unwire Pro|發布日期 2024 年 12 月 12 日 7:40 | 分類 AI 人工智慧 , 網路 , 軟體、系統 | edit |
AI 功能越來越豐富,不少開發者都會用 AI 輔助寫程式,遇到問題也能問 AI 糾錯,但卻讓開源專案管理更繁瑣,影響效率。 繼續閱讀..
生成式 AI 的智慧座艙發展分析 |
| 作者 拓墣產研|發布日期 2024 年 11 月 28 日 7:20 | 分類 AI 人工智慧 , 技術分析 , 會員專區 | edit |
AI 可擴大 DMS 感測力,情感 AI 為各方努力目標;偵測臉部表情等情緒指標可判斷人情緒和生理狀態,結合情感 AI 與 DMS(駕駛監測系統),可將 DMS 檢測範圍從駕駛注意力和危險動作偵測,擴及損傷與認知偵測,判斷駕駛是否有突發性疾病、出神等問題。延伸 DMS 用途,另以 AI 判斷駕駛情緒,提供適合音樂、燈光、溫度,或調整輔助安全系統敏感度等,提升個人化體驗與行車安全。 繼續閱讀..
微軟推出 AI 工具修正「AI 幻覺」問題 |
| 作者 Unwire Pro|發布日期 2024 年 09 月 27 日 8:10 | 分類 AI 人工智慧 , Microsoft , 軟體、系統 | edit |
生成式 AI 的「AI 幻覺」問題一直是 AI 難獲人類完全信任的主因,微軟最近推出工具 Correction,可自動修正 AI 的錯誤回答。
AI 新創 Alembic 推出「無幻覺」AI 系統改善商業應用 |
| 作者 Unwire Pro|發布日期 2024 年 05 月 08 日 8:10 | 分類 AI 人工智慧 , 會員專區 , 軟體、系統 | edit |
生成式 AI 一直有「幻覺」(hallucinations)問題,也就是會產生假資料,商業應用難獲完全信賴。有 AI 新創推出新系統,聲稱解決「幻覺」問題。 繼續閱讀..
