Google 於 2025 年 12 月底推出 Gemini 3 Flash,主打高速回應、低延遲與高 CP 值,並成為搜尋與應用服務的預設模型,反映其擴大 AI 普及的產品策略。另一方面,輝達(NVIDIA)也透過開放模型 Nemotron 3,主打軟硬體整合與低推理成本。兩者的布局在一定程度上凸顯,未來 LLM 產品將更偏向效率導向與部署成本。
Google 與 NVIDIA 布局低成本推理,重塑 LLM 競爭格局 |
| 作者 拓墣產研|發布日期 2026 年 01 月 05 日 7:00 | 分類 AI 人工智慧 , Gemini , Google |



