隨著大型語言模型的規模越來越大,若對所有模型參數進行訓練,成本勢必非常高昂,研究人員設法減少記憶體使用量,其中新方法 GaLore(Gradient Low-Rank Projection)可讓訓練過程更省記憶體,甚至用家中電腦搭配高階顯示卡就能訓練。
高階顯卡也能訓練模型,AI 研究人員提出「GaLore」減少記憶體用量 |
| 作者 陳 冠榮|發布日期 2024 年 03 月 11 日 18:26 | 分類 AI 人工智慧 |
投入科技媒體逾 10 年,長期關注網路服務、電子商務、品牌電腦等議題。
高階顯卡也能訓練模型,AI 研究人員提出「GaLore」減少記憶體用量 |
| 作者 陳 冠榮|發布日期 2024 年 03 月 11 日 18:26 | 分類 AI 人工智慧 | edit |
隨著大型語言模型的規模越來越大,若對所有模型參數進行訓練,成本勢必非常高昂,研究人員設法減少記憶體使用量,其中新方法 GaLore(Gradient Low-Rank Projection)可讓訓練過程更省記憶體,甚至用家中電腦搭配高階顯示卡就能訓練。
新創 Anthropic 發表 Claude 3 模型,可分析複雜圖表、減少幻覺發生 |
| 作者 陳 冠榮|發布日期 2024 年 03 月 05 日 18:39 | 分類 AI 人工智慧 | edit |
美國新創 Anthropic 是在 AI 產業高度關注的公司之一,4 日發表下一代大型語言模型 Claude 3,更能夠執行複雜的提示指令,而且不容易編造故事。
ChatGPT 大聲讀給你聽,可說 37 種語言 |
| 作者 陳 冠榮|發布日期 2024 年 03 月 05 日 15:46 | 分類 AI 人工智慧 | edit |
OpenAI 針對 ChatGPT 推出「Read Aloud」新功能,已在網頁版以及 iOS、Android 版上線,可在必要時刻派上用場。
