中國科技巨頭阿里巴巴旗下阿里雲最近發表論文〈Aegaeon: Effective GPU Pooling for Concurrent LLM Serving on the Market〉,介紹 GPU 資源池化管理「Aegaeon」,成功解決大型語言模型(LLM)推理服務 GPU 資源浪費問題。 繼續閱讀..
阿里巴巴新論文:GPU 資源節省達 82% |
| 作者 TechNews 編輯台|發布日期 2025 年 10 月 21 日 18:20 | 分類 AI 人工智慧 , GPU , 能源科技 |



