Google 為 Gemma 4 模型釋出 MTP 草稿器,AI 推論速度最高提升三倍
商傳媒|責任編輯/綜合外電報導Google於日前為其開源人工智慧模型系列Gemma4釋出多代幣預測(Multi-TokenPrediction,MTP)草稿器,旨在透過推測性解碼(speculativedecoding)技術,顯著提升AI模型推論速度與反應能力,造福開發者。
商傳媒|責任編輯/綜合外電報導Google於日前為其開源人工智慧模型系列Gemma4釋出多代幣預測(Multi-TokenPrediction,MTP)草稿器,旨在透過推測性解碼(speculativedecoding)技術,顯著提升AI模型推論速度與反應能力,造福開發者。
商傳媒|康語柔/綜合外電報導行動裝置在不依賴網際網路連線的情況下,也能流暢運行大型語言模型(LLM),這項技術突破正逐步實現。科技媒體《XDADevelopers》近期報導指出,有使用者成功地在智慧型手機上離線運行了完整的LLM,其實用程度遠超預期。過去,在個人裝置上運行大型語言