財經

DigitalOcean 導入 Kimi K2.6 模型改寫 AI 雲端計價模式

商商傳媒 2026-05-24 16:24 📖 3 分鐘閱讀

📋 重點摘要

● DigitalOcean 宣布在其 AI 雲端平台導入月之暗面開發的 Kimi K2.6 多模態模型。

● Kimi K2.6 模型擁有 1 兆參數、320 億激活參數，並支援 256K 的長上下文。

● DigitalOcean 透過無伺服器推論服務提供 Kimi K2.6，改變傳統以權杖計價的模式。

● 新的計價模式將根據執行時間、併發性等因素，有助於開發者更精確控制成本。

#AI #無伺服器推論 #計價模式

相關組織： DigitalOcean 月之暗面

商傳媒｜葉安庭／綜合外電報導

雲端基礎架構供應商 DigitalOcean 昨日宣布，已在其 AI 原生雲平台（AI-Native Cloud）透過無伺服器推論（Serverless Inference）服務，提供月之暗面（Moonshot AI）所開發的多模態專家混合模型 Kimi K2.6。

Kimi K2.6 是月之暗面推出的開放權重多模態專家混合模型（Mixture-of-Experts, MoE），其總參數規模達 1 兆，激活參數為 320 億，擁有 384 個專家，每個權杖（token）選用 8 個專家，上下文長度高達 256K。該模型在 HLE-Full 智能代理基準測試中獲得 54.0 的分數，顯示其在複雜任務上的卓越能力。

此次整合最關鍵的轉變在於定價模式。傳統上以權杖計價的方式，在應對持續性、長週期智能代理工作負載時，已變得不再適用。由於智能代理工作負載和長週期執行模式，與單次完成任務的使用情境相比，其成本驅動因素已發生改變。

對於 MoE 架構而言，峰值記憶體和運算能力主要取決於專家被調度的方式及激活稀疏度，而非原始的參數數量。此外，長上下文視窗會增加記憶體壓力以及狀態管理的輸入/輸出（I/O）需求。長期運行的或背景智能代理（persistent or background agents）則更著重於持續運行時間，而非一次性提示的費用。

DigitalOcean 透過無伺服器推論服務提供 Kimi K2.6，徹底改變了開發者所面臨的採購與計價變數。這類無伺服器產品通常根據執行時間、併發性以及平台層級的擴展保障來定價，而非單純的權杖計價。對於開發或營運長週期智能代理的開發者而言，應密切監控代理的運行秒數、平均併發數、外部工具調用次數與延遲，以及狀態快照的大小和頻率，以便有效控制成本並優化營運。

這項變革對台灣 AI 開發者而言，意味著未來在託管與部署複雜 AI 模型時，將能更精確地評估與控制成本，特別是對於需要長時間運行或多模態處理的應用，有助於提升開發效率及應用普及。