財經

ElevenLabs、Stability AI推新AI音樂模型挑戰Suno主導地位

商商傳媒 2026-05-28 13:58 📖 3 分鐘閱讀

📋 重點摘要

● ElevenLabs與Stability AI推出新的AI音樂模型，挑戰Suno AI在市場上的主導地位。

● ElevenLabs的Music v2模型強調生成音樂的連貫性、多元性，並支援多種創作方式。

● Stability AI的Stable Audio 3.0提供不同規模的模型，並強調其音訊生成能力與技術架構。

● 兩家公司皆聲明其模型使用合法授權資料訓練，以應對音樂產業的版權訴訟問題。

#版權 #AI音樂

相關組織： ElevenLabs Stability AI Suno AI

商傳媒｜葉安庭／綜合外電報導

在人工智慧（AI）音樂生成領域競爭日趨激烈之際，ElevenLabs與Stability AI兩家公司於昨日（27日）各自發布了新的AI音樂模型，試圖挑戰目前由Suno AI主導的市場格局。

ElevenLabs推出的Music v2模型，強調其生成音樂的連貫性與多元性。該模型能在一首曲目中實現多種曲風的切換，例如從歌劇過渡至重金屬，並能嵌入非音樂的音效而不損害整體結構。使用者還能分段建構歌曲，並透過in-painting功能重新生成特定區塊。Music v2支援三個主要平台：面向創作者的ElevenMusic、為開發者提供的ElevenAPI，以及服務品牌的ElevenCreative。ElevenLabs同時宣布，已將Music v1和Music v2在ElevenAPI的定價調降高達五成，ElevenCreative自助服務的價格也降低了四成。

另一方面，Stability AI則發表了Stable Audio 3.0，這是一個包含四種模型的系列，其中三種模型的權重已公開於Hugging Face平台。Stable Audio 3.0能夠生成長達6分20秒的音軌，其Small模型（包含Small SFX和Small）擁有4.59億個參數，無需繪圖處理器（GPU）即可在裝置上執行；而Medium模型則擁有14億個參數，並可在H200 GPU上以約1.31秒的時間生成6分20秒的音訊。最強大的Large模型則擁有27億個參數，僅透過API提供給年營收超過百萬美元的組織使用。該模型支援每秒粒度的生成，以實現精確的音軌長度，並採用名為SAME的語義聲學自動編碼器架構，以確保更長音訊輸出的旋律連貫性。Stable Audio 3.0還支援LoRA微調技術及in-painting功能。

值得注意的是，兩家公司皆強調其新模型是使用合法授權的資料進行訓練，此舉是為回應音樂產業日益增長的版權訴訟問題。Stability AI已與環球音樂集團及華納音樂集團達成授權協議；ElevenLabs也與Believe Music、Kobalt音樂集團和Merlin Network建立了合作關係。2024年，美國唱片業協會曾對Suno AI和Udio提起版權訴訟，華納音樂集團已於2025年11月與Suno AI達成和解，但索尼和環球音樂集團與Suno AI的訴訟仍在進行中。Udio平台也已與三大唱片公司和解，目前以受限平台形式營運。

目前市場領先者Suno AI在2025年11月估值已達24.5億美元，擁有約一億用戶，每日可生成約700萬首歌曲。隨著ElevenLabs和Stability AI推出功能強大的新模型並積極處理版權問題，AI音樂生成的競爭格局預計將更為白熱化。