ElevenLabs、Stability AI推新AI音樂模型 挑戰Suno主導地位
在人工智慧(AI)音樂生成領域競爭日趨激烈之際,ElevenLabs與Stability AI兩家公司於昨日(27日)各自發布了新的AI音樂模型,試圖挑戰目前由Suno AI主導的市場格局。
ElevenLabs推出的Music v2模型,強調其生成音樂的連貫性與多元性。該模型能在一首曲目中實現多種曲風的切換,例如從歌劇過渡至重金屬,並能嵌入非音樂的音效而不損害整體結構。使用者還能分段建構歌曲,並透過in-painting功能重新生成特定區塊。Music v2支援三個主要平台:面向創作者的ElevenMusic、為開發者提供的ElevenAPI,以及服務品牌的ElevenCreative。ElevenLabs同時宣布,已將Music v1和Music v2在ElevenAPI的定價調降高達五成,ElevenCreative自助服務的價格也降低了四成。
另一方面,Stability AI則發表了Stable Audio 3.0,這是一個包含四種模型的系列,其中三種模型的權重已公開於Hugging Face平台。Stable Audio 3.0能夠生成長達6分20秒的音軌,其Small模型(包含Small SFX和Small)擁有4.59億個參數,無需繪圖處理器(GPU)即可在裝置上執行;而Medium模型則擁有14億個參數,並可在H200 GPU上以約1.31秒的時間生成6分20秒的音訊。最強大的Large模型則擁有27億個參數,僅透過API提供給年營收超過百萬美元的組織使用。該模型支援每秒粒度的生成,以實現精確的音軌長度,並採用名為SAME的語義聲學自動編碼器架構,以確保更長音訊輸出的旋律連貫性。Stable Audio 3.0還支援LoRA微調技術及in-painting功能。
值得注意的是,兩家公司皆強調其新模型是使用合法授權的資料進行訓練,此舉是為回應音樂產業日益增長的版權訴訟問題。Stability AI已與環球音樂集團及華納音樂集團達成授權協議;ElevenLabs也與Believe Music、Kobalt音樂集團和Merlin Network建立了合作關係。2024年,美國唱片業協會曾對Suno AI和Udio提起版權訴訟,華納音樂集團已於2025年11月與Suno AI達成和解,但索尼和環球音樂集團與Suno AI的訴訟仍在進行中。Udio平台也已與三大唱片公司和解,目前以受限平台形式營運。
目前市場領先者Suno AI在2025年11月估值已達24.5億美元,擁有約一億用戶,每日可生成約700萬首歌曲。隨著ElevenLabs和Stability AI推出功能強大的新模型並積極處理版權問題,AI音樂生成的競爭格局預計將更為白熱化。