近日,《你的鋼門比較搖滾》刷遍全網,其背後的功臣少不了SunoAI技術的推動,而繼Suno大火後,AI繪圖應用StableDiffusion的母公司StabilityAI也推出了迭代的文生音頻作曲工具——StableAudio 2.0(後簡稱SA2),新版本允許用戶生成的音樂長度可達3分鐘,比Suno還長1分鐘!
SA2一經注冊便可獲得20積分,消耗積分點數不受音頻時長影響,免費用戶每月最多可生成20首音樂,生成次數總體上比限流前的Suno要少上許多。
進入SA2的生成頁,用戶僅需2-3步便能生成專屬音樂。首先,在左上角提示詞框內輸入相關需求文本,例如流派、樂器和情感術語,以及BPM每分鐘節拍速度等。
其次,用戶可自定義選擇模型生成,默認使用的是SA2.0模型。每使用一次SA2.0的模型生成音頻,便會消耗2點積分(上限3分鐘),SA1.0模型則消耗1點積分(上限1分30秒),免費用戶若僅使用2.0模型,實際每個月最多只可生成10條音頻。
最後,調整所需音樂時長,點擊Generate生成按鈕便可實現0基礎的音樂創作。
本次最大的升級在於,SA2新增音頻到音頻的生成功能,允許用戶使用提示詞對音頻樣本進行再生成,例如,用戶只需錄制上傳一段哼唱幹音並給予提示詞,便可得到一段樂器演奏的旋律。
即便StableAudio迭代到了2.0版本,可如果對標到了SunoAI,一切都顯得微妙了起來。一方面,目前SA2更偏向於生成純音樂,生成的演唱曲目人聲不完整,電音充足,聽起來像是音癡錄音的倒放,如果要說感受,那就是會笑死人不償命。
另一方面,大部分生成的音樂節奏感較弱,旋律走向過於平鋪直敘,缺乏驚喜感。另外,對於中文用戶而言,無法生成中文曲目也是硬傷。
但總體而言,SA2的誕生還是可喜可賀的,雖然在文生音樂的能力上仍有進步空間,但音頻轉音頻的實力還是給足了許多音樂愛好者許多探索期許的。一來是提高了音色轉換的效率,二來則是爲許多音樂創作者开拓思路,也算是豐富了另一條AI音頻的賽道。
AIGC的變化可謂是瞬息萬變,從起初的智能聊天到如今視聽作品的生產,只要你也懂得使用AI工具,你一個人便是一個團隊!可AI生產總繞不過一個課題,便是要擁有一張性能充足的顯卡!影馳RTX 4070 Ti SUPER 金屬大師OC,16GB超大顯存輕松滿足各大AI應用的使用需求,革命性的TensorRT加速也可全面提升你的战鬥力,讓你秒變效率战神!
標題:Suno AI作曲王座遭Stable Audio 2強勢挑战?結果令人震驚!
地址:https://www.utechfun.com/post/357716.html