科技公司 Google 谷歌宣布已在其新推出的AI音樂生成模型Gemini中上線Lyria 3。此模型允許使用者透過輸入文字提示或照片,產生30秒的個人化歌曲,並自動產生歌詞和封面。此次更新將GoogleDeepMind的最新版本音樂生成系統直接整合到Gemini應用中,標誌著該系統迄今為止面向消費者的最大規模發布。
Lyria 3 基於早期模型迭代版本,旨在讓使用者更好地控制音樂輸出。該系統無需用戶輸入即可產生歌詞,調整風格元素(例如流派、節奏和音調),並產生更逼真、更具音樂複雜性的音訊。用戶可以描述想法、記憶或情緒,也可以上傳照片或視頻,模型將根據內容創作一首曲目。 Gemini 應用程式會產生 30 秒的音訊片段,並配上 Nano Banana 產生的自訂封面,方便使用者下載或分享。
該模型支援兩種主要的創作模式。 「文字轉歌曲」模式允許使用者指定音樂類型或情感基調,從而產生帶有歌詞或伴奏的歌曲。 「圖像轉歌曲」模式則以上傳的照片或影片為創作靈感,系統會根據圖像內容自動產生歌詞。谷歌將這些功能定位為休閒創意表達工具,而非專業級音樂製作工具。
YouTube 創作者也可以透過 Dream Track for Shorts 使用 Lyria 3。這項功能目前已在美國推出,並將擴展到其他地區,它允許用戶為短影片創建自訂配樂。該軟體可以產生歌詞或氛圍背景音樂,讓創作者在製作影片配樂時擁有更大的靈活性。
Gemini 應用程式產生的所有音訊都包含 SynthID,這是Google用於識別 AI 生成內容的不易察覺的浮水印。現在,該應用程式允許用戶上傳音訊檔案以檢查是否包含 SynthID,從而擴展了先前僅適用於映像和影片的驗證工具。 Gemini 將分析檔案並確定是否由Google的 AI 系統產生。
谷歌強調,Lyria 3 的開發重點在於負責任的使用以及與音樂產業的合作。該公司指出,該模型旨在實現原創表達,而非模仿特定藝術家。如果提示訊息提及知名表演者,系統將產生受其風格元素啟發的音樂,而不是複製特定的聲音或作品。系統設有篩選器,以防止產生與現有受版權保護作品相似的輸出,使用者可以舉報可能侵犯版權的內容。所有對系統的使用均須遵守Google的服務條款和生成式人工智慧政策。
Lyria 3 現已在 Gemini 應用中上線,面向 18 歲以上用戶,支援英語、德語、西班牙語、法語、印地語、日語、韓語和葡萄牙語。谷歌計劃逐步擴展語言支援並提升服務品質。該模型已率先在桌面端推出,並將於近日登陸行動應用程式。 Google AI Plus、Pro 和 Ultra 會員將享有更高的使用限額。
Source link


