《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 谷歌發布 AI 前沿成果 MusicLM,生成式 AI 迎來爆發

谷歌發布 AI 前沿成果 MusicLM,生成式 AI 迎來爆發

2023-02-01
來源:出新研究
關鍵詞: 谷歌 AI MusicLM 機器人

當地時間 1 月 27 日,谷歌發布全新 AI 模型 ——MusicLM。通過 AI 模型 MusicLM,文字可以直接生成高保真的音樂。

這是繼文字生成 AI 模型 Wordcraft、視頻生成工具 Imagen Video 之后,谷歌又一次推出生成式 AI 模型工具,這一次谷歌將目標瞄準了音樂領域。

透過 MusicLM,不難看到,這兩年生成式 AI 賽道正在迎來爆發。

01、MusicLM 挑戰更復雜場景

谷歌最新推出的 AI 模型 MusicLM,可直接將文字、圖像自動生成音樂,并且曲風多樣,凡是想聽的音樂,基本都能自動生成。

MusicLM 并非是第一個可自動生成音樂的 AI 模型,此前,可視化 AI 工具 Riffusion 也能自動創作音樂,還有 Dance Diffusion,此外,當前最熱門的聊天機器人 ChatGPT 的研發者 OpenAI 也推出過 Jukebox。

但值得注意的是,這些可自動生成音樂的 AI 系統,受限于技術和數據等因素,創作的音樂都比較簡單,相對而言并不復雜。

和前輩們不同的是,MusicLM 可創作特別復雜和保真度特別高的音樂,也可通過圖像生成音樂。這算是實現了全新突破,通過 AI 技術不僅可以識別樂器,融合音樂流派,還可以通過更抽象的概念生成音樂。

比如,想要街機游戲配樂,只要輸入“街機游戲的主配樂,它節奏快且樂觀”等文字,MusicLM 便可自動生成音樂。MusicLM 也可通過圖像生成音樂,例如世界名作《吶喊》《格爾尼卡》《星空》等皆可作為素材來源。

不過,值得一提的是,目前谷歌只是發布了 MusicLM 的研究成果,因為版權等問題,谷歌還未向公眾開放 MusicLM。

02、AI 生成音樂難在哪?

去年 10 月,谷歌在生成式 AI 模型上已經推出過 AudioLM,只需輸入短時音頻,就能生成相似風格的音頻。彼時 AudioLM 只是純音頻模型,這個技術類似于語言模型,根據提示的語音內容,自主判斷并生成相似內容。

從這個角度看,AudioLM 可視為是 MusicLM 的前身。AudioLM 在不進行轉錄或標記的情況下,可以模仿音頻的音色、響度和清晰度等。但是,AudioLM 生成的音頻和原版并無太大區別,并未得到公開應用。

通過 AI 模型創作音樂,這件事并不容易,因為生成的音樂包括音頻信號、環境聲音、人的聲音等多個維度,是由很多信號相互作用形成的,而人體每次向外發出的聲音,無論聲音響度大小、音色好差,都由句法、音律等組成,這是非常復雜的綜合性系統。

也恰恰是這些原因,在早期的探索過程中,自動生成的音頻合成痕跡明顯,聲音聽起來并不自然,發音也都不標準。因此 AI 模型要想實現真正意義上的自動生成音頻,依靠海量的數據訓練和模擬,是必不可少的基礎性步驟。

針對這些挑戰,作為 AudioLM 的“升級版”,MusicLM 的訓練數據更加龐大。據了解,谷歌在 28 萬小時的音樂數據集中,才訓練出 MusicLM,為理解深度和復雜的音樂場景提供了基礎。

此外值得一提的是,針對任務缺乏評估數據等問題,谷歌專門引入了 MusicCaps,用于文本到音樂的生成任務評估。

03、生成式 AI 迎來爆發

此次谷歌推出 MusicLM,可視為拓展 AI 應用的注腳,背后則是生成式 AI 賽道的爆發。事實上,生成式 AI 一直是近兩年最炙手可熱的話題。

2021 年,OpenAI 相繼發布了劃時代的 DALL-E、DALL-E 2 模型,實現了文本生成圖像的跨越;去年,Meta 發布了 AI 短視頻生成模型 Make-A-Video,同樣可由文本內容生成視頻;谷歌也發布了短視頻 AI 生成模型 Imagen Video 與 Phenaki。

不止是國外,國內也有很多生成式 AI 應用。比如,字節跳動旗下剪映 APP,可根據文字內容自動生成匹配的視頻畫面。去年初,網易推出了“網易天音”,也是一站式 AI 音樂創作平臺,可將用戶編輯的內容通過 AI 自動生成為歌曲。

可以看到,生成式 AI 應用的場景越來越廣泛,寫作、繪畫、剪視頻等等,都可以通過 AI 技術實現。基于生成式 AI 廣泛的應用前景,谷歌、微軟、Meta 等巨頭們紛紛推進研發,將生成式 AI 技術融合到產品中,這加速了生成式 AI 賽道的爆發。

事實上,生成式 AI 高速發展并非是這兩年的事,只是因技術門檻過高,其前沿動態一直在科技圈小范圍流傳。直到 AI 繪畫、AI 寫作等頻繁出圈,生成式 AI 得到了更廣泛的關注。

生成式 AI 賽道爆發有必然原因,大數據和算法應用越來越成熟,模型工具越來越完善,這都加速了生成式 AI 應用的迭代。當前,生成式 AI 已經迎來爆發,未來還有巨大的發展潛力。根據 Gartner 統計數據,預計到 2025 年,生成式 AI 將占所有生成數據的 10%,而目前的比例還不到 1%。

當然,任何技術都是一把“雙刃劍”,生成式 AI 也面臨著版權問題等挑戰,此外還面臨由 AI 生成“錯誤”引發的各種損失,就目前來看,還離不開人為干預。但長期而言,生成式 AI 巨大的發展潛力已經成為共識。




更多信息可以來這里獲取==>>電子技術應用-AET<<

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 一本色道久久综合狠狠躁篇| 日韩精品久久久久久免费| 99久久国产亚洲综合精品| 久久中文精品无码中文字幕| 亚洲av极品无码专区在线观看| 亚洲精品国产高清嫩草影院| 亚洲人成电影在线观看青青| 久久国产精品99精品国产| 一边摸一边爽一边叫床免费视频 | 久久久久久国产精品mv| 久久精品国产99精品最新| 三级毛片在线看| 12至16末成年毛片| 色婷婷激婷婷深爱五月小蛇| 熟妇人妻VA精品中文字幕| 最近2019mv中文字幕免费看| 强波多野结衣痴汉电车| 国内精品久久久久久99蜜桃| 小说区乱图片区| 国产精品亚洲综合| 午夜私人影院在线观看| 亚洲成a人片在线观看中文app| 亚洲码欧美码一区二区三区| 久久久国产精品一区二区18禁| 久久久久久久亚洲AV无码| 99久久国产综合精品成人影院| 韩国特黄特色a大片免费| 色偷偷人人澡久久天天| 美女和男生一起差差差| 欧美日韩亚洲国产综合| 扒开双腿爽爽爽视频www| 成人午夜私人影院入口| 国产精品免费视频网站| 国产成年女人特黄特色毛片免| 国产嫩草影院精品免费网址| 国产又色又爽又刺激在线观看| 人妻精品久久久久中文字幕一冢本| 亚洲精品国产高清嫩草影院| 久久66久这里精品99| **aa级毛片午夜在线播放| 福利视频第一区|