《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 業界動態 > AI還能這么玩兒?過濾音質讓音樂更悅耳

AI還能這么玩兒?過濾音質讓音樂更悅耳

2018-07-09
關鍵詞: PixelPlayer 人工智能

  一般利用均衡器可以將音樂中的低音部分調出來,但是麻省理工學院的計算機科學和人工智能實驗室(Computer Science and Artificial Intelligence Lab,CSAIL)的研究人員發現了更好的解決方案。他們所研發的新系統 PixelPlayer,能夠利用人工智能來區分和過濾聲音,讓音樂聽起來更洪亮或更柔和。

  將指定視頻錄入經過充分訓練的 PixelPlayer,系統隨機能夠過濾伴奏,同時識別音源,接著計算圖像中每個像素的音量,然后通過“空間定位”確定產生相似音波的片段。

  今年9月,德國慕尼黑即將舉行歐洲計算機視覺會議(European Conference on Computer Vision),會議中要發表的一篇新論文則詳細論述了“像素的聲音(The Sound of Pixels)”。麻省理工學院計算機科學和人工智能實驗室的博士生,同時也是這篇論文的合著者 Zhao Hang 同學表示,“最好的情況就是,我們能識別出哪種樂器發出怎樣的聲音。”

  PixelPlayer 的核心是一種基于樂器組合多模態訓練的神經網絡,數據集采用了 Youtube 上 714 條未經修剪且未經標記的視頻。其中,總時長為 60 小時的 500 條視頻用于訓練,剩余的則用于驗證和測試。在訓練過程中,研究人員分別根據原聲吉他、大提琴、單簧管、長笛和其他樂器向系統饋入了算法。

  這只是 PixelPlayer 多重機器學習框架的一個部分。經過訓練后的視頻分析算法將從剪輯幀中提取出視覺特征,這就是系統的第二個神經網絡,即音頻分析網絡。音頻分析網絡將聲音拆分為片段,并從中提取特征。最后,音頻合成網絡將把上述兩個網絡輸出的特定像素和聲波關聯起來。

  PixelPlayer 進行完全自監督的學習,人們無需對數據注釋,而且系統目前已經能識別 20 種樂器。Zhao Hang 說,較大的數據集增強了系統的識別量,但識別樂器子類的能力卻不佳。系統也可以識別音樂元素,例如小提琴的諧波頻率。

  研究人員認為 PixelPlayer 可以進行聲音剪輯,或者幫助機器人理解動物、車輛和其他物體所制造的環境聲音。他們寫到,“我們希望我們的工作能夠開辟新的研究途徑,從視覺和聽覺信號角度實現聲源分離”。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 国产综合在线观看| 色婷婷亚洲综合| 日韩一区二区三区精品| 国产乱人伦真实精品视频| 91草莓视频在线观看| 日韩精品无码人妻一区二区三区| 四虎永久免费地址在线网站| 自拍偷拍校园春色| 婷婷被公交车猛烈进出视频| 亚洲精品tv久久久久久久久久| 老司机激情影院| 日日插人人插天天插| 偷窥无罪之诱人犯罪| 中文字幕一区二区三匹| 手机在线观看你懂的| 亚洲精品无码mv在线观看网站| 国产网站麻豆精品视频| 大学生秘书胯下吞吐| 久别的草原电视剧免费观看| 精品美女模特在线网站| 国产色a在线观看| 七次郎最新首页在线视频| 欧美日韩视频在线观看高清免费网站 | 最近中文AV字幕在线中文| 国产91久久久久久久免费| 99久久婷婷国产综合亚洲| 日韩成人无码一区二区三区| 动漫人物桶动漫人物免费观看| 麻豆第一区MV免费观看网站| 性xxxx视频播放免费| 久久精品国产亚洲AV麻豆不卡| 精品一区二区91| 国产精品va在线观看一| 上司撕下内裤后强行进| 日韩欧美三级视频| 亚洲国产欧美日韩精品一区二区三区| 色综合网站国产麻豆| 国产香港特级一级毛片| xvdeviosbbc黑人| 日韩电影免费在线观看网址| 亚洲成在线观看|