《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 業界動態 > AI還能這么玩兒?過濾音質讓音樂更悅耳

AI還能這么玩兒?過濾音質讓音樂更悅耳

2018-07-09
關鍵詞: PixelPlayer 人工智能

  一般利用均衡器可以將音樂中的低音部分調出來,但是麻省理工學院的計算機科學和人工智能實驗室(Computer Science and Artificial Intelligence Lab,CSAIL)的研究人員發現了更好的解決方案。他們所研發的新系統 PixelPlayer,能夠利用人工智能來區分和過濾聲音,讓音樂聽起來更洪亮或更柔和。

  將指定視頻錄入經過充分訓練的 PixelPlayer,系統隨機能夠過濾伴奏,同時識別音源,接著計算圖像中每個像素的音量,然后通過“空間定位”確定產生相似音波的片段。

  今年9月,德國慕尼黑即將舉行歐洲計算機視覺會議(European Conference on Computer Vision),會議中要發表的一篇新論文則詳細論述了“像素的聲音(The Sound of Pixels)”。麻省理工學院計算機科學和人工智能實驗室的博士生,同時也是這篇論文的合著者 Zhao Hang 同學表示,“最好的情況就是,我們能識別出哪種樂器發出怎樣的聲音。”

  PixelPlayer 的核心是一種基于樂器組合多模態訓練的神經網絡,數據集采用了 Youtube 上 714 條未經修剪且未經標記的視頻。其中,總時長為 60 小時的 500 條視頻用于訓練,剩余的則用于驗證和測試。在訓練過程中,研究人員分別根據原聲吉他、大提琴、單簧管、長笛和其他樂器向系統饋入了算法。

  這只是 PixelPlayer 多重機器學習框架的一個部分。經過訓練后的視頻分析算法將從剪輯幀中提取出視覺特征,這就是系統的第二個神經網絡,即音頻分析網絡。音頻分析網絡將聲音拆分為片段,并從中提取特征。最后,音頻合成網絡將把上述兩個網絡輸出的特定像素和聲波關聯起來。

  PixelPlayer 進行完全自監督的學習,人們無需對數據注釋,而且系統目前已經能識別 20 種樂器。Zhao Hang 說,較大的數據集增強了系統的識別量,但識別樂器子類的能力卻不佳。系統也可以識別音樂元素,例如小提琴的諧波頻率。

  研究人員認為 PixelPlayer 可以進行聲音剪輯,或者幫助機器人理解動物、車輛和其他物體所制造的環境聲音。他們寫到,“我們希望我們的工作能夠開辟新的研究途徑,從視覺和聽覺信號角度實現聲源分離”。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 好好的日视频www| 欧美丰满熟妇xxxx性ppx人交| 国产孕妇孕交一级毛片| a级毛片高清免费视频| 日韩免费在线视频| 亚洲欧美日韩丝袜另类| 精品国产理论在线观看不卡| 国产成人A∨激情视频厨房| 97一区二区三区四区久久| 成年女人免费播放影院| 亚洲AV无码一区二区三区在线| 狠狠色狠狠色综合网| 我和娇妻乱荡史| 亚洲国产一成人久久精品| 精品国产Av一区二区三区| 国产成人AV无码精品| 9277手机在线视频观看免费| 成人免费视频国产| 久久精品隔壁老王影院| 残虐极限扩宫俱乐部小说| 啄木乌欧美一区二区三区| 99自拍视频在线观看| 国产高清一区二区三区视频 | 亚洲人成精品久久久久| 男女一进一出抽搐免费视频| 国产一区二区三区小向美奈子| 1000部拍拍拍18勿入免费凤凰福利| 天堂网404在线资源| 中文亚洲成a人片在线观看| 日韩一卡二卡三卡四卡| 午夜内射中出视频| 高清国产av一区二区三区| 成人在线视频一区| 久久精品国产网红主播| 欧美日韩一区二区不卡三区| 健硕粗大猛烈浓精| 经典三级在线播放| 国产精品人成在线播放新网站| eeuss影院www在线观看免费| 成人永久免费福利视频app| 久久精品无码一区二区三区|