智能語音識別和語音應答,成為移動互聯網時代重要的技術,蘋果、微軟、谷歌(微博)、亞馬遜等各大巨頭均有布局。在人類語音識別精度上,各家廠商也展開了軍備競賽。最新消息顯示,微軟研發團隊在識別率上,達到了堪比人類的準確度。
微軟公司人工智能研發團隊最近發表了一篇語音識別的論文,報告中提到他們研發的識別技術,已經實現了5.9%的詞匯差錯率。外媒指出,這樣的差錯率或者準確率,已經和正常人類基本接近。
微軟公司負責語音識別研究的領導人Xuedong Huang表示:“我們已經實現了和人類一樣的識別水平,這是一個歷史性突破。”
據悉,各家廠商的團隊,都在千方百計提高語音識別的準確率,降低詞匯差錯率,而在上個月,差錯率的最新成績降低到了6.3%,而微軟的最新論文,又進一步實現了突破。
和其他可能被束之高閣的創新研究不同,語音識別技術能夠很快應用到實際產品中,因此這一研究成果,對于微軟實際業務也將產生重大意義,比如微軟可以在語音助手Cortana(中文俗稱“小娜”)、Xbox游戲平臺、Windows操作系統中部署最新的語音識別技術。
在智能語音識別領域,微軟的Cortana后來居上,行業評價已經超過了蘋果的Siri,目前微軟已經把語音助理覆蓋了各種計算工具,比如手機、平板電腦、電腦操作系統等。
為了提高語音識別的精度,微軟的研究人員采用了神經網絡,來存儲海量的數據,可以幫助識別軟件更聰明地識別出人類語音表達的模式。
另外,微軟還需要利用聲音信息和圖片信息,讓神經網絡更有效地利用存儲的海量數據。
不過在研究人員看來,達到和人類持平的程度,還不是研究的最終目標,目前的識別技術還不是完美無瑕。
微軟團隊表示,接下來還要進一步提高語音識別的準確率。另外為了確保識別技術獲得更加實際的應用,微軟計劃在更加嘈雜的環境中,同樣實現高精度的識別,比如在一個熱鬧的餐館、人潮涌動的大街上,或是在狂風暴雨環境中,微軟希望在非正常環境下,語音系統也能夠準確理解人們說的話。
另據報道,在智能手機時代,語音識別技術的地位比過去更重要,而目前蘋果Siri表現糟糕,已經引發了蘋果高管的注意。就在近日,蘋果從美國卡耐基梅隆大學挖來了一個人工智能技術的教授,將負責組建微軟的人工智能研究團隊,這一團隊的使命之一,也是大大提高Siri識別語音和智能回答問題的“智商”。