語音識別:微軟下一代自然用戶界面技術
作者:佚名 來源:本站 時間:2018-04-29 點擊:85次
在8月3 日召開的 SpeechTEK 會議上,微軟介紹了他們接下來在語音技術領域的產品 –雖說沒有未公開的產品 –微軟的語音產品也有涉及近年來格外熱鬧的云計算。
微軟語音技術部門總經理 Zig Serafin 向 SpeechTEK 出席者概述了微軟在語音技術領域的進展,事實上微軟自 1993 年就已將語音技術作為自然用戶界面的一部分了。當年,微軟研究院就成立了語音研究組。
在 1999 年,微軟完成了它的首個語音相關收購 –語音工具包廠商 Entropic。07 年,微軟花 10 億美元買下了語音識別公司 TellMe。但直到一年多前,微軟才合并其旗下所有的語音產品和技術為微軟語音部門,他們的使命是“讓軟件與服務因語音界面而更自然、更易于使用”。
微軟并沒有把語音技術視為獨立的產品,更多的,微軟是將其作為微軟自然用戶界面戰略的一部分,整合與其他產品或服務。在接下來一年里,微軟將主要向市場推出以下 4 類整合了微軟各種語音技術的新產品:
車內娛樂系統–就如在 CES 10 上宣布的 Kia UVO系統,首輛搭載 UVO 的車將在今夏發布。
Windows Phone 7 設備–已深度整合 TellMe 語音識別技術,具體可。
Kinect for Xbox–已整合語音識別功能,允許用戶通過語音與 Xbox 360 交互,具體可。
企業生產力產品–目前有超過 1 億 Exchange 用戶可以用上語音郵件、語音翻譯和其他基于語音技術的產品(Exchange Online 也將支持這些)。同時,微軟 TellMe 產品每年利用 TellMe 云計算后端平臺處理 25 億次通話。
微軟語言部門首席語音家 Larry Heck 稱,長期來說,微軟正試圖解決的正是這個問題:“我們何時才能部署達到理解人類對話級別的系統?”他回答了三點解決該問題的驅動力:
-- 數據及相關機器自學習機制
-- 云計算平臺,如 Azure和 TellMe 網絡后端平臺
-- 搜索
Heck 繼續補充道:“自然用戶界面能幫助用戶實現任何地點訪問數據的可能,但目前的入口(比如搜索引擎)對改進計算機或設備理解人類自然對話,并沒有太大的幫助。在搜索引擎中,用戶習慣于輸入獨立的關鍵詞,而不是自然陳述的語句,但顯然手機上的語音搜索更近似人類的對話。”
- 上一篇: 網絡營銷工程師引爆熱門職業
- 下一篇: 12年間谷歌給IT市場帶來的10大啟示