前不久,百度首席科學家吳恩達在百度語音開放平臺上線三周年活動上,發布了百度四項最新語音技術——情感合成、遠場方案、喚醒二期技術和長語音方案,并宣布這些技術通過免費接口提供給開發者使用。這在一定程度上促進了語音輸入技術的發展,讓更多的用戶采納語音輸入。

近日,百度第68期技術沙龍以“移動端輸入法性能優化實戰”為主題,在北京互聯網創業者聚集的車庫咖啡舉行。百度輸入法工程師團隊從iOS輸入法啟動速度和內存優化措施,人工智能在手寫引擎中的應用、輸入體驗的提升,以及智能語音輸入的技術核心、實現方式、優化細節等方面,分享了百度當前最新技術和解決方案。

百度資深研發工程師范敏虎以“iOS輸入法啟動速度優化”為主題,分享了百度輸入法在啟動時間及運行內存方面優化的心得。百度輸入法iOS版本,表面上看僅僅是一個面板,但是麻雀雖小五臟俱全,輸入法開發甚至會面臨比普通app更多的技術問題。范敏虎介紹了百度輸入法在啟動過程中,需要進行的三個步驟及整個啟動過程里可能會遇到四個問題。結合iOS輸入面板的啟動時間、穩定性問題以及面板上多次彈窗等問題,范敏虎生動形象地講解了問題的解決方案。

在如何提高用戶輸入體驗以及新技術的調研應用方面,百度資深研發工程師賀亮為現場的聽眾帶來了一場精妙絕倫的經驗分享。作為百度手機輸入法內核算法核心開發人員,賀亮解析了百度輸入法第一代的模式識別技術存在的問題,同時介紹了基于深度學習網絡技術的第二代手寫引擎技術試驗方案及其優點。結合具體事例,賀亮講解了不同模型的區別,以及如何通過手機硬件加速技術控制深度神經網絡計算帶來的性能損耗。

在移動智能設備普及的大勢下,輸入法與人工智能結合的語音輸入應用場景變得越來越廣泛。百度手機輸入法Android團隊經理、技術負責人施聰和百度語音開放平臺資深研發工程師魏利開,分別從語言技術跟輸入法結合,以及案例方向的角度,介紹了百度語音輸入法具體的實現方式和優化細節。

在案例分享環節,魏利開介紹道,百度語音的識別準確率已經全球領先。
百度技術沙龍是由百度開發者中心主辦的線下技術交流活動,每月1期,旨在為中高端技術人員提供一個自由的技術交流和分享的平臺。百度開發者中心通過百度的技術開放、搜索推廣和應用分發能力,助力開發者加速成功,致力于為開發者、消費者和百度提供創新共贏的生態格局。

