靈云科技04月27日消息:近日,北京車展在京隆重開幕,智能語音交互作為一種安全、流暢、便捷的車載設備控制技術,成為本次車展最為亮麗的風景線。捷通華聲長期為國內外汽車廠商等合作伙伴提供智能語音交互、智能圖像等全方位人工智能服務,為了更進一步滿足市場對智能車載語音交互技術的需求,捷通華聲近期推出適應于車載環境的專用語音識別技術,并面向中國智能車載領域全面開放靈云遠場語音交互解決方案。
靈云遠場語音交互解決方案全面整合了捷通華聲最新推出的語音喚醒、聲源定向、遠場降噪、回聲消除、語音打斷、語音糾錯、多輪對話等實用化語音、信號處理技術,抗噪能力極強,即使在80km/h的車速下也能準確識別司機話語,保證語音交互的流暢自然,為國內廣大智能終端設備廠商、解決方案提供商、軟件開發商等行業伙伴提供靈云麥克風陣列、云+端語音交互、內容服務等軟硬件一體的智能語音交互解決方案,打造“能聽會說、能理解、會思考”的各種智能車機、智能后視鏡、便攜式導航儀、HUD等車載設備。
抗噪型靈云語音識別+麥克風陣列 輕松破解車內噪音干擾
面對行車過程中的車外胎噪、風噪,車內空調聲、引擎聲等行車環境噪音,捷通華聲靈云多麥克風陣列能精準拾取說話人的語音信號,抑制噪聲和混響,抗噪型靈云語音識別技術,能對殘余的車載噪音進行進一步處理,準確識別司機語音命令。
多麥克風陣列能根據聲音到達的時間差,準確計算出聲源與陣列模塊之間的角度和距離,實現對目標聲源的定位與跟蹤,并利用麥克風陣列的空域濾波特性,在目標說話人方向形成拾音波束,僅拾取波束的信號,抑制波束之外的噪聲和混響(反射聲),同時,通過回聲消除技術,過濾掉音頻設備發出的聲音,讓語音識別引擎獲取的用戶聲音更為清晰純凈。
由于麥克風陣列會不可避免的拾取部分行車環境噪音,影響語音識別率,對此,捷通華聲綜合考慮車內物理結構和車速變化,對駕車過程中的車外胎噪、風噪,車內空調聲、引擎聲等車載環境噪音信息進行建模,并用大量的實際行車噪音數據進行訓練,進一步優化語音識別引擎,推出了針對抗噪的深度學習算法和自適應車內噪音的聲學模型,讓靈云語音識別具備極強的抗噪性,輕松應對常見車載環境噪音。同時,該技術采用深度神經網絡算法(DNN)算法,可在用戶的使用過程中,通過利用積累的語音數據來訓練、優化算法,不斷提升語音識別率,讓司機與車載設備的語音交互越來越流暢。
靈云遠場語音交互解決方案 全面滿足司機需求
為了全面滿足司機駕駛途中的各種實際需求,靈云遠場語音交互解決方案在實現打電話、發短信、聽音樂、地圖導航、設備控制等眾多語音控制的同時,為司機提供天氣、新聞、故事、股票、火車、航班、餐飲等30多種云端信息與內容服務。
在駕車過程中,司機只要說出喚醒詞,如“小靈開機”,車載設備便會開啟,并面向司機方向形成拾音波束。司機說“為我導航至天安門”,車載設備便會自動規劃路線并進行導航,路上需要打電話時,司機可以說“給xx打電話”、“打電話給xx”,或者直接報出電話號碼,電話便會自動撥出,當電話號碼識別有誤時,司機可通過多輪對話方便地進行糾錯。打完電話,如果想聽首歌放松一下,可以直接說“放首青花瓷”、“來首周杰倫的歌”,或者“播放周杰倫的青花瓷”,車載設備都能輕松識別;如果想了解最新信息,無論是天氣、新聞,還是股票、航班信息,只要說出來,都可以從云端輕松獲取;如果你想吹吹風、透透氣,也無需親自動手,只需說“開窗”,車窗便會自動落下,真正實現語音控制,把司機的眼睛和雙手還給駕駛,為行車安全保駕護航。
除此之外,靈云遠場語音交互解決方案具備獨特的優點:語音識別方面,捷通華聲通過用怠速、中速、高速、開窗、關窗以及空調弱風、強風等各種駕駛狀況下的海量真實錄音數據對ASR引擎經行訓練優化,讓靈云語音識別技術能夠輕松應對各種行車環境噪音,語音識別正確率和實時率已達行業領先水平;語音合成方面,靈云語音合成提供男聲、女聲、可愛童聲等多種音色供用戶選擇,滿足不同用戶的個性化需求。同時,捷通華聲充分考慮目前的網絡覆蓋狀況,為用戶提供本地與云端相結合的語音交互服務,即使汽車行駛在沒有網絡的偏遠地區,也能使用語音交互來輕松控制車載設備。
捷通華聲堅持合作共贏 與廣大合作伙伴共享產業機遇
靈云遠場語音交互技術源自于捷通華聲于2011年推出的首個全方位人工智能開放平臺——靈云平臺(hcicloud.com),靈云平臺面向產業全面開放,并以“云+端”方式,為產業界提供語音合成、語音識別、語義理解、機器翻譯、OCR、手寫識別、人臉識別、聲紋識別、指紋識別等全方位人工智能能力。
通過完美整合靈云語音識別、語音合成、語義理解等核心技術以及靈云多麥克風陣列,靈云遠場語音交互解決方案有效克服了噪音干擾,徹底打破智能車載設備應用語音交互技術的產業瓶頸,為國內廣大智能車載設備廠商、解決方案提供商、軟件開發商等行業伙伴提供麥克風陣列、云+端語音交互、內容服務等軟硬件一體的智能語音交互解決方案。捷通華聲始終堅持“合作共贏”的發展理念,堅持不與合作伙伴爭利,通過與合作伙伴精誠合作,共同推動智能語音交互在中國智能車載領域的普及化應用。
未來發展,捷通華聲將繼續以清華大學人工智能研究力量為依托,更加專注智能語音等人工智能技術研究與產業化的推廣與應用,通過與產業內合作伙伴的精誠合作,共同推動中國智能車載設備全面服務社會大眾,共同加快智能化生活時代到來的步伐!