7月11日,樂(lè)視網(wǎng)CEO梁軍在2017中國(guó)互聯(lián)網(wǎng)大會(huì)上做了主題為“新樂(lè)視”的演講,這也是梁軍出任樂(lè)視網(wǎng)CEO后的首次公眾亮相。樂(lè)視在互聯(lián)網(wǎng)大屏行業(yè)完成諸多里程碑,在演講中梁軍預(yù)言未來(lái)2、3年即將迎來(lái)互聯(lián)網(wǎng)大屏紅利集中爆發(fā),與諸多事先布局和技術(shù)儲(chǔ)備分不開(kāi)的。其中一份重要的智能技術(shù)儲(chǔ)備就是:樂(lè)視語(yǔ)音。
智能電視串聯(lián)牌照商與內(nèi)容商,將應(yīng)用落到實(shí)處
基數(shù)最大的終端用戶需要好內(nèi)容,好內(nèi)容需要好牌照商來(lái)分發(fā),好牌照商需要好硬件來(lái)呈現(xiàn),好硬件需要好應(yīng)用落到實(shí)處。內(nèi)容、牌照商、硬件、應(yīng)用不能孤立存在,而硬件則更好得將這一切串聯(lián)。能夠做到如此整合生態(tài)鏈的,當(dāng)屬OTT互聯(lián)網(wǎng)電視龍頭樂(lè)視超級(jí)電視。
智能語(yǔ)音作為人工智能領(lǐng)域的一個(gè)重要分支,最近被大規(guī)模的應(yīng)用到了互聯(lián)網(wǎng)電視領(lǐng)域,今年發(fā)布的大部分互聯(lián)網(wǎng)電視都具備了智能語(yǔ)音交互功能,語(yǔ)音已經(jīng)成為了大屏必不可少的交互手段,但是幾乎所有的電視廠商都采用不同的技術(shù)供應(yīng)商的方案組合實(shí)現(xiàn)智能語(yǔ)音能力,樂(lè)視是大屏領(lǐng)域少數(shù)的具備全流程自主,自研智能語(yǔ)音能力的公司,因?yàn)榫邆溥@樣的能力,樂(lè)視電視能夠更好的滿足大屏用戶的需求。
對(duì)于2017年OTT電視領(lǐng)域突然興起的人工智能而言,樂(lè)視超級(jí)電視的TTS語(yǔ)音功能早已經(jīng)在2013年發(fā)布超級(jí)語(yǔ)音功能,隨著與用戶實(shí)際應(yīng)用和用戶需求不斷做著升級(jí)。7月11日,樂(lè)視語(yǔ)音全新升級(jí)為3.0版本。同時(shí),第4代樂(lè)視超級(jí)電視全面支持超級(jí)語(yǔ)音功能,將語(yǔ)音應(yīng)用落到實(shí)處。
樂(lè)視語(yǔ)音3.0全量發(fā)布
樂(lè)視語(yǔ)音3.0最近全量發(fā)布,整體識(shí)別、認(rèn)知能力大幅提升,用戶語(yǔ)音交互活躍量發(fā)布兩周提升了50%。該版本增加了自主認(rèn)知、會(huì)話式語(yǔ)音交互等多項(xiàng)核心能力。該版本的發(fā)布也標(biāo)志著,樂(lè)視成為了互聯(lián)網(wǎng)電視行業(yè)里第一個(gè)具備自主、自研大屏專有TTS綜合服務(wù)能力的公司。
樂(lè)視語(yǔ)音3.0的交互方式從原有的功能應(yīng)答模式轉(zhuǎn)變?yōu)闀?huì)話交互模式,這種方式使得人機(jī)交互更加自然,為了保持交互體驗(yàn)上的統(tǒng)一,在語(yǔ)音識(shí)別過(guò)程中采用了同步實(shí)時(shí)識(shí)別的模式,進(jìn)一步優(yōu)化了識(shí)別效果和用戶體驗(yàn)。
相比于之前的版本,同步實(shí)時(shí)識(shí)別可以有效的解決大屏語(yǔ)音用戶的主觀性延遲體驗(yàn)的問(wèn)題,讓用戶可以擁有更加自然、流暢的大屏語(yǔ)音交互體驗(yàn);樂(lè)視語(yǔ)音團(tuán)隊(duì)對(duì)整體的交互過(guò)程采用了分片化的拆分管理技術(shù),以此來(lái)保證在大屏上統(tǒng)一的會(huì)話式語(yǔ)音交互方式。
自主認(rèn)知系統(tǒng)是樂(lè)視語(yǔ)音的學(xué)習(xí)系統(tǒng),通過(guò)這一系統(tǒng)樂(lè)視語(yǔ)音具備了自主認(rèn)知學(xué)習(xí)能力,在知識(shí)領(lǐng)域構(gòu)建過(guò)程中,依靠自主認(rèn)知系統(tǒng),可以很容易讓系統(tǒng)學(xué)習(xí)到對(duì)應(yīng)領(lǐng)域的知識(shí),并通過(guò)會(huì)話管理系統(tǒng)實(shí)現(xiàn)與用戶的領(lǐng)域交流。
大屏TTS綜合服務(wù)包含語(yǔ)音合成、意圖翻譯等幾個(gè)核心模塊;語(yǔ)音合成要對(duì)發(fā)音語(yǔ)料進(jìn)行嚴(yán)格的篩選,發(fā)音人任何的健康波動(dòng)(如感冒等)都會(huì)影響音質(zhì),因此要保證發(fā)音人在最佳狀態(tài)的情況下進(jìn)行上萬(wàn)次的發(fā)音選取,并且針對(duì)大屏語(yǔ)音用戶的實(shí)際特點(diǎn),樂(lè)視語(yǔ)音團(tuán)隊(duì)構(gòu)建了更加適合于大屏交互的語(yǔ)音合成架構(gòu),訓(xùn)練出了專有合成引擎,并研發(fā)出了意圖翻譯模塊,可以向用戶展示出更加多元化的互動(dòng)性信息。
開(kāi)放的樂(lè)視語(yǔ)音,再次提升大屏TTS綜合服務(wù)能力
樂(lè)視語(yǔ)音3.0的交互方式從原有的功能應(yīng)答模式轉(zhuǎn)變?yōu)闀?huì)話交互模式,這種方式使得人機(jī)交互更加自然,為了保持交互體驗(yàn)上的統(tǒng)一,在語(yǔ)音識(shí)別過(guò)程中采用了同步實(shí)時(shí)識(shí)別的模式,進(jìn)一步優(yōu)化了識(shí)別效果和用戶體驗(yàn)。
大屏語(yǔ)音識(shí)別有著自己特定的使用場(chǎng)景和特點(diǎn),圍繞這些場(chǎng)景、特點(diǎn),樂(lè)視語(yǔ)音團(tuán)隊(duì)在多個(gè)模塊構(gòu)建了多種專屬領(lǐng)域模型,用于有效的理解用戶語(yǔ)音所表達(dá)的真實(shí)意圖,與此同時(shí)圍繞著大屏語(yǔ)音的特點(diǎn),開(kāi)發(fā)出了一系列的模型方法,大幅提升了語(yǔ)音的整體識(shí)別效果;以同音碰撞仲裁算法為例,此算法就是在大屏語(yǔ)音助手的研發(fā)過(guò)程中被提出的,用于解決大屏語(yǔ)音十分突出的同音碰撞問(wèn)題。例如,動(dòng)態(tài)識(shí)別出同音碰撞,及時(shí)把“沒(méi)事”調(diào)整為“美食”等。
樂(lè)視語(yǔ)音3.0相比于之前的版本,同步實(shí)時(shí)識(shí)別可以有效的解決大屏語(yǔ)音用戶的主觀性延遲體驗(yàn)的問(wèn)題,讓用戶可以擁有更加自然、流暢的大屏語(yǔ)音交互體驗(yàn);樂(lè)視語(yǔ)音團(tuán)隊(duì)對(duì)整體的交互過(guò)程采用了分片化的拆分管理技術(shù),以此來(lái)保證在大屏上統(tǒng)一的會(huì)話式語(yǔ)音交互方式。
樂(lè)視語(yǔ)音服務(wù)作為專業(yè)服務(wù)大屏端業(yè)務(wù)場(chǎng)景的智能語(yǔ)音系統(tǒng),具備從語(yǔ)音識(shí)別、語(yǔ)義理解、TTS綜合服務(wù)到語(yǔ)音大數(shù)據(jù)的全流程、整套技術(shù)體系的核心技術(shù),并保持著在大屏領(lǐng)域的技術(shù)先進(jìn)性。代表“新樂(lè)視”的樂(lè)視網(wǎng)CEO梁軍,其規(guī)劃的大屏增值計(jì)劃早已開(kāi)啟,面對(duì)互聯(lián)網(wǎng)大屏這個(gè)“軟黃金”而言,樂(lè)視超級(jí)電視已經(jīng)具備足夠的開(kāi)采能力。以面對(duì)企業(yè)級(jí)客戶的樂(lè)視云(智能云)、方舟系統(tǒng)(廣告服務(wù))、BOSS(一站式商業(yè))、AI(智能算法)、觀星系統(tǒng)(用戶洞察)五大智能平臺(tái),和面對(duì)終端用戶的EUI操作系統(tǒng)、樂(lè)視語(yǔ)音、體感控制等智能人機(jī)交互系統(tǒng),早已為互聯(lián)網(wǎng)大屏這個(gè)金礦做好準(zhǔn)備。