5月22日,在主題為“新生態(tài),聯(lián)未來”的2018百度聯(lián)盟生態(tài)峰會上,百度高級副總裁、百度搜索公司總裁向海龍以“新‘視’代”為題發(fā)表了主題演講。向海龍表示,技術(shù)的發(fā)展讓視頻成為最直接最高效的溝通方式,全民視頻大爆發(fā)時代已經(jīng)來臨,百度依托AI能力,能夠讓復(fù)雜視頻的生產(chǎn)更容易、視頻的內(nèi)容檢索更簡單。百度已經(jīng)準(zhǔn)備好跟合作伙伴們一起,全面擁抱視頻時代。
(百度高級副總裁、百度搜索公司總裁向海龍發(fā)表主題演講)
“指手畫腳”,視頻將成“新原始人”的溝通主流
具有想象力的大腦和知識的沉淀和傳承,是人類以并不強(qiáng)壯的身軀成為萬物之靈的原因。向海龍表示,整個人類的進(jìn)化史實(shí)際上就是知識傳承方式的革命史。
從遠(yuǎn)古時期人類通過口語和手勢進(jìn)行無法留存的溝通,到文字和紙張被發(fā)明,人類的文明和知識才得以一代代被傳承。直到近代,視頻讓人類溝通重新回歸原始的“指手畫腳”的溝通模式,同時突破了時間和空間限制,將信息實(shí)現(xiàn)更高效、更廣闊的傳遞。很多例子都能夠證明,視頻是最高效的溝通和表達(dá)方式。
但在近幾年之前,視頻依然只是文字之外的一種補(bǔ)充方式,未能成為主流信息記錄模式,是源于視頻應(yīng)用的四個難點(diǎn):生產(chǎn)難——視頻生產(chǎn)需要專業(yè)設(shè)備,存儲難——需要很大的存儲空間,傳輸難——傳輸速度慢和流量資費(fèi)貴使得傳輸成本高,檢索難——基于語義理解和字面匹配的傳統(tǒng)檢索技術(shù)難以在視頻這種信息載體上直接應(yīng)用。
但隨著智能手機(jī)、云端存儲、4G網(wǎng)絡(luò)、wifi、AI的視覺識別及語音識別等各個領(lǐng)域的技術(shù)革新陸續(xù)出現(xiàn),原來視頻不能成為記錄主流模式的障礙已基本被打破。向海龍認(rèn)為,因?yàn)橐曨l的便利性,我們將進(jìn)入一種“新原始”時代,讓人們重新回歸傳統(tǒng)的溝通和表達(dá)方式,全民視頻大爆發(fā)的時代已經(jīng)到來,視頻將充斥我們工作和生活的方方面面。百度將依托深耕多年的AI優(yōu)勢,賦能復(fù)雜視頻生產(chǎn)和視頻檢索——百度AI將讓全民視頻時代更簡單。
“生產(chǎn)+檢索”更容易,AI賦能視頻時代開啟更多可能
向海龍?zhí)岬剑臄z一個高質(zhì)量視頻,特效是必不可少的。而以前,視頻中的高級效果大多是通過專業(yè)的后期制作實(shí)現(xiàn)的。現(xiàn)如今,通過AI技術(shù),任何人都能輕易實(shí)現(xiàn)這些酷炫的效果。基于百度AI技術(shù)具備的人體識別、形體美化、人景分離、語音識別、語音合成等能力,他在現(xiàn)場分別演示了“瘦身”、“分身術(shù)”、“變聲”的特效示例視頻,呈現(xiàn)了百度如何讓生產(chǎn)復(fù)雜視頻更簡單。
接下來,他又介紹了百度如何讓檢索視頻更準(zhǔn)確高效——通過對視頻的全景掃描,利用語音識別、人臉識別、物體識別等技術(shù)完整分析視頻中的內(nèi)容,將視頻背景、人物、語言等信息進(jìn)行組合,百度可以給每個視頻生成一個獨(dú)特的指紋,大幅提升視頻檢索的效率和準(zhǔn)確率。
現(xiàn)場演示視頻充分展示了百度的AI技術(shù)讓利用語音快速檢索視頻成為可能。向海龍還指出,當(dāng)視頻具有豐富標(biāo)簽,未來直接通過文字、語音或圖像,都可以快速實(shí)現(xiàn)大規(guī)模的視頻檢索。“哪怕突然有一首歌想不起來了,只要能哼唱一段,百度就能檢索出這首歌曲的MV。”
演講的最后,向海龍表示,百度已經(jīng)準(zhǔn)備好跟合作伙伴們一起,全面擁抱視頻時代。隨著5G時代即將來臨,人們的生活也將產(chǎn)生日新月異的變化。未來醫(yī)療和教育資源將更加均衡,精密的手術(shù)可以遠(yuǎn)程操作、高端教育課程可以隨時隨地進(jìn)行,游戲的體驗(yàn)和真實(shí)生活將融為一體。而人們的溝通方式也可能將全面進(jìn)入視頻時代,區(qū)別于原始人無法被記錄的“聲像”溝通,新的視頻時代將造就“新原始人”。視頻化的“新原始時代”,存在無限可能,既是挑戰(zhàn),也是巨大的機(jī)會。百度希望和伙伴一起,在這個新時代創(chuàng)造更多的價(jià)值。