搜索引擎正在發(fā)生一場靜悄悄的變革,在平靜的搜索結(jié)果頁背后,巨大的浪潮在洶涌澎湃。上一次革命是Pagerank的誕生,它使得Google替代Yahoo成為搜索巨頭,這次輪到了Facebook和Twitter。
在2012年底前后,F(xiàn)acebook、Twitter和國內(nèi)的云云都先后推出了基于社交數(shù)據(jù)的搜索引擎(云云搜索基于新浪、騰訊等四大微博的數(shù)據(jù)源)。盡管有些巧合,但其背后隱藏的邏輯不可低估——以Pagerank(web graph)為基石的傳統(tǒng)搜索引擎,遇到了整合了social graph社交搜索的強(qiáng)大挑戰(zhàn)。
為什么說這是個(gè)強(qiáng)大的挑戰(zhàn),social graph(社交圖譜或社會化搜索)將以什么方式顛覆傳統(tǒng)搜索呢?

傳統(tǒng)網(wǎng)頁的信息源危機(jī)
任何搜索的基礎(chǔ),都是豐富的、海量的信息。當(dāng)世界上的web網(wǎng)頁足夠多的時(shí)候,Google的存在才有意義。1998年的時(shí)候,網(wǎng)上的網(wǎng)站只有那么幾個(gè),掰著手指就可以數(shù)出來,這種信息匱乏的情況下,當(dāng)然用不著多強(qiáng)大的搜索。
隨著網(wǎng)頁信息的增加,在網(wǎng)上尋找信息的網(wǎng)民分化成了兩個(gè)部分:一部分網(wǎng)民的需求,hao123就可以滿足;而更大量、更多網(wǎng)民的信息檢索需求,列表式的網(wǎng)址導(dǎo)航無法滿足,從而誕生了Google和百度。
可以說,有價(jià)值的信息在哪里,搜索的價(jià)值就在哪里。當(dāng)移動互聯(lián)網(wǎng)上產(chǎn)生的信息足夠多、足夠有價(jià)值的時(shí)候,移動搜索就順理成章地出現(xiàn);當(dāng)大量有價(jià)值的信息出現(xiàn)在微博、Twitter上時(shí),微博搜索出現(xiàn)了,社會化搜索的曙光也出現(xiàn)了。
我們可以做個(gè)對比:中國互聯(lián)網(wǎng)上有網(wǎng)站268萬個(gè)(根據(jù)第31次CNNIC報(bào)告),主流搜索引擎索引的中文網(wǎng)頁數(shù)量為1000億;現(xiàn)在有三四千萬微博用戶活躍,每天生產(chǎn)出2、3億條微博信息。微博上一年產(chǎn)生的數(shù)據(jù)量,幾乎等于中文互聯(lián)網(wǎng)有史以來產(chǎn)生的所有數(shù)據(jù)。
如此海量的信息,產(chǎn)生的價(jià)值無可估量。
由于微博是每個(gè)人都可以自由產(chǎn)生信息,比傳統(tǒng)網(wǎng)站經(jīng)過編輯的信息產(chǎn)生效率高出一兩個(gè)數(shù)量級;微博實(shí)名認(rèn)證,每天有幾十萬個(gè)實(shí)名認(rèn)證的企業(yè)、行業(yè)精英來產(chǎn)生內(nèi)容,在很多方面比傳統(tǒng)的互聯(lián)網(wǎng)新聞要可靠、值得信任。比如,同樣一條醫(yī)療信息,你是相信百度搜索出來的網(wǎng)頁,還是相信協(xié)和醫(yī)院醫(yī)生的微博?
Social Graph凸顯朋友的價(jià)值
社交數(shù)據(jù)越來越體現(xiàn)出來在搜索上的價(jià)值,無論是Google這樣的傳統(tǒng)搜索引擎,還是Facebook、Twitter這樣的社交信息擁有者,都異曲同工的瞄準(zhǔn)了社交搜索這個(gè)全新的領(lǐng)域。在國內(nèi),以云云為代表的社交搜索也順勢而起,借助社交因素來優(yōu)化搜索,為用戶提供更準(zhǔn)確的搜索結(jié)果。
從技術(shù)角度來講,F(xiàn)acebook、Twitter跟云云的努力方向并不一致。
例如,搜索“北京最好吃的爆肚”,F(xiàn)acebook是先挑選你在Facebook上的朋友,再在他們發(fā)表的信息里搜索“爆肚”;而云云則是在需要你先登錄,綁定微博后獲知你的微博關(guān)系,再把你的微博好友“動”過的包含“爆肚”的網(wǎng)頁挑出來(這個(gè)“動”,意味著好友對網(wǎng)頁進(jìn)行了贊、轉(zhuǎn)發(fā)等動作)。
理想狀態(tài)下,兩者都可以檢索到想要的結(jié)果,只不過體現(xiàn)在搜索結(jié)果頁上,一個(gè)是Facebook的一條內(nèi)容,一個(gè)是普通的中文網(wǎng)頁。(Facebook的搜索原理,僅是依據(jù)媒體報(bào)道推測,未看到產(chǎn)品呈現(xiàn))
傳統(tǒng)搜索是分析網(wǎng)頁之間的關(guān)系,F(xiàn)acebook搜索是分析人與人之間的關(guān)系,是一種進(jìn)步和趨勢。加入“人”之后的搜索會更加精準(zhǔn)、更個(gè)性化,也更有效。
Web和People的互動,將提升搜索的價(jià)值
Facebook的搜索理論上很有用,因?yàn)槿烁酥g的關(guān)系(link)有價(jià)值。在搜索結(jié)果中,存在著大量并非絕對標(biāo)準(zhǔn)、僅對少部分人有意義的搜索結(jié)果:比如“小明愛吃的面包”,只對小明這個(gè)人周圍的圈子——小明的爸爸、小明的媽媽、小明的朋友有意義,別人對他愛吃什么面包沒興趣。
小明的媽媽搜“好吃的面包”,實(shí)際上可能是為了找“小明愛吃什么面包”,現(xiàn)在的搜索引擎99%是找不到好結(jié)果的。整合了社交數(shù)據(jù)之后,搜索結(jié)果的有效性就會大幅提升。因?yàn)樾∶鞯膵寢屧谛吕宋⒉┥详P(guān)注了小明,當(dāng)她搜“好吃的面包”時(shí),小明轉(zhuǎn)發(fā)過的面包網(wǎng)頁就會排在搜索結(jié)果前列,這樣就有了一個(gè)很棒的搜索結(jié)果。
另外,單純的搜索社交數(shù)據(jù)也是不夠的。就像Facebook一樣,只能搜索社交網(wǎng)絡(luò)上的信息顯得有些單薄,因?yàn)楝F(xiàn)在傳統(tǒng)的互聯(lián)網(wǎng)上也沉淀了大量有價(jià)值的內(nèi)容,無論是Wiki(中文互聯(lián)網(wǎng)上的百科)、問答,還是傳統(tǒng)的論壇和社區(qū),都有不少有用的數(shù)據(jù)。必須是網(wǎng)頁和人的關(guān)系整合在一起,才是社會化搜索的發(fā)展方向。
關(guān)鍵詞搜索和語義搜索的不同
在現(xiàn)有的搜索里,“小明愛吃的面包”和“小明 面包”是兩種搜索方式。前面的語義搜索對用戶更加友好,但使得搜索引擎對自然語言的處理要求更高;后一種關(guān)鍵詞搜索是現(xiàn)在常用的方式,比如Google和百度搜索,大家還是更習(xí)慣于挑幾個(gè)詞來查詢。這種查詢處理起來簡單,但搜索結(jié)果可能需要用戶進(jìn)一步的篩選,給普通用戶的搜索帶來困擾。
從目前報(bào)道的信息來看,F(xiàn)acebook的Social graph和蘋果的Siri類似,都是用自然語言的語義搜索。如果這種搜索習(xí)慣在普通用戶中逐漸培養(yǎng)起來的話,可能給Google和百度這樣的傳統(tǒng)引擎帶來麻煩,比如在Google上搜“我今天下午到哪兒去喝茶會遇到漂亮姑娘”,你猜Google會給一個(gè)什么結(jié)果?
