對現在的手機用戶來說,使用手機攝像頭拍照識圖并不是一個陌生的功能,花草、商品等物品,使用很多App都可以做到相對精準的識別。不過,我們在使用中也不難發現,不管畫面里有多少種物品,這些App基本只能做到識別其中的一種,并不能像人眼觀察世界一樣,對所見的目標同時進行識別。在今天舉辦的“Baidu Create 2019”百度AI開發者大會上,百度高級副總裁、移動生態事業群組總經理沈抖展示了百度App上的“動態多目標識別”技術,就讓我們的手機朝著“像人眼一樣觀察世界”又走近了一步。
(百度高級副總裁、移動生態事業群組總經理沈抖做主題演講)
“動態多目標識別”技術是一項基于移動端實時感知和云端視覺搜索的類眼視覺AI技術,能夠實現所見即所得的信息瀏覽體驗,推出于2018年底,并且目前已經在百度App上應用。據沈抖在百度AI開發者大會現場介紹,“動態多目標識別”技術是基于飛槳移動端部署庫所實現,為了讓這項技術可以在手機端流暢運行,把云端原本200兆字節的視覺算法模型優化到了小于5兆字節,并實現了100毫秒以內識別物體、8毫秒內判斷物體位置并追蹤更新這樣的技術指標。
將這一技術應用在百度App上之后,用戶在使用中所能感受到的最大的不同就是同畫面中可以被識別的物品不再只有一個,并且隨著用戶實時移動攝像頭,百度App也會在實時追蹤已識別的物品的同時,識別新進入畫面中的物品。
用戶想要體驗“動態多目標識別”非常簡單,只要打開最新版百度App,點擊搜索框右側的相機按鈕,然后在拍照界面選擇“通用”場景下的“自動拍”模式即可。在AI開發者大會現場,沈抖使用該技術對多款不同品牌的化妝品進行了識別演示,識別效果迅速且準確。在精準識別的基礎上,借助百度移動生態提供的信息和服務,用戶還可以進行多平臺比價、直接下單購買等操作。
據介紹,百度App目前可以識別超過1000萬種物品,其中包含了20000多種植物以及上百萬種美妝產品;在此基礎上,百度App還支持超過30種場景的智能判斷,可以針對被識別物品的不同,提供不同的擴展信息和服務,例如識別出商品后提供同款和比價功能,識別出植物后提供辨認技巧和養護知識,識別出菜品或食材后提供熱量知功效等信息,識別出題目后提供答案及解題分析等等。
(現場演示百度App實時動態多目標技術一次識別兩款化妝品成功)
AI技術不斷向前發展的同時,也在不斷地走近我們的生活。憑借著領先的技術以及針對移動端的優化、適配,百度App“動態多目標識別”技術不但可以讓我們現在手中的手機攝像頭變得更加智能,在未來可能到來的IoT時代,這項技術還會讓更多的設備具備智能交互能力,帶給用戶更智能的AI交互體驗。