作為雙11背后龐大系統的大腦,忙碌的阿里云人工智能ET還抽空表演了一個神奇的魔術。
11月10日晚,“天貓雙11狂歡夜”在深圳大運中心拉開巨幕。除了匯聚全球半個娛樂圈的明星外,還有一位擁有“超能力”的神秘嘉賓登場——阿里云人工智能ET。在全球上億觀眾的見證下,ET隔空計算出5人手中的撲克牌,震驚全場。
在狂歡夜的壓軸環節中,ET一出場便秀出強悍的語音識別和交互能力,與主持人華少神同步。眾所周知,華少憑借400字/分鐘的語速被譽為“中國好舌頭”。ET竟然可以實時將華少的現場口播翻譯成文字,投在電視機屏幕上,達到極高的準確率。好玩的是,一旦出現錯誤,ET還會結合上下文語境進行毫秒級修正。
不但能聽懂華少的問題,ET還能通過現場觀察和思考,模仿人類的聲音回答問題。
華少發出挑戰:從32張撲克牌中抽出5張,ET你能不能猜出是什么?隨后主持人邀請五位現場觀眾上臺,并依次切牌打亂順序后抽出5張。ET能算出他們手中的牌嗎?

阿里云人工智能ET在天貓雙11狂歡夜上表演魔術,隔空猜牌,全對
ET略略沉思,提了一個小要求,請抽到黑色牌面的觀眾轉身。通過機器視覺識別出轉身觀眾后, ET瞬間計算出答案:梅花A……五個居然全中!ET的神奇表現讓主持人大吃一驚,“實在是太,不,可,思,議了!”
理論上32張撲克牌分到5人手里要全部猜對的概率是2400萬分之一。ET究竟是如何做到的呢?
“這是一個經典的魔術,不過這次是由人工智能魔術師來表演。32張撲克牌以De Bruijn 序列排列,五人洗牌之后,實際上排列可能減少到32種,ET將轉身觀眾(黑牌)記作1紅牌觀眾記為0。進一步從32種可能性中算出最終的唯一排列”,阿里云人工智能科學家初敏說,通常這個魔術非常考驗魔術師的記憶和推算能力。對ET來說,這些都不是難題。
難的是整個過程中需要ET要具備高精確度、高實時性的視頻識別能力,并用人類的語言和主持人溝通交流。“因直播環境受到場地、燈光、音效的影響,語音識別、視頻識別都會受到很大考驗”,初敏說。
據了解,無論是語音識別還是圖像識別,底層都依賴于深度學習算法以及大規模計算能力。一套復雜算法模型的訓練往往需要千億級別的樣本數據,這就對背后的計算能力提出了很高的要求。
ET代表的是阿里云語音識別、語音合成、自然語言理解、實時圖像識別、機器學習的綜合技術,背后是阿里云飛天操作系統強大的計算能力。
值得注意的是,這并非ET第一次登上舞臺。在今年4月份湖南衛視《我是歌手》的決賽中,ET在直播現場成功預測了李玟奪冠。而在其他領域,ET已經開始擔任法庭書記員、超級交通警察、影視投資經理、客服等角色。

