圖解世界互聯網大會黑科技：人工智能如何鑒黃？

2017-12-05 14:58:42來源：威易網作者：

12月3日-5日，第四屆世界互聯網大會在烏鎮召開。這兩天，除了大佬們的飯局，“黑科技”也成為這屆世界互聯網大會備受關注的焦點，烏鎮街黑科技體驗館展出了VR、AR、人工智能、翻譯蛋、機器人等多領域的高科技產品。

12月3日-5日，第四屆世界互聯網大會在烏鎮召開。這兩天，除了大佬們的飯局，“黑科技”也成為這屆世界互聯網大會備受關注的焦點，烏鎮街黑科技體驗館展出了VR、AR、人工智能、翻譯蛋、機器人等多領域的高科技產品。同時，網易云作為唯一的云計算產品參展，展示了其在云計算、大數據領域的“黑科技”：專屬云、超級容器、人工智能在內容安全和智能客服領域的應用、大數據可視化分析工具等。

以人工智能在內容安全領域的鑒黃應用為例，我們看網易云是如何研發和解決具體問題的。

從人工到智能，互聯網鑒黃歷經三個發展階段

從人工到機器，再到智能是很多工作或者產業歷經的發展階段，連“鑒黃”也不例外。在十余年前，互聯網剛起步的時候，UGC內容還不夠多，當時識別黃圖的做法簡單粗暴：人工查刪。“別小看了這個方法，其實針對當時的網絡環境（帶寬小，產品少，圖片數據也少），效果還是很不錯的。一天幾萬的圖片量，安排幾個人肉眼盯著看，發現有不良的圖片人工刪掉就好了”，網易云安全（易盾）CTO朱浩齊說。

此后，隨著互聯網的快速發展，互聯網產品普及率大大提升，網絡數據量暴增，一個產品一天出現幾百萬的圖片量實屬常見，靠堆人力完成內容審核已經難以為繼。“再說，互聯網產品也支撐不起幾百上千審核人員的成本。幸好相應的計算機視覺技術也有進步了，我們用膚色識別算法過濾掉大部分‘黃色’內容的圖片，剩下的再進入到人工審核，可以大大節約審核量”，朱浩齊說。據統計，經過機器膚色識別過濾后大約只有20%的圖片還需要人工審核。

不過，移動互聯網時代又提出了新的挑戰：各種類型的網絡數據量再次暴增，人工審核連20%的數據量也無法承受了，加上視頻、直播等業務和數據的爆發式增長，互聯網界迫切需要一個更加有效的方案來解決審核的問題�？上驳氖�，人工智能深度學習技術在這個階段也有了長足的進步。

“我們緊跟人工智能的技術熱潮，很早開始了研發機器學習的鑒黃系統，并且取得了顯著成果”，網易云安全CTO朱浩齊表示。目前，網易云安全（易盾）已經面向企業市場，每天會為中國的互聯網過濾1億條左右的有害信息。

人工智能鑒黃的三步：定義、學習、建模

“辨別一張圖是不是黃圖，從機器學習的角度看，本質上是一個分類問題：給定一張圖片，讓機器判斷是不是黃圖”，朱浩齊介紹，技術層面要做的就是研發一個“分類器”，讓它根據輸入的圖片計算出該圖片屬于“黃圖”類別的概率，然后再根據這個概率值輸出一個“是”或者“否”的結果。

眾所周知，電腦擅長的是數學運算，所以黃圖“分類器”需要先抽象成某種數學模型，這樣才有可能用電腦來運算。“為了方便理解，我們把數學模型定義為：y=f（x）。即給定圖片x，我們要找到一個函數f，通過計算f（x）可以得到這個圖片的黃圖概率y”，朱浩齊說，這看上去非常簡單，但既然要教機器分類，還需要有明確的分類標準，就是給“黃圖”下個準確的定義。

“這個過程是非常復雜的，因為黃圖并不是簡單的露點就是黃圖了，還包括不露點的色情、以及低俗圖片，另外還要排除雕塑、藝術作品等”，據朱浩齊介紹，有了定義之后，下一步就是根據定義來收集樣本數據。“幸好網易在20年的發展中，多領域的產品線通過審核工作積累了大量的圖片數據，我們從里面篩選出部分圖片作為訓練的數據”，這個工作消耗了大量的時間和人力成本，并且還一直在持續進行中。

圖片訓練的目的就是為了得到數學模型y=f(x)中的f，技術上稱之為特征提取。近些年來，基于深度學習的神經網絡模型在各種圖像識別的比賽中獲得了突破性的進展。網易云安全（易盾）同樣選用了CNN（卷積神經網絡）、GoogLeNet、ResNet（殘差網絡）三種深度網絡模型結構作為研究的基礎。通過這些模型，可以更加高效地把圖片數據轉變成了可以運算的數學模型，以便更快更好地得到f。

“我們經過不斷迭代和算法調參，得到了越來越精準的f（模型），在驗證圖集上也達到了99.9%以上的準確率，并且我們的技術仍在進化”，朱浩齊說。目前，除了智能鑒黃，網易云安全（易盾）同時開放有廣告過濾、暴恐識別、謠言檢測等內容安全服務，驗證碼、營銷反作弊、應用加固等業務安全服務，以及DDoS 防護、SSL 證書管理等網絡安全服務。

關鍵詞：世界互聯網大會

成人午夜激情影院,小视频免费在线观看,国产精品夜夜嗨,欧美日韩精品一区二区在线播放

圖解世界互聯網大會黑科技：人工智能如何鑒黃？

相關閱讀: