于2014年3月10日啟動報名的首屆阿里巴巴大數據競賽開賽一個月以來,報名隊伍數突破6400支,已經成為目前全球最大的算法類競賽之一。截止4月10日,阿里巴巴大數據競賽總參賽人數近1.5萬人。其中港澳臺參賽隊伍超過120支,海外隊伍超過80支。
此前,從1997年開始已舉辦了15屆的KDD CUP一直以來是世界范圍內最大規模的數據競賽,該競賽依附于美國計算機協會數據挖掘及知識發現專委會主辦的ACM SIGKDD國際會議(簡稱KDD)。作為數據挖掘研究領域的頂級年會,2012年的KDD CUP數據競賽曾經吸引了國內隊伍參加,但全球范圍內參加的隊伍數不超過1000支。
據悉,阿里巴巴大數據競賽是由阿里巴巴集團主辦,在阿里巴巴大數據科研平臺——“天池”上開展的,基于天貓真實推薦業務場景與海量真實用戶的訪問數據的推薦算法大賽。整個競賽過程持續九個月,將于十一月中旬結束。參賽選手不僅可以通過大賽接觸到真實的天貓用戶行為數據,還有機會被邀請到天貓,與天貓推薦算法團隊的工程師們一起設計雙11的個性化推薦產品。
阿里巴巴天池項目負責人王一婷對面向學術界免費開放天池平臺的目的解釋說,目前高校和科研機構在使用數據時,往往面臨兩個困擾,一是數據陳舊不鮮活,缺乏有價值的真實的商業數據,二是缺乏具有強大功能的計算平臺來支持復雜的數據處理。天池平臺將向學術界提供免費的科研數據和開放數據處理服務,幫助大數據科研領域的發展。“我們搭建一個大數據科研平臺,并向科研界提供數據和計算服務,在有安全措施保障的情況下,讓學術界神樣的理論與工程界的實際應用產生碰撞、擦出火花,促進大數據科研的發展——這個平臺就叫做天池平臺”,王一婷表示。
據介紹,阿里巴巴天池平臺是基于阿里集團自主研發的ODPS海量數據離線處理服務的大數據開放平臺,向學術界免費提供科研數據和開放數據處理服務(Open Data Processing Service, 簡稱ODPS)。ODPS以RESTful API的形式提供針對PB級別數據的批量處理能力,主要應用于數據分析、海量數據統計、數據挖掘、商業智能等領域。
