在6月23日阿里郵箱的產(chǎn)品發(fā)布會上,阿里郵箱產(chǎn)品負(fù)責(zé)人張紫徽說了這么一個段子:“我第一次向當(dāng)時的老板提出要做郵箱時,我老板回答:‘做郵箱?我家的郵箱都長草了’。”
2009年,阿里郵箱團(tuán)隊成立,當(dāng)時它的名字還是“阿里云郵”。七年之后,這個曾被認(rèn)為會“長草”的郵箱產(chǎn)品以突破100萬的企業(yè)用戶數(shù)成為國內(nèi)企業(yè)郵箱市場第一,完成超300次迭代,并且更名“阿里郵箱”完成升級。
佘智勇是郵箱團(tuán)隊中呆滿整七年的技術(shù)專家,做郵箱產(chǎn)品的幕幕在他的記憶里仍然清晰。
2014年,為了滿足越來越多企業(yè)用戶提出的需求,阿里郵箱曾經(jīng)歷過一次大規(guī)模的數(shù)據(jù)庫遷移,數(shù)據(jù)量涉及數(shù)P,數(shù)據(jù)庫記錄達(dá)數(shù)百億條,這樣大規(guī)模的數(shù)據(jù)遷移在當(dāng)時的阿里巴巴都屬罕見。為了平穩(wěn)遷移,把對用戶的影響降到最小,阿里郵箱對用戶承諾只停服5分鐘,5分鐘后便可以正常使用。
佘智勇回憶,在約5個月的前期準(zhǔn)備之后,郵箱團(tuán)隊進(jìn)入了數(shù)據(jù)庫遷移的攻堅戰(zhàn)。每次數(shù)據(jù)搬運(yùn)約需3天,3天后便進(jìn)入數(shù)據(jù)校驗環(huán)節(jié),而為了實現(xiàn)對用戶的承諾,團(tuán)隊必須在5分鐘內(nèi)完成數(shù)百億條數(shù)據(jù)的校驗工作。
“這就好比在給一架飛行中的飛機(jī)換引擎,如果處理不當(dāng)就會墜毀。而在我們遷移數(shù)據(jù)的過程中,這架飛機(jī)墜毀了無數(shù)次。”佘智勇說,“很多次,到了最后幾分鐘,校驗程序驗證數(shù)據(jù)不對,如果要繼續(xù)核查,我們的停服時間就會超出5分鐘。為了不影響用戶體驗,每次我們都選擇從頭來過,再等3天。”
等3天,校驗數(shù)據(jù),數(shù)據(jù)不對,放棄從頭來過,再等3天……這樣的狀態(tài)延續(xù)了整整兩個月。
疲乏,是郵箱團(tuán)隊當(dāng)時的狀態(tài),但是遷移數(shù)據(jù)庫的工作還在繼續(xù)。
“最后一次驗證,驗證工具報錯,數(shù)百億條數(shù)據(jù)中有2條數(shù)據(jù)不對。怎么辦?在最后一分鐘,團(tuán)隊中一位不停以人肉校對數(shù)據(jù)的同學(xué)突然發(fā)現(xiàn),驗證工具存在bug。千鈞一發(fā)的時候,我們決定切新數(shù)據(jù)庫,而事實證明,所有的數(shù)據(jù)的確都對了。”
類似的緊急情況還出現(xiàn)過無數(shù)次,而為了一個功能、一個圖標(biāo),團(tuán)隊開會時拍桌走人的情況也不少見。
關(guān)于阿里郵箱未來的發(fā)展方向,佘智勇說:“郵箱最大的特點是跨平臺、跨公司,阿里郵箱就是要發(fā)揮郵箱的這個特點,更加徹底地開放自己,讓郵箱成為更高頻的產(chǎn)品,連接更多,不止于郵箱。”

