國際文檔分析與識別大會(ICDAR)是文檔分析領(lǐng)域最權(quán)威的國際會議,也是全球OCR領(lǐng)域公認最權(quán)威的比賽之一,有“OCR領(lǐng)域奧斯卡”之稱。會議每兩年舉辦一次,每屆會發(fā)表大批高質(zhì)量的學(xué)術(shù)論文,帶動技術(shù)更新迭代,對文字處理行業(yè)起到巨大推動作用。
眼控“Template-Instance Loss for Offline Handwritten Chinese CharacterRecognition”提出了一種新的損失函數(shù)用于中文手寫字符識別,對于中文識別和手寫識別兩個領(lǐng)域都起到了巨大的貢獻,也得到了ICDAR 2019組委會的認可和肯定。
當前,在國內(nèi)外的計算機視覺研究領(lǐng)域針對于中文手寫識別問題主要有以下痛點和難點問題存在:
1.大多數(shù)漢字有相似的結(jié)構(gòu)和共同的偏旁部首,難以區(qū)分;
2.手寫字符由于書寫潦草導(dǎo)致難以有效辨認。
針對于此,眼控AI研究院提出一種新的損失函數(shù),由模板損失和實例損失組成。模板損失用于處理結(jié)構(gòu)問題,放大不同漢字結(jié)構(gòu)上的差異,實例損失可以很好地抑制書寫潦草帶來的混淆問題。此外,專家團隊還設(shè)計了一個新的漢字識別網(wǎng)絡(luò),訓(xùn)練的模型在識別率上達到行業(yè)最高水平。
(入選論文)
眼控AI研究院論文“Template-Instance Loss for OfflineHandwritten Chinese Character Recognition”的提出對中文手寫識別處理行業(yè)的發(fā)展起到巨大推動作用。其意義不僅僅在于提出一種新穎的損失函數(shù)用于漢字手寫識別,同樣可以應(yīng)用到其他各種識別網(wǎng)絡(luò)中去;而且模型識別率達到了行業(yè)最高水平,提高了整體行業(yè)標準;解決了文字識別中最難的中文手寫識別問題,具有很大的現(xiàn)實應(yīng)用價值。