
國際文檔分析與識別大會(ICDAR)是文檔分析領域最權威的國際會議,也是全球OCR領域公認最權威的比賽之一,有“OCR領域奧斯卡”之稱。會議每兩年舉辦一次,每屆會發表大批高質量的學術論文,帶動技術更新迭代,對文字處理行業起到巨大推動作用。
眼控“Template-Instance Loss for Offline Handwritten Chinese CharacterRecognition”提出了一種新的損失函數用于中文手寫字符識別,對于中文識別和手寫識別兩個領域都起到了巨大的貢獻,也得到了ICDAR 2019組委會的認可和肯定。
當前,在國內外的計算機視覺研究領域針對于中文手寫識別問題主要有以下痛點和難點問題存在:
1.大多數漢字有相似的結構和共同的偏旁部首,難以區分;
2.手寫字符由于書寫潦草導致難以有效辨認。
針對于此,眼控AI研究院提出一種新的損失函數,由模板損失和實例損失組成。模板損失用于處理結構問題,放大不同漢字結構上的差異,實例損失可以很好地抑制書寫潦草帶來的混淆問題。此外,專家團隊還設計了一個新的漢字識別網絡,訓練的模型在識別率上達到行業最高水平。

(入選論文)
眼控AI研究院論文“Template-Instance Loss for OfflineHandwritten Chinese Character Recognition”的提出對中文手寫識別處理行業的發展起到巨大推動作用。其意義不僅僅在于提出一種新穎的損失函數用于漢字手寫識別,同樣可以應用到其他各種識別網絡中去;而且模型識別率達到了行業最高水平,提高了整體行業標準;解決了文字識別中最難的中文手寫識別問題,具有很大的現實應用價值。

