近日,中国平安旗下平安产险人工智能团队在icdar(国际文档分析与识别大会)上的国际票据扫描件文字识别和信息提取(sroie)大赛中脱颖而出,击败了国内外100多家参赛单位和队伍,综合检测识别技术位列榜单第一位,荣获世界第一。
icdar专注于文本领域的识别与应用,每两年会举办一次各种文档的识别竞赛,至今吸引了89个国家的3500多支队伍参与,google、microsoft、amazon、 facebook、北京大学、中国科学技术大学、腾讯、搜狗等均曾参与其中,具有ocr(智能单证识别)领域的奥斯卡盛会之称。
sroie大赛是由icdar主办的国际顶级赛事,是目前ocr技术领域全球最具挑战性的比赛。sroie比赛在对购物小票做文本检测和文本识别的基础上还加入了极具挑战的“关键信息抽取” 任务,包括“商店名称”“商店地址”“购物物品”和“总价”4个信息的提取。这需要充分理解文档、证件和小票等内容,定位识别并将所需要的关键信息提取出来,相比常规的ocr具有更高准确度的要求。
本次比赛数据使用了真实的购物小票,票面质量恶劣、格式不统一,是最贴近真实业务场景的一次,难度相当高。在本次比赛中,平安产险从检测到文字识别到最后“关键信息抽取识别”的综合能力比拼中力压群雄,夺得第一,超过了众多人工智能领先企业。
平安产险相关负责人介绍,在全面线上化、自动化、数据化转型的过程中,公司众多业务场景都需要实现各种单证识别和信息提取,而ocr技术是关键。目前,ocr技术已经在产险承保、理赔等环节被广泛应用,包括身份证、银行卡、驾驶证、行驶证、新车合格证、发票等10余种业务场景,年总使用量超过两千万,还有数十种类的单证识别正在研发应用中。
在中国平安“金融 科技”“金融 生态”的战略指引下,平安产险加大科技的投入,强化智慧化经营。目前,平安产险的科技人才近千人,人工智能团队70余人。基于人工智能等核心科技,平安产险已打造出智能机器人、ocr智能单证识别、ifd智能风控反欺诈平台、kyd驾驶风险预测、营销大脑、ai开放平台等六大创新产品。未来,平安产险将持续探索ai技术的场景化落地应用,加速向科技转型。