前不久有段视频在网上流传,视频显示长春一家银行内,有位大妈因为等待办理业务的时间太长,对业务员办事效率不满,就和AI机器人展开了对话。大妈问机器人:“你们的工作人员在里面哄孩子,怎么不出来办业务呢?”机器人答:“我们柜台里的哥哥姐姐也在很努力地办业务呢。”大妈不甘心,便轻轻把服务机器人的脑袋转向柜台,“你往里瞅瞅,是不是在哄孩子呢?”没想到机器人大声说:“你不要触碰我了!跟我说话就可以。”两人一本正经的“灵魂对话”,让网友们忍俊不禁。
NLP 最难一关:谁能越过 SQuAD 2.0的山丘?
这种主打聊天的机器人,其实只是在自然语言处理(Natural Language Processing)中的一个案例呈现,也只是人工智能领域的一小部分。纵观整个AI学界,当下最受关注的三大研究热门应是:自然语言处理、深度学习、以及信息检索,自然语言处理(NLP)作为其中研究难度最高的领域之一,也成为了众多科研学者最渴望实现突破的AI技术领域。
聚焦自然语言处理(NLP)的研究发展,目前主要有三个方向:翻译、聊天、阅读理解,其中翻译已经被人类研究到较高水平,近年来像银行机器人聊天也顺利落地使用了,三者中仅剩的一个老大难问题:阅读理解。微软创始人比尔盖茨也曾表示人工智能的关键是解决机器的阅读理解问题。
在机器阅读理解方面,数据集的获取是个技术难点,早期的阅读理解数据集如MCTest、Algebra、Science等都有着数据量小、难度较大等缺点。2016年,斯坦福大学通过亚马逊众包平台(AMT)建立了一个新的阅读理解数据集—SQuAD。这个数据集包含了100k个问题答案对,问题和答案只与维基百科中文章的某一段落有关,答案的形式是该段落的某一片段。如此一来,新型阅读理解数据集SQuAD的出现,大大降低了人们获取数据的时间成本。
目前SQuAD是业内公认的机器阅读理解标准水平权威测试,几乎让所有拥有搜索业务的公司趋之若鹜,通过参加他们举办的比赛来验证自身的科技实力。2018年6月3日,斯坦福NLP团队对外宣称, 机器阅读理解数据集1.1完成一波更新,已搭建完成SQuAD 2.0。相较于SQuAD 1.1中的10万问答,SQuAD 2.0又新增了5万个人类众包者对抗性地设计的问题,而且问题不一定有对应答案换句话说,执行 SQuAD 2.0 阅读理解任务的模型,不仅要能够在问题可回答时给出答案,还要判断哪些问题是阅读文本中没有材料支持的,并拒绝回答这些问题。这对机器阅读理解的要求,SQuAD 2.0比1.0难度大大提高,前来参赛的科技公司唯有拿出更精准的答案才能通过比赛。
中国战队全面领跑,平安金融壹账通浮出水面
常人看来难于上青天的事,在AI界来说或许是一种兴奋剂。试想一下,如果能让计算机来做高考英语的阅读理解题,而且还能获得高分,那么人类大脑是不是就得到了松绑和解放?这算不算科技造福人类的另一种体现?
事实上,国内外几支顶级的NLP研究团队不仅这么想,也是这么干的。谷歌、微软亚研院、阿里达摩院、科大讯飞、IBM、复旦大学……全世界最好的NLP团队每年都会在SQuAD赛事中碰面。
今年没想到是,有一支先前不被多数人关注的团队横空出世,在SQuAD最新榜单中勇夺第一。在2018年11月,冠军还属于哈工大讯飞联合实验室团队(HFL),如今宝座易主,成了黑马平安金融壹账通 GammaLab的囊中之物。
新晋冠军有多牛?本次的SQuAD竞赛中,这位新晋冠军深度学习模型的阅读理解能力已非常接近人类水平,可以阅读任何文章并回答问题,精准匹配准确度可达到83.435%,模糊匹配准确度可达到85.992%,而人类水平是86.831%(精确匹配)和89.452%(模糊匹配)。集成模型EM=83.435%、F1=85.992%,单模型EM=81.347%、F1:84.560%,新冠军的集成模型和单模型的成绩均列榜单首位,可以说是名副其实的双料王。
这个NLP的新晋世界冠军正是中国平安旗下的金融壹账通GammaLab(金融壹账通加马人工智能研究院)。虽然金融壹账通GammaLab的成立时间不到2年,SQuAD夺冠却已不是他们收获的第一个世界冠军了——
1 、2018年5月,在微表情国际权威评测OMG微表情竞赛(One Minute Gradual Emotion Challenge)公布的评测排行榜中,金融壹账通GammaLab的微表情识别技术取得重大突破,在情绪强烈程度(Arousal)和正负倾向(Valence)两方面均以最高分的成绩位列榜首,获得世界第一的排名;
2 、2018年11月,在2018 EmotioNet 国际面部动作单元(Action Unit, 简称AU)识别竞赛上,金融壹账通GammaLab以94.46%的准确率获得世界第一的排名;
3 、2018年11月,第一财经公布的“2018第一财经金融价值榜”中,金融壹账通GammaLab也凭借卓越的人工智能研发能力和金融场景落地能力脱颖而出,荣获第一财经“2018最佳人工智能研究院”大奖;
4 、2018年12月3日,金融壹账通GammaLab夺得SQuAD竞赛榜单第一名;
5 、……
只能说,中国平安的眼光很准。金融壹账通从成立至今,不足2年,却已经拥有超过350位科技人才,团队累计申请专利技术200多项,发表论文10余篇。
平安千亿投研,机器阅读理解深入两大场景应用
科技,特别是人工智能,对平安“金融+生态”战略执行与发展中,是至关重要的。当然,中国平安也对科研投入相当舍得,过去十年集团共投入70亿美元,将每年收入的1%用于金融科技及医疗科技的研发。2018年11月7日,在香港举行的以科技为题的投资者开放日上,中国平安副首席执行官、首席运营官兼首席信息执行官陈心颖表示,平安在未来十年的科技投入预计将达150亿美元。
什么概念?也就是1000亿人民币,是过去十年的2倍还多。这样的付出所得的汇报也非常明显,三大核心科技:人工智能、区块链和云计算,在当下及未来会持续赋能平安集团的五大生态圈:金融服务、医疗健康、汽车服务、房产服务及智慧城市服务。
仅仅是人工智能中的机器阅读理解技术,平安已经在两大金融场景落地应用:
A.保险场景:当业务员流动,客户被移交给其他业务员时,这种保单俗称孤儿单,对于新接手的业务员来说是很大挑战:一是保险条款较之前可能有所变化,需要业务员去审查消化才能讲给客户;二是客户熟悉需要过程,而且沟通成本较大。壹账通阅读理解技术的介入可以帮助业务员很好地解决这个问题,降低操作时间和难度,有效提升服务客户的效率,提升客户服务体验。
B.销售场景(银保业务):由于不熟悉产品而造成销售机会的浪费和误导销售的事情在银保业务销售中屡见不鲜。壹账通阅读理解技术可以自动阅读保险条款,辅助大堂经理快速准确回答客户问题。壹账通在2018年7月正式向行业发布加马智能营销方案,其中加马销售助手(Gamma eExpert)可以运用先进的语音识别技术,通过“虚拟客户经理”与客户就金融产品进行实时语音互动。在智能销售助手的帮助下,业务员在遇到问题均可在1秒内获得正确解答,平均业务时间缩短30%。
金融壹账通作为中国最大的金融服务SaaS平台,已为483家银行(包括93%的城市商业银行),42家保险公司以及2400家金融机构提供服务。并且打造了全球最大的商业区块链平台拥有40,000个节点,涉及200家银行,20万企业和其他500个商业和政府实体。还有一个数据可以说明技术实力:区块链TPS(每秒处理交易),金融壹账通达到50,000宗/秒。
后来者居上,平安助力中国金融科技势力崛起
在The Envisioners公司首席执行官、未来学家戴夫科普林(Dave Coplin)撰写的名为《好机器人》(Good Robot)的报告中表示:“我欢迎机器人进入我们的生活,不是作为我们的领主或奴隶,而是作为我们的伙伴,不是在竞争中工作,而是在合作中工作,将两个世界的优点结合起来,为我们所有人创造更美好的未来。”
尽管看到了阅读机器人是科技发展的必然趋势,但和其他擅长自然语言处理领域的科技巨头相比,平安在项目多样性和覆盖范围的广度上有着自己的独特优势,能依托自身丰富的金融业务场景来进行创新科技的具体实践,有着其他企业所不能比拟的落地场景和技术应用优势。30年的金融专长及数据积累、8.8亿个客户及超过8400万个企业数据、这些非常厚实的业务底子为科技落地提供了必然条件。仅是金融壹账通2,000位经验丰富的员工中,就有46%是科研人才。
明眼人会发现,平安以多场景应用带动科技落地的策略很成功,这也为阅读机器人的诞生提供了必要的生长条件。金融壹账通每年脸部及微表情识别的使用量超过10亿,拥有超过1000个专利,50个产品及2000个应用程序接口。平台的SAT智能营销解决方案,成功帮助了一家城市商业银行的22间分行增加客户活动,使这个银行支付方案的交易量在1个月内增加了3倍。
改革开放40年,中国平安创办30年,金融壹账通GammaLab成立还不到2年,就已经脱颖而出,获得了包括SQuAD在内的多个第一。接下来十年、未来会发展成什么样?看这个迅猛的势头,真不敢想。其实也不用想,平安不会止步于此,至少不会是传统金融世界的样子,也将进一步助力中国金融科技势力的崛起。GammaLab团队也不会满足在眼前,毕竟科技发展永无止境。让机器阅读理解等技术与人更加匹配的合作,更好的为8.8亿乃至更多人的金融科技生活服务,从美好的愿景变为一个完全的现实,已经越来越近了。
原创文章,作者:燕子李三,如若转载,请注明出处:《机器阅读理解能否超越人类?中国平安队给出了最有可能的答案》https://tianfangyantan.com/articles/3115