Matching Layer(相当于带着问题读段落):得到问题里面的词和文章段落词之间的对应(或者叫匹配)关系。基本是采用注意力(attention)的机制实现,常见的有基于Match-LSTM和Co-attention两种,这样就得到文章里面每个词的和问题相关的表示。
Self-Matching Layer(相当于人再读一遍进行验证):在得到问题相关的词表示的基础上再采用self-attention的机制进一步完善文章段落中的词的表示。
AnswerPointerLayer(相当于人综合线索定位答题):对文章段落里面的每个词预测其是答案开始以及答案结束的概率,从而计算文章段落中答案概率最大的子串输出为答案。
所谓一千个读者有一千个哈姆雷特,我们人类在理解一篇文章的时候往往会带上自己的主观色彩,每个人都会生成自己的看法。而AI呢?在做题之外又能否对文章生成不一样的看法?
AI疯狂“跑分”,其结果是成为人类更好的帮手
之所以大家都认为AI阅读理解超越了人类,是因为从技术原理来讲,AI阅读理解超越人类是一件非常合理的事情。
首先,AI“阅读”的能力正在一天天提升,自然语言处理技术的突破,很可能取代人类的“理解力”。其次,深度神经网络模型能够模拟人类在做阅读理解问题时的一些行为,包括结合篇章内容审题,带着问题反复阅读文章,避免阅读中遗忘而进行相关标注等。于是,自然语言处理技术和深度神经网络模型相结合,使得AI可以进行超乎人类的阅读理解,似乎就成为了顺理成章的一件事。
于是很多人开始思考,AI阅读理解是否会替代由人工完成的规则、对话、服务信息类的相关理解工作?事实上,这种想法仅仅是理论上成立,但在实际应用时还有很多问题。
首先是把阅读理解这件事过分简单化了。阅读理解的题目分为精准匹配和模糊匹配,前者是硬性的阅读理解,即看到一段文字提取对应的信息,并进行简单的加工处理得到直观的信息;后者则是通过一段文字或一篇文章,结合文字背后的背景信息以及现实世界中的社会、人文背景以及读者的阅历等诸多方面,经过逻辑和“感性”的思考得出的理解和感受。换句话说,阅读理解是包含了语境理解、人文理解以及对内容熟稔之后的综合工作。这些显然是AI无法替代的。
再者,AI阅读理解的“跑分”结果是有着前提约束条件的,比如在确定的题库和测试时间,并且只是成年人平均理解水平。而要进一步推动阅读理解技术的发展,就得跟无人驾驶汽车分级测试一样需要设定问题的难度,逐级增加难度,对每一个级别建立训练和评测集合。