AI在阅读理解领域开始“跑分”，这个“人类好帮手”还能去哪炫技

来源：整理时间：2022-08-13 16:50:17 编辑：派代电商手机版

：一般采用多层的循环神经网络得到问题和文章段落的每个词的上下文相关的表示。

Matching Layer（相当于带着问题读段落）：得到问题里面的词和文章段落词之间的对应（或者叫匹配）关系。基本是采用注意力（attention）的机制实现，常见的有基于Match-LSTM和Co-attention两种，这样就得到文章里面每个词的和问题相关的表示。

Self-Matching Layer（相当于人再读一遍进行验证）：在得到问题相关的词表示的基础上再采用self-attention的机制进一步完善文章段落中的词的表示。

AnswerPointerLayer（相当于人综合线索定位答题）:对文章段落里面的每个词预测其是答案开始以及答案结束的概率，从而计算文章段落中答案概率最大的子串输出为答案。

所谓一千个读者有一千个哈姆雷特，我们人类在理解一篇文章的时候往往会带上自己的主观色彩，每个人都会生成自己的看法。而AI呢？在做题之外又能否对文章生成不一样的看法？

AI疯狂“跑分”，其结果是成为人类更好的帮手

之所以大家都认为AI阅读理解超越了人类，是因为从技术原理来讲，AI阅读理解超越人类是一件非常合理的事情。

首先，AI“阅读”的能力正在一天天提升，自然语言处理技术的突破，很可能取代人类的“理解力”。其次，深度神经网络模型能够模拟人类在做阅读理解问题时的一些行为，包括结合篇章内容审题，带着问题反复阅读文章，避免阅读中遗忘而进行相关标注等。于是，自然语言处理技术和深度神经网络模型相结合，使得AI可以进行超乎人类的阅读理解，似乎就成为了顺理成章的一件事。

于是很多人开始思考，AI阅读理解是否会替代由人工完成的规则、对话、服务信息类的相关理解工作？事实上，这种想法仅仅是理论上成立，但在实际应用时还有很多问题。

首先是把阅读理解这件事过分简单化了。阅读理解的题目分为精准匹配和模糊匹配，前者是硬性的阅读理解，即看到一段文字提取对应的信息，并进行简单的加工处理得到直观的信息；后者则是通过一段文字或一篇文章，结合文字背后的背景信息以及现实世界中的社会、人文背景以及读者的阅历等诸多方面，经过逻辑和“感性”的思考得出的理解和感受。换句话说，阅读理解是包含了语境理解、人文理解以及对内容熟稔之后的综合工作。这些显然是AI无法替代的。

再者，AI阅读理解的“跑分”结果是有着前提约束条件的，比如在确定的题库和测试时间，并且只是成年人平均理解水平。而要进一步推动阅读理解技术的发展，就得跟无人驾驶汽车分级测试一样需要设定问题的难度，逐级增加难度，对每一个级别建立训练和评测集合。