自然语言模型【自然语言处理】自然语言处理中神经注意模型的批判性回顾

Computation and Language (cs.CL)

(Submitted on 4 Feb 2019)

摘要

注意力机制是一种在各种神经架构中，越来越流行。由于该领域的快速发展自然语言模型，人们仍然缺乏对系统的关注。在本文中自然语言模型，我们为自然语言处理的注意力架构定义了一个统一模型，重点是设计用于处理文本数据的矢量表示的架构。我们讨论提案不同的维度，关注的可能用途，并绘制该领域的主要研究活动和公开挑战。

要点

语言学理论模型_c语言自然常数e的x次方_自然语言模型

图1所示。RNNsearch结构（Bahdanau et al., 2015）（左）它的注意力模型（右）。

自然语言模型_c语言自然常数e的x次方_语言学理论模型

图2所示。注意力模型的核心。

语言学理论模型_自然语言模型_c语言自然常数e的x次方

图3所示。一般类型的注意力模型。

自然语言模型_语言学理论模型_c语言自然常数e的x次方

图4所示。注意力在序列到序列模型中的例子。

自然语言模型_语言学理论模型_c语言自然常数e的x次方

图5所示。Yang et al. (2016b)(左)，Zhao and Zhang(2018)(中)，Ma et al.(2018)(右)定义的分层输入注意模型。从左到右依次应用不同层次的注意功能。

语言学理论模型_c语言自然常数e的x次方_自然语言模型

图6所示。: Lu et al.(2016)(左)和Ma et al.(2017)(右)的粗粒度联合注意模型。

c语言自然常数e的x次方_语言学理论模型_自然语言模型

图7所示。dos Santos et al.(2016)(左)和Cui et al.(2017)(右)提出的细粒度共同注意模型。虚线显示了最大池/分布函数是如何执行的(按列或按行)。

英文原文

Attention is an increasingly popular mechanism used in a wide range of neural architectures. Because of the fast-paced advances in this domain, a systematic overview of attention is still missing. In this article, we define a unified model for attention architectures for natural language processing, with a focus on architectures designed to work with vector representation of the textual data. We discuss the dimensions along which proposals differ, the possible uses of attention, and chart the major research activities and open challenges in the area.

———END———
限时特惠：本站每日持续更新海量各大内部创业教程，一年会员只需128元，全站资源免费下载点击查看详情
站长微信：jiumai99

声明：本站内容转载于网络，版权归原作者所有，仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。本站仅保存近一年的最新资源，过期资源将不在保留。若本站内容侵犯了原著者的合法权益，可联系我们进行处理。本站仅作项目分享，不提供任何收益保障，风险自辩，不对操作项目的收益及损失负责.站长不是项目作者，不负责项目解答

序列所示架构模型神经

发表回复取消回复

快速搜索

每日更新热点项目

相关文章

发表回复 取消回复

发表回复取消回复