[arXiv18]更快的基于非二叉化自底向上策略的转移系统成分句法分析

时间:2022-12-29 17:00:02


原文链接:


​Faster Shift-Reduce Constituent Parsing with a Non-Binary, Bottom-Up Strategy​


论文地址:​​Faster Shift-Reduce Constituent Parsing with a Non-Binary, Bottom-Up Strategy​

介绍

这篇论文提出了一种非二叉化、自底向上的转移系统,并且针对它提出了一种Dynamic Oracle,用损失函数的形式来实现它。

之前的模型针对多叉树的处理都是采用head规则进行二叉化,或者采用空结点作为临时结点来进行隐式二叉化。但是本文将REDUCE动作扩展为REDUCE-k动作,从而可以对k叉树进行预测,这样减少了很多二叉树预测的中间过程,降低了模型的训练时间。并且为了提升准确率,还提出了一种用损失函数实现的Dynamic Oracle。

自底向上的转移系统就不详细介绍了,之前都已经介绍过了,这里只说明一下之后要用到的记号。

[arXiv18]更快的基于非二叉化自底向上策略的转移系统成分句法分析


[arXiv18]更快的基于非二叉化自底向上策略的转移系统成分句法分析


[arXiv18]更快的基于非二叉化自底向上策略的转移系统成分句法分析

[arXiv18]更快的基于非二叉化自底向上策略的转移系统成分句法分析

[arXiv18]更快的基于非二叉化自底向上策略的转移系统成分句法分析

[arXiv18]更快的基于非二叉化自底向上策略的转移系统成分句法分析

实验

实验采用的转移模型都是基于​​Dyer et al.​​​,并且也采用了​​James and Huang​​中的exploration策略来增加错误状态,提高Dynamic Oracle的准确率。

在PTB上的实验结果如下:


[arXiv18]更快的基于非二叉化自底向上策略的转移系统成分句法分析

结果其实也不是很高,现在来看算低的了,本文只和其他的转移系统结果进行了比较,可以说在转移系统上还算比较高的吧,虽然今年转移系统也做到了92.0了。在运行速度上,本文的模型也比其他转移系统略有提升,我感觉虽然不需要二叉化了,但是REDUCE#k动作的增加同样会增加复杂度,这是自底向上转移系统的一个固有的问题。

总结

本文提出了一个非二叉化的自底向上的转移系统,主要有如下几个贡献点吧:

  • 非二叉化预测,采用REDUCE#k动作。
  • 采用损失函数来实现Dynamic Oracle。
  • 准确率上超过了除了in-order的大多数转移系统。
  • 训练速度上是所有转移系统中最快的。

看完这篇,我准备在chart-based的top-down模型上面也搞一个这种Dynamic Oracle试试,需要改变的就是每个状态的损失函数,现在的F1还只有91.87,希望能有所突破吧。