美文网首页
BiDAF 和 QANet

BiDAF 和 QANet

作者: 孙庚辛 | 来源:发表于2021-12-12 10:19 被阅读0次

BIDAF,这是一个多阶段的分层过程,它以不同的粒度级别表示上下文,并使用双向注意力流机制来实现 query-aware 的上下文表示,而无需提前总结。 实验评估表明,我们的模型在斯坦福问答数据集和 CNN/DailyMail 完形填空测试中达到了 state-of-the-art的结果。 消融分析显示了我们模型中每个组成部分的重要性。 可视化和 discussion 表明,我们的模型正在学习 MC 的合适表示,并且能够通过关注给定段落中的正确位置来回答复杂的问题。未来的工作包括扩展我们的方法,将注意力层和多步推理结合起来。

该模型的亮点在于双向注意力机制的提出,这种双向注意力机制在 QA 任务中充当编码器 或者推理单元中的一环 对后续的性能产生更大的影响,这才是最为重要的。

QANet 训练相对较快。与流行的 BiDAF 网络相比,QANet 的性能提升约 5~6 倍。我们用 60,000 次全局步骤训练网络,在 GTX1080 GPU 上大约需要 6 个小时。

Transformer 101 个思考问题:

https://gitee.com/oatmeal3000/Transformer101Q

相关文章

  • BiDAF 和 QANet

    BIDAF,这是一个多阶段的分层过程,它以不同的粒度级别表示上下文,并使用双向注意力流机制来实现 query-aw...

  • QANet

    QANet: Combining Local Convolution with Global Self-Atten...

  • Match-LSTM & BiDAF

    简介 抽取式QA是要在文档中定位问题的答案。模型输入是【Passage,Question】,模型输出是【start...

  • 机器阅读理解(MRC)必看论文 - BiDAF

    原创:张春阳 应用和数据集 QA SQuAD 后续影响 ELMo BERT 原始论文 BI-DIRECTIONAL...

  • -和 和 -

    产品介绍:和和是一款会员制共享平台;所有 经营者可在APP内注册和和商家成为会员供 应商(实体店、网店、微商、平台...

  • &和&&,|和||

    原文:https://blog.csdn.net/chinabestchina/article/details/7...

  • 和可和,非常和

    我年纪很小的时候,父亲有一本笔记本,上面只写了一句话:万物并育而不相害,道并行而不相悖。我当时很喜欢这句话,所以期...

  • kotlin中的空? 和 ?. 和 ?: 和 as? 和 !!

    ? 可空类型 kotlin和Java的类型系统之间的一个很重要的区别就是,Kotlin对可空类型的显示支持 也就是...

  • self. 和 _ 和 = 和 set

    声明了一个属性 @property (a,b) p1; 只有用self.调用时修饰关键词才起作用, 用_调用...

  • Observable和Observe和Subcriblers 和

    Observable事件源,被观察者。Subcriblers 观察者,事件订阅者Observer 同Subcrib...

网友评论

      本文标题:BiDAF 和 QANet

      本文链接:https://www.haomeiwen.com/subject/cdclfrtx.html