Extended dialog bAbI tasks and CBT-OOV datasets
收藏数据集概述
本数据集包含扩展版的对话bAbI任务1、2和4以及CBT测试集的OOV版本,旨在解决自然语言处理(NLP)任务中对命名实体(NEs)的依赖问题,特别是在遇到Out-Of-Vocabulary(OOV)或罕见NEs时,现有依赖于学习词嵌入的神经方法可能表现不佳的问题。
数据集内容
-
扩展对话bAbI任务
- 基于Facebook发布的“对话bAbI任务数据”数据集的改编。
- 遵循CC BY 3.0 Unported许可。
-
CBT-OOV数据集
- 基于Facebook发布的“儿童图书测试(CBT)”数据集的改编。
- 遵循GNU自由文档许可证(版本1.3,2008年11月3日)。
许可信息
本数据集遵循CC BY-SA 4.0许可。
引用信息
若在研究中使用此数据集,请引用以下论文: shell @inproceedings{DBLP:conf/ranlp/RajendranGGYSP19, author = {Janarthanan Rajendran and Jatin Ganhotra and Xiaoxiao Guo and Mo Yu and Satinder Singh and Lazaros Polymenakos}, title = {NE-Table: {A} Neural key-value table for Named Entities}, booktitle = {Proceedings of the International Conference on Recent Advances in Natural Language Processing, {RANLP} 2019, Varna, Bulgaria, September 2-4, 2019}, pages = {980--993}, year = {2019}, url = {https://doi.org/10.26615/978-954-452-056-4_114}, doi = {10.26615/978-954-452-056-4_114} }
数据集元数据
- 名称:扩展对话bAbI任务和CBT-OOV数据集
- 别名:扩展对话bAbI任务1、2和4及CBT测试集的OOV版本
- URL:https://github.com/IBM/ne-table-datasets
- 描述:许多自然语言处理(NLP)任务依赖于使用文本和外部知识源中包含的命名实体(NEs)。虽然这对人类来说很容易,但依赖于学习词嵌入的现有神经方法可能在这些NLP任务中表现不佳,特别是在存在Out-Of-Vocabulary(OOV)或罕见NEs的情况下。
- 提供者:IBM
- 引用:https://dblp.org/rec/conf/ranlp/RajendranGGYSP19




