five

Felix-ML/quoteli3

收藏
Hugging Face2022-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Felix-ML/quoteli3
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集基于Muzny等人(2017)的quoteli3数据集,包含三部文学作品的注释引用:契诃夫的《草原》、奥斯汀的《艾玛》和《傲慢与偏见》。数据集的语言为英语,结构包括训练和测试数据,分别包含引用和角色的特征和行数。

This dataset is based on the quoteli3 dataset from Muzny et al. (2017). It contains annotated citations from three literary works: Anton Chekhov's *Steppe*, Jane Austen's *Emma* and *Pride and Prejudice*. The dataset is in English. Its structure includes training and test datasets, which respectively contain the features and line counts for citations and characters.
提供机构:
Felix-ML
原始信息汇总

数据集概述

数据集名称

  • 名称: quoteli3

数据集描述

  • 摘要: 该数据集基于Muzny等人(2017)的quoteli3数据集,包含三部文学作品(Chekhov的《The Steppe》、Austen的《Emma》和《Pride and Prejudice》)的标注引用。

语言

  • 语言: 英语

数据集结构

  • 训练数据:
    • 引用:
      • 特征: [mention, oid, speaker, connection, id, answer, answer_mention {answer, answer_start, answer_end, answer_in_context}, question, context, large_context, book_title]
      • 行数: 1575
    • 角色:
      • 特征: [aliases, description, gender, name, id, book_title]
      • 行数: 32
  • 测试数据:
    • 引用:
      • 特征: [mention, oid, speaker, connection, id, answer, answer_mention {answer, answer_start, answer_end, answer_in_context}, question, context, large_context, book_title]
      • 行数: 1513
    • 角色:
      • 特征: [aliases, description, gender, name, id, book_title]
      • 行数: 145
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作