rose-e-wang/backtracing
收藏Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/rose-e-wang/backtracing
下载链接
链接失效反馈官方服务:
资源简介:
Backtracing数据集旨在解决用户查询背后的原因检索问题。该数据集由三个不同领域的子数据集组成:讲座领域(Lecture)、新闻文章领域(News Article)和对话领域(Conversation)。每个子数据集包含查询目录和源目录,分别存储用户问题和相关内容。数据集的目标是帮助内容创作者理解用户查询的原因,从而改进内容质量。
The Backtracing dataset aims to address the problem of retrieving the cause behind user queries. It consists of three heterogeneous sub-datasets from different domains: Lecture, News Article, and Conversation. Each sub-dataset contains a query directory and a sources directory, storing user questions and related content, respectively. The goal of the dataset is to help content creators understand the reasons behind user queries, thereby improving content quality.
提供机构:
rose-e-wang
原始信息汇总
数据集概述
基本信息
- 许可证: cc-by-nc-4.0
- 任务类别: 文本生成
- 语言: 英语
- 标签: 数学
- 数据集名称: backtracing
- 数据集大小: n>1k
数据集描述
- 任务: 回溯(Backtracing),即系统检索最可能引发用户查询的文本段落。
- 领域:
- 讲座领域(Lecture Domain)
- 新闻文章领域(News Article Domain)
- 对话领域(Conversation Domain)
- 数据集组成:
- 包含三个异构数据集,分别用于理解学生困惑、读者好奇心和用户情绪。
- 每个数据集包含
query目录(例如学生问题)和sources目录(例如讲座文本段落)。
数据集结构
└── data # Backtracing Datasets
└── sight # 讲座领域, SIGHT, 源自 https://github.com/rosewang2008/sight
├── query
└── sources
└── inquisitive # 新闻文章领域, Inquisitive, 源自 https://github.com/wjko2/INQUISITIVE
├── query
└── sources
└── reccon # 对话领域, RECCON, 源自 https://github.com/declare-lab/RECCON
├── query
└── sources



