five

rose-e-wang/backtracing

收藏
Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/rose-e-wang/backtracing
下载链接
链接失效反馈
官方服务:
资源简介:
Backtracing数据集旨在解决用户查询背后的原因检索问题。该数据集由三个不同领域的子数据集组成:讲座领域(Lecture)、新闻文章领域(News Article)和对话领域(Conversation)。每个子数据集包含查询目录和源目录,分别存储用户问题和相关内容。数据集的目标是帮助内容创作者理解用户查询的原因,从而改进内容质量。

The Backtracing dataset aims to address the problem of retrieving the cause behind user queries. It consists of three heterogeneous sub-datasets from different domains: Lecture, News Article, and Conversation. Each sub-dataset contains a query directory and a sources directory, storing user questions and related content, respectively. The goal of the dataset is to help content creators understand the reasons behind user queries, thereby improving content quality.
提供机构:
rose-e-wang
原始信息汇总

数据集概述

基本信息

  • 许可证: cc-by-nc-4.0
  • 任务类别: 文本生成
  • 语言: 英语
  • 标签: 数学
  • 数据集名称: backtracing
  • 数据集大小: n>1k

数据集描述

  • 任务: 回溯(Backtracing),即系统检索最可能引发用户查询的文本段落。
  • 领域:
    • 讲座领域(Lecture Domain)
    • 新闻文章领域(News Article Domain)
    • 对话领域(Conversation Domain)
  • 数据集组成:
    • 包含三个异构数据集,分别用于理解学生困惑、读者好奇心和用户情绪。
    • 每个数据集包含query目录(例如学生问题)和sources目录(例如讲座文本段落)。

数据集结构

└── data # Backtracing Datasets └── sight # 讲座领域, SIGHT, 源自 https://github.com/rosewang2008/sight ├── query └── sources └── inquisitive # 新闻文章领域, Inquisitive, 源自 https://github.com/wjko2/INQUISITIVE ├── query └── sources └── reccon # 对话领域, RECCON, 源自 https://github.com/declare-lab/RECCON ├── query
└── sources

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作